본문 바로가기
AI 생성 글 정리/bio

SPATIA 논문 정리

by Honbul 2026. 4. 26.

 

한 문장 요약

SPATIA는 세포 이미지, 유전자 발현, 조직 내 위치를 함께 학습하는 모델입니다.

목표는 두 가지입니다.

  • 세포 상태를 더 정확히 예측하기
  • 특정 생물학적 변화가 일어났을 때 세포 형태가 어떻게 바뀔지 생성하기

기존 모델은 보통 이미지 또는 유전자만 보거나, 조직을 큰 패치 단위로만 봤습니다.

SPATIA는 세포 하나에서 시작해 주변 미세환경, 전체 조직 구조까지 연결합니다.

 

Crop 포인트: 하단의 세포-니치-조직 입력이 상단의 예측 과제와 형태 생성 과제로 이어지는 흐름을 보면 됩니다.


왜 이 논문이 필요한가

공간 전사체학은 조직을 부수지 않고도 다음 정보를 함께 제공합니다.

  • 세포의 위치
  • 세포 이미지
  • 유전자 발현
  • 주변 세포와의 관계

문제는 이 정보들이 서로 따로 분석되는 경우가 많다는 점입니다.

예를 들어 이미지 모델은 세포 모양을 잘 봅니다.
하지만 유전자 상태를 놓칠 수 있습니다.

단일세포 유전자 모델은 발현 패턴을 잘 봅니다.
하지만 세포가 조직 안에서 어떤 이웃을 갖는지는 약하게 반영합니다.

SPATIA의 핵심 질문은 단순합니다.

세포의 모양, 유전자, 위치를 하나의 표현으로 묶으면 더 나은 생물학적 예측과 생성이 가능한가?

논문은 가능하다고 주장합니다.


핵심 아이디어

SPATIA는 세포를 단독으로 보지 않습니다.

세포를 세 단계로 해석합니다.

  1. Cell level
    개별 세포의 이미지와 유전자 발현을 함께 봅니다.
  2. Niche level
    가까운 세포들이 이루는 국소 미세환경을 봅니다.
  3. Tissue level
    여러 니치를 묶어 전체 조직 구조를 봅니다.

이 구조는 실제 병리 분석과 닮아 있습니다.

현미경을 볼 때도 먼저 세포를 보고, 주변 세포 배열을 보고, 마지막으로 조직 전체 패턴을 봅니다.

 

Crop 포인트: Cell, Niche, Tissue가 단순한 해상도 차이가 아니라 서로 다른 생물학적 맥락을 담는 단계라는 점에 주목하면 됩니다.


SPATIA의 모델 구조

SPATIA는 세포 이미지와 유전자 정보를 먼저 결합합니다.

직관적으로는 이미지가 “이 세포는 어떻게 생겼는가”를 묻고, 유전자 정보가 “그 모양을 어떤 분자 상태가 설명하는가”를 답하는 방식입니다.

그 다음 모델은 주변 세포들을 묶어 니치 표현을 만듭니다.

이 니치 표현은 세포가 혼자 있는 것이 아니라 특정 미세환경 안에 있다는 사실을 반영합니다.

마지막으로 여러 니치를 모아 조직 수준 표현을 만듭니다.

결과적으로 하나의 세포 표현 안에는 다음 정보가 함께 들어갑니다.

  • 세포 고유의 형태
  • 세포의 유전자 발현
  • 주변 세포 구성
  • 전체 조직 구조

Crop 포인트: 데이터 다양성, 계층형 입력, 약한 쌍 생성, 형태 변화 생성, 다운스트림 성능 향상이 하나의 파이프라인으로 연결되는 지점을 보면 됩니다.


수식 없이 보는 핵심 방법

1. 이미지와 유전자를 맞춰 읽기

SPATIA는 세포 이미지를 단순한 픽셀 덩어리로 보지 않습니다.

이미지에서 형태 토큰을 만들고, 유전자 발현에서 분자 토큰을 만듭니다.

그 후 두 토큰이 서로를 참조하도록 합니다.

이 과정은 “모양과 발현이 서로 설명되는 부분”을 찾는 단계입니다.


2. 니치와 조직 맥락 추가

세포 상태는 혼자 결정되지 않습니다.

같은 암세포라도 주변에 면역세포가 많은지, 기질세포가 많은지에 따라 의미가 달라집니다.

SPATIA는 가까운 세포들을 묶어 국소 환경을 만들고, 다시 이 국소 환경들을 묶어 조직 전체 맥락을 만듭니다.

이렇게 하면 모델은 “이 세포가 어떤 위치에서 어떤 이웃과 함께 존재하는지”를 학습합니다.


3. 실제 전후 관찰 없이 형태 변화를 만들기

공간 전사체 실험에서는 같은 세포를 변화 전과 변화 후에 동시에 볼 수 없습니다.

조직을 측정하는 과정 자체가 파괴적이기 때문입니다.

그래서 SPATIA는 직접적인 전후 쌍 대신 약한 쌍을 만듭니다.

방법은 다음과 같습니다.

  • control 상태의 세포 집단을 찾습니다.
  • target 상태의 세포 집단을 찾습니다.
  • 유전자 발현이 생물학적으로 가까운 세포끼리 연결합니다.
  • 위치와 세포 계통 조건을 추가해 말이 안 되는 연결을 줄입니다.

이 연결은 완벽한 “같은 세포의 전후”가 아닙니다.

대신 “비슷한 생물학적 전환을 대표하는 쌍”입니다.


4. 불확실한 쌍은 덜 믿기

약한 쌍에는 오류가 있습니다.

SPATIA는 이 문제를 정면으로 다룹니다.

연결이 확실해 보이는 쌍은 학습에서 더 크게 반영합니다.

연결이 애매한 쌍은 덜 반영합니다.

핵심은 단순합니다.

모델이 불확실한 pseudo-label에 과하게 끌려가지 않도록 만든다.


5. 형태 변화의 방향을 배우기

SPATIA의 생성 모듈은 이미지를 곧바로 복사하지 않습니다.

세포 형태가 control 상태에서 target 상태로 이동하는 “변화 방향”을 학습합니다.

예를 들어 다음 변화를 다룹니다.

  • DCIS에서 침윤성 암으로 진행
  • immune-cold 환경에서 immune-hot 환경으로 재구성

생성 결과는 단순히 그럴듯한 이미지가 아니라, target 상태의 형태적 특성을 따라야 합니다.

그래서 논문은 생성 이미지를 CellProfiler 기반 형태 지표로도 평가합니다.


데이터셋: MIST

논문은 SPATIA 학습과 평가를 위해 MIST를 구성합니다.

MIST는 image-based spatial transcriptomics 데이터를 모은 대규모 데이터셋입니다.

주요 규모는 다음과 같습니다.

항목 규모
세포-유전자 쌍 2,590만
니치-유전자 쌍 200만
조직-유전자 항목 2만
데이터 소스 74개
조직 종류 17개
공여자 60명
플랫폼 4개

 

사용 플랫폼은 Xenium, CosMx, Stereo-seq, Visium HD입니다.

이 구성이 중요한 이유는 명확합니다.

모델이 특정 플랫폼의 노이즈만 외우면 실제 생물학을 배우기 어렵습니다.

SPATIA는 플랫폼 차이를 줄이고, 생물학적 구조를 보존하도록 학습합니다.


실험 1: 세포 형태 변화 생성

생성 실험은 SPATIA의 가장 차별적인 부분입니다.

모델은 control 세포 이미지를 받아 target 상태의 형태를 생성합니다.

평가는 두 축으로 나뉩니다.

  • 이미지 품질: 생성 이미지가 실제 이미지처럼 보이는가
  • 생물학적 형태 정확성: target 상태의 형태 지표 분포를 따르는가

비교 모델은 CellFlux, MorphDiff, GeneFlow입니다.

결과적으로 SPATIA는 더 낮은 생성 거리 지표와 더 높은 형태 일치도를 보였습니다.

특히 형태 정렬 손실을 추가했을 때 성능이 가장 좋아졌습니다.

 

Crop 포인트: Target 열과 SPATIA 열의 형태적 유사성을 비교하면, 단순한 질감 생성이 아니라 target 상태의 세포 밀도와 형태 패턴을 따라가려는 효과가 드러납니다.

 

핵심 수치는 다음과 같습니다.

모델 이미지 품질 지표 FID 이미지 품질 지표 KID 형태 일치도
CellFlux 64.1 2.31 낮음
MorphDiff 70.5 2.52 낮음
GeneFlow 62.4 2.20 중간
SPATIA base 59.5 2.09 높음
SPATIA + reweight 59.1 2.06 높음
SPATIA + morphology loss 58.5 2.01 가장 높음

 

결론은 분명합니다.

형태 생성을 잘하려면 이미지 생성 능력만으로는 부족합니다.

유전자 상태, 주변 미세환경, target 형태 분포를 함께 써야 합니다.


실험 2: 플랫폼 차이와 배치 효과

공간 전사체 데이터는 플랫폼마다 측정 방식이 다릅니다.

같은 생물학적 상태라도 플랫폼이 다르면 표현이 달라질 수 있습니다.

SPATIA는 이 문제를 줄이는 것을 목표로 합니다.

Xenium과 CosMx에서 세포 클러스터링을 평가했습니다.

Xenium에서는 SPATIA가 가장 좋은 ARI와 NMI를 보였습니다.

CosMx에서는 ARI가 가장 높았습니다.

 

다만 NMI는 일부 단일세포 기반 모델보다 낮았습니다.

이 지점은 중요합니다.

SPATIA가 전 지표에서 압도적으로 이긴 것은 아닙니다.

하지만 서로 다른 플랫폼에서 생물학적 구조를 꽤 안정적으로 보존했다는 점은 강점입니다.

 

Crop 포인트: PCA보다 SPATIA에서 데이터 소스별 흩어짐이 줄고, 조직별 구조가 더 응집되는 부분을 보면 배치 효과 완화의 의도를 읽을 수 있습니다.


실험 3: 바이오마커 예측

논문은 유방암 병리 슬라이드에서 ER, PR, HER2 상태를 예측했습니다.

SPATIA는 전용 병리 모델과 비교됩니다.

결과는 다음과 같습니다.

모델 ER AUC PR AUC HER2 AUC
GigaPath 0.841 0.803 0.721
CONCH 0.881 0.810 0.715
UNI 0.891 0.820 0.732
SPATIA 0.902 0.825 0.744

 

SPATIA는 생성 전용 모델이 아닙니다.

예측 과제에서도 강한 병리 foundation model과 비슷하거나 더 나은 결과를 냈습니다.

단, 차이는 매우 크지 않습니다.

논문의 의미는 “예측만 잘하는 모델”이 아니라, 예측과 생성이 가능한 하나의 공간 생물학 backbone을 제시했다는 점에 있습니다.


실험 4: 세포 주석과 클러스터링

세포 주석에서는 F1과 precision을 봅니다.

클러스터링에서는 ARI와 NMI를 봅니다.

SPATIA는 CellPLM, scGPT, scBERT, CellTypist 같은 단일세포 모델과 비교됩니다.

결과는 다음과 같습니다.

과제 SPATIA 결과 비교 포인트
세포 주석 F1 0.725 비교 모델 중 최고
세포 주석 precision 0.734 비교 모델 중 최고
클러스터링 ARI 0.870 비교 모델 중 최고
클러스터링 NMI 0.831 비교 모델 중 최고

 

이 결과는 계층형 공간 정보가 단순한 부가 정보가 아니라는 점을 보여줍니다.

세포 정체성을 판단할 때 주변 맥락이 도움이 됩니다.


실험 5: 이미지에서 유전자 발현 예측

SPATIA는 이미지 패치에서 유전자 발현을 예측하는 과제도 수행했습니다.

비교 대상은 CTransPath, GigaPath, CONCH, UNI, UNI v1.5, H-Optimus-0 등입니다.

평가는 여러 암 코호트에서 이루어졌습니다.

SPATIA는 IDC, PAAD, SKCM, COAD, LUAD 전반에서 높은 상관을 보였습니다.

 

Crop 포인트: 각 암종의 마지막 막대가 대체로 가장 높게 나타나는 흐름을 보면, SPATIA 표현이 이미지-유전자 연결을 잘 보존한다는 메시지가 드러납니다.

 

핵심은 단순한 성능 향상이 아닙니다.

이미지와 유전자를 함께 학습한 표현이 downstream 회귀에도 유용하다는 점입니다.


Ablation: 어떤 구성요소가 중요한가

논문은 SPATIA의 구성요소를 하나씩 추가하며 성능을 비교합니다.

결과는 계층형 구조의 중요성을 보여줍니다.

설정 손실 정확도
Cell level only 0.405 0.93
+ reconstruction 0.396 0.94
+ multi-level 0.369 0.97
+ fusion 0.361 0.98

 

가장 큰 개선은 multi-level 구조를 추가했을 때 나타납니다.

즉, 세포 하나만 보는 것보다 주변과 조직 맥락을 함께 보는 것이 중요합니다.


OT pairing이 틀려도 버티는가

약한 쌍 생성은 SPATIA의 핵심이지만 동시에 취약점입니다.

잘못된 control-target 연결이 많아지면 생성 방향이 흐려질 수 있습니다.

논문은 일부 쌍을 의도적으로 섞어 robustness를 평가했습니다.

노이즈가 늘수록 성능은 떨어졌습니다.

하지만 중간 수준의 pairing 오류에서는 비교적 안정적으로 동작했습니다.

 

Crop 포인트: 노이즈가 증가할수록 생성 품질과 형태 일치도가 함께 나빠지는 흐름을 보면, 약한 pairing의 품질이 생성 성능의 핵심 병목임을 알 수 있습니다.

이 결과는 장점과 한계를 동시에 보여줍니다.

  • 장점: 완벽한 전후 쌍 없이도 학습 가능
  • 한계: 약한 쌍의 품질이 낮으면 생성 성능도 악화

이 논문의 기여

1. 세포-니치-조직을 잇는 계층형 모델

SPATIA는 세포 하나의 정보에 머물지 않습니다.

국소 미세환경과 전체 조직 구조를 함께 학습합니다.

공간 생물학 데이터의 본질에 가까운 설계입니다.


2. 이미지와 유전자 발현의 강한 결합

이미지 모델과 유전자 모델을 단순히 붙이지 않습니다.

서로 참조하면서 공통 표현을 만들도록 설계했습니다.

이 덕분에 예측과 생성 과제 모두에 쓸 수 있습니다.


3. paired data 없이 형태 변화를 생성

같은 세포의 변화 전후 이미지를 얻기 어려운 상황에서, SPATIA는 population-level pairing으로 문제를 우회합니다.

이 접근은 실험적으로 측정하기 어려운 세포 상태 전환을 시뮬레이션하는 데 유용합니다.


4. 대규모 MIST 데이터셋

논문은 2,590만 세포 규모의 MIST를 구성했습니다.

다양한 조직, 질병, 플랫폼을 포함해 cross-platform 일반화를 평가할 수 있게 했습니다.


한계와 주의점

SPATIA의 결과는 강하지만, 해석에는 주의가 필요합니다.

1. 생성 결과는 실험 검증이 아니다

모델이 만든 이미지는 예측 시뮬레이션입니다.

실제 생물학적 전환이 반드시 그렇게 일어난다는 증거는 아닙니다.


2. 약한 pairing 품질에 의존한다

OT 기반 pairing이 잘못되면 생성 방향도 흔들립니다.

논문은 reweighting으로 이를 완화했지만, 완전히 제거하지는 못합니다.


3. 예측 성능 향상은 일부 과제에서 제한적이다

생성 과제에서는 차별성이 큽니다.

하지만 일부 예측 과제에서는 기존 강력한 foundation model 대비 개선 폭이 작습니다.


4. 대규모 학습 비용이 필요하다

논문은 고성능 GPU 환경에서 대규모 학습을 수행했습니다.

실제 연구실에서 재현하려면 계산 자원과 데이터 처리 파이프라인이 필요합니다.


읽을 때의 핵심 관점

이 논문은 단순히 “더 좋은 이미지 생성 모델”을 제안한 것이 아닙니다.

더 중요한 메시지는 다음입니다.

공간 생물학에서 세포 상태는 이미지, 유전자, 위치, 주변 맥락을 함께 봐야 이해된다.

 

SPATIA는 이 메시지를 모델 구조로 구현합니다.

그리고 생성 과제를 통해 그 표현이 단순 분류용 feature가 아니라, 세포 상태 전환을 시뮬레이션할 수 있는 표현임을 보이려 합니다.

가장 흥미로운 부분은 morphology generation입니다.

전후 paired data가 없는 상황에서도, 유전자 기반 약한 pairing과 공간 맥락을 이용해 target 상태의 형태를 만들어냅니다.

이는 암 진행, 면역 미세환경 변화, 약물 반응 시뮬레이션 같은 문제로 확장될 수 있습니다.

단, 생성 결과를 생물학적 사실로 바로 받아들이면 안 됩니다.

가설 생성 도구로 보는 것이 더 적절합니다.


결론

SPATIA는 공간 전사체학의 세 가지 축을 하나로 묶습니다.

  • 세포 형태
  • 유전자 발현
  • 조직 내 공간 맥락

이 결합을 통해 예측과 생성을 동시에 수행합니다.

논문이 제시한 가장 큰 가치는 “공간 맥락을 가진 세포 phenotype foundation model”의 가능성입니다.

향후 관건은 세 가지입니다.

  • 더 다양한 조직과 질병에서의 검증
  • 생성 결과의 실험적 검증
  • 임상적 해석 가능성과 신뢰도 평가

SPATIA는 아직 최종 해답이라기보다, 공간 생물학 foundation model이 나아갈 방향을 보여주는 강한 출발점입니다.


Source

  • Zhenglun Kong, Mufan Qiu, John Boesen, Xiang Lin, Sukwon Yun, Tianlong Chen, Manolis Kellis, Marinka Zitnik. SPATIA: Multimodal Generation and Prediction of Spatial Cell Phenotypes. Preprint, February 17, 2026.
  • arXiv:2507.04704v2
  • Link: https://arxiv.org/abs/2507.04704