
한눈에 보는 결론
RFdiffusion3는 단백질 설계의 기본 단위를 아미노산 잔기에서 개별 원자로 낮춘 생성 모델입니다.
이 변화의 의미는 큽니다.
- 단백질 뼈대만 만드는 데서 끝나지 않습니다.
- 리간드, DNA, 촉매 활성 부위처럼 원자 위치가 중요한 대상을 함께 고려합니다.
- 수소결합, 매몰 정도, 대칭성, 활성 부위 배치 같은 조건을 더 직접적으로 걸 수 있습니다.
- 기존 RFdiffusion 계열보다 빠르면서도 여러 설계 과제에서 더 높은 성능을 보였습니다.
핵심 메시지는 단순합니다.
“단백질을 원자 단위로 설계하면, 기능도 원자 단위로 설계할 수 있다.”

Crop 포인트: 아래쪽 속도 그래프와 가운데 입력-출력 흐름을 함께 보면, RFD3가 다양한 생체분자 조건을 받으면서도 계산 비용을 크게 낮춘 모델임을 확인할 수 있습니다.
왜 새로운 모델이 필요했나
최근 단백질 설계 모델은 빠르게 발전했습니다.
대표적으로 RFdiffusion은 새로운 단백질 구조를 생성하는 데 강력했습니다.
하지만 한계가 있었습니다.
기존 접근의 병목
대부분의 모델은 단백질을 잔기 단위로 봅니다.
즉, 아미노산 하나를 하나의 큰 단위처럼 다룹니다.
이 방식은 다음 문제에는 충분했습니다.
- 단백질 단량체 설계
- 단백질 복합체 설계
- 단백질-단백질 결합체 설계
하지만 다음 문제에서는 부족했습니다.
- 작은 분자 리간드 결합
- DNA 또는 RNA 같은 핵산 결합
- 효소 활성 부위 설계
- 특정 원자 사이의 수소결합 설계
- 촉매에 필요한 정밀한 기하 구조 설계
이 문제들은 “대략적인 모양”보다 정확한 원자 배치가 중요합니다.
예를 들어 효소는 특정 원자가 특정 위치에 있어야 반응을 촉진합니다.
리간드 결합 단백질도 마찬가지입니다.
리간드의 어느 원자가 묻히고, 어느 원자가 수소결합을 만들며, 단백질의 어느 쪽에 놓이는지가 중요합니다.
RFD3는 바로 이 지점을 겨냥합니다.
RFD3의 핵심 아이디어: 잔기보다 원자
RFD3는 단백질을 만들 때 모든 주요 원자를 명시적으로 다룹니다.
각 잔기는 동일한 수의 원자 슬롯으로 표현됩니다.
- 뼈대 원자
- 곁사슬 원자
- 실제 원자가 부족한 경우 채워 넣는 가상 원자
이 설계 덕분에 모델은 서로 다른 아미노산을 하나의 통일된 형식으로 처리할 수 있습니다.
그 결과, 단백질 뼈대와 곁사슬을 동시에 생성할 수 있습니다.
직관적으로 보면
기존 모델이 “방의 배치도”를 그렸다면, RFD3는 “방 안의 가구와 콘센트 위치”까지 함께 정하는 방식입니다.
단백질 기능은 종종 이런 세부 배치에서 결정됩니다.
따라서 원자 단위 표현은 단순한 해상도 향상이 아닙니다.
기능 설계를 위한 표현 방식의 전환입니다.
조건을 더 자연스럽게 거는 방법
RFD3는 다양한 조건을 입력으로 받을 수 있습니다.
논문에서 강조하는 조건은 다음과 같습니다.
- 단백질이 붙어야 할 표적 단백질
- 결합해야 할 DNA 서열
- 결합해야 할 리간드 정보
- 효소 활성 부위의 핵심 원자
- 수소결합 donor 또는 acceptor 정보
- 리간드 원자의 노출 또는 매몰 정도
- 생성될 단백질의 중심 위치
- 대칭성 조건
중요한 점은 이 조건들이 별도의 복잡한 예외 규칙이 아니라, 모델의 원자 표현 안에서 자연스럽게 다뤄진다는 것입니다.

Crop 포인트: 가운데의 수소결합 조건화와 용매 접근성 조건화 패널은 RFD3가 “어떤 원자가 어떤 상호작용을 해야 하는지”를 직접 조건으로 받을 수 있음을 보여줍니다.
효소 설계에서 특히 중요하다
효소 설계는 단백질 설계 중에서도 가장 까다로운 분야입니다.
효소는 단순히 기질을 붙잡는 것이 아닙니다.
반응이 일어나도록 원자들을 정확한 방향과 거리로 배치해야 합니다.
RFD3는 활성 부위의 핵심 원자만 고정해두고, 나머지 단백질 구조를 그 주변에 생성할 수 있습니다.
즉, 사람이 “이 원자들은 이렇게 있어야 한다”는 최소 조건을 주면, 모델이 그 조건을 만족하는 단백질 구조를 찾아갑니다.
구조는 가볍게, 생성은 정밀하게
RFD3는 AlphaFold3의 원자 확산 아이디어에서 영향을 받았습니다.
하지만 목적은 다릅니다.
AlphaFold3는 주어진 서열과 분자 정보를 바탕으로 구조를 예측합니다.
RFD3는 조건을 만족하는 새로운 구조를 생성합니다.
그래서 RFD3는 더 가벼운 구조를 선택했습니다.
논문에서 제시한 설계 방향은 다음과 같습니다.
- 조건 처리 모듈을 크게 줄임
- 무거운 삼각형 업데이트 연산을 제거
- 원자 수준 정보와 잔기 수준 정보를 오가는 경로를 설계
- 가까운 원자와 잔기 위주로 정보가 흐르도록 희소 attention 사용
이 결과 RFD3는 약 1억 6천8백만 개의 학습 가능한 파라미터를 사용합니다.
논문은 이 구조가 기존 RFdiffusion2보다 일반적인 단백질 길이에서 약 10배 빠르다고 보고합니다.
학습 데이터: 실제 복합체와 예측 구조를 함께 사용
RFD3는 다양한 생체분자 상호작용을 학습합니다.
학습에는 다음 데이터가 사용되었습니다.
- Protein Data Bank의 단백질-단백질 복합체
- 단백질-작은 분자 복합체
- 단백질-DNA 복합체
- 기능성 모티프를 포함한 구조
- AlphaFold2 기반 고품질 예측 구조
학습 과정은 직관적으로 설명할 수 있습니다.
먼저 실제 구조에 노이즈를 섞습니다.
그다음 모델이 노이즈를 제거하면서 원래의 원자 배치를 회복하도록 훈련합니다.
이 과정을 반복하면 모델은 “무작위 원자 구름”에서 기능 조건을 만족하는 단백질 구조를 만들어내는 법을 배웁니다.
벤치마크 결과: 네 가지 설계 문제에서 성능 확인
논문은 RFD3를 여러 설계 과제에서 평가했습니다.
결과는 네 범주로 정리할 수 있습니다.
1. 단백질 결합체 설계
RFD3는 다섯 개 표적 단백질에 대해 단백질 결합체를 생성했습니다.
비교 대상은 기존 RFdiffusion1입니다.
결과적으로 RFD3는 더 다양한 성공 구조를 찾았습니다.
특히 단순히 성공 개수만 늘린 것이 아니라, 서로 다른 구조적 해법을 더 많이 제시했습니다.
이 점은 실제 실험 선별에서 중요합니다.
비슷한 후보만 많이 만드는 것보다, 다양한 후보군을 만드는 쪽이 성공 가능성을 넓힙니다.
2. DNA 결합 단백질 설계
DNA 결합 단백질 설계는 어렵습니다.
DNA는 유연하고, 염기서열에 따라 모양이 달라지며, 결합 표면도 극성이 강합니다.
RFD3는 DNA 서열을 입력으로 받고, DNA 모양과 단백질 구조를 함께 생성할 수 있습니다.
이 접근은 “고정된 DNA 구조에 맞추는 설계”보다 더 유연합니다.
표적 DNA가 실제 결합 상태에서 어떤 모양을 가질지 함께 탐색하기 때문입니다.
3. 작은 분자 결합 단백질 설계
작은 분자 리간드는 여러 형태를 가질 수 있습니다.
기존 방법은 보통 리간드의 고정된 형태를 입력으로 요구했습니다.
RFD3는 리간드 형태와 단백질 구조를 함께 샘플링할 수 있습니다.
즉, 단백질이 리간드를 감싸는 포켓과 리간드의 결합 자세를 동시에 찾습니다.
4. 효소 활성 부위 설계
효소 설계 벤치마크에서는 특정 활성 부위 원자 배치를 만족하는 단백질을 생성해야 합니다.
RFD3는 기존 RFdiffusion2보다 대부분의 테스트에서 더 좋은 결과를 보였습니다.
특히 활성 부위가 여러 떨어진 구간으로 나뉘는 어려운 경우에도 상대적으로 강했습니다.

Crop 포인트: 네 개 패널 모두에서 RFD3는 단백질 결합, DNA 결합, 작은 분자 결합, 효소 설계라는 서로 다른 문제를 하나의 원자 기반 프레임으로 처리합니다.
실험 검증: DNA 결합체와 시스테인 가수분해효소
인실리코 성능만으로는 충분하지 않습니다.
논문은 두 가지 실제 실험을 진행했습니다.
DNA 결합 단백질
연구진은 무작위로 정한 DNA 서열에 결합하는 단백질을 설계했습니다.
전체 흐름은 다음과 같습니다.
- AF3로 표적 DNA 구조를 예측
- RFD3로 DNA 결합 단백질 후보 생성
- LigandMPNN으로 서열 설계
- 잘 예측된 후보의 DNA 접촉 모티프를 고정
- 나머지 구조를 다시 생성해 다양성 확대
- 합성 유전자로 실제 결합력 측정
테스트한 5개 설계 중 1개가 낮은 마이크로몰 수준의 결합력을 보였습니다.
이 결과는 완벽한 성공률을 뜻하지 않습니다.
하지만 전통적으로 어려운 DNA 결합 단백질 설계에서, 생성 모델이 실험적으로 결합 후보를 낼 수 있음을 보여줍니다.

Crop 포인트: 오른쪽 위 결합 곡선과 오른쪽 아래 효소 반응 곡선은 RFD3 설계가 계산 예측에 머물지 않고 실제 실험 신호로 이어졌다는 점을 보여줍니다.
DNA 결합체의 세부 구조를 보면, 모델이 단순히 DNA 근처에 단백질을 배치한 것이 아닙니다.
주요 홈과 인산 골격에 대한 상호작용이 함께 나타납니다.
이는 원자 수준 조건화가 실제 결합 인터페이스 구성으로 이어질 수 있음을 시사합니다.

Crop 포인트: 아래쪽 접촉 확대 영역은 설계 단백질이 DNA 염기와 골격을 동시에 인식하도록 배치된 상호작용 네트워크를 보여줍니다.
시스테인 가수분해효소
두 번째 실험은 효소 설계입니다.
표적 반응은 활성화된 에스터 기질을 분해하는 반응입니다.
연구진은 Cys-His-Asp 촉매 삼합체와 주변 보조 원자를 최소 활성 부위 조건으로 사용했습니다.
그 뒤 RFD3가 해당 활성 부위를 품는 단백질 구조를 생성했습니다.
실험에서는 190개 설계를 스크리닝했습니다.
그중 35개가 반복적으로 기질을 전환하는 활성을 보였습니다.
가장 좋은 설계는 같은 반응을 겨냥한 이전 설계보다 높은 효율을 보였습니다.

Crop 포인트: 위쪽 스크리닝 그래프와 아래쪽 활성 부위 확대 이미지를 함께 보면, 활성 신호가 특정 촉매 구조 배치와 연결되어 있음을 확인할 수 있습니다.
이 논문의 기여
RFD3의 기여는 “더 좋은 단백질 생성기”에 그치지 않습니다.
더 중요한 변화는 설계 문제를 표현하는 방식입니다.
1. 원자 수준 조건을 직접 다룸
효소, 리간드, DNA 결합은 모두 원자 수준 문제입니다.
RFD3는 그 조건을 모델 내부 표현과 같은 언어로 처리합니다.
그래서 조건이 덜 억지스럽고, 더 직접적입니다.
2. 다양한 생체분자 상호작용을 하나의 모델로 다룸
단백질-단백질.
단백질-DNA.
단백질-리간드.
효소 활성 부위.
대칭성 복합체.
RFD3는 이들을 별도 모델이 아니라 하나의 확산 모델 안에서 처리합니다.
3. 계산 비용을 낮춤
고해상도 모델은 보통 느립니다.
하지만 RFD3는 구조를 단순화하고 희소 attention을 사용해 속도를 개선했습니다.
이 점은 대규모 후보 생성이 필요한 단백질 설계에서 중요합니다.
4. 실험 검증까지 제시
논문은 계산 벤치마크만 제시하지 않습니다.
DNA 결합체와 효소 설계에서 실제 실험 데이터를 함께 보여줍니다.
이 때문에 RFD3는 “그럴듯한 구조 생성기”가 아니라, 기능성 단백질 설계 플랫폼에 가까운 방향을 제시합니다.
읽을 때 주의할 점
성과는 인상적이지만, 해석에는 신중함이 필요합니다.
프리프린트 단계
이 논문은 bioRxiv 프리프린트입니다.
아직 동료심사를 거친 최종 논문은 아닙니다.
실험 검증 규모는 제한적
DNA 결합 단백질은 5개 후보 중 1개가 결합을 보였습니다.
효소 설계는 더 많은 후보에서 활성이 관찰되었지만, 특정 반응과 특정 활성 부위 설정에 대한 결과입니다.
따라서 모든 표적에서 같은 성공률을 기대해서는 안 됩니다.
서열 설계는 별도 단계와 연결됨
RFD3가 구조를 생성한 뒤, ProteinMPNN 또는 LigandMPNN이 서열을 맞추는 단계가 사용됩니다.
즉, 실제 설계 파이프라인은 RFD3 단독이 아니라 후속 서열 설계 및 구조 예측 필터링과 함께 작동합니다.
앞으로의 의미
RFD3가 겨냥하는 방향은 명확합니다.
단백질을 “접히는 물체”가 아니라 “원자 단위로 기능하는 분자 장치”로 설계하는 것입니다.
이 관점은 다음 영역에서 특히 중요합니다.
- 맞춤형 효소
- 소분자 센서
- DNA 결합 단백질
- 치료용 단백질 결합체
- 복잡한 대칭 단백질 어셈블리
- 특정 화학 반응을 촉진하는 인공 촉매
RFD3는 단백질 설계의 목표를 더 세밀하게 바꿉니다.
이제 질문은 “어떤 구조를 만들 수 있는가”에서 “어떤 원자 상호작용을 설계할 수 있는가”로 이동합니다.
Source
- Jasper Butcher, Rohith Krishna, Raktim Mitra, Rafael I. Brent, Yanjing Li, Nathaniel Corley, Paul Kim, Jonathan Funk, Simon Mathis, Saman Salike, Aiko Muraishi, Helen Eisenach, Tuscan Rock Thompson, Jie Chen, Yuliya Politanska, Enisha Sehgal, Brian Coventry, Odin Zhang, Bo Qiang, Kieran Didi, Max Kazman, Frank DiMaio, David Baker. De novo Design of All-atom Biomolecular Interactions with RFdiffusion3. bioRxiv preprint. Posted September 18, 2025.
- DOI: https://doi.org/10.1101/2025.09.18.676967
- Note: The manuscript is available under a CC-BY 4.0 International license and had not been certified by peer review at the time of posting.
'AI 생성 글 정리 > bio' 카테고리의 다른 글
| An AI system to help scientists write expert-level empirical software 논문 정리 (0) | 2026.05.29 |
|---|---|
| Nucleotide Transformer 논문 정리 (0) | 2026.05.29 |
| RFdiffusion2 논문 정리 (0) | 2026.05.18 |
| Latent-Y: A Lab-Validated Autonomous Agent for De Novo Drug Design 논문 정리 (0) | 2026.04.27 |
| [Protein Design with Agent Rosetta: A Case Study for Specialized Scientific Agents] 논문 정리 (0) | 2026.04.27 |