본문 바로가기
AI 생성 글 정리/tech_github

Scientific Agent Skills — AI 에이전트를 과학 연구 조수로 확장하는 138개 Agent Skill 라이브러리

by Honbul 2026. 5. 21.

한 줄 요약: scientific-agent-skills는 Cursor, Claude Code, Codex, Gemini CLI, K-Dense BYOK 같은 Agent Skills 호환 클라이언트가 과학 패키지·공개 데이터베이스·분석 워크플로를 더 안정적으로 호출하도록 만든 대규모 절차형 지식 저장소다.

 

분석 기준은 2026-05-19 현재 공개 GitHub 저장소의 README, docs/, scientific-skills/, pyproject.toml, 보안 스캔 스크립트, GitHub Actions 워크플로, Issues/Releases다. 공개 Wiki와 Discussion 탭은 접근 가능한 항목을 확인하지 못했으므로, 이 리포트는 README·문서·소스 구조·이슈/릴리스 신호를 중심으로 작성했다.


Quick Links


Image & Asset Harvesting 결과

저장소 내부에서 확인된 원본 시각 자산은 docs/k-dense-web.gif 1개다. 블로그 본문 삽입을 위해 해당 GIF의 대표 프레임을 figures/K_Dense_Web_실행_데모.png로 변환했다. README와 문서에는 별도 아키텍처 다이어그램이 없어, 코드 구조·문서 구조·CI 워크플로를 기반으로 아키텍처, 작동 흐름, 보안 스캔, 연구 워크플로 다이어그램을 추가 생성했다.


그림 1. 저장소에서 수집한 원본 GIF와 분석 기반으로 생성한 다이어그램의 기능별 매핑. 각 이미지는 관련 설명 섹션 바로 아래에 배치했다.


Key Features

1. Agent Skills 표준을 과학 연구 영역으로 확장

이 저장소의 핵심은 애플리케이션이 아니라 스킬 디렉터리 모음이다. 각 스킬은 SKILL.md를 중심으로 구성되며, 에이전트는 먼저 스킬 설명을 읽고 필요할 때만 구체적인 사용법·예제·스크립트를 불러온다. 즉, 모델이 모든 과학 패키지의 문법을 항상 기억하는 방식이 아니라, 필요한 순간에 절차형 지식을 로드하는 구조다.

 

이 접근은 생물정보학, 화학정보학, 임상 연구, 물리/재료과학, 데이터 시각화처럼 문법과 도메인 규칙이 복잡한 분야에서 특히 유용하다. 예를 들어 사용자가 “10x single-cell 데이터 QC와 UMAP을 수행해 줘”라고 요청하면, 에이전트는 scanpy, anndata, scvelo 같은 관련 스킬을 참조해 전처리 순서와 권장 파라미터를 구성할 수 있다.


그림 2. Agent Skills의 discovery → activation → execution 흐름. Scientific Agent Skills는 이 흐름을 과학 패키지와 데이터베이스 워크플로에 맞춰 확장한다.

2. 138개 스킬과 광범위한 과학 도메인 커버리지

README 기준 저장소는 138개 ready-to-use scientific/research skill을 제공한다. 주요 범주는 Bioinformatics & Genomics, Cheminformatics & Drug Discovery, Clinical Research & Precision Medicine, Medical Imaging, Machine Learning & AI, Materials/Chemistry/Physics, Engineering & Simulation, Data Analysis & Visualization, Scientific Communication 등이다.

 

범주별 수치는 README의 설명을 기반으로 시각화했다. 일부 범주는 + 표기와 중복 활용 가능성을 포함하므로 합계가 전체 138개와 정확히 일치하지 않는다. 중요한 점은 이 저장소가 단일 도메인의 패키지 목록이 아니라, 연구 과정 전체를 연결하는 수평적 skill layer로 설계되어 있다는 점이다.


그림 3. README에 기재된 범주별 스킬 수의 최소값. Bioinformatics, Scientific Communication, ML/Data Analysis 계열의 비중이 크다.

3. 공개 과학 데이터베이스 접근을 에이전트 작업 흐름에 통합

database-lookup 스킬은 PubChem, ChEMBL, UniProt, PDB, AlphaFold, KEGG, Reactome, STRING, ClinVar, COSMIC, ClinicalTrials.gov, FDA, FRED, USPTO, SEC EDGAR 등 다수의 공개 API를 다룬다. 여기에 DepMap, Imaging Data Commons, PrimeKG, U.S. Treasury Fiscal Data, Hugging Science 같은 전용 데이터 접근 스킬이 더해진다.

 

이 기능의 장점은 “검색”과 “분석”이 분리되지 않는다는 점이다. 예를 들어 EGFR 저해제 탐색에서는 ChEMBL/PubChem에서 화합물을 가져오고, COSMIC에서 변이를 확인하고, AlphaFold/PDB 구조를 참조한 뒤, RDKit/DiffDock/DeepChem 기반 분석으로 이어갈 수 있다. 단순 링크 모음이 아니라 다단계 연구 파이프라인의 데이터 진입점을 제공하는 구조다.

4. 과학 패키지 사용법을 문서·예제·스크립트로 캡슐화

이 저장소는 RDKit, Scanpy, PyTorch Lightning, scikit-learn, BioPython, BioServices, PennyLane, Qiskit, OpenMM, MDAnalysis, scVelo, TimesFM, PyMC, SHAP, NetworkX, GeoPandas 등 다양한 패키지를 스킬 단위로 정리한다. 에이전트는 일반 Python 패키지를 직접 사용할 수도 있지만, 스킬이 있는 패키지는 문서화된 사용 패턴과 예제 덕분에 더 안정적인 출력을 기대할 수 있다.

 

패키지별 SKILL.md는 “무엇을 할 수 있는가”보다 “어떤 순서로, 어떤 함정을 피하면서, 어떤 출력 형태로 작업할 것인가”를 알려준다. 이 점이 단순 dependency list와 가장 크게 다른 부분이다.


그림 4. Drug discovery, single-cell omics, clinical evidence workflow는 서로 다른 스킬을 조합해 데이터 수집, 모델링, 보고서 생성까지 연결할 수 있다.

5. 연구 산출물 제작까지 포함한 communication skill

Scientific Communication 계열 스킬은 문헌 검색, literature review, scientific writing, peer review, citation management, scientific slides, posters, schematics, Mermaid diagrams, infographics 등을 포함한다. 이 계층은 분석 결과를 논문, 보고서, 슬라이드, 포스터, 표, 그림으로 바꾸는 데 초점을 둔다.

 

과학 에이전트의 실제 가치는 코드 실행만으로 결정되지 않는다. 연구자는 최종적으로 근거가 추적 가능한 요약, 재현 가능한 방법론, 한계와 후속 실험 제안, 시각적으로 이해 가능한 figure를 필요로 한다. 이 저장소가 writing/visualization skill을 대량 포함한 것은 “계산”과 “커뮤니케이션”을 하나의 작업 흐름으로 본다는 의미다.

6. K-Dense BYOK/Web과 결합한 로컬 연구 작업공간 지향

README는 K-Dense BYOK를 Scientific Agent Skills와 결합되는 로컬 AI co-scientist로 소개한다. BYOK 방식은 사용자가 자신의 API key를 가져오고, 로컬 프로젝트와 파일을 다루며, 필요 시 Modal 같은 클라우드 컴퓨팅으로 확장하는 방향을 지향한다.

 

저장소의 docs/k-dense-web.gif는 웹 기반 연구 작업공간에서 사용자가 air pollution과 respiratory health 관련 분석을 요청하고, 에이전트가 연구 실행 계획을 만드는 흐름을 보여준다.


그림 5. docs/k-dense-web.gif에서 추출한 K-Dense Web/BYOK 실행 예시. 사용자가 연구 질문을 입력하면 에이전트가 분석 범위, 데이터 가용성, 산출물 형식을 확인하며 실행 계획을 만든다.

7. 보안 스캐닝과 거버넌스가 저장소 운영의 핵심 축

Agent Skill은 단순 문서가 아니라 에이전트 행동을 유도할 수 있는 실행 지침이다. 따라서 prompt injection, data exfiltration, 악성 코드 패턴, 과도한 네트워크 호출, 민감한 API key 노출 가능성 같은 위험을 검토해야 한다.

 

저장소는 scan_skills.py, scan_pr_skills.py, .github/workflows/security-scan.yml, .github/workflows/pr-skill-scan.yml을 통해 보안 검사를 운영한다. PR에서는 변경된 skill을 검사하고, 주간 전체 스캔은 SECURITY.md를 갱신한다. SECURITY.md에는 2026-05-18 기준 138개 스킬 스캔, 856개 findings, Critical 68, High 18, Safe skills 107/138이 기록되어 있다.

 

단, 스캐너 결과는 “악성 확정”이 아니라 위험 패턴 신호다. 예를 들어 API key 사용, 외부 API 호출, 파일 생성처럼 정상적인 연구 기능에도 플래그가 발생할 수 있다. 실제 운영에서는 SKILL.md 직접 검토, 버전 pinning, 최소 권한, 샌드박스 실행이 함께 필요하다.


그림 6. PR 단위 변경 스캔과 주간 전체 스캔의 흐름. 에이전트 스킬 저장소에서는 기능 확장만큼 공급망·실행 안전성 관리가 중요하다.


Tech Stack

저장소/패키지 수준

영역 내용
프로젝트 버전 pyproject.toml 기준 2.39.0
프로젝트 메타데이터 Python 요구사항 requires-python = ">=3.13"
README 사용 전제 Python 3.11+, 3.12+ 권장, uv, Agent Skills 호환 클라이언트
패키지 매니저 uv
보안 스캔 의존성 cisco-ai-skill-scanner >= 2.0.8
기타 프로젝트 의존성 firecrawl-py >= 4.9.0, python-dotenv >= 1.0.0
CI/CD GitHub Actions: PR skill scan, weekly security scan, release automation
설치 채널 npx skills add, GitHub CLI gh skill

 

README의 Python 3.11+ 안내와 pyproject.toml>=3.13 요구사항은 용도가 다르게 읽어야 한다. 스킬 사용 자체는 개별 SKILL.md와 대상 패키지 요구사항을 따르며, 저장소 수준의 보안 스캔·개발 워크플로는 Python 3.13을 기준으로 구성되어 있다.

Skill ecosystem 수준

도메인 대표 스택
Bioinformatics BioPython, BioServices, Scanpy, AnnData, scVelo, scvi-tools, pysam, gget, TileDB-VCF
Drug Discovery RDKit, Datamol, Molfeat, DeepChem, TorchDrug, DiffDock, MedChem, OpenMM, MDAnalysis
Clinical/Medical ClinicalTrials.gov, ClinVar, COSMIC, FDA, PyHealth, NeuroKit2, pydicom, PathML, histolab
ML/AI PyTorch Lightning, Transformers, scikit-learn, SHAP, PyMC, PyMOO, Torch Geometric, TimesFM
Data/Visualization Matplotlib, Seaborn, Dask, Polars, Vaex, NetworkX, GeoPandas, scientific visualization workflows
Communication Literature Review, Paper Lookup, Scientific Writing, Peer Review, Slides, Posters, Infographics, Citation Management
Infrastructure Modal, DNAnexus, LatchBio, OMERO, Opentrons, GPU optimization stack

Architecture


그림 7. Scientific Agent Skills의 구조적 해석. 호환 agent host가 skill metadata를 탐색하고, 필요한 SKILL.md 및 참조 자산을 활성화한 뒤, 과학 패키지·데이터베이스·통합 플랫폼으로 실행을 위임한다.

핵심 구조

scientific-agent-skills/
├── scientific-skills/
│   ├── database-lookup/
│   │   └── SKILL.md
│   ├── rdkit/
│   │   └── SKILL.md
│   ├── scanpy/
│   │   └── SKILL.md
│   └── ...
├── docs/
│   ├── scientific-skills.md
│   ├── examples.md
│   └── k-dense-web.gif
├── .github/workflows/
│   ├── pr-skill-scan.yml
│   ├── security-scan.yml
│   └── release.yml
├── scan_skills.py
├── scan_pr_skills.py
├── SECURITY.md
├── pyproject.toml
└── README.md

작동 원리

  1. Skill discovery: 호환 agent host가 scientific-skills/<skill>/SKILL.md의 frontmatter와 설명을 읽어 후보 스킬을 찾는다.
  2. Skill activation: 사용자의 요청에 맞는 스킬이 선택되면, 해당 SKILL.md와 필요 시 references/, scripts/, assets/를 컨텍스트에 로드한다.
  3. Execution planning: 스킬 문서가 패키지 설치, API 호출, 파라미터 선택, 데이터 전처리, 오류 회피 패턴을 안내한다.
  4. Runtime execution: 실제 실행은 agent host와 사용자의 로컬/클라우드 환경에서 Python 패키지, REST API, 파일 시스템, 문서 생성 도구를 통해 수행된다.
  5. Governance: PR·주간 스캔을 통해 스킬의 위험 패턴을 탐지하고, SECURITY.md로 결과를 공개한다.

이 저장소는 중앙 서버형 과학 분석 플랫폼이 아니다. 더 정확히는 AI coding agent가 과학 워크플로를 수행할 때 참고하는 domain-specific operational memory에 가깝다. 이 때문에 특정 백엔드 API보다 SKILL.md의 품질, 예제의 정확성, reference 자료의 최신성, 보안 스캔 체계가 전체 품질을 좌우한다.


Usage & Setup

1. Agent Skills 전체 설치

npx skills add K-Dense-AI/scientific-agent-skills

 

README 기준으로 이 방식은 Claude Code, Claude Cowork, Codex, Gemini CLI, Cursor 등 Agent Skills 표준을 지원하는 클라이언트에 적용되는 기본 설치 경로다.

2. GitHub CLI로 설치

# 인터랙티브 설치
gh skill install K-Dense-AI/scientific-agent-skills

# 특정 스킬만 설치
gh skill install K-Dense-AI/scientific-agent-skills scanpy

# 특정 agent host 대상으로 설치
gh skill install K-Dense-AI/scientific-agent-skills --agent cursor
gh skill install K-Dense-AI/scientific-agent-skills --agent claude-code
gh skill install K-Dense-AI/scientific-agent-skills --agent codex
gh skill install K-Dense-AI/scientific-agent-skills --agent gemini

3. 재현 가능한 설치를 위한 버전 pinning

# 현재 분석 기준 최신 릴리스 예시
gh skill install K-Dense-AI/scientific-agent-skills --pin v2.39.0

# 특정 commit SHA로 pinning
gh skill install K-Dense-AI/scientific-agent-skills --pin <commit-sha>

 

연구 자동화 환경에서는 전체 저장소를 무조건 최신으로 따라가기보다, 프로젝트 단위로 검증된 릴리스나 commit에 고정하는 편이 안전하다.

4. 저장소를 직접 내려받아 검토

git clone https://github.com/K-Dense-AI/scientific-agent-skills.git
cd scientific-agent-skills

# 스킬 카탈로그 확인
ls scientific-skills

# 관심 스킬 문서 확인
sed -n '1,160p' scientific-skills/scanpy/SKILL.md
sed -n '1,160p' scientific-skills/database-lookup/SKILL.md

5. 보안 스캔 실행

# 저장소 개발/스캔 워크플로 기준
uv sync --python 3.13
uv run python scan_skills.py

# 개별 skill 로컬 스캔 예시
uv pip install cisco-ai-skill-scanner
skill-scanner scan /path/to/skill --use-behavioral

6. 실제 프롬프트 예시

Always use available skills when possible.
Use database-lookup, rdkit, medchem, and scientific-visualization.
Find known EGFR inhibitors from ChEMBL, calculate drug-likeness descriptors,
cluster scaffolds, and summarize top candidate chemotypes with citations.
Use scanpy and scientific-visualization.
Given a 10x Genomics single-cell RNA-seq dataset, perform QC, normalization,
PCA, UMAP, Leiden clustering, marker gene analysis, and produce a reproducible report.

Personal Insights

의료 AI 관점

이 저장소는 의료 AI 시스템에서 “모델이 직접 임상 판단을 내리는 구조”라기보다, 임상·생물학적 근거를 수집하고 정리하는 workflow assistant로 활용할 때 가치가 크다. ClinicalTrials.gov, ClinVar, COSMIC, FDA, DepMap, Imaging Data Commons 같은 데이터 접근 경로와 clinical decision support/reporting 계열 스킬은 precision medicine workflow에 유용하다.

 

다만 의료 영역에서는 기술적 가능성과 운영 가능성을 분리해야 한다. 환자 데이터가 포함되면 HIPAA/GDPR 등 개인정보 보호 요건, 병원 내부망 제한, audit trail, 임상 근거 등급, 의사 검토 프로세스가 필요하다. 특히 treatment plan이나 clinical decision support 관련 스킬은 최종 판단 자동화가 아니라 근거 정리·문헌 연결·후보 옵션 생성의 범위로 제한하는 것이 바람직하다.

Bioinformatics 관점

Bioinformatics에서는 이 저장소의 강점이 뚜렷하다. 실험 데이터 분석은 단일 라이브러리 호출이 아니라 FASTQ/BAM/VCF/AnnData, QC, normalization, batch correction, differential expression, pathway enrichment, visualization, report writing이 이어지는 긴 절차다. scanpy, scvelo, scvi-tools, pysam, BioPython, BioServices, gget, TileDB-VCF, database-lookup 같은 스킬은 이 절차를 에이전트가 놓치지 않도록 해준다.

 

실무 적용 시에는 데이터베이스 버전과 패키지 버전을 반드시 고정해야 한다. ClinVar, UniProt, KEGG, Reactome, ChEMBL 같은 데이터 소스는 시간이 지나며 결과가 달라질 수 있다. 따라서 분석 리포트에는 조회 날짜, API endpoint, accession ID, package version, random seed, filtering threshold를 남겨야 한다.

Autonomous Agent 개발 관점

Autonomous Agent 개발에서 이 저장소는 “tool registry”보다 더 흥미로운 구조다. 각 skill은 단순 tool call 정의가 아니라, agent가 특정 과학 업무를 수행할 때 따라야 할 절차, 제약, 예시, 실패 회피 패턴을 담는다. 이는 agent의 장기기억 또는 operating manual에 가깝다.

 

장점은 명확하다. 모델 컨텍스트를 모든 도메인 지식으로 채우지 않고, 요청에 맞는 스킬만 불러와 context efficiency를 높인다. 또한 패키지별 best practice를 표준화해 agent output의 일관성을 개선할 수 있다.

 

반면 위험도 명확하다. Skill은 agent 행동을 지시하므로 공급망 공격면이 된다. 악의적인 SKILL.md가 파일 삭제, credential exfiltration, 의도치 않은 외부 전송을 유도할 수 있다. 따라서 autonomous agent 환경에서는 다음 원칙이 필요하다.

  • 전체 설치보다 필요한 skill만 설치한다.
  • 릴리스 태그나 commit SHA를 pinning한다.
  • SKILL.md와 scripts를 사람이 검토한다.
  • API key는 최소 권한·도메인 제한·짧은 수명으로 관리한다.
  • 실행 환경은 프로젝트별 sandbox로 분리한다.
  • 보안 스캐너 결과를 “통과/실패”가 아니라 위험 신호 triage 자료로 해석한다.

종합 평가

scientific-agent-skills는 과학용 LLM agent를 위한 범용 연구 운영 지식 레이어에 가깝다. 단일 패키지의 wrapper가 아니라, 데이터베이스 조회, 패키지 사용, 분석 설계, 문헌 검토, 시각화, 보고서 작성, 보안 검토를 한 저장소 안에서 연결한다.

 

가장 큰 장점은 폭넓은 커버리지와 Agent Skills 표준 호환성이다. 가장 큰 리스크는 스킬 수가 많아질수록 개별 스킬의 최신성·안전성·검증 비용이 증가한다는 점이다. 연구자와 개발자에게 권장되는 활용 방식은 “전체를 설치해 모든 것을 맡기는 것”이 아니라, 프로젝트 목적에 맞는 스킬 세트를 선별하고, 버전을 고정하고, 산출물을 사람이 검토하는 방식이다.

 

의료 AI, bioinformatics, autonomous agent 시스템에서 이 저장소는 생산성을 크게 높일 수 있지만, 임상·연구 환경에서는 재현성, provenance, 보안, 책임 있는 검토 체계를 함께 설계해야 한다.