목차

최근 제약·바이오 산업은 AI와 인실리코 기술의 발전과 함께 빠르게 변화하고 있습니다. 특히 저분자 화합물 기반 신약 개발에서는 단순히 좋은 후보를 찾는 것을 넘어, 얼마나 빠르고 효율적으로 후보를 선별할 수 있는지가 연구 경쟁력을 결정짓는 핵심 요소가 되었습니다.
이러한 흐름 속에서 등장한 기술이 바로 HTVS(High Throughput Virtual Screening)입니다. HTVS는 수많은 화합물을 동시에 평가하여 유망 후보를 빠르게 선별하는 기술로, 현재 대부분의 인실리코 신약 개발 과정에서 필수적으로 활용되고 있습니다. 하지만 실제 연구를 진행하다 보면 다음과 같은 고민이 자연스럽게 따라옵니다.
“어떤 도킹 알고리즘을 선택해야 하는가?”
“얼마나 많은 분자들을 가상 스크리닝 할 수 있는가?
“오픈소스 도구만으로 충분한가, 아니면 상용 솔루션이 필요한가?”
이 글에서는 이러한 질문에 답하기 위해, 신약 개발 구조부터 HTVS의 개념, 실제 연구 사례, 그리고 도킹 성능 비교까지 단계적으로 정리해보겠습니다.
신약 개발은 어떻게 이루어지는가: 4가지 접근 방식
| 모달리티 | 작용 기전 | 주요 타겟 | 장점 | 한계 |
| Small Molecules | Target Inhibition | 효소, 수용체 (Binding Pocket) | 경구 투여, 높은 투과성 | Off-Target 독성위험 |
| Peptide | Prot-Prot Interation Modulation | 단백질-단백질 상호작용 | 높은 선택성, 낮은 Off-Target 독성위험 | 생체 내 낮은 안정성, 주사제 필요 |
| Antibody | Antigen Recognition | 세포 외 단백질 / 항원 | 매우 높은 특이성 | 높은 제조 비용, 낮은 조직 투과성 |
| Targeted Protein Degradation | Targeted Protein Degradation | 세포 내 단백질(Undruggable 포함) | Undruggable Target 공략 | 높은 분자량, 설계 난이도 높음 |

신약 개발은 단일한 방법으로 이루어지지 않습니다. 현재는 크게 세 가지 모달리티를 기반으로 연구가 진행됩니다.
가장 전통적이면서도 여전히 중심이 되는 방식은 Small Molecule, 즉 저분자 화합물 기반 접근입니다. 이 방식은 질병의 원인이 되는 단백질의 활성 부위에 특정 화합물이 결합하여 기능을 억제하는 원리를 기반으로 합니다. 우리가 흔히 말하는 docking 기반 신약 설계가 바로 이 영역에 해당합니다.
한편, 최근에는 펩타이드나 항체를 활용하는 Biologics 접근도 활발히 연구되고 있습니다. 이 방식은 저분자보다 훨씬 큰 분자를 활용하여 표적 단백질을 정밀하게 인식한다는 특징이 있습니다. 특히 펩타이드는 넓은 결합 면적을 활용하여 높은 특이성을 확보할 수 있다는 장점이 있지만, 체내 안정성이 낮고 주사제 형태가 필요하다는 한계를 가집니다.
그리고 최근 가장 주목받는 분야는 TPD(Targeted Protein Degradation)입니다. 대표적으로 PROTAC이 있으며, 이는 단백질을 단순히 억제하는 것이 아니라 아예 분해시키는 방식입니다. 기존 기술로 접근이 어려웠던 undruggable target까지 공략할 수 있다는 점에서 매우 혁신적인 접근으로 평가됩니다. 결국 중요한 것은, 어떤 방식이 더 우수하냐가 아니라 “타겟과 질환에 맞는 최적의 전략을 선택하는 것” 입니다. 오늘은 이러한 관점에서, 오랜 기간 연구되어 온 저분자 화합물 기반 신약 개발을 중심으로, 최근 컴퓨터 기술의 발전으로 가능해진 고효율 가상 스크리닝 기법인 HTVS에 대해 말씀드리고자 합니다.
HTVS란 무엇인가: 연구 속도를 바꾸는 기술

HTVS(High Throughput Virtual Screening)는 대규모 화합물 라이브러리를 계산 기반으로 신속하게 평가하여 유망 후보를 선별하는 기술입니다. 그러나 HTVS는 단순히 docking을 빠르게 수행하는 것에 그치지 않고, 나아가 방대한 화학 공간을 효율적으로 탐색하기 위한 전략적 접근 방식입니다. 이는 과거 수백에서 수천 개의 화합물을 실험적으로 검증하던 방식에서 벗어나, 수백만 개 이상의 후보 물질을 사전에 계산으로 선별할 수 있도록 해주는 핵심 기술입니다.
이로 인해 연구 방식 자체가 변화했습니다.
✔️ 실험 횟수 감소
✔️ 초기 후보 탐색 속도 증가
✔️ 새로운 binding 패턴 발견 가능
특히 최근에는 GPU 기반 연산과 AlphaFold와 같은 단백질 구조 예측 기술이 결합되면서,
HTVS는 이제 million을 넘어서 billion 단위의 분자까지, 즉 방대한 화학 공간을 탐색할 수 있는 수준으로 확장되고 있습니다. 이러한 HTVS의 일반적인 workflow는 다음과 같습니다.
타겟 단백질 선정
✔️ 구조 확보
✔️ ligand library 준비
✔️ docking 수행
✔️ 후보 선별
✔️ 실험 검증
이 과정을 통해 연구자는 훨씬 넓은 chemical space를 탐색할 수 있게 됩니다.
실제 사례로 보는 HTVS: ALK 저해제 발굴


이러한 HTVS가 실제로 어떻게 활용되는지 이해하기 위해, ALK(Anaplastic Lymphoma Kinase) 단백질을 대상으로 한 연구를 살펴보겠습니다. (DOI: 10.1080/1062936X.2025.2496155)
이 연구에서는 약 5만 개의 화합물을 대상으로 스크리닝을 수행하여, 기존 저해제의 내성을 극복할 수 있는 새로운 후보를 찾는 것을 목표로 했습니다.
핵심 전략은 hierarchical screening입니다. 처음에는 빠른 계산 방식(HTVS)을 통해 약 17,000개의 후보를 남기고, 이후 SP 단계에서 약 3,500개, 마지막 XP 단계에서 236개까지 줄입니다. 이 구조는 매우 중요합니다.
“처음에는 속도, 마지막에는 정확도”
이후에는 단순 docking 결과만으로 판단하지 않고, 구조 기반 clustering, ADMET 예측, Molecular Dynamics까지 수행하여 최종 후보를 도출합니다.
Docking 알고리즘 비교: 무엇이 가장 좋은가?

그렇다면 실제로 어떤 도킹 알고리즘이 가장 효과적일까요? 해당 연구의 Virtual Screening 과정을 재현하기 위해 다음의 Docking tool들을 활용했습니다.
✔️ Discovery Studio (CDOCKER)
✔️ AutoDock-GPU
✔️ VinaGPU
✔️ DiffDock


총 23,600개의 docking pose를 분석한 결과, 흥미로운 차이가 나타났습니다.
우선 계산 속도에 있어 CPU 기반의 Docking 대비 GPU Docking이 약 30배 정도의 빠른 효율을 보여주었습니다. 게다가 VinaGPU는 RMSD 0.897 Å로 가장 정확한 구조 재현 능력을 보였습니다. AutoDock-GPU 역시 유사한 수준의 성능을 보이며 HTVS에 적합한 도구로 평가되었습니다.
반면, DiffDock은 AI 기반 모델임에도 불구하고 HTVS 환경에서는 상대적으로 낮은 성능을 보였습니다. 이는 아직 대규모 스크리닝 환경에서는 GPU 기반 물리 기반 도킹이 더 안정적이라는 점을 시사합니다.
결론적으로 “HTVS에서는 GPU 기반 도킹이 사실상 필수이며, VinaGPU가 가장 균형 잡힌 선택”입니다.
중요한 포인트: Consensus Docking
많은 연구에서 간과되는 중요한 포인트가 있습니다. 그것은 바로 특정 도킹 점수 자체가 절대적인 기준이 되기 어렵다는 것입니다. 각 도킹 알고리즘은 서로 다른 scoring function을 사용하기 때문에, 동일한 화합물이라도 ranking 결과가 달라질 수 있으며 실무 프로젝트에서도 실험 결과와 docking 계산 간의 상관관계는 일관되지 않게 나타나는 경우가 많습니다.
즉, 하나의 알고리즘만으로는 보편적인 최적 해를 정의하기 어렵습니다. 따라서 여러 도킹 결과를 종합적으로 비교하고 해석할수록 예측의 신뢰도와 정확도를 높일 수 있습니다. 이러한 관점에서 중요한 접근법이 바로 Consensus Docking 전략입니다. Consensus Docking은 여러 알고리즘에서 일관되게 상위에 등장하는 후보 물질에 주목하는 방식으로, 단일 방법에서는 놓칠 수 있는 유망 후보를 효과적으로 발굴할 수 있습니다.
Discovery Studio가 필요한 이유

여기서 자연스럽게 다음 질문이 나옵니다.
“오픈소스 기반의 GPU 도킹만으로 충분하지 않을까?”
Case Study 결과에서 확인할 수 있듯이, 속도가 빠른 GPU 기반 Docking만으로도 충분히 유의미한 후보 구조를 선별할 수 있습니다. 다만 이러한 연구를 수행하기 위해서는 일반적으로 Python이나 Shell Script와 같은 프로그래밍 기술이 요구됩니다.
하지만 최근에는 BIOVIA Discovery Studio와 같은 상용 플랫폼의 등장으로 이러한 진입 장벽이 크게 낮아지고 있습니다. Discovery Studio를 활용하면, 프로그래밍 지식 없이도 단순한 마우스 클릭과 Drag & Drop만으로 인실리코 기반 신약 설계의 전 과정을 수행할 수 있습니다.
또한 Docking뿐만 아니라 Molecular Dynamics, ADMET 예측, De novo design, Protein–Protein Interaction 분석 등 다양한 계산 시뮬레이션을 하나의 통합 환경에서 수행할 수 있다는 장점이 있습니다. 더불어 parallel processing(병렬 계산) 기능을 통해 대규모 계산을 동시에 처리할 수 있어, 연구 효율 또한 크게 향상됩니다.
마무리: HTVS 시대의 신약 개발 전략
지금까지 살펴본 내용을 정리하면 다음과 같습니다.
✔️ HTVS는 저분자 신약 개발의 핵심 기술
✔️ hierarchical screening이 효율을 결정
✔️ GPU 기반 도킹의 두드러진 계산 속도
✔️ consensus docking의 중요성
✔️ Discovery Studio는 누구나 사용하고 배우기 쉬운 신약개발 핵심 도구
이러한 요소들은 각각 독립적인 기술이라기보다, 하나의 workflow로 유기적으로 연결될 때 가장 큰 효과를 발휘합니다. 특히 최근 연구 환경에서는 단순히 하나의 도구를 선택하는 것이 아니라, GPU 기반 HTVS와 정밀 분석 플랫폼을 어떻게 조합할 것인가가 중요한 전략적 판단 요소가 되고 있습니다.
따라서 HTVS workflow를 구축하려는 연구자나, GPU 도킹 도입을 고민하는 연구팀, 또는 Discovery Studio 활용을 검토 중인 경우라면 현재 보유한 인프라와 연구 목적에 맞는 최적의 workflow를 설계하는 것이 무엇보다 중요합니다.
실제 연구 환경을 기준으로 도킹 전략 구성부터 workflow 설계, 도입 방향까지 구체적으로 고민하고 있다면, 이에 맞춘 적용 사례와 함께 현실적인 접근 방안을 확인해보는 것도 하나의 방법이 될 수 있습니다.
자주 묻는 질문 (Q&A)
Q1. HTVS에서 가장 중요한 요소는 무엇인가요?
초기 필터링과 정밀 docking의 균형입니다.
Q2. GPU 도킹이 필수인가요?
대규모 screening에서는 사실상 필수입니다.
Q3. 하나의 도킹 프로그램만 사용해도 되나요?
권장되지 않으며 consensus 접근이 필요합니다.
Q4. Discovery Studio는 언제 필요한가요?
validation, ADMET, 정밀 docking 단계에서 필수적입니다.
BIOVIA Discovery Studio 프로그램 및 사용법이 궁금하시다면 언제든 인실리코로 연락 주세요!
아래의 블로그 구독과Youtube 구독 버튼을 눌러주시면 더 많은 영상을 확인하실 수 있습니다. 감사합니다 :)
