News & Notice
New Ways to New Materials by Insilico

HTVS 기반 저분자 신약 개발: Docking 성능 비교와 고속 가상 스크리닝 소개


HTVS 기반 저분자 신약 개발: Docking 성능 비교와 고속 가상 스크리닝 소개

최근 제약·바이오 산업은 AI와 인실리코 기술의 발전과 함께 빠르게 변화하고 있습니다. 특히 저분자 화합물 기반 신약 개발에서는 단순히 좋은 후보를 찾는 것을 넘어, 얼마나 빠르고 효율적으로 후보를 선별할 수 있는지가 연구 경쟁력을 결정짓는 핵심 요소가 되었습니다.

이러한 흐름 속에서 등장한 기술이 바로 HTVS(High Throughput Virtual Screening)입니다. HTVS는 수많은 화합물을 동시에 평가하여 유망 후보를 빠르게 선별하는 기술로, 현재 대부분의 인실리코 신약 개발 과정에서 필수적으로 활용되고 있습니다. 하지만 실제 연구를 진행하다 보면 다음과 같은 고민이 자연스럽게 따라옵니다.

“어떤 도킹 알고리즘을 선택해야 하는가?”

“얼마나 많은 분자들을 가상 스크리닝 할 수 있는가?

“오픈소스 도구만으로 충분한가, 아니면 상용 솔루션이 필요한가?”

이 글에서는 이러한 질문에 답하기 위해, 신약 개발 구조부터 HTVS의 개념, 실제 연구 사례, 그리고 도킹 성능 비교까지 단계적으로 정리해보겠습니다.


모달리티작용 기전주요 타겟장점한계
Small MoleculesTarget Inhibition효소, 수용체
(Binding Pocket)
경구 투여,
높은 투과성
Off-Target 독성위험
PeptideProt-Prot Interation Modulation단백질-단백질 상호작용높은 선택성,
낮은 Off-Target 독성위험
생체 내 낮은 안정성, 주사제 필요
AntibodyAntigen Recognition세포 외 단백질 / 항원매우 높은 특이성높은 제조 비용,
낮은 조직 투과성
Targeted Protein DegradationTargeted Protein Degradation세포 내 단백질(Undruggable 포함)Undruggable Target 공략높은 분자량,
설계 난이도 높음

신약 개발은 단일한 방법으로 이루어지지 않습니다. 현재는 크게 세 가지 모달리티를 기반으로 연구가 진행됩니다.

가장 전통적이면서도 여전히 중심이 되는 방식은 Small Molecule, 즉 저분자 화합물 기반 접근입니다. 이 방식은 질병의 원인이 되는 단백질의 활성 부위에 특정 화합물이 결합하여 기능을 억제하는 원리를 기반으로 합니다. 우리가 흔히 말하는 docking 기반 신약 설계가 바로 이 영역에 해당합니다.

한편, 최근에는 펩타이드나 항체를 활용하는 Biologics 접근도 활발히 연구되고 있습니다. 이 방식은 저분자보다 훨씬 큰 분자를 활용하여 표적 단백질을 정밀하게 인식한다는 특징이 있습니다. 특히 펩타이드는 넓은 결합 면적을 활용하여 높은 특이성을 확보할 수 있다는 장점이 있지만, 체내 안정성이 낮고 주사제 형태가 필요하다는 한계를 가집니다.

그리고 최근 가장 주목받는 분야는 TPD(Targeted Protein Degradation)입니다. 대표적으로 PROTAC이 있으며, 이는 단백질을 단순히 억제하는 것이 아니라 아예 분해시키는 방식입니다. 기존 기술로 접근이 어려웠던 undruggable target까지 공략할 수 있다는 점에서 매우 혁신적인 접근으로 평가됩니다. 결국 중요한 것은, 어떤 방식이 더 우수하냐가 아니라 “타겟과 질환에 맞는 최적의 전략을 선택하는 것” 입니다. 오늘은 이러한 관점에서, 오랜 기간 연구되어 온 저분자 화합물 기반 신약 개발을 중심으로, 최근 컴퓨터 기술의 발전으로 가능해진 고효율 가상 스크리닝 기법인 HTVS에 대해 말씀드리고자 합니다.


HTVS(High Throughput Virtual Screening)는 대규모 화합물 라이브러리를 계산 기반으로 신속하게 평가하여 유망 후보를 선별하는 기술입니다. 그러나 HTVS는 단순히 docking을 빠르게 수행하는 것에 그치지 않고, 나아가 방대한 화학 공간을 효율적으로 탐색하기 위한 전략적 접근 방식입니다. 이는 과거 수백에서 수천 개의 화합물을 실험적으로 검증하던 방식에서 벗어나, 수백만 개 이상의 후보 물질을 사전에 계산으로 선별할 수 있도록 해주는 핵심 기술입니다.

이로 인해 연구 방식 자체가 변화했습니다.

✔️ 실험 횟수 감소

✔️ 초기 후보 탐색 속도 증가

✔️ 새로운 binding 패턴 발견 가능

특히 최근에는 GPU 기반 연산과 AlphaFold와 같은 단백질 구조 예측 기술이 결합되면서,
HTVS는 이제 million을 넘어서 billion 단위의 분자까지, 즉 방대한 화학 공간을 탐색할 수 있는 수준으로 확장되고 있습니다. 이러한 HTVS의 일반적인 workflow는 다음과 같습니다.

타겟 단백질 선정

✔️ 구조 확보

✔️ ligand library 준비

✔️ docking 수행

✔️ 후보 선별

✔️ 실험 검증

이 과정을 통해 연구자는 훨씬 넓은 chemical space를 탐색할 수 있게 됩니다.


이러한 HTVS가 실제로 어떻게 활용되는지 이해하기 위해, ALK(Anaplastic Lymphoma Kinase) 단백질을 대상으로 한 연구를 살펴보겠습니다. (DOI: 10.1080/1062936X.2025.2496155)

이 연구에서는 약 5만 개의 화합물을 대상으로 스크리닝을 수행하여, 기존 저해제의 내성을 극복할 수 있는 새로운 후보를 찾는 것을 목표로 했습니다.

핵심 전략은 hierarchical screening입니다. 처음에는 빠른 계산 방식(HTVS)을 통해 약 17,000개의 후보를 남기고, 이후 SP 단계에서 약 3,500개, 마지막 XP 단계에서 236개까지 줄입니다. 이 구조는 매우 중요합니다.

“처음에는 속도, 마지막에는 정확도”

이후에는 단순 docking 결과만으로 판단하지 않고, 구조 기반 clustering, ADMET 예측, Molecular Dynamics까지 수행하여 최종 후보를 도출합니다.


그렇다면 실제로 어떤 도킹 알고리즘이 가장 효과적일까요? 해당 연구의 Virtual Screening 과정을 재현하기 위해 다음의 Docking tool들을 활용했습니다.

✔️ Discovery Studio (CDOCKER)

✔️ AutoDock-GPU

✔️ VinaGPU

✔️ DiffDock

총 23,600개의 docking pose를 분석한 결과, 흥미로운 차이가 나타났습니다.

우선 계산 속도에 있어 CPU 기반의 Docking 대비 GPU Docking이 약 30배 정도의 빠른 효율을 보여주었습니다. 게다가 VinaGPU는 RMSD 0.897 Å로 가장 정확한 구조 재현 능력을 보였습니다. AutoDock-GPU 역시 유사한 수준의 성능을 보이며 HTVS에 적합한 도구로 평가되었습니다.

반면, DiffDock은 AI 기반 모델임에도 불구하고 HTVS 환경에서는 상대적으로 낮은 성능을 보였습니다. 이는 아직 대규모 스크리닝 환경에서는 GPU 기반 물리 기반 도킹이 더 안정적이라는 점을 시사합니다.

결론적으로 “HTVS에서는 GPU 기반 도킹이 사실상 필수이며, VinaGPU가 가장 균형 잡힌 선택”입니다.


많은 연구에서 간과되는 중요한 포인트가 있습니다. 그것은 바로 특정 도킹 점수 자체가 절대적인 기준이 되기 어렵다는 것입니다. 각 도킹 알고리즘은 서로 다른 scoring function을 사용하기 때문에, 동일한 화합물이라도 ranking 결과가 달라질 수 있으며 실무 프로젝트에서도 실험 결과와 docking 계산 간의 상관관계는 일관되지 않게 나타나는 경우가 많습니다.

즉, 하나의 알고리즘만으로는 보편적인 최적 해를 정의하기 어렵습니다. 따라서 여러 도킹 결과를 종합적으로 비교하고 해석할수록 예측의 신뢰도와 정확도를 높일 수 있습니다. 이러한 관점에서 중요한 접근법이 바로 Consensus Docking 전략입니다. Consensus Docking은 여러 알고리즘에서 일관되게 상위에 등장하는 후보 물질에 주목하는 방식으로, 단일 방법에서는 놓칠 수 있는 유망 후보를 효과적으로 발굴할 수 있습니다.


여기서 자연스럽게 다음 질문이 나옵니다.

“오픈소스 기반의 GPU 도킹만으로 충분하지 않을까?”

Case Study 결과에서 확인할 수 있듯이, 속도가 빠른 GPU 기반 Docking만으로도 충분히 유의미한 후보 구조를 선별할 수 있습니다. 다만 이러한 연구를 수행하기 위해서는 일반적으로 Python이나 Shell Script와 같은 프로그래밍 기술이 요구됩니다.

하지만 최근에는 BIOVIA Discovery Studio와 같은 상용 플랫폼의 등장으로 이러한 진입 장벽이 크게 낮아지고 있습니다. Discovery Studio를 활용하면, 프로그래밍 지식 없이도 단순한 마우스 클릭과 Drag & Drop만으로 인실리코 기반 신약 설계의 전 과정을 수행할 수 있습니다.

또한 Docking뿐만 아니라 Molecular Dynamics, ADMET 예측, De novo design, Protein–Protein Interaction 분석 등 다양한 계산 시뮬레이션을 하나의 통합 환경에서 수행할 수 있다는 장점이 있습니다. 더불어 parallel processing(병렬 계산) 기능을 통해 대규모 계산을 동시에 처리할 수 있어, 연구 효율 또한 크게 향상됩니다.


지금까지 살펴본 내용을 정리하면 다음과 같습니다.

✔️ HTVS는 저분자 신약 개발의 핵심 기술

✔️ hierarchical screening이 효율을 결정

✔️ GPU 기반 도킹의 두드러진 계산 속도

✔️ consensus docking의 중요성

✔️ Discovery Studio는 누구나 사용하고 배우기 쉬운 신약개발 핵심 도구

이러한 요소들은 각각 독립적인 기술이라기보다, 하나의 workflow로 유기적으로 연결될 때 가장 큰 효과를 발휘합니다. 특히 최근 연구 환경에서는 단순히 하나의 도구를 선택하는 것이 아니라, GPU 기반 HTVS와 정밀 분석 플랫폼을 어떻게 조합할 것인가가 중요한 전략적 판단 요소가 되고 있습니다.

따라서 HTVS workflow를 구축하려는 연구자나, GPU 도킹 도입을 고민하는 연구팀, 또는 Discovery Studio 활용을 검토 중인 경우라면 현재 보유한 인프라와 연구 목적에 맞는 최적의 workflow를 설계하는 것이 무엇보다 중요합니다.

실제 연구 환경을 기준으로 도킹 전략 구성부터 workflow 설계, 도입 방향까지 구체적으로 고민하고 있다면, 이에 맞춘 적용 사례와 함께 현실적인 접근 방안을 확인해보는 것도 하나의 방법이 될 수 있습니다.


Q1. HTVS에서 가장 중요한 요소는 무엇인가요?

초기 필터링과 정밀 docking의 균형입니다.

Q2. GPU 도킹이 필수인가요?

대규모 screening에서는 사실상 필수입니다.

Q3. 하나의 도킹 프로그램만 사용해도 되나요?

권장되지 않으며 consensus 접근이 필요합니다.

Q4. Discovery Studio는 언제 필요한가요?

validation, ADMET, 정밀 docking 단계에서 필수적입니다.


BIOVIA Discovery Studio 프로그램 및 사용법이 궁금하시다면 언제든 인실리코로 연락 주세요!

아래의 블로그 구독Youtube 구독 버튼을 눌러주시면 더 많은 영상을 확인하실 수 있습니다. 감사합니다 :)

인실리코 DX사업분야 로고

개인정보처리방침

주)인실리코(이하 “회사”라고 함)은 정보주체의 자유와 권리 보호를 위해 개인정보보호법 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 개인정보보호법 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립∙공개합니다.

제1조 총칙
“개인정보”란 생존하는 개인에 관한 정보로써 성명, 주민등록번호 등의 사항에 의해 당해 개인을 식별할 수 있는 정보(당해 정보만으로는 특정 개인을 식별할 수 없더라도 다른 정보와 용이하게 결합하여 식별할 수 있는 것을 포함)를 말합니다. “정보주체”란 처리되는 정보에 의하여 확인될 수 있는 사람으로서 그 정보의 주체가 되는 사람을 말합니다. 회사는 개인정보처리방침을 웹 사이트 첫 화면에 공개함으로써 언제나 쉽게 확인할 수 있도록 하고 있습니다. 또한, 개인정보처리방침을 개정하는 경우 웹 사이트를 통하여 공지(또는 개별공지)할 것입니다. 각 사업부문은 업무특성에 맞게 별도의 개인정보처리방침으로 운영될 수 있습니다. 이런 경우 각 사업부문의 개인정보처리방침이 우선 적용되며, 해당 웹 사이트에 공지된 개인정보처리방침을 확인하시기 바랍니다.

제2조 개인정보 처리 항목 및 목적
회사는 서비스 제공을 위해 필요한 최소한의 범위 내에서 개인정보를 처리하고 있으며, 처리하고 있는 개인정보는 다음의 목적 이외의 용도로 이용되지 않습니다.

①처리 항목
가)문의사항 등록 시 수집항목 : 성명, 회사명, 이메일, 전화번호, 소속부서
나)내∙외부 감사 제보 등록 시 수집항목 : 이메일
다)웹 사이트 이용과정에서 자동 생성되어 수집되는 항목 : 접속 IP 정보, 서비스 이용기록, 접속 로그, 쿠키, MAC주소

②처리 목적
가)사용자 식별, 사용자 문의 대응, 제안∙불만·AS처리 등의 민원처리
나)접속빈도 파악 및 서비스 이용 통계 수집 등 사용자 서비스 이용 분석을 통한 안정적 서비스 운영 및 품질 향상

제3조 개인정보의 처리 및 보유기간
회사는 개인정보의 수집 및 이용 목적이 달성된 후에는 해당 정보를 지체 없이 파기합니다. 다만, 다음의 정보에 대해서는 아래의 이유로 명시한 기간 동안 보유하며, 필요시 정보주체의 동의를 받습니다.

① 문의사항 등록 시 수집항목
– 보유 기간 : 5년
– 보유 이유 : 사용자 식별, 사용자 문의 대응, 민원처리, 공지사항 전달

② 내∙외부 감사 제보 등록 시 수집항목
– 보유 기간 : 3년
– 보유 이유 : 사용자 식별, 부정비리 제보, 민원처리

③ 웹 사이트 이용과정에서 자동 생성되어 수집되는 항목
– 보유 기간 : 3년
– 보유 이유 : 접속빈도 파악 및 서비스 이용 통계 수집

제4조 개인정보의 파기
회사는 개인정보 보유기간의 경과, 처리 목적 달성 등 개인정보가 불필요하게 되었을 때에는 지체 없이 해당 개인정보를 파기합니다. 정보주체로부터 동의 받은 개인정보 보유기간이 경과하거나 처리 목적이 달성되었음에도 불구하고 다른 법령에 따라 개인정보를 계속 보존하여야 하는 경우에는, 해당 개인정보를 별도의 데이터베이스(DB)로 옮기거나 보관장소를 달리하여 보존합니다. 개인정보 파기의 방법은 다음과 같습니다.
① 전자적 파일 형태로 기록∙저장된 개인정보는 기록을 재생할 수 없는 기술적 방법을 통하여 삭제합니다.
② 종이 문서에 기록∙저장된 개인정보는 분쇄기로 분쇄하거나 소각하여 파기합니다.

제5조 개인정보의 제3자 제공
회사는 개인정보를 수집한 목적 범위에서 개인정보를 이용하며, 그 범위를 초과하여 개인정보를 이용하거나 제3자에게 제공∙공유하지 않습니다. 다만, 다음의 경우는 예외로 합니다.

① 정보주체로부터 별도의 동의를 받은 경우
② 다른 법률에 특별한 규정이 있는 경우
③ 정보주체 또는 그 법정대리인이 의사표시를 할 수 없는 상태에 있거나 주소불명 등으로 사전 동의를 받을 수 없는 경우로서 명백히 정보주체 또는 제3자의 급박한 생명, 신체, 재산의 이익을 위하여 필요하다고 인정되는 경우
④ 통계작성 및 학술연구 등의 목적을 위하여 필요한 경우로서 특정 개인을 알아볼 수 없는 형태로 개인정보를 제공하는 경우
⑤ 개인정보를 목적 외의 용도로 이용하거나 이를 제3자에게 제공하지 아니하면 다른 법률에서 정하는 소관 업무를 수행할 수 없는 경우로서 보호위원회의 심의∙의결을 거친 경우
⑥ 조약, 그 밖의 국제협정의 이행을 위하여 외국정부 또는 국제기구에 제공하기 위하여 필요한 경우
⑦ 범죄의 수사와 공소의 제기 및 유지를 위하여 필요한 경우
⑧ 법원의 재판업무 수행을 위하여 필요한 경우
⑨ 형(刑) 및 감호, 보호처분의 집행을 위하여 필요한 경우

제6조 개인정보처리의 위탁
회사는 고객의 개인정보를 외부 업체에 위탁하고 있지 않습니다. 향후 위탁 업무가 발생할 경우에는 지체 없이 본 개인정보처리방침을 통하여 공개하도록 하겠습니다.

제7조 정보주체의 권리·의무 및 행사방법
정보주체는 회사에 대해 언제든지 다음 각 호의 개인정보 보호 관련 권리를 행사할 수 있습니다.

① 개인정보 열람 요구
② 오류 등이 있을 경우 정정 요구
③ 삭제 요구
④ 처리정지 요구

개인정보 보호 관련 권리 행사는 회사에 대해 서면, 전자우편, FAX 등을 통하여 할 수 있으며 회사는 이에 대해 지체 없이 조치하겠습니다.
정보주체가 개인정보의 오류 등에 대한 정정 또는 삭제를 요구한 경우에는 회사는 정정 또는 삭제를 완료할 때까지 당해 개인정보를 이용하거나 제공하지 않습니다.

권리 행사는 정보주체의 법정대리인이나 위임을 받은 자 등 대리인을 통하여 하실 수 있습니다. 이 경우 위임장을 제출하셔야 합니다.

제8조 개인정보의 안정성 확보조치
회사는 개인정보의 안전성 확보를 위해 다음과 같은 조치를 취하고 있습니다.

① 관리적 조치 : 내부관리계획 수립∙시행, 정기적 직원 교육 등
② 기술적 조치 : 외부접근통제시스템 설치, 백신프로그램을 이용한 컴퓨터바이러스 피해 방지, 암호알고리즘을 이용한 네트워크 상의 개인정보 전송 보안장치(SSL) 등
③ 물리적 조치 : 전산실, 자료보관실 등의 접근통제

제9조 개인정보 자동수집 장치의 설치, 운영 및 그 거부에 관한 사항
회사는 귀하의 정보를 수시로 저장하고 찾아내는 ‘쿠키(cookie)’ 등을 운용합니다. 쿠키란 회사의 웹 사이트를 운영하는데 이용되는 서버가 귀하의 브라우저에 보내는 아주 작은 텍스트 파일로써 귀하의 컴퓨터 하드디스크에 저장됩니다.

회사는 다음과 같은 목적을 위해 쿠키를 사용합니다.
① 접속 빈도나 방문 시간 등을 분석, 이용자의 취향과 관심분야를 파악 및 자취 추적
② 각종 이벤트 참여 정도 및 방문 회수 파악 등을 통한 타겟 마케팅 및 개인 맞춤 서비스 제공

귀하는 쿠키 설치에 대한 선택권을 가지고 있습니다. 따라서, 귀하는 웹 브라우저에서 옵션을 설정함으로써 모든 쿠키를 허용하거나, 쿠키가 저장될 때마다 확인을 거치거나, 모든 쿠키의 저장을 거부할 수도 있습니다.

쿠키 설정을 거부하는 방법으로는 귀하가 사용하는 웹 브라우저의 옵션을 선택함으로써 모든 쿠키를 허용하거나 쿠키를 저장할 때마다 확인을 거치거나, 모든 쿠키의 저장을 거부할 수 있습니다.

– 설정방법 예시 (인터넷 익스플로러의 경우) : 웹 브라우저 상단의 도구 > 인터넷 옵션 > 개인정보

단, 귀하께서 쿠키 설치를 거부하였을 경우 서비스 제공에 어려움이 있을 수 있습니다.

제10조 개인정보 보호책임자
회사는 개인정보를 보호하고 개인정보 처리와 관련한 불만처리를 위하여 다음과 같이 개인정보 보호책임자를 지정하고 있습니다.

– 개인정보 정보 보호책임자 : 기획실 김민경 팀장, 031-495-6932(120), mkkim@insilico.co.kr

정보 주체께서는 회사의 서비스를 이용하시면서 발생한 모든 개인정보 보호 관련 문의, 불만처리, 피해구제 등에 관한 사항을 개인정보 보호책임자에게 문의하실 수 있습니다. 회사는 정보주체의 문의에 대하여 신속히 답변 및 처리를 해드릴 것입니다.

기타 개인정보침해에 대한 신고나 상담이 필요하신 경우, 다음 기관에 문의하시기 바랍니다.
– 개인정보 침해신고센터(privacy.kisa.or.kr/118)
– 개인정보 분쟁조정위원회(www.kopico.go.kr/1833-6972)
– 대검찰청 사이버수사과(www.spo.go.kr/1301)
– 경찰청 사이버안전국(cyberbureau.police.go.kr/182)

제11조 개인정보 처리방침 변경
이 개인정보 처리방침은 2023년 6월 1일부터 적용됩니다. (최초고지)