인공지능 스타트업으로 잘 알려진 SandboxAQ는 수요일에 새로운 대규모 데이터세트를 공개하여 약물 발견을 가속화하려고 한다고 밝혔다. 이 데이터는 인체 내 약물이 단백질과 어떻게 결합하는지를 과학자들이 예측하는 데 도움을 준다.
2025년 6월 18일, 인베스팅닷컴의 보도에 따르면 이 회사는 Alphabet의 Google로부터 스핀아웃되어 현재까지 거의 10억 달러 가까운 벤처 자본을 유치했다. 이 데이터는 전통적인 실험실 실험 대신, Nvidia의 칩을 사용하여 생성되었으며, 이는 제약 분자가 목표 단백질에 결합할지를 신속하게 결정하는 AI 모델에 포함될 것이다.
SandboxAQ의 접근 방식은 전통적인 과학 계산과 AI의 발전을 결합하여 약물 발견에서의 근본적인 도전을 해결하려 한다. 과학자들은 원자 결합을 예측할 수 있는 방정식을 가지고 있지만, 3차원 약물 분자를 다룰 때 계산은 현대 컴퓨터로도 지나치게 복잡해진다.
회사 측에서는 약 520만 개의 새로운 ‘합성’ 3차원 분자를 기존 실험 데이터에 기반하여 계산했다. 이러한 분자들은 실제 세계에서는 관찰된 적이 없지만, 실제 데이터에 기반한 방정식을 사용해 도출되었다. 이 공개된 데이터세트는 약물-단백질 결합 예측 시 수작업 계산보다 훨씬 빠르고 정확성을 유지할 수 있도록 AI 모델을 훈련시킬 수 있다.
SandboxAQ는 이 데이터를 활용하여 개발한 AI 모델을 상업화할 계획이며, 실험실 실험과 유사한 결과를 가상 환경 속에서 달성하고자 한다. SandboxAQ의 AI 시뮬레이션 총괄 매니저인 나디아 하렌은 화요일 다른 생물학 산업 문제들과 마찬가지로 이를 해결하려고 노력해왔다고 전했다. 그에 따르면 “이 모든 계산 구조물은 실험적 데이터에 기초 tagged되어 있어서, 이 데이터세트를 선택하고 모델을 훈련할 때 이러한 합성 데이터를 그 동안 해보지 않았던 방식으로 사용할 수 있다.”라고 설명했다.