샌프란시스코 (로이터 통신) – 엔비디아(NASDAQ:NVDA)의 지원을 받는 인공지능(AI) 스타트업인 SandboxAQ가 구글(Alphabet)의 자회사로부터 분사된 뒤 과학자들이 약물이 단백질에 붙는 방식을 이해하는 것을 돕기 위해 새로운 데이터를 수요일에 발표했다.
이 데이터의 목표는 과학자들이 약물이 인체 내 목표에 결합할지를 예측하는 데 도움을 주는 것이다. 하지만 이 데이터는 실제 실험에서 나온 것이 아니라, SandboxAQ가 약 10억 달러의 벤처 자금을 모아 엔비디아의 칩을 사용해 생성한 데이터로, AI 모델에 피드백을 제공하여 과학자들이 작은 분자 형태의 약물이 과학자들이 목표로 하고 있는 단백질에 결합할 것인지 빠르게 예측할 수 있도록 돕는 것이 목표이다. (2025년 6월 18일, 로이터 통신의 보도에 따르면)
예를 들어, 약물이 질병의 진행과 같은 생물학적 과정을 억제하기 위해 설계된 경우, 과학자들은 이 도구를 사용하여 약물 분자가 해당 과정에 관련된 단백질에 결합할 가능성이 있는지를 예측할 수 있다.
이 방식은 전통적인 과학적 계산 기법과 AI의 발전을 결합한 새로운 분야로, 많은 분야에서 과학자들은 원자들이 분자로 결합하는 방식을 정확히 예측할 수 있는 방정식을 오랫동안 가져왔다. 그러나 상대적으로 작은 3차원 약물 분자에 대해 모든 가능한 조합은 오늘날의 가장 빠른 컴퓨터로도 수동으로 계산하기에는 너무 방대하다. 그래서 SandboxAQ의 접근법은 기존 실험 데이터를 사용하여 약 520만 개의 새로운 ‘합성’ 3차원 분자를 계산하는 것이다. 이는 실제 세계에서 관찰된 것은 아니지만, 실세계 데이터를 기반으로 한 방정식으로 계산된 것이다.
SandboxAQ는 이 합성 데이터를 공개하여 과학자들이 새로운 약물 분자가 목표로 하는 단백질에 결합할 가능성을 더욱 빠르게 예측할 수 있도록 AI 모델을 훈련하는 데 사용할 수 있다. SandboxAQ는 이 데이터를 이용해 개발된 자체 AI 모델에 대해 비용을 청구할 예정이며, 이는 실험실 실험을 가상으로 수행하는 것과 맞먹는 결과를 가져올 것으로 기대된다.
SandboxAQ의 AI 시뮬레이션 총괄 매니저인 나디아 하렌은 화요일 로이터와의 인터뷰에서 “생물학에서 오랫동안 존재했던 문제를 산업 전체가 해결하고자 했습니다.”라며, “모든 계산적으로 생성된 구조는 실험적 데이터에 연결되어 있어, 이 데이터 세트를 선택해 모델을 훈련할 때 합성 데이터를 종전에 없던 방식으로 사용할 수 있습니다.”라고 밝혔다.