구글(NASDAQ:GOOGL)의 딥마인드가 인간 DNA의 유전적 변이가 유전자 조절을 담당하는 생물학적 과정에 미치는 영향을 예측하기 위해 설계된 새로운 인공지능 도구인 알파지놈을 공개했다.
이 AI 모델은 최대 100만 개의 DNA 염기쌍을 분석하고 조절 활동과 관련된 수천 가지 분자 속성을 예측할 수 있다. 또한 변이와 비변이 염기서열 간의 예측을 비교하여 유전 변이의 영향을 평가할 수 있다. 딥마인드는 이 알파지놈을 비상업적 연구 목적으로 API를 통해 미리볼 수 있게 하고, 향후 전체 모델을 출시할 계획이다.
이 새로운 도구는 딥마인드의 이전 유전체 모델인 엔포머를 기반으로 하며, 유전체의 단 2%를 차지하는 단백질 코딩 영역에 중점을 두는 알파미센스와 보완된다. 알파지놈은 유전자 활동을 지휘하고 많은 질병 연관 변이를 포함하는 나머지 98%의 비코딩 영역을 해석하는 것이 목표다.
딥마인드에 따르면, 알파지놈은 기존의 DNA 서열 모델에 비해 여러 가지 이점을 제공한다. 길고 복잡한 서열 분석을 높은 해상도로 수행하고, 다양한 생물학적 과정을 아우르는 종합적인 예측을 제공하며, 효율적인 변이 채점과 새로운 스플라이스 접합 모델링을 가능하게 한다.
회사는 단일 DNA 서열의 예측을 생성할 때 24개의 평가 중 22개에서 최상의 외부 모델을 능가했다고 보고했다. 변이의 조절 효과를 예측할 때는 26개의 평가 중 24개에서 상위 성능을 보였거나 이를 초과했다.
「알파지놈은 이 분야에 강력한 도구가 될 것이다. 비코딩 영역의 다양한 변이의 중요성을 파악하는 것은 특히 대규모로 수행할 때 매우 어려운 작업이다」라고 런던 대학의 마크 만수르 교수가 말했다. 「이 도구는 암과 같은 질병을 이해하는 데 있어 중요한 연결고리를 제공할 것이다」
메모리얼 슬론 케터링 암 센터의 케일럽 라로 박사는 이를 「이 분야의 중대 사건」이라고 부르며 「처음으로, 우리는 전 범위의 유전체 작업에 걸쳐 장기적 맥락, 염기 수준의 정밀도 및 최첨단 성능을 통합하는 단일 모델을 가졌다」고 언급했다.
딥마인드는 알파지놈이 질병 이해, 합성 생물학 및 기본 유전체 연구를 진전시킬 수 있을 것으로 제안했다. 이 회사는 T-세포 급성 림프구 백혈병의 암 관련 변이를 조사하기 위해 이 도구를 사용하여 알려진 질병 메커니즘을 성공적으로 재현함으로써 그 가능성을 입증했다.
그 능력에도 불구하고, 딥마인드는 매우 먼 조절 요소의 영향을 포착하는 것과 구체적인 세포 패턴 인식을 향상하는 데 현재의 한계점을 인정하고 있다. 알파지놈은 연구 목적 전용이므로 임상 응용에 대한 검증은 이루어지지 않았다.