앤트로픽 “AI 시스템, 스스로 더 발전하는 속도 빨라져”…재귀적 자기개선 우려 제기

앤트로픽은 인공지능(AI) 시스템이 더 발전된 AI의 개발 속도를 가속화하고 있다고 4일 밝혔다. 이 같은 흐름은 AI가 자율적으로 자신의 후속 모델을 만들어내는 재귀적 자기개선(recursive self-improvement)으로 이어질 수 있다는 우려를 키우고 있다.

2026년 6월 4일, 인베스팅닷컴의 보도에 따르면 앤트로픽은 내부 데이터에서 자사 엔지니어들이 분기당 작성하는 코드 규모가 2021년부터 2025년 사이보다 8배나 늘었다고 설명했다. 2026년 5월 기준으로는 앤트로픽 코드베이스에 병합된 코드의 80% 이상이 클로드(Claude)가 작성한 것으로 집계됐다. 앤트로픽은 클로드 코드(Claude Code)가 2025년 2월 연구용 미리보기 형태로 공개되기 전에는 이 비율이 한 자릿수 초반에 불과했다고 전했다.

여기서 클로드는 앤트로픽이 개발한 생성형 AI 모델이며, 코드 작성·분석·문서 초안 작성 등 다양한 업무를 수행할 수 있는 것으로 알려져 있다. Mythos Preview는 앤트로픽 연구팀이 활용한 AI 모델의 미리보기 버전으로, 내부 조사에서 직원들은 이를 사용했을 때 AI 없이 일할 때보다 산출물이 평균적으로 약 4배 많아졌다고 답했다. 앤트로픽은 2026년 3월 자사 연구팀 소속 직원 130명을 대상으로 한 설문에서, 응답자 중간값 기준으로 이 같은 결과가 나왔다고 밝혔다.

공개 벤치마크 역시 AI 모델의 향상 속도가 빨라지고 있음을 보여준다. AI 시스템이 스스로 안정적으로 완료할 수 있는 과제의 길이는 과거 약 7개월마다 두 배로 늘어났지만, 최근에는 그 주기가 4개월마다 두 배로 단축됐다. 이는 AI가 처리할 수 있는 작업의 복잡도와 지속 시간이 빠르게 늘고 있음을 뜻한다. 기술적으로 벤치마크는 모델의 성능을 같은 기준으로 비교하는 시험을 의미하며, 이번 수치는 AI 발전 속도가 단순한 점진적 개선이 아니라 가속 국면에 들어섰다는 점을 시사한다.

앤트로픽은 사례를 통해 이 변화를 구체적으로 제시했다. 2024년 3월 클로드 오푸스 3(Claude Opus 3)는 인간이 약 4분에 끝낼 수 있는 소프트웨어 작업을 수행할 수 있었고, 1년 뒤인 2025년에는 클로드 소네트 3.7(Claude Sonnet 3.7)가 약 1시간 30분이 걸리는 작업을 처리했다. 이어 2026년 3월에는 클로드 오푸스 4.6(Claude Opus 4.6)가 12시간짜리 작업까지 수행한 것으로 나타났다. 이는 AI가 단순 반복 업무를 넘어 장시간 이어지는 복합 과제를 맡는 방향으로 빠르게 진화하고 있음을 보여준다.

또한 앤트로픽은 2026년 5월 기준으로 클로드의 개방형 과제(open-ended tasks) 성공률이 76%에 도달했다고 밝혔다. 이는 6개월 만에 50%포인트 상승한 수치다. 개방형 과제는 정답이 하나로 정해져 있지 않고 탐색과 판단이 필요한 작업을 뜻한다. 앤트로픽은 2026년 4월 클로드가 AI 안전성 분야의 개방형 연구 프로젝트를 처음부터 끝까지 수행하는 시연도 공개했다고 전했다. 당시 클로드 기반 에이전트들은 AI 안전성에 관한 열린 문제를 부여받고 스스로 해결하도록 맡겨졌다.

앤트로픽은 인간 연구자 2명이 약 일주일에 걸쳐 성능 격차의 약 23%를 회복한 반면, 에이전트들은 약 18,000달러의 연산 자원을 들여 누적 800시간에 걸쳐 97%를 회복했다고 설명했다.

이는 AI 에이전트가 특정 조건에서는 인간 연구자의 개입 없이도 상당한 수준의 연구 수행 능력을 보일 수 있음을 시사한다. 다만 앤트로픽은 이러한 결과가 곧바로 완전한 자율성이나 광범위한 실용성을 의미하는 것은 아니라고 해석할 여지도 남겼다. 그럼에도 불구하고, 연산 자원과 시간 투입이 충분할 경우 AI가 복잡한 연구를 상당 부분 자체 완결할 수 있다는 점은 업계 전반에 중요한 신호로 받아들여진다.

앤트로픽은 최첨단(frontier) AI 개발 속도를 늦추는 것이 사회 제도와 정렬 연구(alignment research)가 기술 발전을 따라잡을 시간을 벌어주는 데 도움이 될 것이라고 봤다. 정렬 연구는 AI가 인간의 의도와 안전 기준에 맞게 작동하도록 만드는 연구를 뜻한다. 회사는 다른 개발자들도 검증 가능한 방식으로 동시에 속도를 늦추거나 일시 중단한다면, 자신들 역시 개발 속도를 늦추거나 잠시 중단할 수 있다고 밝혔다.

또한 앤트로픽 인스티튜트(Anthropic Institute)는 전 세계 최첨단 AI 개발자들이 실제로 개발을 멈추거나 늦췄는지 서로 검증할 수 있는 시스템을 구축하는 데 도움이 되는 연구를 수행할 계획이라고 설명했다. 이는 업계 전반의 협조와 투명성이 뒷받침되지 않으면 일방적인 속도 조절이 어렵다는 판단을 반영한 것으로 풀이된다. AI 기술 경쟁이 심화하는 가운데, 각 기업이 성능 개선과 안전성 확보 사이에서 어떤 균형을 택하느냐가 향후 시장과 규제 환경에 적지 않은 영향을 미칠 것으로 보인다. 특히 AI가 소프트웨어 개발, 연구, 자동화 영역에서 더 긴 작업을 수행할 수 있게 되면 생산성 향상 기대가 커지는 동시에, 인력 대체와 기술 통제 문제를 둘러싼 논의도 한층 거세질 전망이다.

이번 기사는 AI의 도움으로 작성됐으며 편집자의 검토를 거쳤다고 앤트로픽은 전했다. 회사는 관련 약관을 참고하라고 덧붙였다.