쿠퍼티노(미 캘리포니아주) 스티브 잡스 극장에서 열린 ‘Awe-Dropping’ 행사장 벽면에는 2025년 9월 9일 발표된 ‘AirPods Pro 3’가 전시돼 있었다. 관객들은 스타 트렉이나 은하수를 여행하는 히치하이커 같은 고전 SF 속 ‘보편 번역기’(Universal Translator)가 눈앞에 펼쳐지는 순간을 목격했다.
2025년 9월 12일, CNBC 뉴스 보도에 따르면 애플뿐 아니라 구글의 모기업 알파벳·메타 플랫폼스도 실시간 음성 번역 기능을 탑재한 기기를 잇달아 발표하며 ‘언어 장벽’ 해소에 나서고 있다. OpenAI ChatGPT 출시(2022년 11월) 이후 급가속한 생성형 인공지능(generative AI) 기술이 3년 만에 ‘즉시 통역’이라는 가시적 성과로 이어지고 있다는 평가다.
애플은 AirPods Pro 3(가격 250달러)를 다음 주 출시하면서 Live Translation을 핵심 기능으로 내세웠다. 사용자는 프랑스어·독일어·포르투갈어·스페인어를 “동시통역 수준”의 영어로 즉시 청취할 수 있다. 또한 두 사람이 각각 에어팟을 착용하고 대화하면 양방향 실시간 번역이 각자의 이어폰 안에서 동시 진행된다.
분석가들은 이를 ‘Apple Intelligence’ 전략의 전환점으로 본다. DA 데이비드슨의 길 루리아 애널리스트는 CNBC 인터뷰에서 “AirPods로 실제로 라이브 번역이 가능하다면, 대규모 기기 업그레이드를 촉발할 수준의 AI 획기적 진전
”이라고 말했다.
치열해지는 빅테크 번역 전장
경쟁사도 속도를 높이고 있다. 구글은 2025년 8월 20일 브루클린 ‘Made by Google’ 행사에서 Pixel 10 Pro Fold를 공개하며 ‘Voice Translate’ 기능을 시연했다. 해당 기능은 통화 중 상대방 음성을 사용자가 설정한 언어로 번역하고, 화자 고유의 억양까지 재현한다는 점이 특징이다. 소프트웨어 업데이트는 9월 15일(월)부터 배포된다.
메타는 올해 5월 ‘Ray-Ban Meta 스마트글라스’에 실시간 번역 기능을 탑재하겠다고 예고했다. 상대 언어를 안경 다리의 스피커로 들려주고, 응답은 사용자 스마트폰 화면에 문자로 표기된다. 메타는 9월 17일 열리는 ‘Meta Connect’ 기조연설에서 렌즈 한 쪽에 소형 디스플레이를 내장한 차세대 글라스를 발표할 것으로 예상된다.
한편 OpenAI는 6월 ChatGPT 음성 비서 모드를 시연했다. 이 기능은 자연스러운 통성명·번역·요약을 지원하며, 애플 Siri와도 통합돼 있다. 업계에서는 전(前) 애플 디자이너 조니 아이브가 참여하는 별도 하드웨어가 수년 내 등장할 것으로 본다.
번역·통역 직종에 드리운 그림자
실시간 번역 기술은 노동시장에도 파장을 일으킨다. 마이크로소프트리서치가 8월 발표한 연구에 따르면 “번역·통역사는 AI로 대체될 가능성이 가장 높은 직군”이며, 업무의 98%가 AI와 겹치는 것으로 나타났다.
전용 기기 vs. 범용 생태계
현재 시장에는 수백 달러 가격대의 ‘전용 번역기’도 다수 출시돼 있다. 일본 기업 Pocketalk의 미국 담당 총괄 조 밀러는 “애플이 문제의 시급성을 환기시켰다”고 평가한다. Pocketalk S 기기는 95개 언어를 음성·텍스트로 번역하며, 학교·병원 등 보안이 중요한 현장에서 활용도가 높다고 강조했다.
폴란드 Vasco Electronics의 알렉산데르 알스키 북미총괄은 “우리는 실제 언어학자(linguist)를 채용해 AI에 사람 손길을 더했다”며 “높은 정확도”를 차별점으로 내세웠다. Vasco는 화자의 목소리와 유사한 음색을 복제하는 기능도 지원한다.
시장조사업체 카날리스에 따르면, 2025년 1분기 애플은 무선 이어폰을 약 1,800만 대 출하했다. 전문가들은 “애플의 거대 이용자 기반이 번역 기술 대중화를 가속할 것”이라고 본다. 다만 Live Translation은 5개 언어로 제한돼 Pocketalk의 95개 언어에 못 미친다. 또 애플 공식 웹사이트에 따르면 EU 지역은 지원 대상에서 제외됐다.
‘생성형 AI’ 용어풀이※
‘생성형 인공지능’은 기존 데이터를 학습해 새로운 텍스트·음성·이미지를 창출하는 기술을 뜻한다. 번역 분야에서는 문맥과 어조를 고려한 ‘자연어 생성’ 덕분에 즉각적이면서도 자연스러운 표현이 가능해졌다.
또한 ‘동시통역’은 화자가 말하는 동시에 통역사가 번역하는 고난도 기법으로, 지연(latency)이 1~2초 이내일 때 실시간으로 간주한다. 애플·구글·메타가 겨루는 영역이 바로 이 구간이다.
전망과 과제
① 언어 다양성 확대 — 글로벌 사용자 확보를 위해서는 지원 언어·방언을 대폭 늘려야 한다. 특히 아시아·아프리카 지역 언어 지원 여부가 관건이다.
② 개인정보 보호 — 학교·병원처럼 민감 정보가 오가는 현장에선 온디바이스(기기 내 처리) 방식을 통한 데이터 비식별화가 요구된다. 애플은 ‘프라이버시 우선’ 전략을 강조하지만, 구체적 암호화 수준은 아직 공개되지 않았다.
③ 음성 합성(Speech Synthesis) 기술 — 구글과 바스코 일렉트로닉스처럼 화자의 음색을 복제할 경우, 악용 가능성(딥페이크 음성)도 커진다. 규제와 기술적 보호장치가 병행돼야 한다.
결국 경쟁의 승패는 정확도·지연 시간·언어 범위·프라이버시 네 축에서 갈릴 전망이다. 애플·구글·메타·OpenAI가 구축하는 생태계가 ‘포스트 스마트폰’ 시대의 필수 인터페이스가 될지, 혹은 전문 번역 기기와 공존하게 될지는 아직 미지수다.
“이것은 사치성 관광을 위한 장난감이 아니라, 언어와 마찰이 만나는 지점에서 필수 대화를 가능케 하는 기술이다.” — Pocketalk 조 밀러 총괄
애플은 CNBC의 질의에 응답하지 않았다.
ⓒ 2025 CNBC Reproduction Prohibited