2025년 첫 주, AI 업계는 그 어느 때보다 역동적인 움직임을 보였습니다. 마이크로소프트의 의료 진단 AI가 의사를 압도하는 성과를 보인 가운데, OpenAI의 차세대 기능이 유출되고, 중국 바이두가 오픈소스 모델로 글로벌 경쟁에 뛰어들었습니다. 한편으로는 AI 에이전트의 현실적 한계가 드러나기도 했죠. 이번 주는 AI의 놀라운 가능성과 현실적 도전이 동시에 부각된 한 주였습니다.
마이크로소프트가 개발한 다중 에이전트 AI 시스템 'MAI-DxO'가 의료계에 충격을 주고 있습니다. 무스타파 술레이만 팀이 개발한 이 시스템은 뉴잉글랜드 의학저널의 복잡한 의료 사례를 85%의 정확도로 진단해냈습니다. 이는 맹검 테스트에서 20%의 정확도를 보인 인간 의사들을 크게 앞선 결과입니다.
이 성과는 단순히 정확도의 문제가 아닙니다. AI가 의료진의 진단 과정을 보완하고, 특히 복잡하고 희귀한 질환의 진단에서 새로운 가능성을 열어주고 있는 것입니다. 비용 효율성까지 고려하면, 의료 접근성 향상에도 큰 기여를 할 것으로 예상됩니다.
ChatGPT의 웹 및 안드로이드 베타 버전에서 유출된 코드가 AI 커뮤니티를 들썩이게 했습니다. 'Operator'와 유사한 도구가 통합되어 있다는 것인데, 이는 AI가 클릭, 드래그, 타이핑, API 호출 등을 원격 브라우저나 샌드박스 환경에서 직접 수행할 수 있게 해줍니다.
이는 단순한 텍스트 생성을 넘어서 실제 컴퓨터 작업을 수행하는 AI의 등장을 의미합니다. GPT-5의 능력을 암시하는 이 기능은 AI가 우리의 디지털 업무 환경에서 진정한 어시스턴트 역할을 할 수 있는 가능성을 보여줍니다.
중국의 바이두가 Apache 2.0 라이선스로 ERNIE 4.5 비전-언어 모델과 대규모 언어 모델 제품군을 공개했습니다. 이들 모델은 DeepSeek v3와 Qwen 235B를 능가하고, OpenAI의 O1과도 경쟁할 수 있다고 주장합니다.
이는 오픈소스 AI 생태계에 중요한 변화를 가져올 것으로 보입니다. 특히 중국의 주요 기업이 이렇게 대규모로 오픈소스 모델을 공개한 것은 글로벌 AI 경쟁 구도에 새로운 역학을 만들어낼 것입니다. 개발자들과 연구자들에게는 더 많은 선택지가 생긴 셈이죠.
일론 머스크가 xAI를 위해 해외 발전소를 구매해 미국으로 운송한다고 확인했습니다. 이 발전소는 100만 개의 AI GPU를 수용하고 최대 2기가와트의 전력을 소비하는 새로운 데이터센터에 전력을 공급할 예정입니다.
이는 차세대 AI 개발에 필요한 에너지 수요가 얼마나 막대한지를 보여주는 상징적인 사건입니다. AI의 발전이 단순히 소프트웨어의 문제가 아니라 전력 인프라와 같은 물리적 제약과 밀접하게 연결되어 있음을 명확히 보여줍니다.
카네기 멜론 대학교의 연구가 AI 에이전트 열풍에 찬물을 끼얹었습니다. 구글 제미니 2.5 프로를 포함한 주요 AI 에이전트들이 실제 사무 업무의 70%를 완료하지 못했고, GPT-4o는 91.4%의 실패율을 보였습니다.
이 연구는 AI 에이전트에 대한 과도한 기대를 경계하라는 메시지를 전합니다. 2025년이 AI 에이전트의 해가 될 것이라는 예측과 달리, 아직 해결해야 할 기술적 과제들이 많다는 것을 보여줍니다. 하지만 이는 동시에 개선의 여지가 크다는 의미이기도 합니다.
ElevenLabs의 CEO 마티 스타니셰프스키는 AI 음성이 올해 튜링 테스트를 통과할 수 있을 것이라고 예측했습니다. 그는 범용 번역기의 등장과 이것이 가져올 문화적 변화가 '과소평가되고 있다'고 강조했습니다.
음성 AI의 발전은 단순히 기술적 성취를 넘어서 인간의 소통 방식 자체를 바꿀 수 있는 잠재력을 가지고 있습니다. 언어 장벽이 사라지는 세상, 그리고 AI와 인간의 음성 구분이 불가능해지는 시대가 곧 올 수 있다는 것입니다.
Gero가 혁신적인 AI 모델을 공개했습니다. 이 모델은 복잡한 3D 구조 데이터 없이도 단백질의 아미노산 서열만으로 소분자를 설계할 수 있습니다. 성능은 기존의 구조 기반 모델과 비교할 만한 수준입니다.
이는 신약 개발, 특히 노화 관련 질환 치료제 개발에 혁명을 가져올 수 있습니다. 3D 구조 분석이라는 복잡하고 시간이 많이 걸리는 과정을 건너뛸 수 있다면, 신약 개발 속도가 크게 향상될 것입니다.
SpiritAI가 차세대 모션 제어와 VLA(Visual-Language-Action) 모델을 탑재한 휴머노이드 로봇 Moz1을 출시했습니다. 이 로봇은 더욱 정밀하고 유연한 움직임으로 예측 불가능한 환경에서도 복잡한 작업을 수행할 수 있습니다.
이는 단순히 로봇 기술의 발전을 넘어서 '체화된 지능(embodied intelligence)'의 실현을 의미합니다. AI가 물리적 세계와 상호작용하는 능력이 향상되면서, 노동 패러다임 자체가 변화할 수 있는 가능성을 보여줍니다.
메타가 AI를 '최우선 투자 분야'로 선언하며 AI 인프라에 290억 달러를 투자한다고 발표했습니다. 이 자금은 주로 NVIDIA H100 GPU 구매에 사용될 예정입니다. 또한 Llama 3와 같은 대규모 모델을 오픈소스로 공개하고 최고 수준의 AI 연구자들을 적극 영입하고 있습니다.
메타의 이러한 움직임은 AI 경쟁에서 뒤처지지 않겠다는 강한 의지를 보여줍니다. 특히 오픈소스 전략을 통해 AI 생태계에서의 영향력을 확대하려는 전략이 주목됩니다.
최근 연구에 따르면 대규모 언어 모델의 길고 복잡한 작업 완료 능력이 약 7개월마다 두 배씩 향상되고 있습니다. 이런 지수적 개선이 계속된다면, 2030년경에는 고급 LLM이 회사 설립이나 소설 쓰기 같은 복잡한 다단계 작업을 며칠 또는 몇 시간 만에 안정적으로 처리할 수 있을 것으로 예상됩니다.
이는 AI의 능력이 단순히 점진적으로 개선되는 것이 아니라 지수적으로 발전하고 있음을 보여줍니다. 우리가 생각하는 것보다 훨씬 빠르게 AI가 복잡한 창작 및 기획 업무를 수행할 수 있는 시대가 올 수 있다는 것입니다.
이번 주의 AI 뉴스들을 종합해보면, 몇 가지 중요한 트렌드가 눈에 띕니다.
첫째, AI의 실용적 응용이 급속히 확산되고 있습니다. 의료 진단, 신약 개발, 로봇 제어 등 다양한 분야에서 AI가 실질적인 성과를 내고 있습니다.
둘째, 인프라와 에너지 문제가 AI 발전의 핵심 과제로 부상했습니다. xAI의 발전소 구매나 메타의 290억 달러 투자는 AI 발전이 단순히 알고리즘의 문제가 아님을 보여줍니다.
셋째, 오픈소스 vs 클로즈드 소스의 경쟁이 치열해지고 있습니다. 바이두의 ERNIE 4.5 공개와 메타의 Llama 전략은 AI 생태계의 민주화를 가속화하고 있습니다.
마지막으로, 기대와 현실 사이의 간극도 명확해지고 있습니다. AI 에이전트의 한계가 드러난 것처럼, 과도한 기대보다는 현실적인 접근이 필요한 시점입니다.
2025년은 AI가 진정으로 우리 일상과 업무에 깊숙이 들어오는 해가 될 것 같습니다. 하지만 그 과정에서 기술적 도전과 사회적 적응이 함께 이루어져야 할 것입니다.