
구글이 3월 12일(현지 시간) ‘젬마(Gemma) 3’를 공개했다. 구글 제공
딥시크 효율성 넘어선 구글
딥시크가 높은 효율성을 갖춘 AI 모델을 공개한 이후 AI 업계에서는 경제성이 중요한 이슈로 떠오르고 있다. 구글은 이에 맞서 연산 최적화를 강화한 젬마 3를 선보였다. 젬마 3는 10억~270억 개의 AI 학습 파라미터(매개변수)를 갖춘 다양한 버전으로 공개됐다. 사용자는 필요에 따라 적절한 모델을 선택할 수 있다. 최대 12만8000개 토큰(정보 단위)을 한 번에 처리할 수 있어 긴 문서나 방대한 데이터를 빠르고 정밀하게 분석하는 것이 특징이다.
젬마 3의 구체적인 성능은 AI 모델의 연산 효율을 평가하는 ‘엘로(Elo) 점수’로 알 수 있다. 체스 같은 게임에서 선수들 실력을 평가하는 데 사용하는 엘로 점수는 최근 AI 모델의 성능을 보여주는 지표로도 쓰인다. 구글 딥마인드가 공개한 젬마 3 기술 보고서에 따르면 딥시크의 ‘R1’ 모델이 1338~1363점을 기록했으며, 젬마 3는 이 점수의 98% 수준에 도달했다.
성능 면에서는 R1이 다소 앞서는 듯하지만 연산 자원의 효율성 측면에서 결정적 차이가 있다. R1은 엔비디아 GPU H100을 32개 사용해야 하는 반면, 젬마 3는 단 1개의 H100만으로 동일한 성능을 구현할 수 있다는 것이 구글의 주장이다. 높은 연산 효율 덕분에 젬마 3는 메타의 라마(LLaMA)
3와 비교해도 더 적은 GPU 자원으로 더 높은 엘로 점수를 기록한 것으로 나타났다.
이러한 성능 최적화의 핵심에는 지식 증류(Distillation) 기법이 있다. AI 모델은 일반적으로 파라미터 수가 많을수록 더 복잡한 연산을 수행할 수 있지만 그만큼 처리 속도가 느려지고 하드웨어 요구 사항이 커진다. 하지만 젬마 3는 대형 모델에서 학습된 정보를 압축해 작은 모델로 전이하는 방식으로 성능을 유지함으로써 연산 부담을 줄이는 데 성공했다. 그 결과 딥시크 R1은 6710억 개 매개변수를 사용하고 필요한 경우 370억 개 매개변수를 선택적으로 활성화할 수 있는 데 비해, 젬마3는 10억~270억 개 매개변수만으로도 뛰어난 성능을 발휘한다.

거대언어모델(LLM) 기반 인공지능 ‘엘로(Elo) 점수’ 비교 그래프. 구글 ‘젬마 3(왼쪽에서 두 번째)’는 엔비디아 H100 한 장으로 딥시크 수준의 성능을 낸다. 구글 제공
멀티모달 AI 시대, 오픈소스로 승부수
구글은 젬마 3 출시를 통해 메타, 오픈AI, 딥시크 등 주요 AI 기업과 경쟁하며 더욱 개방적이고 확장성 높은 AI 생태계를 구축하려 하고 있다. 단순히 강력한 성능을 가진 AI 모델을 만들어내는 것에 그치지 않고 개발 및 활용의 진입 장벽을 낮춘다는 전략이다.
특히 젬마 3는 멀티모달 AI로 설계됐다는 점에서 주목할 만하다. 멀티모달 AI는 자연어 처리(NLP) 한계를 넘어 텍스트, 이미지, 영상, 음성 등 다양한 데이터를 동시에 이해하고 분석할 수 있는 기술이다. ‘시그립(SigLIP) 비전 인코더’는 최대 896×896 해상도의 이미지를 처리할 수 있도록 설계됐다. 현재 오픈AI의 GPT-4 터보, 메타의 라마 3 등도 멀티모달 기능을 지원하지만, 대부분 폐쇄형 모델로 접근이 제한적이다. 반면 젬마 3는 오픈소스 기반으로 연구자와 개발자들이 자유롭게 활용하고 최적화할 수 있다.
멀티모달 AI는 아직 초기 단계지만 AI와 인간의 상호작용 방식을 근본적으로 변화시킬 것으로 기대되는 기술 중 하나다. 인간의 감각 처리 방식을 모방해 더욱 직관적인 방식으로 정보를 처리할 수 있어 의료 진단, 자율주행, 감정 분석 등 다양한 분야에서 응용이 가능하다. 의료 분야에서는 환자의 증상 기록과 의료 영상을 함께 분석해 더 정밀한 진단을 제공한다. 자율주행 차량에 적용할 경우 도로 표지판, 보행자, 차량 움직임뿐 아니라 운전자의 음성 명령까지 실시간으로 처리할 수 있다. 또한 산업용 로봇에 적용하면 작업 지시를 따르는 것을 넘어 스스로 환경을 학습하고 적응하는 방향으로 발전할 수 있다.
마이크로소프트(MS) MVP를 22회 수상한 기술 전문가 브라이언 포지는 한 정보기술(IT) 매체가 주최한 기술 간담회에서 “멀티모달 AI는 앞으로 가장 주목해야 할 핵심 트렌드”라며 “향후 10년 동안 AI가 이룰 발전 기반이 될 것”이라고 강조했다.
