경기 성남시 네이버 본사 사옥. [뉴스1]
국내 최대 검색엔진 업체 네이버도 챗GPT가 촉발한 초거대 AI 전쟁에 참전했다. 네이버는 올해 상반기 한국판 챗GPT라 할 수 있는 ‘서치GPT’를 선보일 예정이다. 서치GPT는 네이버가 2021년 자체 개발한 초거대 AI 플랫폼 ‘하이퍼클로바’를 기반으로 한다. 최수연 네이버 대표는 2월 3일 실적 발표 콘퍼런스 콜에서 “최근 주목받는 생성 AI 같은 새로운 검색 트렌드에 대한 대응책을 준비 중”이라면서 서치GPT 출시 계획을 밝혔다. 최 대표는 “풍부한 사용자 데이터와 네이버의 기술 노하우를 접목해 생성 AI의 단점인 신뢰성·최신성 부족, 영어 기반 모델을 한국어로 번역하면서 발생하는 정확성 저하를 해결할 수 있다”고 자신감을 드러내기도 했다. 네이버는 서치GPT를 당장 검색 서비스에 도입하지 않고 생성 AI의 신뢰성 부족을 해결하는 방안을 모색할 방침이다.
서치GPT 상반기 출시
네이버가 출시할 서치GPT에 대한 세간의 궁금증은 크게 두 가지로 요약된다. 첫째는 기존 하이퍼클로바와 어떻게 차별화되고 발전된 모습을 보여줄지, 둘째는 상반기 안으로 개발을 완료할 수 있을지 여부다. 하이퍼클로바는 이미 네이버의 각종 서비스 분야에 적용되고 있다. 사용자가 전문 분야에 대한 궁금증을 일상용어로 물으면 대화형 AI가 답하는 ‘지식인터랙티브’ 등 검색 분야는 물론, AI 음성기록 애플리케이션(앱) ‘클로바노트’의 인식 엔진에도 하이퍼클로바 기술이 적용됐다.네이버 초거대 인공지능(AI) 플랫폼 ‘하이퍼클로바’와 사용자 간 문답 예시. [네이버 제공]
전문가들은 네이버로 대표되는 국내 빅테크의 초거대 AI 기술 수준을 어떻게 평가할까. 장준혁 한양대 융합전자공학부 석학 교수는 “네이버가 (서치GPT의 구체적 스펙을) 오픈하지 않아 아직 알 순 없다”면서도 “네이버 등 국내 기업도 딥러닝 알고리즘 기술을 보유하고 있고 챗GPT와 비교해도 기술 격차가 그리 크지 않지만, 문제는 데이터 확보에 필요한 기술”이라고 말했다. 향후 질적·양적으로 우수한 데이터를 확보하고 이를 초거대 AI에 학습시킬 컴퓨팅 기술을 고도화하는 게 관건이라는 지적이다. 이경전 경희대 경영학·빅데이터응용학과 교수는 “하이퍼클로바와 GPT-3의 기술 격차는 1년, 지난해 11월 나온 챗GPT와 격차는 2년 정도로 보인다”면서 “(네이버가) 먼저 나온 챗GPT를 새 모델 개발에 참고할 수 있기에 아무런 기반도 없이 개발하는 것보다는 완성 시점을 좀 더 앞당길 수 있을 것”이라고 말했다.
초거대 AI 기술을 발전시키기 위해서는 딥러닝 알고리즘 수준을 높일 수 있는 우수 인력 확보가 필수적이다. 네이버는 국내 기업 중에선 우수한 AI 인력을 확보한 상태지만 미국, 중국 등 경쟁국과 비교하면 인력풀이 부족하다는 지적이 나온다. 위정현 중앙대 경영학부 교수는 “국내에선 AI 기술 개발 인력이 상당히 부족한 실정으로, 글로벌 우수 인력 대부분이 미국과 중국에 집중돼 있다”면서 “AI 학습용 데이터양에서도 미국, 중국을 당해내기 어렵다”고 말했다.
“한국어 전용 AI 개발 승산 있어”
초거대 AI의 오류를 잡아내려면 대규모 단순노동 인력도 필요하다. 초거대 AI가 사람의 글과 말을 정확히 이해해 자연스러운 답변을 할 수 있게끔 하려면, 많은 인력이 개입해 오류를 계속 수정해야 한다. 가령 오픈AI는 챗GPT가 폭력적·선정적 콘텐츠를 학습하지 않도록 케냐 노동자들을 고용해 ‘데이터 솎아내기’ 작업을 시켰다. 챗GPT가 사회적으로 논란이 될 만한 답을 내놓을 가능성은 줄었지만, 저임금을 받으며 자극적 콘텐츠에 노출된 노동자들의 인권 문제가 논란을 빚었다. 국내 기업이 노동자 인권을 보호하면서 AI 오류 개선에 필요한 인력을 확보하는 게 관건인 이유다.네이버가 국내 최대 검색엔진으로서 확보한 대량의 한국어 데이터가 강점이 될 수 있다는 평가도 있다. 영어 데이터 기반인 챗GPT는 정교한 한국어 문답에서 아직 한계를 보인다. 네이버가 이 점을 파고들어 국내 검색엔진 시장을 수성하는 한편, 초거대 AI 산업 발전의 발판을 마련할 수 있다는 것이다. 이경전 교수는 “영어가 아닌 한국어 검색, AI 답변의 출처 표시 등 분야에서 네이버가 챗GPT와 차별성을 두는 전략이 유의미할 수 있다”고 말했다. 장준혁 교수는 “영어 데이터베이스 기반인 챗GPT의 한국어 서비스는 아직 어색한 수준이라 국내 기업이 한국어 전용 AI 개발에 집중하면 승산이 있다”며 “개인정보 보호 등 이슈로 국내 기업의 AI 데이터 수집엔 복잡한 규제가 적용되는데 정부 차원에서 개발에 발목을 잡는 규제를 과감히 없앨 필요가 있다”고 지적했다.
김우정 기자
friend@donga.com
안녕하세요. 주간동아 김우정 기자입니다. 정치, 산업, 부동산 등 여러분이 궁금한 모든 이슈를 취재합니다.
민주 “한덕수 권한대행 탄핵안 발의 유보… 26일이 마지막 기회”
윤 대통령 측 “25일 공수처 출석 어려워… 헌재 탄핵 심판이 우선”