“챗GPT는 보고 듣고 말할 수 있다” 오픈AI 선언의 의미는?

초거대 인공지능(AI)이 빠른 속도로 똑똑해지고 있다. AI가 머지않은 미래에 사람을 모방한 예민한 감각기관까지 갖출 것이라는 전망마저 나온다. 챗GPT 개발사 오픈AI가 9월 25일(현지 시간) “이제 챗GPT는 보고 듣고 말할 수 있다”고 한 선언은 훗날 초거대 AI 발전사(史)를 쓸 때 중요한 사건으로 기록될 것이다. 당시 오픈AI의 발표는 유료 서비스를 중심으로 챗GPT에 음성·이미지 인식 기능을 추가하겠다는 게 뼈대였다. 초거대 AI라는 두뇌가 폭넓은 감각기관을 갖춘 시작점이 될 수도 있는 대목이다.

기존 챗GPT 사용자는 텍스트로 명령어(prompt)를 입력하고 그 결과도 텍스트 형태로 확인했다. 하지만 이제는 음성이나 사진을 입력해 챗GPT에 명령을 내릴 수 있게 됐다. 그뿐 아니라 텍스트, 음성, 이미지 등 다양한 형태의 정보를 합친 멀티 모달(multi modal) 인터페이스 형식의 명령도 가능해졌다. 여기에 더해 최근 오픈AI가 이미지 생성 AI ‘달리(DALL-E)-3’를 정식 출시하면서 챗GPT를 통해 이미지도 만들 수 있게 됐다. 그간 텍스트나 표, 그래프 형태로만 정보를 출력하던 것에서 벗어나 이미지로까지 표현 방식이 늘어난 것이다. 초거대 AI에 사람처럼 눈과 귀가 달리고, 다양한 방식으로 정보를 표현할 수 있게 된 셈이다.

샘 올트먼 오픈AI 최고경영자. [뉴시스]

‘멀티 모달’ 명령 가능해진 챗GPT

이 같은 AI 기술 발전이 일상생활에는 구체적으로 어떤 변화를 가져올까. 현 기술 수준에서 현실화된 변화상은 이렇다. 가령 챗GPT가 설치된 스마트폰으로 냉장고 속 식재료를 촬영해 “이 재료들로 어떤 음식을 요리할 수 있을까”라고 물으면 몇 가지 요리 레시피를 추천받는 식이다. 이미지 인식 기능이 없을 때는 챗GPT에 일일이 재료를 텍스트로 기입해야 했는데, 그것에 비하면 편리해진 방식이다. 사진을 찍어 인스타그램 같은 소셜네트워크서비스(SNS)에 올릴 때 적절한 설명과 해시태그를 추천받거나, 이미지에서 파악할 수 있는 다양한 정보를 빠르게 분석하는 것도 가능해졌다.

초거대 AI가 사용자에게 정보를 전달하는 방식이 다양해진 점도 특기할 만하다. 챗GPT의 이미지 생성 기능을 이용하면 상품 디자인이나 보고서 작성, 다이어그램 제작도 간단히 할 수 있다. 당장 업무에 활용 가능한 수준은 아니지만, 몇 글자 안 되는 명령으로 일종의 ‘디지털 목업(mock-up)’을 만들 수 있다는 게 상당한 변화다. 향후 초거대 AI가 방대한 정보를 이미지뿐 아니라, 소리와 영상으로도 표현할 수 있게 된다면 그 메시지의 호소력은 지금보다 강력해질 것이다. 이미 사용자와 AI의 대화 내용을 바탕으로 이미지를 생성해주는 챗봇 토키(Talkie), AI로 생성한 자신의 디지털 페르소나를 이용해 영상통화를 할 수 있는 SNS 재피(Zappy) 서비스가 화제를 모으고 있다.

미국 스타트업 휴메인(Humane)이 개발한 웨어러블 IT 기기 ‘AI 핀(Pin)’. [휴메인 제공]

AI를 접목해 인간의 감각기관을 확장하는 기술도 조금씩 현실로 다가오고 있다. 그런 점에서 미국 스타트업 휴메인(Humane)이 개발한 웨어러블 기기 ‘AI 핀(Pin)’이 눈에 띈다. AI 핀은 카메라에 연동된 AI 소프트웨어로 주변 물체를 인식하고, 그 분석 결과를 대화형 인터페이스로 표현하는 장비다. 정보 수용·표출 단계의 성능을 더 높인다면 시각장애인의 길잡이 역할도 할 수 있을 것이다.

AI 할루시네이션 등 부작용 우려

초거대 AI가 일상 곳곳에 자리 잡은 미래가 마냥 장밋빛인 것은 아니다. 우려가 가장 큰 대목은 역시 개인정보나 지식재산권(IP) 침해 논란이다. 최근 각종 AI가 인터넷에 공개된 방대한 데이터를 무분별하게 학습하는 것 아니냐는 논란이 이어지고 있다. 개인과 기업, 공공기관 할 것 없이 다양한 SNS 계정을 운영하는 시대다. 이들 계정에 텍스트는 물론 이미지와 음성, 영상 등 막대한 데이터가 올라와 있다. 이미 빅테크가 이 같은 데이터들을 수집해 마케팅에 오용한다는 우려의 목소리가 높다. 초거대 AI 시대를 맞아 개인정보 이슈는 더 심각해질 가능성이 크다. AI가 수집하는 데이터의 폭과 양이 기존과는 차원이 다를 정도로 넓고 많기 때문이다. 기업 입장에선 초거대 AI의 정보 학습에서 자사 IP를 어떻게 보호할지도 골칫거리다. 글로벌 빅테크의 AI가 다른 기업 IP를 학습하는 데 어느 정도 대가를 지불하고, 향후 거기에서 생기는 부가가치를 어떻게 분배할지 아직까지 뚜렷한 법적 가이드라인이 없는 상황이다.

초거대 AI가 인간과 같은 감각기관은 물론, 물리적 실체를 갖출 날도 머지않았다. 글로벌 정보기술(IT)업계 최신 동향은 AI의 정보 습득 경로를 다변화하는 동시에 다른 디지털 디바이스와 연동을 추구하고 있기 때문이다. 이런 추세를 감안해 상상력을 조금 발휘해보자. 지금보다 성능이 훨씬 고도화된 AI가 귀와 눈, 입 같은 장치를 넘어 더 강력한 신체까지 갖추게 된 미래를 말이다. 인터넷 속 가상공간이 아닌 물리적 현실 세계에 AI가 진출하는 시대 IT업계, 나아가 인류는 어떻게 대응해야 할까.

당장 우려되는 부분은 AI의 할루시네이션(hallucination: 사실이 아니거나 질문의 맥락과 관련 없는 내용을 마치 사실처럼 착각하는 현상)이 가져올 부작용이 더 커질 수 있다는 점이다. 현 단계에서 초거대 AI의 오류는 사용자 질문에 엉뚱한 답을 내놓는 해프닝에 그친다. 그러나 AI가 로봇과 결합해 일상이나 산업현장 곳곳에서 쓰이게 될 미래 사회의 할루시네이션은 심각한 부작용을 낳을 수 있다. 초거대 AI가 똑똑해지고 사회 전반에 스며들수록 그 부작용에 대응할 사회적 합의와 고민이 필요하다.

_{*유튜브와 포털에서 각각 ‘매거진동아’와 ‘투벤저스’를 검색해 팔로잉하시면 기사 외에도 동영상 등 다채로운 투자 정보를 만나보실 수 있습니다.}