주간동아 1002

..

혼자 배우고 판단하는 똑똑한 기계들의 시대

인공지능, 사람 도움 없이도 특정 이미지·언어 인식하는 ‘심화학습’ 가능

  • 조용수 LG경제연구원 수석연구위원 yscho@lgeri.com

    입력2015-08-24 14:42:00

  • 글자크기 설정 닫기
    1997년 5월 IBM의 컴퓨터 시스템 딥 블루(Deep Blue)가 당시 체스 세계 챔피언이던 가리 카스파로프를 물리쳤다. 2011년 2월에는 같은 IBM의 왓슨(Watson) 시스템이 미국 인기 TV 프로그램 ‘제퍼디(Jeopardy!)’ 퀴즈쇼에서 전설적인 퀴즈왕들을 물리치고 최종 우승했다. 수백 가지 경우의 수를 미리 읽어야 하는 체스 게임에서 사람을 이기고, 기상천외한 문제를 척척 알아들어 빛의 속도로 정답을 맞히는 모습은 인공지능의 시대가 코앞에 와 있다는 인상을 주기에 충분했다. 다만 다행인지 불행인지 왓슨 이후 IBM은 아직까지 뚜렷한 후속타를 내지 못하고 있다.

    인공지능은 기계로 인간의 ‘지능’을 구현하는 것이다. 지능은 단순히 책에 적힌 내용 외우기나 좁은 의미의 학문적 기술, 시험 보는 요령을 가리키는 게 아니다. 더 넓고 깊은 의미에서 주변 환경을 이해하는 능력, ‘따라잡고’ ‘의미를 파악’하며 ‘다음 할 일을 깨닫는’ 능력이 바로 지능이라고 전문가들은 정의한다. 이를 감안하면 딥 블루나 왓슨은 제 아무리 뛰어난 성능을 보였다 해도 여전히 ‘훌륭한’ 기계장치에 불과하다. 연구진이 이룬 성취는 물론 대단하지만, 참된 인공지능이라는 관점에서 보면 아직 갈 길이 먼 것이다.

    왓슨이 퀴즈쇼에서 인간 퀴즈왕들을 이길 수 있었던 건 방대한 양의 지식 정보와 과거 출제 경향 등을 데이터베이스에 입력해두고, 제시된 문제의 의미와 맥락을 이와 대조함으로써 순식간에 정답에 가장 가까운 옵션을 찾아낼 수 있게 해놓았기 때문이다. 다시 말해 IBM 컴퓨터 과학자들의 프로그래밍 역량과 강력한 컴퓨터 연산능력이 뒷받침된 결과다. 사람이 개입하지 않으면 아무리 훌륭한 컴퓨터라도 결국 깡통에 불과하다는 뜻이기도 하다.

    4개의 레이어를 거치면

    그걸로 끝일까. 이른바 ‘기계학습(Machine Learning)’은 인공지능이 당면한 이러한 근본적인 한계를 돌파하기 위해 연구자들이 오랫동안 집중해온 분야다. 사람의 지능을 가진 기계를 만들겠노라고 무모하게 달려들기보다, 작은 것이라도 뭔가 유용한 걸 컴퓨터가 스스로 배우고 익히는 학습능력을 갖도록 해보자는 게 기계학습의 기본 구상이다. 기계에게 처음 뭔가를 가르치려면 사람 손길이 필요하지만, 한번 배우고 나면 나중에는 스스로 생각하고 일할 수 있게 되므로 우리에게 더 도움이 된다는 발상이다. 각종 검색엔진의 추천어 자동완성 기능, 인터넷 쇼핑몰이나 서점, 음악, 영화 사이트의 추천 및 제안 기능 등이 이런 기계학습의 산물이다.



    2012년 6월 앤드루 응 미국 스탠퍼드대 교수는 기계학습의 한 분야인 ‘심화학습(Deep Learning)’ 알고리즘을 이용해 임의의 수백만 개 유튜브 동영상에서 특정 이미지(고양이)를 높은 정확도로 식별해내는 ‘구글 브레인 프로젝트’를 성공적으로 수행했다. 인공지능 연구에 일대 전환점이 된 사건이다. 심화학습은 신경 네트워크(Neural Networks) 개념을 이용해 컴퓨터로 하여금 인간의 도움 없이도 스스로 특정 이미지와 언어 등을 인식하게 하는 기법이다.

    사람의 두뇌에서 학습기능을 관장하는 것으로 알려진 신피질(neocortex)은 뉴런 수천억 개의 층(layer·레이어)으로 이뤄져 있다. 각 뉴런은 외부 자극에 반응해 서로 전기화학적 신호를 주고받으면서 정보를 처리하고 기억을 형성한다. 만약 뉴런이 하는 이런 행동을 컴퓨터가 그대로 모방할 수 있다면 기계도 사람처럼 지능적 행동을 할 것이라는 게 신경 네트워크의 기본 아이디어다.

    2012년 프로젝트에서 앤드루 응 교수팀이 사용한 신경 네트워크는 뉴런 수십억 개가 상호 연결된 복수의 레이어로 구성된다. 첫 번째 레이어가 어떤 이미지(예컨대 고양이 사진)의 전체적 밝기, 색채 같은 대략적 분포를 학습하면, 두 번째 레이어는 모서리나 그림자 같은 좀 더 복잡한 특성을 식별하고, 세 번째 레이어는 눈, 귀, 코 등의 구체적 형상을 훈련한다. 그리고 마지막 레이어를 거치면서 이 모두를 결합한 학습 결과를 출력한다. 컴퓨터는 출력된 학습 정보를 입력된 초깃값과 연결시키는 통계적 규칙(상관관계)을 찾으면서 결과 값이 신뢰할 만한 수준에 도달할 때까지 이러한 과정을 반복한다. 하나의 단일한 레이어가 아닌 복수의 레이어를 거치면서 심도 있는 학습활동이 이뤄진다는 의미에서 ‘심화(deep)’라는 용어를 쓴다.

    혼자 배우고 판단하는 똑똑한 기계들의 시대
    암 진단, 주식 거래, 경기 예측까지

    구글의 2012년 ‘고양이’ 프로젝트 이후 인공지능 연구는 일약 전 세계 정보기술(IT)기업이 주목하는 가장 ‘핫’한 분야로 떠올랐다. 컴퓨터 비전(이미지 인식), 텍스트와 음성 인식 같은 분야에서 심화학습 기법의 실용성이 상당 부분 인정받은 덕택이다. 수많은 데이터 속에서 자동으로 필요한 정보를 추출하고 처리하는 기능을 통해 기존 제품과 서비스의 기능을 획기적으로 끌어 올릴 수 있게 된 것이다.

    자율주행 무인자동차 개발에 매진 중인 구글은 물론, 왓슨 시스템을 만들었던 전통의 인공지능 강자 IBM, 마이크로소프트, 페이스북, 아마존 등 거대 기술기업이 인공지능에 지대한 관심을 기울이며 관련 인재를 영입하고 거액에 스타트업을 사들이고 있다. 중국 IT업계 대표주자인 바이두 역시 미국 실리콘밸리 등에 연구시설을 만들고 자국 출신 연구자들을 끌어모으는 중이다.

    고양이 프로젝트를 이끌었던 앤드루 응 교수는 2014년 바이두의 인공지능 연구책임자로 자리를 옮겼다. 구글은 2014년 초 심화학습에 특화된 딥마인드(DeepMind)라는 스타트업 회사를 6억 달러(약 7113억6000만 원)에 인수하기도 했다. 이 밖에도 많은 스타트업이 심화학습과 관련된 세부 기술항목을 발전시키는 작업에 매달리고 있다.

    이 때문에 인공지능의 응용 분야는 IT 분야를 벗어나 암 진단과 유전자 분석 같은 의료 분야, 신약 개발, 주식 거래, 경기 예측, 보안 등으로 빠르게 확대되고 있다. 인공지능 분야가 이뤄내고 있는 엄청난 속도의 기술 발전 급물살이 장차 어디까지 갈지 상상하기 쉽지 않을 정도다. 바야흐로 똑똑한 기계들의 시대, 사람이 기계와 고된 레이스를 펼쳐야 할 날도 그리 멀지 않았다는 뜻이다.



    댓글 0
    닫기