한국은 공용어가 두 개인 국가다. 하나는 흔히 쓰는 한국어, 다른 하나는 ‘수화(手話)’로 불리는 ‘수어(수화 언어)’다. 공용어라지만, 실제 수어를 사용하는 모습을 보기는 어렵다. 그나마 볼 수 있는 곳도 공영방송의 일부 프로그램 정도다.
하지만 수어가 필요한 사람은 많다. 통계청에 따르면 2019년 기준 국내 청각장애인은 총 25만3000여 명. ‘이큐포올’은 이들을 위한 업체다. 음성언어를 수어로, 수어를 다시 음성언어로 번역하는 인공지능(AI) 솔루션을 개발한다. 5월에는 유엔(UN)의 ‘공공선을 위한 인공지능 서밋 2020’에 참가해 수어 안내방송 제공 사례를 발표했다. 수어 안내방송이란 재난, 사고 등 긴급 상황에서 들리는 음성 안내방송을 수어로 제공하는 시스템을 말한다. 정확한 전달을 위해 청각장애인의 휴대전화로 수어 메시지가 전송되는 식이다.
수어 번역이 이들의 최종 목표는 아니다. 모션 캡처 기술을 통해 입력 장치를 한층 더 발전시키는 것이 목표다. 마치 사람과 대화하는 것처럼 AI와도 말과 제스처를 섞어 소통할 수 있게 되는 셈이다.
6월 2일 고승용 이큐포올 대표를 만났다. 다음은 그와 나눈 일문일답.
수어도 엄연한 한국 공용어
-음성언어 간 자동 번역도 완벽하지 않은 편이다. 수어 번역은 어느 정도 수준인가.“구글 번역기나 파파고가 사람들의 문장과 번역 용례를 통해 딥러닝을 하고 있다면, 수어 번역은 배울 자료들을 모으고 있는 수준이다. 한국어 수어도 표준화돼 있지 않아, 다양한 번역 시스템을 개발하면서 AI가 배울 자료를 쌓는 중이다. 지금은 음성언어를 수어로 번역하는 작업이 일부 가능한 상태다. 재난안내방송, 일기예보 등 일정한 형식이 있는 내용은 자동 번역이 가능하다. 반대로 수어를 음성언어로 번역하는 작업은 아직 어렵다. 수어를 해석할 능력이 있는 AI를 개발해야 하는데, 그 자체가 어렵다. 수어 중에서도 지(指)문자라고, 자음과 모음으로 의사를 전달하는 방식이 있다. 지문자는 한 글자 한 글자씩 인식할 수 있는 수준이다. 점차 발전시켜 추후에는 일반 수어도 번역하는 것이 목표다.”
-굳이 수어가 아니더라도 청각장애인은 문자를 통해 소통할 수 있다.
“사실 일반인 때문에 필담을 선호하는 청각장애인들이 있다. 특히 관공서나 금융기관에서는 좀 더 확실한 표현을 위해 필담을 더 많이 한다. 하지만 생각보다 문맹인 청각장애인이 많고, 필담을 어려워하는 분들도 있다. 음성언어를 기반으로 문자가 만들어지는 만큼, 글을 읽고 쓰는 속도가 일반인과 다를 수 있기 때문이다. 따라서 청각장애인의 불편을 줄이기 위해서는 음성 안내처럼 수어 안내도 보편화돼야 한다.”
-수어도 음성언어처럼 나라마다 차이가 있나.
“한국어를 한국에서 주로 쓰는 것과 같다. 나라와 지역마다 차이도 있다. 독일 등 일부 국가는 한 나라 안에서도 다양한 수어 체계가 있다. 그래서 한국 수어와 수어계의 세계 공용어(ISL)를 중심으로 연구개발하고 있다.”
사람 같은 인공지능 만들려면 제스처 분석 필수
-어떤 계기로 수어에 관심을 갖게 됐나.“원래는 게임업계 출신이다. AI에 관심이 생겨 창업을 꿈꿨고, 단순 창업이 아니라 회사가 하는 일이 사회에 도움이 되면 좋겠다고 생각했다. 우연히 떠오른 것이 수어였다. 대학생 시절 관련 동아리 활동 경험도 있어 완전히 모르는 분야도 아니었다. 조사하는 과정에서 수어를 주로 사용하는 사람들이 생활에서 마주하는 불편에 대해서도 알게 됐다.”
-수어 관련 기업을 경영하면서 특별히 어려운 점이 있다면?
“장애인을 대상으로 하는 서비스를 개발하다 보니, 장애인을 통해 수익을 내기가 어렵다. 조금만 실수해도 장애인을 착취한다는 오해를 살 수 있다. 결국 정부의 지원책이나 사업에서 벗어나기가 힘들다.”
-방송 등지에서 수어 번역을 하는 분들의 일자리도 위험한 것 아닌가.
“아직은 수어 통역사의 일자리를 빼앗는 정도까지는 해내지 못한다. 외려 이들이 물리적으로 시간이 부족해 하지 못하는 통역 업무를 통역 시스템이 도울 수 있다. 기존 수어 통역사는 통역 시스템을 감수하는 등 당분간은 일이 더 늘어날 수도 있다. 동시에 청각장애인의 불편은 빠르게 해소될 것이다.”
-마치 사회적기업의 창업 이야기로 들린다.
“수화 번역 AI의 활용 방안은 무궁무진하다. 일단 수화를 완벽하게 인식하는 AI 개발에 성공할 경우 일반 소비자도 이를 사용할 수 있다. 음성언어는 물론, 제스처까지 인식하는 AI가 있다면 마치 사람과 이야기하듯 제스처를 쓰면서 AI에게 명령을 내리는 것이 가능하다. 지금도 일부 손동작이나 몸동작을 인식하는 시스템은 있지만 손가락 하나하나 등 작은 움직임을 잡아내는 AI는 없다. 특히 수어 번역 AI의 경우 움직임을 나타내는 방식과 그것을 해석하는 능력까지 갖춰야 해, 지금의 동작 입력 장치와는 완전히 다른 수준의 기술이다. 고성능의 동작 인식 AI의 용처는 무궁무진하다. 게임에 쓰인다면 동작이라는 새로운 입력 방식을 통해 이용자를 한층 더 게임에 몰입하게 할 수 있다.”
-AI 비서나 게임 말고도 용처가 있다면.
“영화 ‘마이너리티 리포트’를 보면, 아무것도 없는 허공에 손을 뻗으면 손끝에 사진이나 영상이 떠오르고 이를 움직여 시스템을 조작하는 장면이 나온다. 동작 인식 AI가 고도화되면 이 장면도 충분히 재현할 수 있다. 손가락의 위치와 움직이는 속도 등에 맞춰 제스처로 동작을 입력하는 식이다. 이 같은 기술은 특히 자율주행차에 유용할 것으로 보인다. 음악이 나오는 차량 내부에서 제스처로 볼륨을 낮추거나 창문을 여닫을 수 있다.”
-새로운 형태의 제스처 입력 기술이 먼 미래라면, 가까운 당면 과제는 무엇인가.
“수어 번역 시스템의 고도화가 급선무다. 최대한 많은 용처를 확보해 다양한 데이터를 모으고, 이를 기반으로 현재 음성언어 번역 시스템처럼 딥러닝을 할 수 있는 재료를 확보할 예정이다. 그리고 3년 뒤 열리는 세계농아인대회에 참가해 이 서비스를 해외에도 알릴 계획이다. 국내에서는 일기예보, 대중교통 안내방송 등에도 진출할 것이다.”