주간동아 311

..

열려라! 생활혁명 ‘말’ 한마디면 끝

음성인식 기술 시장 눈부신 성장 … 게임, 번역, 전자상거래 등 다양한 서비스

  • < 조미라/ 웹 칼럼니스트 > alfone@hanmail.net

    입력2004-11-24 14:09:00

  • 글자크기 설정 닫기
    열려라! 생활혁명 ‘말’ 한마디면 끝
    국내 음성인식 기술의 독보적 황제는 외국기업 L&H였다. 그런데 최근 이 회사가 무너졌다. 그러자 L&H의 빈자리를 차지하기 위해 수많은 중소 업체가 경쟁에 뛰어들었다. 지금 국내 음성인식 시장은 절대강자 없이 치열한 쟁탈전이 벌어지는 춘추전국시대를 맞고 있다. 이러한 현상은 다양한 음성인식 서비스를 등장시키는 부수적 효과를 낳고 있다.

    1990년대 초반 음성인식·음성합성 기술은 장애인을 위한 PC에 접목되었지만 자리잡지 못했다. 컴퓨터가 명령어를 제대로 인지하지 못해 자꾸 틀린 작업을 수행하고 용량을 많이 차지한 탓에 도리어 불편만 가져왔기 때문이다. 그런데 현재 국내엔 수백개의 음성인식 관련 업체가 활동할 정도로 음성인식 시장은 전성기를 맞고 있다.

    여기엔 다국적 공룡기업 L&H의 공이 컸다. L&H가 국내 지사를 설립한 99년 말은 한국의 음성인식 시장이 본격적으로 형성하기 시작한 때였다. 그런 환경에서 원천기술을 다수 확보하고 있는 기업의 대규모 투자, 공격적인 마케팅은 음성인식 시장을 꽃피웠다. 그러다 지난 4월 말 L&H가 파산신청을 내자 스피치윅스, 버발텍, 킨버세이, 뉘앙스 등 쟁쟁한 외국 음성인식 업체들이 국내에 들어왔다. 국내에서도 자생적으로 새로운 음성인식 업체들이 생겨났다.

    현재 음성인식시스템이나 음성인식기술을 개발하고 있는 업체는 30곳 이상. 이 밖에 200여개 업체가 음성기술을 응용한 음성 게임, 교육, 반도체 칩, 보안 솔루션, 사이버 캐릭터, 음성 번역, 음성 브라우저, 음성 게시판, 음성정보 서비스, 음성 포털 서비스, 인터넷 TV, 장난감, 전자사전, 전자상거래, e북, 홈오토메이션, PDA, UMS 서비스 등 다양한 사업을 펼치고 있다.

    보이스웨어(http:// www. voice ware.co.kr)는 89년부터 음성처리 원천기술과 시스템 구축을 해온 LG종합기술원 출신들이 지난 99년 설립한 업계 선두주자다.



    KAIST 출신들이 설립한 SL2 (http://www.slworld.co.kr)는 음성인식·음성합성 등 다양한 음성 인터페이스에 대한 기술력을 보유하고 보이스 포털, 음성 도메인, 컴퓨터 통신통합(CTI) 등 분야를 대상으로 사업을 펼치고 있다. 역시 KAIST 전자계산과 오영환 교수가 창업한 보이스피아(http://www.voicepia.co.kr)는 연속어 인식분야에서 상당한 기술력을 인정받는다.

    열려라! 생활혁명 ‘말’ 한마디면 끝
    강원대 정보통신연구소 정익주 교수가 4명의 제자와 함께 창업한 디앤엠테크놀로지는 PDA(개인 휴대 단말기), 클라이언트 PC의 음성인식 분야에 주력하고 있다. 국내 최초로 3개사 이상의 엔진을 이용해 어플리케이션을 전문적으로 개발하고 있는 보이스메이커는 창업 후 4개월 만에 매출 30억을 돌파해 업계의 주목을 받고 있다.

    음성인식시스템이란 컴퓨터가 사람의 말을 이해해 작업을 수행하도록 하는 시스템을 말한다. 몇 년 전 ‘우리 집’이라고 말하면 전화를 걸어주는 기능을 가진 휴대폰이 나왔다. 이는 음성인식의 기초기술을 이용한 것이다. 보이스웨어의 보이스 브라우저와 보이스텍 그리고 OK캐쉬백(http://www. okcashbag.com)에서 선보인 보이스 익스플로러는 익스플로러에 스킨처럼 설치되어 인터넷 검색이나 익스플로러의 명령을 말로 할 수 있도록 했다. 또 하나는 텍스트를 음성으로 바꿔주는 TTS(Text-to-Speech), 즉 음성합성 기술과 말로 문장을 말하면 텍스트로 만들어주는 딕테이션(Dictation) 기술이다. 즉 받아쓰기를 하는 시스템이다.

    열려라! 생활혁명 ‘말’ 한마디면 끝
    음성합성 기술은 음성인식과 반대로 문자를 말로 바꾸어준다. 하나의 프로그램을 열고 메뉴에서 내용 읽어주기를 고르면 실시간 음성합성으로 문장을 자연스럽게 읽어준다. 큐리오(http:// kr.qrio.com), 베스트나우(http:// www.bestnow.com)의 UMS 서비스에서 문자 메일을 핸드폰을 통해 들려주는 서비스에서 이용되고 있다. 하지만 이번 오피스 XP에 음성 기능을 추가하면서 워드프로세서, 파워포인트, 엑셀, 아웃룩에서도 음성합성 서비스를 볼 수 있게 됐다. 화자인증 기술도 있다. 이 기술은 사람에게는 지문(Finger Print)이 있듯 목소리에는 지문과 같은 성문(Voice Print)이 있다는 것을 이용한 것이다. 사람마다 목소리가 다르다는 점에 착안해 음성을 컴퓨터의 잠금장치로 활용한 것이다. 최근 음성기술은 무선 인터넷과 만나며 전성기를 맞고 있다. 증권정보시스템 자동응답 서비스, 예약시스템, 무선 지리정보시스템(GIS), 음성인식 웹브라우저가 잇따라 등장했다.

    열려라! 생활혁명 ‘말’ 한마디면 끝
    보이스메이커와 TLS사는 음성인식 기능과 교통정보 기능을 갖춘 차세대 지도(보이스 맵)를 개발했다. TLS가 개발한 콩나물지도(http://www. congnamul.com)에 보이스메이커의 음성기술을 얹은 음성인식·합성 지도는 예를 들어 “여의도에서 압구정까지 가장 빠른 길” “택시요금이 가장 적게 나오는 길”이라고 발음하면 시스템이 화면에 소요시간, 거리, 혼잡상황 등 답을 표시한다. 병원, 동사무소 등 원하는 목표지점을 말하면 그곳을 지도에 표시해 준다. 향후 휴대폰에도 이 시스템을 도입할 예정이다. 그렇게 되면 운전하는 도중에 말로 인터넷에 접속해 가장 빠른 길을 찾아달라고 명령할 수도 있다. 보이스메이커는 이 밖에도 장난감에서 콜센터 음성인식·합성까지 음성과 관련된 어플리케이션을 개발하는 업체로서 음성 관련 어플리케이션 개발업체로서는 짧은 기간에 두각을 나타내 주목받고 있다.

    헤이아니타(http://www.heyanita. co.kr)는 기존의 전화로 인터넷을 검색하는 서비스다. 030311번으로 전화를 걸면 인터넷에 올라와 있는 뉴스나 생활정보를 들을 수 있다.

    음성인식·합성 기술의 단적인 예가 자동응답 전화기(ARS)다. 항공사, 증권사 및 TV 쇼핑업체들은 과거엔 내용이 바뀔 때마다 일일이 목소리로 정보를 녹음해야 했지만 음성합성시스템이 도입되면서 녹음 단계를 생략할 수 있게 됐다. 행정자치부는 재해상황 자동응답시스템에 음성기술을 도입했다. 포털사이트들도 음성인식 솔루션이 도입된 서비스를 마련하고 있다. 음성 게시판과 인스턴트 메신저 등이 그것이다. 지금까지 인터넷 음성서비스는 UMS 서비스로 전자우편을 음성으로 녹음해 무선 단말기에서 확인할 수 있는 간단한 서비스에 국한됐다. 음성 포털 서비스를 선언한 다음커뮤니케이션(http://www.daum.net)은 E-메일 서비스인 한메일넷에 음성메일 솔루션을 적용했다. 음성 게시판, 음성 상담실, 음성 도움말, 음성 뉴스까지 서비스를 확장할 계획이다. SK텔레콤의 리빙OK(http://www.livingok.com)는 컴퓨터 대신 일반 전화나 이동통신 단말기를 인터넷에 연결하고 말로 명령을 내리면 음성으로 원하는 정보를 들을 수 있는 서비스를 준비하고 있다.

    자동차 분야에서도 음성인식 기술은 빠른 속도로 발전하고 있다. 도요타, 벤츠, BMW는 도어록, 내비게이션, 백미러 작동, 통신단말기 등에서 음성으로 자동차를 조작할 수 있는 기술을 실용화하고 있다. 음성인식 자동차가 실용화되면 자동차 열쇠가 필요 없어진다. 운전자는 “문 열어” “시동 걸어” “창문 내려” “음악 선곡”이라고 말만 하면 된다.

    음성인식 기술의 응용분야는 무궁무진하다. 또 다른 생활혁명을 예고하고 있는 것이다.



    댓글 0
    닫기