IT이야기

애플이 음성인식 '시리'에 목을 매는 이유는?

想像 2012. 10. 29. 09:01
반응형

애플은 2011년 아이폰4S신제품 발표회장에서 '음성인식 비서기능(Your Virtual Personal Assistant)'라는 이름으로 시리(Siri)를 발표한다. 1년만인 지난 6월에 발표된 iOS6의 주요 특징 하나도 더 똑똑해진 음성인식 비서 기능 '시리'다.

이날 발표장에서 iOS6 개발담당인 스콧 포스톨 수석부사장이 시리에게 "(미국 프로농구 스타인) 르브론과 코비 중에 누가 더 크냐"고 묻자, 시리는 "르브론 제임스가 약간 더 클걸"이라고 답했다. 동시에 화면에는 르브론 제임스와 코비 브라이언트, 두 선수를 비교하는 각종 수치들이 나타났다. 또 프로야구팀 샌프란시스코 자이언츠의 최근 경기 결과나 선수 개개인의 성적, 전체 순위, 미식축구 경기 일정, 재미있는 영화와 출연 배우의 프로필 등 묻는 것마다 척척 답했다.


이어 포스톨 부사장이 "저녁 먹을 괜찮은 식당을 소개해봐라"고 말하자 시리는 주변에 있는 15개 식당을 약도·사용자 평가와 함께 제시했다. 애플은 BMW·GM·벤츠·아우디 같은 자동차 회사들과 연계해 음성으로 길을 안내해주는 기능도 추가하기로 했다.

현재 음성 인식 비서 기능 시리(Siri)는 한국어를 포함해 총 15개국 언어를 지원하며 향후 지원 언어의 수, 음성인식의 정확도, 적용 서비스의 종류에 있어서 지속적인 발전이 예상되고 있다. 

시리(Siri)는 현재 애플이 역점을 두고 있는 사업이다. 애플은 왜 음성인식 비서기능인 '시리(Siri)에 이처럼 목을 매고 있는 것일까?

음성인식은 멀티터치 다음 차세대 UI

이유는 간단하다. 음성인식이 멀티터치 기술 다음의 차세대 핵심 유저 인터페이스(UI)기술이기 때문이다. 애플은 지금까지 혁명적인 유저 인터페이스(UI)를 개발해 왔으며 혁명적인 유저 인터페이스가 나올 땐 혁명적인 제품을 내 놓았다. 마우스가 개발돼 맥이 나왔고, 클릭휠이 개발돼 아이팟이 나왔다. 그리고 멀티터치가 개발돼 아이폰이 나온다. 아이폰은 '멀티터치'기술의 정수를 보여주는 혁명적인 제품이다.

애플은 이제 음성인식 비서기능 '시리'를 통해 또 한번 혁명적인 유저 인터페이스(User Interface)기술을 선보이고 있다. 아직은 음성인식 UI를 기반으로 한 혁명적인 새로운 제품은 선보이지 않고 있지만(?) 시리는 차세대 UI기술의 미래를 보여주는 바로미터가 되고 있다.

다방면에 적용가능한 음성인식기술

아래 ETRI의 연구보고서에 있는 그림처럼 음성인식은 멀티터치 이상으로 다양한 분야에 유저 인터페이스로 적용될 수가 있는 핵심기술이다. 

음성인식 기술 관련 세계 시장 규모는 2005년 11억 달러에서 2010년 30억 달러로 성장한 데 이어 2013년에는 54억 달러까지  성장할 것으로 전망되고 있으며 국내 음성인식 시장도 2010년 1,800억 원에서 2012년 3,900억 원으로 매년 47%씩 성장할 것으로 기대를 모으고 있다. 

이 수치는 음성인식기술에 국한된 시장규모이며 음성인식을 활용한 후방산업의 시장규모는 추정이 불가능할 정도로 어마어마하게 크다. 이미 자동차, 의료, 교육 등에 음성인식이 적용되고 있다. 특히 자동차의 경우 2015년까지 전세계에서 출시되는 자동차의 57%이 음성인식 기능을 갖출 전망이다.

음성인터페이스 기술의 활용분야



자동차와 음성인식 기능, 애플의 도전

애플은 이미 자동차 제조업체와 협력하여  'Eyes Free'라는 이름으로 시리를 특정 음성 제어 시스템에 통합하고 있는 중이다.  핸들에 있는 음성 명령 버튼을 통해 도로 주행 중에도 시선을 돌리지 않고 시리에게 물어볼 수 있다. 시리에게 전화를 걸고, 음악을 선택해서 재생하고, 문자 메시지를 듣거나 쓰고, 지도를 사용하여 길 안내를 받고, 알림 항목을 읽고, 캘린더 정보를 찾고, 미리 알림을 추가하도록 물어보는 등 다양한 일이 가능해진다. 

애플이 자동차에 음성인식 비서기능 '시리'를 적용하는 것은 시의적절한 것 같다. 전자신문 미래기술연구센터(ETRC)와 서울마케팅리서치(SMR)가 운전자 1000명을 대상으로 조사한 결과에 따르면 일반 운전자가 내비게이션을 이용할 때 필요한 기능으로 `음성 인식`이라는 응답이 51%로 가장 많았다. 그 다음으로 `3D 기능`이 13.7%로 나타났다.

과도한 부가 기능을 경계하면서 안전을 강조한다는 차원에서 음성인식 기능은 매력적일 수밖에 없다. 편의성과 안전이라는 두 화두가 음성인식 기술과 연계돼 있기 때문이다. 카 내비게이션에서 음성인식 기능 내장 여부가 향후 시장 주도권을 좌우할 핵심 요소가 될 것으로 보인다.

반응형