SCHOOL PROJECT#5 음성인식 디바이스
AI 비서의 상용화?
(출처 : 네이버 영화)
영화 "아이로봇"을 보신적이 있으신가요? 영화 아이로봇은 2004년에 개봉한 영화로, SF소설계의 거장인 아이작 아시모프의 "아이로봇"에 그 원작을 두고 있습니다. 이 영화는 주로 인공지능 로봇과 사람과의 대립 구도를 중심으로 이야기를 풀어 나가는데요, 영화 초반부에 흥미로운 장면을 볼 수 있습니다. 인간이 로봇에게 음성으로 명령하면, 인공지능 로봇은 이를 인식하여 주인의 명령을 수행하는 장면을 찾아볼 수 있습니다. 이렇게 영화로만 접하면 먼 미래의 이야기같기만 합니다. 그런데 이러한 일들이 현재 실제로 상용화되어 사용되고 있다면 믿으시겠습니까?
현재 아마존, LG, Samsung, Google과 같은 여러 세계적 기업들은 음성인식 디바이스 개발에 총력을 쏟아붓고 있습니다. 이는 이미 음성인식 기술이 상용화 되어 있으며 앞으로도 무궁무진한 발전을 보여줄 것을 시사합니다. 특정 디바이스가 아니더라도 우리는 주위에서 쉽게 이러한 기술들을 접할 수 있습니다. 그예로 삼성의 빅스비, 애플의 시리가 있습니다.
그래서 오늘은 여러 기업들에서 출시한 음성인식 디바이스들의 성능과 그 기능을 비교해 보고자 합니다.
삼성의 빅스비(Bixby), 애플의 시리(Siri)
기존의 스마트폰에 가장 먼저 음성 인식 기술을 적용한 것은 애플의 시리입니다. 그 이후 삼성이 갤럭시 s8을 출시하면서 빅스비의 자체 개발을 통해 유포하게 되었습니다. 그러나 저도 그렇고 국내에서 빅스비라는 음성인식 시스템을 주로 사용하는 사람은 많이 없는 것 같다고 생각했습니다. 전화를 걸거나 문자를 보낼 때 직접 손으로 전화를 걸거나 타이핑을 치는 사람이 대부분이지 빅스비를 호출하여 "ㅇㅇ에게 전화걸어줘", "ㅇㅇ에게 ㅇㅇ라고 문자보내줘"라고 하는 사람은 많이 찾아보지 못했습니다. 그러나 외국에서는 시리와 관련된 사용 사례들이 많이 나오고 있습니다. 교통 사고를 당한 사람이 몸을 움직일 수 없어 시리를 호출해 119를 불렀다는 기사까지 나올 정도입니다.
왜 같은 서비스를 제공하는 비슷한 형식의 소프트웨어 임에도 불구하고 이렇게나 다른 결과를 보여주고 있는 것일까요? 바로 보유한 데이터양의 차이라고 생각합니다. 인공지능은 생성된 직후부터 사용자에 맞게, 상황에 맞게 작동하는 것이 아닙니다. 많은 과정의 교육을 통하여 상황에 맞는 적절한 대처를 할 수 있도록 유도하는 것이죠. 아직 삼성의 빅스비는 출시 된지 몇 년 되지 않아 상황에 따른 데이터가 부족하여 사용자가 원하는 정보를 제공하기에는 시간이 조금 더 걸릴 것으로 예상됩니다.
아마존 에코
아마존의 에코는 현재 기업들 사이에서의 음성인식 디바이스 개발을 유행시킨 장본인 이라고 할 수 있습니다. 인공지능 스피커 에코(Echo)는 현재 아마존의 자체적인 인공지능 시스템인 알렉사를 구현하고 있습니다. 스피커와 대화를 통해 원하는 음악을 재생하고, 쇼핑을 하며 당일의 핫 토픽 뉴스를 확인하는 등 영화에서만 봐왔던 것들을 현실화하는 매개체라고 할 수 있을 정도의 놀라운 성능을 보여주고 있습니다.
기본적인 사양으로는 1kg이 되지 않는 가벼운 무게(954g)과 안드로이드, ios동시 지원 가능한 어플리케이션, 고출력 우퍼가 포함되어 있으면서도 149달러라는 그리 부담스럽지 않은 가격으로 소비자 층에게 가볍게 다가가고 있다는 점에서 많은 칭찬을 받고 있는 제품입니다. 한 가지 눈여겨 볼 점은, 인공지능 스피커에서 스피커 유닛 만큼 중요한 것이 바로 마이크라는 점이다. 그만큼 인공지능 스피커에서 사용자의 음성을 인식하고 원하는 작업을 수행하는 것이 그 어떤 기능 보다도 중요하다는 것이다. 아마존의 에코에는 무려 7개의 마이크를 탑재하면서 먼거리에서 말하더라도 잘 알아들을 수 있도록 하는 기술을 도입하였다.
SKT 누구(NUGU), KT 기가지니(GIGAGINI)
두 장치를 비교하기 앞서 각각의 주요 기능들을 먼저 정리해 보았습니다.
SKT 누구
-음악 서비스(멜론)
-스마트 홈
-미디어 : 라디오, Btv연동, 팟캐스트, 데일리 브리핑
-주문, 배달
-교통 : 길 안내
-개인 비서 : 위키피디아, 구글 캘린더, 알람 등
-타이머, 수면예약, 폰찾기 등의 기능KT기가지니
-음악 서비스(지니)
-올레 TV연동
-영상통화 기능(화면 탑재)
-홈 매니저(스마트홈)
-주문 배달
-캘린더, 알람, 교통 등의 유용한 기능
두 제품 중 누구는 실제로 저희 집에서 사용하고 있는 제품입니다. 그러나 두 제품의 기능을 비교 해보았을때는, 전부 비슷한 모습을 보여주고 잇습니다. 따라서 조금더 자세한 부분에서 성능을 비교해 보고자 하였습니다. 음질 부분에서 기가 지니는 히만 카돈 이라는 꽤나 유명한 스피커 회사와 협업하여 제작한 제품이기에 음질 측면에서는 더욱 뛰어난 모습을 보여주고 있습니다. 복합적인 TV와의 연동 측면에서는, 누구가 더욱 복합적 정보를구하고, 멜론이라는 음원 사이트의 이용자 수가 지니에 비해 현저히 많다는 점에서 '누구'의 사용자 수가 현재 더 많을 수 밖에 없는 이유 중 하나입니다.
마무리
앞으로는 스피커 형태의 음성인식 디바이스가 아닌 실제로 물리적으로도 도움을 주는 로봇 장치에 음성인식 서비스가 탑재될 확률이 매우 높습니다. 아마도 이러한 음성인식 디바이스는 훗날 개발될 로봇에 더욱 효율적이고 정확한 음성인식 소프트웨어를 탑재하기 위한 일종의 사전 실험 느낌의 제품이 아닐까 생각해 보았습니다.
알아보기 좋게 정리해 주셔서 감사합니다. 비교 분석을 자세히 해주셔서 나중에 구입을 할때도 도움이 되겠네요.
직접 써보니 꽤 유용한 제품이더라구요! 꼭한번 사용해보시는걸 추천드릴게요
잘 정리해주셨네요. 요즘 이런 인공지능 기반의 스피커가 엄청나게 나오네요. ^^
그러게요.. 앞으로는 스피커 뿐만아니라 다른 많은 디바이스에도 접목될 예정이라하니 많이 기대되네요
5월 다시 파이팅해요!
호출에 감사드립니다!