스마트폰 음성인식 서비스, 어디까지 써 봤니? AhnLab 콘텐츠기획팀 l 2020-05-06
아이폰의 ‘시리’가 일으킨 음성인식 광풍은 이제 선택이 아닌 모든 스마트폰의 필수 서비스가 됐다. 현재 국내에서 이용할 수 있는 스마트폰 음성인식 서비스는 애플 시리(Siri)와 구글 어시스턴트(Assistant), 삼성 갤럭시 시리즈에 탑재되는 빅스비(Bixby)와 S보이스, LG스마트폰의 Q보이스가 대표적이다. 해외의 음성인식 서비스인 코타나(Cotana)나 아마존 알렉사(Alexa)같은 서비스도 있지만 여기선 논외로 한다. 스마트폰 음성인식 서비스는 음악 재생이나 날씨 정보 같은 단순 서비스를 넘어 최근에는 집안에 있는 사물인터넷 기기를 제어하거나 온라인 쇼핑몰 주문 등으로 그 영역을 확대하고 있다. 스마트폰 음성인식 서비스가 얼마나 일상화되고 있고 앞으로 어떻게 발전해 나갈지 알아본다.
집안에 있는 사물인터넷 전자기기들이 사람의 말을 알아듣기 시작했다. 인공지능 스피커나 스마트폰의 음성인식 서비스와 연결되어 제어가 가능해진 것이다. 이를 테면 “하이, 세탁기. 청바지에 오물이 많이 묻었으니 강력 세탁해줘” 라든지 여행 갔다 돌아오는 길에 스마트폰에 대고 “하이, 에어컨. 집안에 온도 시원하게 해줘.” 혹은 “알렉사 전자레인지야 팝콘 튀겨줘.”나 “하이 냉장고. 냉장고 안에 딸기가 없으면 쇼핑몰에 주문해줘.”와 같은 명령을 그대로 따라준다.
스마트폰 음성인식 서비스의 발전
스마트폰 음성인식 서비스의 시초는 애플의 ‘시리’이다. 애플은 2011년 아이폰4S에 처음으로 음성인식 기술 시리를 탑재했다. 시리는 원래는 군사용으로 개발된 CALO 프로젝트의 일부 서비스가 상용화하면서 개발된 것으로 2010년 4월 애플에서 시리를 독점 인수하여 현재의 애플 시리가 탄생하게 되었다.
시리는 애플 iOS 5 이상, 아이폰 4S부터 지원하는 서비스다. 서비스를 시작한 지 9년 이상이 흐르면서 음성인식의 정확도와 명령 인식률이 매우 높아졌다. 또한 수준급의 자연어 처리를 통해 문맥을 이해한 결과를 사용자에게 스스로 제안하기도 한다. 기존의 음성인식 서비스들이 지정된 형태의 문장으로 말해야만 성공적으로 인식되었던 것에 비하면 놀랄만한 발전이다. 애플 스마트폰 사용자들은 '시리야'를 활용해 통화와 문자메시지, 일정 확인이나 알림 설정 같은 일상 업무, 음악 재생 및 멈춤 같은 간단한 기능을 음성으로 활용할 수 있다.
시리의 등장 이후 국내에서는 삼성전자의 S보이스, LG전자의 Q보이스, 펜택의 스마트보이스 등 음성인식 서비스들이 잇따라 선보였다. 삼성전자의 음성인식 서비스인 S 보이스는 애플 시리보다 1년 늦은 2012년 처음 공개됐다. 갤럭시 S3와 함께 공개된 이후 약 8년 동안 서비스를 유지했다. 삼성전자의 음성 인식 기반 서비스는 S 보이스 이전에 '음성 명령'과 '음성 대화'라는 기능이 분리돼 제공되다가 2012년 S 보이스가 등장하면서 '하이 갤럭시'로 음성 인식 비서 서비스를 가동했다.
초기의 S 보이스 기능은 삼성 스마트폰 안에 있는 기능을 실행하거나 인터넷을 통해 일정한 키워드를 검색하는 수준에 불과했다. 하지만 클라우드와 연계해 서비스 기능을 고도화하면서 점차 발전했으며 대화형 서비스도 가능하게 됐다. 하지만 2017년 3월 공개된 '빅스비'의 등장으로 S보이스는 후퇴하는 모양새다.
삼성 언팩 행사에서 갤럭시 S8과 함께 베일을 벗은 '빅스비'는 스마트폰과 웨어러블 기기뿐만 아니라 가전제품에도 적용되기 시작했다. 이후 삼성전자는 인공지능 비서에 대한 투자를 빅스비에 집중하고 있다. 그럼에도 불구하고 기존 스마트폰의 S 보이스가 빅스비로 대체되지는 않을 전망이다.
스마트폰 음성인식 서비스는 어떻게 호출할까? 아이폰은 '시리야'를 부르면 되고, 구글 어시스턴트는 '오케이 구글'이나 '하이 구글', 삼성 빅스비는 '하이 빅스비'라고 외치면 서비스가 실행된다. 삼성 빅스비는 또한 애플 시리, 구글 어시스턴트와 다르게 빅스비를 호출하는 물리 버튼이 있다. 만약 음성으로 빅스비 호출을 할 수 없는 상황이라면, 좌측면 아래 빅스비 버튼이나, 전원 버튼을 빅스비 버튼으로 할당해 호출하면 된다.
저가 피처폰에도 음성인식 서비스 탑재
음성인식 기술의 발전은 스마트폰 입력 방식에 변화를 가져왔다. 스마트폰을 손가락으로 입력하면 1분에 약 40개 단어를 입력할 수 있지만 음성으로 하면 150개 단어까지 가능하다. 이 같은 음성인식 서비스는 고령층이 주로 사용하는 피처폰에도 탑재되어 디지털 정보 격차를 해소할 수 있을 것으로 보인다. LG전자에서 출시하는 LTE 피처폰 'LG폴더2'에 음성인식 인공지능(AI) 비서인 '누구'와 '기가지니'가 탑재됐다. 폴더형 피처폰에 음성인식 인공지능 서비스가 탑재되는 것은 이번이 처음이다.
LG폴더2는 휴대폰 통화버튼 상단의 마이크 심볼이 새겨진 'AI 핫키' 버튼을 누르면 AI 비서가 실행된다. AI 비서가 "제가 도울 일을 말해주세요"라고 하면 궁금한 내용을 물어보면 된다. 답변은 음성과 텍스트로 동시에 알려준다.
AI 비서로 가능한 기능은 날씨, 계산기, 날짜, 어학사전, 백과사전 등이다. 또 감성대화도 가능하다. 하지만 디지털 정보 격차가 해소되기엔 아직 한계는 많다는 평가다. 음성으로 문자를 보내거나 전화를 거는 건 어렵고 복잡한 정보를 검색하기도 아직은 쉽지 않다.
스마트폰으로 가전제품도 제어하고 건강정보까지 컨트롤
앞서 예로 든 스마트폰으로 집안의 사물인터넷 가전기기를 작동하는 것은 점차 현실화되고 있다. LG전자는 최근 스마트폰으로 가전제품을 제어하는 ‘LG 씽큐(LG ThinQ)’ 앱(App)에 음성인식 기능을 추가했다.
LG전자는 고객들이 LG 씽큐 앱을 보다 편리하게 사용할 수 있도록 구글 어시스턴트 기반의 음성인식 기능을 넣기로 했다. 이렇게 되면 올해 말까지 무선인터넷(Wi-Fi)이 탑재된 생활가전 전 제품이 스마트폰을 통해 음성으로 제어할 수 있게 된다.
국내 가전업체 가운데 가전관리 앱에 음성인식 기능을 추가한 것은 LG전자가 처음이다. 씽큐 앱의 음성인식 기능을 사용해 가전제품을 제어할 수 있을 뿐 아니라 제품 상태를 파악하고 기능이나 고장 여부를 물어보고 생활 팁까지 얻을 수 있다고.
또한 음성인식 서비스를 활용해 스마트폰을 신용카드처럼 쓸 수 있는 서비스도 오픈됐다. Q 보이스나 구글 어시스턴트를 이용해 손을 대지 않고 말로 “LG 페이로 결제해줘”라고 말하면 앱을 터치하지 않고도 바로 결제가 된다.
최근에는 딥러닝 같은 기술이 발전되면서 음성, 이미지, 동영상 또는 텍스트와 같은 데이터를 자동으로 인식해 데이터와 연관된 정보를 제공하거나 데이터와 관련된 서비스를 제공하는 지능형 서비스도 선보이고 있다. 사용자로부터 입력된 데이터에 기초해 사용자의 상태 정보를 인식하고 사용자의 건강상태 정보를 분석하며 사용자의 건강상태 정보를 바탕으로 응답 메시지를 생성해 내보내는 특허를 삼성전자가 출원한 것이다.
예를 들어 S보이스나 빅스비를 실행하고 "내가 지금 왜 피곤할까?"라고 물어보면 S보이스나 빅스비는 단말기에 저장된 사용자의 걸음 수나 수면시간, 심박수, 운동량 등의 정보를 관련 기본 정보와 비교한 후 "어제 너무 많이 걸어서 무리하셨고 잠을 덜 잤어요.”라고 답변하고 이어 "푹 주무시고 쉬는 게 좋아요"라는 대답을 하는 식이다. 미리 정해놓은 패턴의 대답이 아니고 스스로 분석해서 인공지능적으로 답변을 하는 것이다. IT기술이 조금 더 발달하면 사용자의 마음까지 헤아려서 대화하는 음성인식 서비스가 나올 지도 모른다. |
'<정보 및 지식> > ◈ 컴퓨터 & IT' 카테고리의 다른 글
구직자 울리는 악성코드 조심하세요! (0) | 2020.05.17 |
---|---|
피싱, 스팸으로부터 가족을 보호하는 법 (0) | 2020.05.16 |
긴급재난지원금 스미싱 주의, URL 클릭하지 마세요! (0) | 2020.05.08 |
유튜브로 '생활 속 보안 정보' 알아보자 (0) | 2020.04.24 |
'배리어 프리'로 다가가는 IT 기술들 (0) | 2020.04.23 |