본문 바로가기

IT

인공지능 스피커에 담긴 전략

I. 공짜로 뿌려지는 AI 스피커들


 2014년에 아마존이 세상에 에코 (echo)라는 새로운 제품을 내놓을 때만 해도 조금은 낯선 느낌이었다. 

음성 인식 기기라는 특성상 언어 (language) 를 가릴 수 밖에 없어서 한글이 지원되지 않는 에코는 국내에는 거의 무용지물인 기기였으며, 게다가 아마존이 그런 제품을 만드는 데 있어 국내 시장을 시장을 타겟으로 하지도 않다 보니 꽤 먼 나라 이야기로 생각되었다.

햇수로는 3년이지만 이런 음성인식 기기는 이제 굉장히 빠르게 올라오고 있는 느낌이다. 스마트 OS 기반 생태계가 한번 갖춰지고 나니 그걸 토대로 응용할 수 있는 새로운 기기나 서비스의 탄생은 예전에 새로운 것들이 나오기 까지 걸렸던 리드타임과는 비교도 안될 정 도로 짧아 졌다. 그렇다 해도 국내에서 이런 소비재가 나오기에는 AI(인공지능) 및 음성인식 기술이 영미권보다 꽤 뒤쳐져 있었기에 최근 KT 와 SKT, 네이버와 카카오가 앞다투어 내놓고 있는 AI 스피커들의 모습은 필자의 예상보다도 조금 더 빠르다.



제품 소개 동영상만 보면 꽤 나이스해 보이는 이런 AI 스피커들이, 서두에 말한 것처럼 그야말로 공짜에 가깝게 시장에 '뿌려지고' 있다. 필자를 비롯해 꽤 많은 주변 지인들도 네이버나 카카오가 한정판매 한다는 그 시간만을 기다리며 대기했고, 런칭 이벤트를 놓쳤더라도 기어이 한대씩은 사고야 마는 모습을 연출하고 있다. 정확히 말하면 그들의 음악서비스에 가입하면 거의 공짜로 얻을 수 있는 거라 'WHY NOT'을 외치며 공짜 하드웨어를 하나씩 가져가고 있는 셈이다.


네이버와 카카오 같은 국내 포털들, 사용자들이 경험을 시작하는 관문을 장악하고 그걸 기반으로 비즈니스를 만들어 온 그런 기업들은 과거 아이폰의 사례에서, 그리고 스마트폰에 기본적으로 탑재되는 구글의 소프트웨어와 검색창을 보며 큰 교훈을 얻었다. 경험의 패러다임이 바뀌거나 새로운 경험이 의미있게 시작될 때 자칫 실기를 하면 안방을 다 내줄수 있다는 그런 교훈을 말이다. 그래서 이렇게 인공지능. 그리고 스피커에 있어서는 빠르게 따라오려 하는 지도 모르겠다. 꾹꾹 숨긴 채 기술을 좀 더 다듬는 모습보다는 빨리 오픈해서 협력할 것은 협력하고 개선점을 찾아가는 것이 보다 유리하다는 것 역시 깨달았기에 아직은 완성도에 있어 그리 칭찬받을 정도는 아니지만 이렇게 소비자의 손에 배달되는 완성품의 모습을 빨리 볼 수 있었으리라.



암튼 올 가을은 네이버와 카카오가 KT나 SKT가 먼저 내놓은 AI 스피커에 강력한 도전장을 던지면서 시장에 제법 움직임을 만들어 내고 있다. 그들은 기십만원은 받아야 할 것 같은 이런 AI 스피커들을 왜 이렇게 낮은 가격에 뿌려댈까?

거기에 숨은 인사이트를 한번 짚어 보기로 한다.



II. AI 스피커에 담긴 사업전략적 특성


네이버나 카카오가 AI 스피커를 그렇게 시장에 뿌려대는 것은 사업전략적 특성과 사용자 경험(UX) 특성에서 그 이유를 생각해 볼 수 있다. 먼저 네이버와 카카오가 자사의 AI 스피커들을 원가에도 못미치는 비용만 받고 공급하고 있는 데 깔려 있는 사업전략적인 생각들을 살펴보자.


음악과 결합한 부담없고 자연스러운 try 


솔직히 지금 나와있는 네이버의 웨이브/프렌즈 스피커나 카카오 미니 스피커들을 사용해 보면 소비자가로 적혀 있는 것처럼 10만원이 넘는 가격에 제품을 판매했다면 얼마나 구입으로 이어졌을까 싶다. 

이미 누구나 손에 스마트폰이 있는 상황에서, 제 돈을 주고 살 만큼 특별한 가치를 전해주는 녀석인가 바라보면 아직은 아니다. 음악을 주문하면 바로 틀어주고 알람을 맞춰주는 것이 즐거움을 주긴 하지만 아직 AI라고 부르기엔 일천한 경험들이 대부분이다.


이런 상황에서 '보급'에 필요한 전략이 필요했을 것이다. 약간은 시기상조일 것 같은 상품을 사람들 손에 쥐어주고자 하는 경우에 필요한 영민한 전략. 그런 기기가 스피커 형태로 나오고 거기에 자사의 음악 서비스가 결합한 이유가 여기에 있다. 실질적으로 유료음악 서비스에 필요한 비용만 내면 획득할 수 있는  AI 스피커들의 조건은 당장 그렇게까지 필요가 없을 수 있는 물건을 쉽게 집안에 들여놓을 수 있게 했다. 가치를 인지하고 구매하기에 이르기까지 아주 험난해 보이는 장벽을 이런 음악 서비스와의 결합과 아주 낮은 진입비용으로 허물고 사람들이 AI 스피커라는 녀석에 부담없는 첫 경헙을 하게 한 것이다.



음악 시장 점유율을 늘리는 모멘텀 도구


네이버 뮤직과 뮤직과 멜론이라는 음악 서비스들은 매일 치열한 경쟁을 치르는 시장이다 . KT 의 기가지니 역시 자사 음악 서비스인 지니와 결합하면서 기기 이름까지 정의할 장도이니 정도이니 … 이처럼 음악 스트리밍 시장에서의 점유율을 보다 높이기 위해 새로운 모멘텀이 될 것으로 이 AI 스피커를 바라봤다 . 실제로 네이버와 카카오가 이런 방식으로 공급을 하니 벅스 같은 음악 서비스를 사용하던 주변 지인들도 꽤 많은 이동을 했다 .


다양해질 컨텐츠 플랫폼의 전략적 시작 포인트


이런 식으로 보급하면 사람들은 AI 스피커를 통해 음악을 주로 듣게 된다. 거실에 가만히 앉아 '볼빨간 사춘기 음악 틀어줘' 한마디로 할 수 있는 경험은 꽤 그럴싸 하다. 사용하다보면 AI라는 말은 점차 무색해지고 그냥 음성을 좀 알아듣는 '스피커'만 남지만 어찌 됐든 사용자들은 이를 통해 유료음악들을 즐긴다.


이렇게 유료 컨텐츠를 스마트폰이 아닌 기기를 통해 즐기다 보면 TV에 이어 유료 컨텐츠 스트리밍을 즐길 수 있는 제3의 플랫폼이 되어 갈 것이다. 지금도 음악 외에 뉴스나 팟캐스트 등이 AI 스피커를 통해 가능한데, 기가지니가 그렇듯 이런 컨텐츠 영역은 음성 only 컨텐츠를 넘어 다른 분야로까지 확장될 것이다. 그럴 가능성을 가진 기기이기에 플랫폼 플레이어들이 과감한 투자를 하는 것이다.


하드웨어를 주고 소프트웨어와 데이터를 얻는 전략


프린터 비즈니스와 일견 흡사하다 보면 된다. 프린터들이 소모품을 팔기 위해 기기 자체는 아주 저가에 공급하듯이 AI 스피커는 하드웨어가 아닌 그 이후 소프트웨어를 통해 다양한비즈니스를 하기 위함이다. 제조 원가나 개발 비용이 당장 하드웨어 판매에서 보전되지 않더라도 일단 많이 깔고 보급해야 하는 것이 이런 비즈니스에서의 핵심이다. 일단 사람들이쓰고 있으면 AI 및 음성대화형 인터페이스에서 가져갈 서비스 모델들은 향후 무궁무진해진다. 

그리고 이는 공급하는 컨텐츠 입장에서만 봐서는 안된다. 우리가 공짜와 다름없이 받은 이AI 스피커들은 우리의 말을 끊임 없이 듣고 학습하고 있다. 보다 정교한 AI 기반 서비스를위해서는 수많은 데이터 축적이 필요한데 이러한 노드(node)를 확보하는 측면에서도 한시라도 먼저 보급을 하는 전략이 필요하다. 


결국 홈 IoT시장을 장악하기 위한 첨병 역할 


위에서 말한 컨텐츠 플랫폼으로서의 시작과 확장은 결국 홈 IoT 시장으로 이어진다. 컨텐츠스트리밍과 함께 이 AI 스피커가 제공하는 또 다른 측면의 경험은 ‘제어’, 즉 뭔가를 컨트롤하는 것을 자연스러운 음성으로 수행하는 경험이다. 스마트폰 역시 홈 IoT 에서 중요한 플랫폼 역할을 하겠지만 개인 기기가 아닌 고정형 가족 기기로서 TV와 함께 기대가 되는 거점이 바로 이런 음성 비서형 기기이다. 



‘지니야, 불 좀 꺼줘’ ‘샐리야, 세탁기 좀 돌려줘’ 처럼 스마트폰에서 하는 것 보다 직관적인제어가 되기에 그런 거점을 장악하는 것은 홈 IoT 라는 거대한 플랫폼 시장에 이르는 지름길이 될 것이다.



III. AI 스피커에서 주목해야 하는 사용자경험(UX)적 특성


  음성으로 대화를 통해 풀어가는 디지털 기기는 인류에게 꽤 익숙할 만도 하지만 반면 오늘날 손가락 하나로 거의 모든 걸 할 수 있는 세상이기에 생소한 부분도 있다. 다른 스마트기기들과는 뚜렷하게 다른 이 AI 스피커와의 경험이 이를 더 특별하게 만든다. 


자연어를 알아 듣고 사용자를 학습해서 또 자연어로 정보를 주는 AI 스피커만의 경험, 그런 특성들 때문에 더더욱 네이버와 카카오가 서둘러 이렇게 시장에 뿌려 대는 이유가 있는데 그것이 어떤 것들인지 짚어 본다. 


Direct Path UX로 인한 손쉬운 제어라는 특성


 ‘아이유의 밤편지 틀어줘’현존하는 음성인식 스피커를 가장 잘 활용하는 씬은 위와 같은 것일 것이다. 듣고 싶은 음악을 굳이 찾지 않고도 바로 주문하면 틀어주는 경험… 이런 스피커들이 스마트폰의 터치UX보다 더 편할 수 있는 몇 안되는 경험이다. 중간 메뉴를 탐색해서 몇 단계를 거칠 필요없이 바로 원하는 결과물을 꺼낼 수 있는 경험. 필자는 Direct Path UX라고 칭하는데 음성인식 스피커들이 줄 수 있는 이런 유쾌한 경험들에 사용자들이 적응하게 될 것이다. 


이것 저것 선택하지 않고 바로 뭔가를 제어할 수 있는 경험, 이는 홈 IoT 와 같은 시장에서절대적으로 필요한 경험이 된다. 그런 경험을 익숙하게 만드는 시발점이 되서 음성인식 스피커들이 집안에 있는 다양한 장치들을 제어하는데 가장 유리한, 혹은 쉬운 출발점이 될 수있는데 이러한 경험적 특성도 사업전략적 특성과 더불어 스피커를 대거 뿌리게 만드는 중요한 이유가 된다. 


한글이라는 따뜻한 언어 장벽 


 앞선 언어 인식력과 보다 다양한 스킬(?)을 발휘하는 해외 플랫포머들의 인공지능 스피커,그들은 다행히(?)도 한글을 못하거나 익숙하지 않다. 즉 아마존의 에코가 제아무리 할 수있는게 많다고 해도 한글로 말을 걸면 아무런 성과가 없다. 그들이 한글을 익혀서 학습을하기까지엔 제법 시간이 필요하게 된다. 


이런 언어 장벽은 국내 포털들에게 꽤 짭짤한 장벽 역할을 해왔다. 네이버가 한글이라는언어 장벽이 가능한 시대를 잘 활용해서 지금과 같은 강력한 국내 포털을 구축한 것처럼텍스트로 된 정보에 있어서도 마찬가지였다. 하지만 텍스트 시장에서는 이제 구글과 같은검색 포털에게 언어 문제가 더 이상 장벽이 아니듯 음성 시장도 머지 않았을 것이다. 예전 처럼 한글이라는 언어 장벽이 주는 해피타임(?)이 길지 않다. 그렇기에 더더욱 네이버나 카카오는 이런 음성 스피커들을 뿌리는데 서둘렀을 것이다. 


유년기부터 실버층까지 아우르는 보편적 경험이라는 특성 


 대화라는 Natural UX는 그 층을 매우 폭넓게 만든다. 하루가 다르게 진화하는 스마트폰 화면 위의 인터 페이스는 누군가에게 어렵지만 말로서 대화하는 것은 매우 보편적인 경험이다.즉 앞서 예를 든 ‘아이유의 밤편지 틀어줘’ 와 같은 명령은 어린 아이에서부터 할아버지 할머니까지 누구나 할 수 있는 표현이다. 


경제력이 있는 실버층은 수익 모델을 확장시켜 줄 것이고, 어려서부터 경험에 익숙하게 하면 장기적으로 네이버나 카카오에게 큰 고객층이 된다. 귀여운 스피커 때문에 시작했지만그 때문에 어느 새 정착하게 되는 플랫폼… 장기적인 고객 확보 측면에서는 매우 중요한부빈이다. 그렇게 만드는 보편적인 경험을 인공지능 스피커가 제공하고 있기에 그 누구보다도 빨리 시장에서 그들을 만나보게 하려는 것이다



아주 소수의 선택지만을 제공하게 하는 특성‘


 '이 주변에 중국집 좀 알려줘’ 

네이버에 근처 중국집을 검색하면 수십개의 리스트가 검색되서 나온다. 그렇다고 인공지능스피커에게 저렇게 물어봤을 때 여기저기 엄청 많은 중국집들을 다 얘기할 수는 없다. 그중 몇 개만 추려서 선택하게 만드는 데 이런 경험 역시 독특한 부분이다. 

그런 소수의 선택지만을 제공하는데 있어 나름의 기준과 필터링을 하게 될 것이고 이는 또다른 포털로서의 지위와 파워를 제공할 것이다. 그것은 엄청난 광고 시장으로 이어지게 될텐데 이런 매력적인 시장을 두고 느긋할 수는 없는 것이다. 이런 또 하나의 게이트를 점유하고 컨트롤하기 위한 싸움이 기다리고 있는 것이고 비즈니스 모델 자체가 그 장악력인 그들은 하루 빨리 시장에서 플레이하고 싶었던 것이다. 



개인 기기가 아닌 가족형 기기라는 특성 


 음성 인식 스피커는 개인 기기라기 보다는 가족형 기기에 가깝다. 스마트폰이야 매우 개인적인 기기이지만 스피커를 가지고 다니면서 혼자만 듣는 장치로 쓰는 사람은 거의 없을 것이다. 스피커라는 특성상, 그리고 소리를 내서 말하고 큰 소리로 들어야 하는 UX 특성상이는 가족형 기기로 포지셔닝 된다. 


가족형 기기의 특성을 가지면 가정에서 그걸 소비하는 숫자에 있어 심리적으로 제한을 받게 된다. 즉 이를 마치 개인형 기기처럼 가정 내에서 사람마다 사는 것이 아니라 가정당 1대 정도가 현실적인 한계일 수 있다는 것이다. 서로 다른 2개의 음성인식 스피커를 사도이상할 것은 없지만 마치 거실에 라디오가 2대 있는 것이 어색할 수 있듯이 이 또한 어색해서 구매 심리에 영향을 준다. 그래서 특정회사의 음성인식 스피커를 먼저 손에 얻게 되면 추가로 다른 회사의 제품을 더 구매할 확률이 낮아진다. 그렇기 때문에 그래서 더더욱서두르고 이를 초저가에 뿌려버리는 것이다.



IV. 주안점을 둬야 할 포인트들


 사업전략적인 이유로, 그리고 AI 스피커만의 경험적 특성으로 인해 서둘러 시장에 뿌리려고 하는 이유들을 살펴보았다. 그 외에도 이유들은 더 있겠지만 결국 중요한 것은 현재의기기가 지속 가능한 가치들을 제공해야 그런 이유들이 의미가 있어진다. 지속 가능한 가치들을 제공하지 못하면 막대한 비용을 감수하면서 뿌렸지만 결국 외면되어 버릴 수도 있다. 


가장 최악의 시나리오는 지금 정도 수준에 머무르며 이러다 마는 모양새이다. 몇 년 전 3DTV가 그러했듯이 한참 열풍처럼 기술 경쟁을 부추기며 너도 나도 떠들었지만 그 경험적장벽을 결국 극복 못하고 현재는 외면되 버리듯 말이다. 인공지능 스피커들도 지금 핫하지만 냉정히 그 제공 가치들을 보면 아직은 많이 부족하다. 할 수 있는 것들이 훨씬 많아져야 지속 사용하게 되는 기기가 될 것이다. 


그런 가치들, 소위 Value Contents (밸류 컨텐츠)의 발굴과 함께 그 완성도를 빨리 높여야할 것이다. 음성인식 스피커만이 줄 수 있는 WoW 팩터를 키워야 하는데 여기서 주안점을가져가야 할 생각은 3가지이다. 


첫째, ‘음성’에 주목하는 밸류 컨텐츠가 우선되어야 한다. 


어디까지나 음성으로 주고 받는 것이 메인인 스피커이다. 위에서 말한 음성UX 경험과 착달라붙는 컨텐츠들이 우선적으로 완성도를 가져가야 한다. 외국어 번역이나 회화 연습과같은 컨텐츠는 매우 잘 어울리는 부분이다. 아이들에게 동화를 읽어주는 것도 지금 스피커에서 매우 가능성이 보이는 분야이다. 스마트폰에서도 물론 가능한 것들이지만 지극히 개인적인 기기인 스마트폰에서 하면 좀 불편할 수 있는 컨텐츠가 이 스피커들과는 기가 막히게 들어맞는 것들이 있다. 


반대로 최근 시도하고 있는 이런 음성 스피커들을 통한 음성 뱅킹 같은 서비스는 좀 더 우선순위를 뒤에 둬야 한다. 음성만으로는 완연한 경험이 되지 않고 중간에 반드시 시각적인확인을 해야 하는 그런 컨텐츠나 서비스는 이 스피커를 통해 WoW한 경험을 주지 못한다. 


둘째, 스마트폰보다 비교우위에 있는 포인트에 집중해야 한다. 


스마트 기기이자 인공지능이라고 해서 스마트폰과 동일하게 접근해서는 안된다. 반드시 스마트폰보다 유리한 부분이 있어야 의미있는 경험이 된다. 앞서 예를 든 그런 음악 서비스가 주는 Direct Path UX는 분명 차별적인 가치를 주고 있다. 


하지만 포털들이 현재 음성인식 스피커에서 계획하고 있다고 발표하는 음식배달 서비스 같은 경우는 필자를 갸우뚱하게 한다. 주문하기 위해 뭔가를 입력하고 또 그것을 확인하는작업이 반복적으로 일어나는 데서는 이런 대화형 UX가 스마트폰보다 더 우위에 있기 어렵다. 되기는 되지만 매우 불편한 경험을 줄 수 있는 그런 서비스는 결국 외면될 것이다. 


셋째, 오픈 생태계를 충분히 받아들여야 한다. 


보편적인 경험이 가능한 기기이지만 아직까지 인류가 제대로 경험하지 못한 분야. 그런 데 는 어떤 서비스나 경험이 폭발적으로 시장을 이끌지 잘 예측이 안된다. 스마트폰이 비로소 앱스토어와 같은 오픈 플랫폼을 통해 폭발적으로 성장했듯이 그런 곳에서는 생태계 성숙이 매우 절실하다. 


충분히 오픈하고 다양한 파트너 기업과 개인이 참여할 수 있는 생태계를 만들어야 빠르게성장시킬 수 있다. 다행히 이 부분은 그동안 학습효과가 있어서인지 포털이나 통신사가 무엇보다 신경을 쓰고 있는 것 같다. 아이디어는 과감하게 오픈하고 마음껏 활용할 수 있게Issue&Trend 10해야 한다. 

이런 것들을 보다 고려하면서 AI 스피커 시장을 만들어 간다면 상당히 매력적인 경험들을지속 만들어낼 수 있을 것으로 보인다. 그러기 위해서는 자연어 인식이나 취향 학습 등 기술적인 성숙도도 빠르게 따라가 줘야 하지만 그런 부분은 인공지능 기술 진화로 인해 꽤시간이 단축된 것도 사실이다. 


아무쪼록 새로운 경험과 가치들에 목말라 있는 요즘, 이 작고 귀여운 스피커들이 시장에재밌는 파장을 만들어 주길 기대해 본다.

- 이화여대 디자인대학원 겸임교수 문형철

출처: 왜 네이버/카카오는 AI스피커를 뿌려대는가