본문 바로가기

요즘 뜨는 브랜드&트렌드

독립형 포켓 AI 디바이스: 래빗(Rabbit) R1를 통해 본 빅테크(Big Tech) 트렌드

반응형

 

 

2024년 CES(Consumer Electronics Show)에서 선보인 래빗(Rabbit) R1이 많은 주목을 받으며, 하루만에 1만대가 판매되는 관심을 모으고 있습니다. 새로운 디바이스에 관심을 두고 있는 분들에게도 관심이지만, 전세계 테크 구르(Guru)들에게도 관심을 보이고 있다고 합니다. 그래서 이번에 선보인 래빗R1에 대해 살펴보면서, 앞으로의 기술변화에 대해서 살펴보도록 하겠습니다. 

 

 

 

 

독립형 음식AI 디바이스: 래빗 R1

래빗테크 CEO이자 창업자 제시 류(Jesse Yu)는 키노트에서 래빗R1은 스마트폰을 대체하는 용도가 아닌, 독립형 AI라고 밝혔습니다. 한손에 들어갈만한 크기에 2.88인치 터치스크린, 전면과 후면으로 돌아가는 카메라, 스크롤 훨, 마이크가 장착된 래빗 R1은 외관만 보아도 매력적인 제품이라고 생각됩니다. 미디어텍 2.3GHZ 프로세서, 4G 메모리, 128GB SSD가 장착된 래빗R1은 스펙면에서 보면, 보급형 스마트폰보다 낮은 수준이기 합니다. 블루투스 5.0, 와이파이(2.4GHz + 5GHz / 4G LTE) 통신도 포함이 되어 있습니다.

 

스크린을 통해 보여주고 있는 토끼는 디바이스와 사용자간에 연결고리를 만들어주는 역할과 동시에 과거에 가지고 놀던 게임기 같은 묘한 매력을 주고 있기도 합니다. 현재 199달러는 가격 역시도 한번 사보고 싶은 마음이 들 정도로 부담없는 가격이기도 합니다. 래빗 R1의 제품 디자인은 틴에이지 엔지니어링(teenage engineering)과 협업을 했다고 하는데요. 틴에이지 엔지니어링은 아크네 스튜디오라는 광고 회사를 공동 창업했던 아트 디렉터 제스퍼 쿠토트드 등이 2007년에 설립한 스웨덴의 음향 기기 제조 회사로 미니멀한 디자인 감각으로 힙한 제품들을 선보이고 있는 회사입니다. 

 

이번에 선보인 래빗R1은 독자적인 래빗OS를 통해 작동하며, 챗GPT와 같은 거대언어모델 LLM(Large Language Model)을 기반으로 한 음성 AI 에이전트(Agent)라고 소개하는데, 가장 적합할 듯하네요. 쉽게 생각하면, 거대언어모델을 기반으로 하고 있는 애플 시리(Siri), 아마존 알렉사(Alexa)라고 이해하면 쉬울 것 같습니다.



 

 

과연 래빗 R1은 무엇을 할 수 있을까?

음성인식이라는 영역도 일종의 디바이스와 사용자간의 컨트롤러의 역할을 하고 있습니다. 인터페이스을 생각해보면, 리모콘, 키보드, 마우스, 펜슬, 터치 스크린까지 발전을 해왔지만, 터치스크린을 제외하면 도구를 사용하는 인터페이스의 발전이라고 할 것입니다. 그리고 음성인식에 대한 발전 역시도 지속적으로 개선시키며, 발전해 온 것도 사실입니다. 하지만, 음성인식의 단점은 무엇인가를 물어보고, 요청하지만 현실에서는 인간의 행동이 들어가야 완성이 된다는 점에는 한계점을 가지고 있기도 했습니다. 즉 묻고 답하는 정도의 간단한 방식이었다면, 이번 래빗R1은 단순한 음성인식 인공지능 디바이스와는 다른 형태로 전개가 된다는 점에서 관심을 모으고 있지 않을까 싶습니다. 그래서 음성을 기반으로 스마트 디바이스가 어떻게 발전하게 될지를 보여준 사례라는 점에서도 높은 평가를 얻고 있기도 한 것으로 생각되네요. 

 

CEO 제시류 키노트에서 보여진 사례 중 가장 많이 쓰이기도 하고, 단순한 기능이라고 할 수 있는 것이 바로 음성으로 좋아하는 음악을 틀어달라는 요청하는 부분이었습니다. 이는 현재 음성AI 디바이스로도 충분히 가능하다는 점이지만, 여기에 머물러 있지 않고 래빗 R1은 음악을 만든 작사가에 대한 정보를 묻으면 답변을 해주기도 합니다. 그리고 음악에 대해 어떻게 생각하지에 대한 래빗 AI의 답변을 얻을 수 있기도 하네요. 이외에 어떤 기능들이 가능한지 키노트에 소개된 부분을 살펴보겠습니다.

 

 

 

 

 

우버(Uber) 예약하기

 

(사용자)
“지금 사무실에서 집까지 가고 싶은데, 수화물이 3개나 되고, 사람들은 여섯명이니까, 우리 모두가 탈 수 있는 우버를 찾아줘"

 

(래빗 AI)
“6명이 탑승 가능하고, 수하물이 3개가 있는 경우, 모든 승객과 수화물을 수용할 수 있는 우버 XL예약이 좋습니다.”

 

 

다음 대화에서 볼 수 있듯이, 사용자는 래빗 AI에게 간단한 지금의 상황을 이야기하면, 래빗 AI는 사용자의 상황을 고려하여, 우버 XL을 추천하는 방식으로 전개가 되고 있습니다. 그리고 마지막으로 최종 컨펌을 사용자에게 요청을 하는 과정으로 마무리가 되게 됩니다. 

 

 

 

 

 

음식 배달 주문하기

 

 

 

(사용자)
“피자헛에서 12인치 피자를 여기로 배달해줘"

 

(래빗 AI)
“앱에서 가장 많이 주문하는 옵션이 괜찮습니다.”
“당신이 가장 많이 주문하는 옵션이 괜찮다고 했으니, 피자헛에서 12인치 피자를 주문하세요”
“방금 12인치 피자를 주문했습니다. 클래식 마리나다 소스와 레귤러 치즈가 토핑될 예정입니다”

 

 

피자헛에서 주문하는 과정을 보면, 래빗 AI는 피자헛에서 가장 많은 주문이 있는 메뉴를 파악하고, 사용자에게 추천합니다. 그리고 사용자가 평소 주문이 많은 피자를 선호한다는 것을 기억하고 있다는 것도 알수가 있습니다. 이러한 과정에서 사용자의 평소 스타일을 다시 한번 음성에서 표출하여, 확인하는 과정은 마치 사람이 대화를 풀어가는 방식으로 자연스럽게 적용되고 있다는 점을 보면, 챗GPT와 채팅하는 부분이 음성으로 현실화된 것으로 생각이 됩니다. 그리고 마지막 과정은 역시 사용자의 최종 컨펌으로 주문이 완료가 되는 방식입니다.

 

 

 

 

여행 계획하기

 

 

 

 

래빗 AI는 스마트폰의 여러 앱이 필요한 복잡한 과정을 쉽게 수행할 수 있다고 합니다. 개인적으로는 이 부분이 매우 흥미로웠습니다. 우리가 여행 계획을 하다보면, 항공권 예약, 호텔 예약 등 많은 검색과 가격 비교 등의 과정을 거쳐야 합니다. 하지만, 래빗 AI는 이러한 여러 앱(App)을 통해 일어나는 복잡한 과정을 한번에 수행해준다는 점이 매우 흥미로웠습니다.

(사용자)
“나와 아내, 그리고 12살 아이가 있는데, 가족이 함께 런던 여행을 가고 싶어. 1월 30일부터 2월 5일로 일정을 생각하고 있는데, 전체 여행 계획을 세워줄 수 있니? 저렴한 직항편, 단체석, 멋진 SUV, 와이파이가 제공되는 호텔을 선호해.”

 

(래빗 AI)
“저는 당신의 여행을 현실로 만들기 위해 티겟팅 옵션을 검색하고 있습니다. 여행 중 다양한 항공편 옵션, 선택할 수 있는 다양한 호텔, 이용 가능한 렌트카를 찾아봤습니다. 자세한 내용과 예약을 위해 각 옵션을 개별적으로 확인해주세요”

 

이러한 대화과정을 통해 사용자는 가족과의 런던여행 계획을 래빗 AI를 통해 제안 받게 됩니다. 막상 여행 계획을 세우다보면, 항공권, 호텔 예약 등이 번거로워서 여행사 패키지를 활용하는 경우가 많기도 합니다. 하지만 래빗 AI를 활용하면 복잡한 검색과 비교 과정을 거치지 않고, 래빗 AI가 제안한 부분을 확인하면서 쉽게 여행계획을 세울 수 있다는 점에서 보면, 검색이라는 복잡한 과정이 이제 점차 사라질 수 있다는 생각이 들기도 합니다.

 

(사용자)
“내가 런던에 있는 동안, 재미있는 일을 할 수 있도록 일정을 짜 줄 수 있겠니?”

 

(래빗 AI)
“저는 여러분의 여행을 위해 상세한 여행 계획을 준비했습니다. 요약하면, 런던의 상징적인 랜드마크, 박물관을 방문하고 현지 레스토랑에서 맛있는 식사를 즐기고, 다양한 동네의 활기찬 분위기를 경험할 수 있도록 계획 했습니다. 내비게이션 세부정도로 준비되어 있어서, 도와드릴 수 있습니다. 참석하고 싶은 모든 이벤트의 티겟도 예약을 할 수 있습니다.”

 

(사용자)
“전체여행 계획도 좋지만, 너무 무리한 것 같아서, 조금 쉬운 일정으로 계획해줄 수 있겠니?”

 

(래빗 AI)
“물론입니다. 한번 보시고 어떻게 생각하는지 알려주세요. 모든 세부 사항이 포함하여 더 편안한 일정을 제공했습니다. 정말 좋은 것 같아요.”

 

위에 대화 내용을 살펴보면, 스케줄이 꽉찬 여행부터 여유있는 여행까지 래빗 AI를 통해 제안받을 수 있다는 점도 흥미로웠습니다. 공상과학 영화에서나 보던, 일들이 현실로 다가오고 있다는 생각이 드네요. 

 

 

 

카메라를 사용한 음식 레시피 제안

 

(래빗 AI)
“냉장고에 뭐가 있나요?”

 

(사용자)
“칼로리가 낮은 맛있는 요리를 만들어줄래?”

 

(래빗 AI)
“냉장고를 잠깐 볼께요. 그린 가든 오믈렛은 어떠세요?
맛있고 저칼로리 요리로 브로콜리와 양배추의 신선함과 달걀의 크리미함이 어울려져 있었습니다. 여기 간단한 레시피가 있습니다.”

 

래빗 R1 장착된 카메라를 통해 앨범 커버 사진을 보여주면, 음악을 들려주기도 하고, 냉장고의 내부를 보여주면, 냉장고에 있는 재료를 인지하고, 재료를 가지고 만들 수 있는 음식을 만드는 레시피를 제안해 주는 것도 가능하다는 점을 키노트를 통해 살펴볼 수 있었습니다. 만약 유튜브에 요리 컨텐츠를 래빗 AI에게 보여준다점 유튜브 컨텐츠를 보여주면 간단하게 정리된 레시피를 받을 수 있다는 점도 편리하게 활용될 수 있는 장점이 되지 않을까 싶습니다. 

 

 

카메라를 사용한 문서 작업 지원

 

래빗 AI는 문서 작업을 도와주기도 한다고 합니다. 역시 카메라를 통해 작업중인 문서시트를 보여주면, 래빗 AI는 테이블 데이터를 살펴보고, 일치하는 열을 추가하여 이메일로 결과를 보여주는 기능 역시 가능하다고 키노트를 통해 시연을 해주고 있었습니다. 물론 사용자는 래빗 AI가 보낸 이메일에 피드백을 줄 수 있기도 하네요. 

 

 

 

티치 모드(Teach Mode)

 

CEO 제시류에 따르면, 티치 모드라는 것을 실험하고 있다고 하는데요. 우리가 친구에게 스케이트보드 타는 법을 가르칠 수 있는 것처럼 래빗 R1에게도 특정 방법을 알려주면, 사용자가 가르쳐준 것을 학습할 수 있다고 합니다. 키노트에서는 예를 들어서 보여준 것은 AI를 통해 이미지 생성이었습니다. 미드저니(Midjourney)를 접속해, 프롬프트를 입력하여 귀여운 아기 들개를 생성하는 법을 학습하게 되면, 이후 래빗 R1은 사용자가 음성을 통해 요청한 이미지를 미드저니를 활용해서 만들고, 래빗 R1을 통해 생성한 이미지를 보여주는 것이 가능한 것을 알 수 있었습니다. 미드저니 사용법을 학습한 래빗 AI는 사용자가 음성으로 픽셀 아트 스타일의 토끼를 만들어달라는 요청에게 이미지 생성을 하여, 사용자에게 보여주는 과정 역시도 키노트에서 볼 수 있기도 했네요. 

 

 



 

LLM에서 LAM로 발전

이번 래빗 R1에 관심을 갖게 된 이유는 거대 언어모델(Large Language Model)이 아닌, 거대행동모델(Large Action Model)이라는 점으로 요약할 수 있을 것 같습니다. 지금까지 빅테크의 발전에서 보면, 컴퓨터, PDA, 스마트폰 등이 있었지만, 인간의 행동을 대신해 준 디바이스는 많지 않았습니다. 챗GPT를 통해 웹검색의 시대에서 질문, 그리고 대화로 발전하면서 시리와 같은 음성AI가 나오지 않을까라고 생각을 하긴 했습니다. 하지만, 이 역시도 음성으로 통한 디바이스와 사람간의 커뮤니케이션으로 끝나는 경우가 대부분입니다. 하지만 래빗 R1을 음성을 통해 대화하고, 인간이 그 동안 하던 행동 과정을 대신해 줄 수 있다는 점에서 앞으로 애플, 삼성, 구글과 같은 스마트폰 업체들이 어떻게 기술 개발을 풀어가야할지 실마리를 주는 게기가 될 것으로 생각됩니다. 또한 개인이 휴대한 스마트폰이 사용자를 이해하는 학습까지 이루어진다면, 음성 명령을 통해 다양한 작업을 사용자에 맞게 수행하게 될 것으로 기대가 됩니다. 래빗 OS를 통해 역시도 지속적인 업데이트를 한다면, 지금까지 우리가 보지 못한 경험을 래빗 R1을 통해 가능해지는 시점이 올 것으로도 예상이 됩니다. 

 

 

온디바이스(On-Device) AI의 시대

온디바이스 AI는 기기 자체에서 작동하거나 처리되는 것을 의미합니다. 소프트웨어나 기능이 외부 서버나 클라우드에 의존하지 않고, 사용자의 장치나 기기 내에서 직접 실행되거나 처리되는 것을 말합니다. 래빗 R1은 바로 온디바이스AI의 가능성을 보여준다는 점에서도 앞으로 지켜볼 포인트가 아닐까 싶은데요. 23년 12월 애플이 논문으로 발표한 페렛(Ferret)을 보면, 쉽게 이해하기 어려운 부분이 있긴 하지만, 애플은 원도잉(Winnowing)과 로우 컬럼 번들링(Row Column Bundling)이라는 기술을 통해 스마트폰과 같은 한정된 메모리에서도 거대 언어모델(Large Language Model)를 구현할 수 있는 연구를 하는 것으로 보여집니다. 그래서 앞으로  인공지능산업은 온디바이스로의 구현을 위한 발전으로 방향점을 찾고 있지 않나 싶습니다.  다만, 인공지능 산업은 지금까지 우리가 직면했던 기술과는 전혀 다른 차원이라는 점에서 인공지능 산업으로 일어날 윤리적 문제에 대한 논의도 같이 이루어져야겠다는 생각도 들긴 하네요. 

 

 

 

Don't Be Evil
사악해지지 말자


 

 

 

728x90
반응형