애플, ‘다크 데이터’ 처리 기업 인수···‘시리’ 더 똑똑해질까
애플이 비정형 데이터 처리 기업을 인수했다. 인공지능 비서 ‘시리’가 진짜 비서로 거듭날지도 모르겠다.
애플이 비정형 데이터 처리 방법을 연구하는 기업 래티스데이터를 약 2억달러에 인수했다. <테크크런치>는 5월14일 애플이 래티스데이터와 이미 2-3주 전에 계약을 체결했으며 약 20명의 기술자가 애플에 새로 합류하게 됐다고 전했다.
래티스데이터는 비정형 데이터(다크 데이터)를 정형 데이터로 변환시키는 기술을 보유한 기업이다. 스탠포드의 비정형 데이터 연구 프로젝트 딥다이브에서 출발했다.
비정형 데이터는 텍스트, 표, 그림, 영상 및 이미지에 묻혀있는 대량의 데이터다. 이러한 데이터들은 활용할 수 없어 방치돼 있었다. PDF 파일에서 원하는 정보를 긁어내기 어렵다는 사실을 떠올려보면 되겠다.
구조화돼 있지 않은 데이터는 기존 소프트웨어만으로 처리하기 힘들다. 인공지능 기계학습이 발달하면서 이러한 데이터까지 활용할 수 있게 됐는데, 딥다이브도 비정형 데이터를 활용하는 하나의 방식이다. 구조화되지 않은 텍스트 정보 등을 토대로 구조화된 데이터를 만들고, 기존 구조화된 데이터베이스와 통합해 구조를 찾아낸다.
딥다이브는 다양한 분야에서 활용되고 있다. 예를 들어 인신매매 종사자가 불법 노동, 성 노동자 등에 관한 공급 및 수요 정보를 게시하면 이를 처리해 이름, 주소, 전화번호, 서비스 요금, 작업 요구 사항 등과 같은 증거 데이터를 추출해낸다. 이 밖에도 범죄 수사 분야 외에도 지질학 및 고생물학, 약물 유전체학 등에서 응용된다.
딥다이브 연구진들이 공동 설립한 회사가 래티스데이터다. 2015년 첫발을 디뎠다. 이들은 최첨단 시스템 연구를 통해 수십억개의 웹페이지, 수천대의 기계 및 테라바이트 데이터를 포함하는 시스템과 응용 프로그램을 구축해왔다.
그렇다면 애플은 이 기업을 왜 인수했고 이 기술을 어떻게 사용하려는 걸까.
애플 대변인은 <테크크런치>와 인터뷰에서 “애플은 때때로 소규모 기술 회사를 사들인다. 우리는 일반적으로 우리의 목적이나 계획에 관해 논의하지 않는다”라고 밝혔다. 애플은 거의 모든 프로젝트를 비밀리에 추진하는 편이다. 그래서 추측만 할 따름이다.
인공지능 비서는 보통 정형 데이터를 활용한다. 달력에 잡힌 일정이나 검색을 통해 쉽게 알 수 있는 정보를 제공한다. 그 외에 엄청난 양의 데이터를 구문 분석하는 것은 쉽지 않은 일이다.
때문에 <엔가젯>은 래티스데이터를 인수한 것이 애플의 인공지능 비서 ‘시리’의 능력 향상을 위한 것이라고 내다봤다. 래티스는 비정형 데이터를 활용할 수 있게 만들어 시리가 더 많은 명령을 처리하도록 도울 수 있다. 불명확하고 불분명한 정보를 찾을 때에도 도움이 된다.
애플은 이전에 ‘애플 홈킷’을 내놓은 바 있다. 아이폰을 기반으로 스마트홈 기기를 제어하는 플랫폼이다. 현재는 아마존 에코 같은 스마트홈 스피커를 개발 중인 것으로 알려졌다.
시리의 활용도를 높인다면 단기적으로는 아마존 에코, 구글 홈 등 다른 인공지능 음성 스피커 업체와의 경쟁력을 높이는 데도 효과적일 것이다. 장기적으로는 시리가 사용자의 모든 것을 수행하는 ‘진짜’ 비서로 거듭날 수 있지 않을까.