아이티랩 - 국내 연구팀, ‘AI 음향장면 인식 분야’ 세계 1위 달성

사진=ETRI

한국전자통신연구원(ETRI)가 국제 인공지능(AI) 음향기술 대회에서 글로벌 기업들을 제치고 우수한 성적을 달성했다. ETRI는 이달 초 IEEE(세계 전기·전자 기술자협회)가 주관한 음향기술 경진 대회(DCASE)의 ‘음향장면 인식 분야’에서 최종 팀 순위 1위를 차지했다고 밝혔다.

googletag.cmd.push(function() { googletag.defineSlot('/6357468/0.Mobile_Article_intext_1_300_250', [300, 250], 'div-gpt-ad-1468307418602-0').addService(googletag.pubads());googletag.pubads().collapseEmptyDivs();googletag.pubads().enableSyncRendering();googletag.enableServices();googletag.display('div-gpt-ad-1468307418602-0'); });

ETRI가 참가한 ‘복수 단말 대상 음향장면 인식’ 과제는 다양한 단말기로 녹음된 소리를 듣고 녹음 장소를 맞히는 분야다. 잡음이 쉽게 섞이는 스마트폰부터 액셔냄, 바이노럴 마이크 등의 댜앙한 장비에 입력되는 서로 다른 신호 특성을 정확하게 구분하는 일반화 성능이 관건이 분야다.

예를 들어, 프랑스 파리 지하철에서 나는 소리를 인식할 수 있는 AI를 만들었다고 치자. 여기에 사용된 학습 데이터는 스마트폰으로 녹음한 것이다. 대회는 이후 스마트폰이 아닌 다른 장비로 녹음된 소리를 들려줬을 때도 AI가 그것을 정확하게 구분할 수 있는지 여부를 측정하는 방식이다. 마치 사람의 귀가 조금씩 왜곡된 소리에도 응용력을 발휘해 그 원천을 구분할 수 있는 것과 같은 기능을 기계에 부여하는 기술이다.

이런 기술은 노약자나 청각장애인 등을 위한 ‘위험 회피기술’ 분야에 응용할 수 있다. 또 소리를 듣고 관련 정보를 도출하는 미디어 자동 태깅, 자동차·공장 장비 등의 소리를 듣고 이상 유무를 알아내는 상태 모니터링 등 다양한 분야로의 활용도 예상된다.

팀별로 최대 4개 기술까지 제출이 가능하고 총 28개 팀, 92개 시스템이 출전한 가운데 ETRI가 제출한 기술들은 좋은 평가를 받으며 전체 팀 순위 1위 달성에 기여했다. 2등은 조지아텍-중국과기대-텐센트-UEK 연합팀이 차지했다.

연구진은 ▲소리를 주파수 대역별로 나눠 모델이 각각 학습을 할 수 있도록 만든 ‘딥러닝 기반 트라이던트(Trident) 구조 신경망 개발’ ▲단말별 오디오 신호처리 특성 일반화를 이루는 ‘비균등 입력 특징 분할 기법’을 설계, 적용한 점을 비결로 들었다.

또한 AI가 시각, 언어 인식 등의 분야에서는 인간을 상회하는 수준으로 연구가 이뤄진 것에 비해, 청각 분야에서는 갈 길이 먼 상황을 고려해 ‘전자귀’처럼 모든 소리를 인식할 수 있는 기술 개발에 박차를 가한다는 계획이다.

한편, 올해로 6회째를 맞이한 본 대회는 IEEE AASP가 주관하고 구글, 인텔, 아마존, IBM, 삼성, LG 등 세계 유수 기관이 참가한 음향 기술 대회다. 6개 분야에서 총 138개 팀과 473개의 제안 시스템이 제출돼 지난 3월부터 6월 중순까지 과제별 기술 경쟁이 이뤄졌다.

The post 국내 연구팀, ‘AI 음향장면 인식 분야’ 세계 1위 달성 appeared first on Bloter.net.

의견 0 신규등록      목록