3G 휴대전화의 구조 (14)-자연스러운 영상을 전송하는 부호화 처리

멀티미디어 서비스를 모바일 환경에서 제공하기 위해서는 음성 및 동화상을 디지털화해서 효율적으로 송수신하는 신호처리기술이 필요하다. 제3세대 휴대전화 ‘IMT-2000’은 광대역 통신의 특징을 살리기 위해 다양한 처리기술을 이용하고 있다.

IMT-2000은 음성 이외에도 정시화상, 동화상 등 멀티미디어 데이터의 송수신을 간단하게 처리할 수 있어 주고받는 정보량이 비약적으로 증가했다. 대용량 데이터를 원활하게 송수신하기 위해서는 데이터의 양을 최대한 줄여 전송해야 하는데, 이를 가능케 하는 것이 ‘부호화 처리’다. 부호화 처리란 휴대단말기가 송출하는 아날로그의 전기신호를 디지털 데이터로 변환하는 것을 말한다. 예를 들어 음성을 전송하는 경우, 정보의 양은 보통 약 100Kb/sec 정도가 되는데, 부호화 처리를 하면 약 10분의 1정도로 그 양이 줄어든다.

NTT Docomo의 제3세대 휴대전화 서비스 ‘FOMA’는 음성, 동화상, 정지화상을 각각 별도의 방법으로 부호화하고 있다. 이중 음성과 동화상의 부호화 처리에 대해 자세히 살펴보자.




--------------------------------------------------------------------------------
음성파형을 디지털 변환하는 음성부호화
--------------------------------------------------------------------------------
음성의 부호화를 통해 아날로그 전기신호를 디지털 데이터로 변환한다. 사람의 귀에 들리는 소리는 공기의 진동으로서, 일반적으로 아날로그 파형신호로 표현할 수 있다. 그러나 디지털 방식의 휴대전화에서는 이 아날로그 신호를 전기신호로 바꾼다. 또한 전기신호로 표현된 파형을 수치로 변환, 최종적으로는 0과 1의 조합으로 나타내는 디지털 데이터로 변환한다. 이것이 음성 부호화의 역할이다.

FOMA는 음성의 부호화를 위해 AMR을 이용하는데, 이 방식은 제2세대 휴대전화방식 ‘PDC’의 음성 부호화에 이용되고 있는 CELP 부호화 기술을 기본으로 하고 있다. CELP는 음성을 미리 준비해둔 패턴으로 변환시킴으로써 디지털 데이터로 변환시킨다.

구체적인 구조는 다음과 같다. 우선 단말기에 입력된 음성의 파형을 10mm~50mm초 단위로 구분, 양자화한다. 다음으로 이 신호에 가장 가까운 디지털 음을 생성하는 데 필요한 파형 및 소리의 크기 등을 나타내는 코드를 코드북에서 선택하는데, 코드북은 음량이나 음질을 나타내는 코드를 기록한 것과 각 발음의 차이 등을 기록한 2종류를 사용한다.

상대에게는 이 코드만을 전송한다. 코드북이란 단말기 내에 있는 데이터베이스로서, 음성에서 빈번하게 사용되는 신호파형에 식별용 번호가 붙어있다.

수신한 측에서는 송신측과 같은 코드북을 통해 파형을 합성하고, 그것을 배열해 음성신호를 복원한다.
이런 방식을 이용하면 음성신호를 그대로 전송하는 데 비해 데이터의 양을 약 10분의 1로 줄일 수 있다. 바꿔말하면 같은 주파수 대역에서 통화할 수 있는 이용자가 10배가 된다는 얘기다. 많은 이용자들이 동시에 통화하는 현재의 휴대전화 서비스에는 반드시 필요한 기술이라고 할 수 있다.


--------------------------------------------------------------------------------
데이터를 압축해 사이즈를 줄이는 동화상 부호화
--------------------------------------------------------------------------------
한편 동화상의 경우에도 다양한 방법으로 정보량을 압축하고 있다. 예를 들면 데이터의 정보량 압축에는 데이터의 差分을 이용한다. 일반적으로 동화상은 초당 5콤마에서 30콤마 정도의 프레임으로 구성되는데, 전후 프레임의 화상은 크게 다르지 않다는 성질을 갖고 있다.

그래서 직전의 프레임에서 差分만을 기록함으로써 데이터 량을 줄이고 있다. 이런 방법으로 데이터 용량은 최대 100분의 1까지 압축할 수 있다.

FOMA에서 이용하고 있는 동화상 부호화 방식 ‘MPEG-4’는 64Kb/sec 이하의 통신환경에서 멀티미디어 데이터를 이용할 수 있도록 개발됐다. FOMA는 MPEG-4를 통해 동화상을 48Kb/sec로 전송한다.
여기에 AMR로 부호화한 음성 12.2Kb/sec를 추가해도 FOMA의 64Kb/sec의 회선교환 서비스로 전송이 가능하다. 그 결과 TV전화 서비스를 제공할 수 있게 된 것이다. MPEG-4와 AMR의 조합은 영상기록 서비스에도 이용되고 있다.

<용어해설>
AMR: Adaptive Multiple Rate. 최대 12.2Kb/sec의 음성압축 부호화 방식. 기지국으로부터의 거리나 간섭상태, 트래픽에 따라 전송용량을 4.75Kb~12.2Kb/sec로 단계적으로 변환할 수 있는 것이 특징

CELP: Code Excited Linear Prediction. 미국 AT&T가 개발한 낮은 비트레이트의 음성 부호화 방식.

양자화: 연속적인 값을 단락적인 근사치로 변환하는 것. 아날로그 신호를 디지털화하는 처리과정에서는 아날로그 신호의 크기를 일정 간격으로 측정한 후에 양자화를 실행한다.

MPEG-4: Moving Picture Experts Group phase-4. ISO의 하부조직인 MPEG가 표준화 작업중인 멀티미디어 데이터의 부호화 방식. 정식 규격명은 ‘ISO/IEC14496’

의견 0 자료등록      목록