KR100808909B1

KR100808909B1 - 화자구분이 가능한 다중 화상대화 시스템 및 그 제공 방법

Info

Publication number: KR100808909B1
Application number: KR1020060074724A
Authority: KR
Inventors: 문정훈
Original assignee: 엔에이치엔(주)
Priority date: 2006-08-08
Filing date: 2006-08-08
Publication date: 2008-03-03
Also published as: KR20080013332A

Abstract

본 발명에 의한 다중 화상대화 시스템 및 그 제공 방법이 개시된다.

본 발명은, 다중 화상대화를 가능하게 제공하는 시스템에 있어서, 사용자 단말기는, 디스플레이 화면상에 대화상대방에 대응하는 위치마커의 위치에 근거하여, 대화상대방으로부터 전달되는 미디어 데이터에서 추출된 음향의 출력음량을 조절하여 출력하는 것을 특징으로 하는 화자구분이 가능한 다중 화상대화 시스템 및 다중 화상대화 시스템 상에서 화자구분이 가능한 다중 화상대화 제공 방법이다.

본 발명에 의하면, 디스플레이의 화면상에서 대화상대방에 대응하는 위치마커에 근거하여 음향의 좌우음량이 조절되므로 사용자는 마치 입체적인 공간에서 대화상대방과 대화를 나누는 느낌을 가지게 되며, 복수의 대화상대방과 대화시에도 사용자는 각각의 다른 위치에서 화성이 들리는 느낌이 가지게 되므로 그에 따라 대화상대방을 구분할 수 있게 된다.

화상대화, 화상통화, 음향분배장치, 위치마커, 인터넷 폰

Description

화자구분이 가능한 다중 화상대화 시스템 및 그 제공 방법{System of Multiple Picture Conversation and Providing Method Thereof}

도 1은 다중 화상대화 시스템의 구성도를 개략적으로 나타낸다.

도 2는 본 발명에 따른 다중 화상대화 시스템의 사용자 단말기 구성부분을 개략적으로 도시한다.

도 3은 본 발명에 따른 다중 화상대화 시스템에서 영상 데이터를 처리하는 구성부분을 포함하는 사용자 단말기의 구성을 개략적으로 도시한다.

도 4는 본 발명에 따른 다중 화상대화 시스템에서 화자구분이 가능한 다중 화상대화 제공 방법에 대한 개략적인 흐름도를 나타낸다.

도 5는 본 발명에 있어서, 미디어 데이터가 영상 데이터를 포함하는 경우 화자구분이 가능한 다중 화상대화 제공 방법에 대한 개략적인 흐름도를 나타낸다.

도 6a 및 도 6b는 본 발명에 있어서, 위치마커의 이동에 따른 출력음향의 변화를 나타낸다.

도 7은 본 발명에 있어서, 배경화면과 그에 대응하는 효과음을 제공하는 방법에 대한 개략적인 흐름도를 나타낸다.

도 8a 및 도 8b는 본 발명에 있어서, 배경화면이 시현된 실시예를 나타낸다.

<도면의 주요부분에 대한 부호의 설명>

110 : 통신 수신부 120 : 음향 추출부 130 : 음향 분배부

140 : 스테레오 믹서부 150 : 스테레오 스피커부

200 : 디스플레이부 210 : 위치마커 220 : 위치 인식부

230 : 저장부

본 발명은 다중 화상대화 시스템 및 그 제공 방법에 관한 것으로, 보다 상세하게는 멀티세션 컨퍼런스 소프트 폰 또는 VoIP를 이용한 시스템에서 화자를 구분 가능하게 하는 다중 화상대화 시스템 및 그 제공 방법이다.

인터넷 사용자 수의 급격한 증가와 인터넷 서비스 보급의 대중화로 인해 인터넷 텔레포니(VoIP) 기술은 전 세계 전기통신사업자 및 인터넷서비스 사업자들의 주요 이슈가 되고 있다. 최근 인터넷 전화 관련 시장 규모가 전세계적으로 기하급수적으로 성장하고 있는 등 인터넷 텔레포니 서비스에 대한 기술 개발이 급격히 진행되고 있다.

종래의 다중 화상대화 시스템은 다중사용자 간에 사용자의 음성을 믹싱하는 중앙 멀티컨퍼런스 유닛(MCU)에서 화상과 음성을 종합하고, 종합된 신호를 각각의 클라이언트에게 전송하였다. 상기 중앙 멀티컨퍼런스 유닛은 화자의 구분을 위한 특정한 처리를 하지 않으며 화상도 일괄적으로 처리하여 대화를 듣는 사람들은 그 참여자 수에 관계없이 단지 하나의 음성채널로만 음성이 전달되어 화자의 구분이 모호한 문제점이 있다.

네트워크 기술의 발달에 따라 피어투피어 형태의 메쉬형 컨퍼런스 시스템이 나타나게 되었다. 이 시스템은 각각의 화자로부터 독립된 화상과 음성 신호를 전송받을 수 있게 되어 보다 나은 품질의 서비스가 가능하게 되었지만 이러한 시스템 또한 각각의 음성 신호는 재생부에서 하나의 채널로 믹싱되어 처리되므로 화면상의 화자 구분은 단지 음색을 통해서만 가능한 문제점을 가지고 있다.

이와 같은 종래기술들은 화자를 구분하기 위한 별도의 장치가 없어서 복수 대화상대방을 대상으로 대화시에 단조로운 느낌을 주게 되며, 특히 대화상대방들이 비슷한 음성을 가지고 있다면 화자가 구분이 되지 않는 문제점을 가지고 있다 .

상기 문제점을 해결하기 위하여 본 발명은, 복수의 대화상대방과 대화시에도 각각의 화자를 구별할 수 있는 시스템 및 그 방법을 제공한다.

또한 사용자가 원하는 장소와 분위기에서 대화하는 느낌이 들 수 있게 하여 실제감을 강화한 화자구분이 가능한 다중 화상대화 시스템을 제공하고자 한다.

상기 목적을 달성하기 위하여 본 발명은, 다중 화상대화를 가능하게 제공하는 시스템에 있어서, 사용자 단말기는, 디스플레이 화면상에 대화상대방에 대응하는 위치마커의 위치에 근거하여, 상기 대화상대방으로부터 전달되는 미디어 데이터에서 추출된 음향의 출력음량을 조절하여 출력하는 것을 특징으로 하는 화자구분이 가능한 다중 화상대화 시스템이다.

바람직하게는, 상기 사용자 단말기는, 대화상대방으로부터 전달되는 미디어 데이터를 수신하기 위한 통신수신부; 상기 미디어 데이터에서 음향을 추출하기 위한 음향 추출부; 상기 대화상대방에 대응하는 위치마커를 시현하는 디스플레이부; 상기 디스플레이부 화면상의 위치마커의 위치를 인식하여 위치신호를 생성하는 위치인식부; 상기 위치신호에 근거하여 상기 추출된 음향의 출력음량을 조절하는 음향분배부; 상기 음향분배부에서 조절된 음향을 스테레오 출력장치에 믹싱하는 스테레오 믹서부; 및 상기 믹싱된 음향을 출력하는 스테레오 스피커부를 포함할 수 있다.

보다 바람직하게는, 상기 미디어 데이터에서 영상을 추출하기 위한 영상 추출부를 더 포함하고, 상기 추출된 영상이 시현되는 영상창을 상기 위치마커로 이용할 수 있다.

나아가서, 상기 디스플레이부의 화면상에 시현하기 위한 적어도 하나이상의 배경화면과 상기 배경화면에 대응하는 효과음을 저장하고 있는 저장부를 더 포함하고, 사용자에 의해 선택된 배경화면이 상기 디스플레이부의 화면상에 시현되는 경우, 상기 스테레오 믹서부는 상기 선택된 배경화면에 대응하는 효과음과 상기 음향 분배부에서 조절된 음향을 스테레오 출력장치에 믹싱 할 수 있다.

한걸음 더 나아가서, 상기 배경화면은 3차원 입체 공간을 시현하는 것일 수 있다.

바람직하게는 상기 추출된 영상은, 상기 대화상대방의 실시간 모습을 시현하는 화상일 수 있다.

나아가서, 상기 디스플레이부 화면상에서 상기 위치마커의 위치를 이동시키기 위한 이동수단을 더 포함할 수 있으며, 상기 사용자 단말기는 인터넷 폰이 될 수 있다.

또한 본 발명은, 다중 화상대화 시스템 상에서 다중 화상대화를 제공 방법에 있어서, 대화상대방으로부터 전송되는 미디어 데이터를 수신하는 단계; 상기 미디어 데이터에서 음향 데이터를 추출하여 디코딩하는 단계; 디스플레이의 화면상에 상기 대화상대방에 대응하는 위치마커를 시현하는 단계; 위치인식부에서 상기 위치마커의 위치를 인식하여 위치신호를 생성하는 단계; 음향분배장치에서 상기 위치마커에 대응하는 상기 디코딩된 음향 데이터의 음량을 상기 위치신호에 근거하여 조절하는 단계; 상기 음량이 조절된 음향 데이터를 스테레오 믹서에서 믹싱하는 단계; 및 상기 믹싱된 음향을 스테레오 스피커로 출력하는 단계를 포함하는 것을 특징으로 하는 화자구분이 가능한 다중 화상대화 제공 방법이다.

바람직하게는, 상기 미디어 데이터에서 영상 데이터를 추출하여 디코딩하는 단계를 더 포함하고, 상기 위치마커는 상기 추출된 영상이 시현되는 영상창이 될 수 있다.

보다 바람직하게는 상기 위치 인식부는, 상기 위치마커의 화면상 위치를 좌표화하여 상기 위치마커의 좌표에 근거하여 위치신호를 생성할 수 있다.

보다 바람직하게는 상기 디스플레이부 화면상에서 상기 위치마커가 이동된 경우, 상기 위치 인식부는 이동된 위치마커의 위치에 근거하여 변경된 위치신호를 생성하는 단계를 더 포함할 수 있다.

또한 저장부에 저장된 적어도 하나의 배경화면 중 상기 디스플레이부의 화면상에 시현하기 위한 하나의 배경화면이 선택되는 단계; 상기 저장부로부터 상기 선택된 배경화면과 상기 배경화면에 대응하는 효과음이 로딩되는 단계; 상기 선택된 배경화면이 상기 디스플레이부의 화면상에 시현되는 단계; 및 상기 스테레오 믹서부에서 상기 선택된 배경화면에 대응하는 효과음과 상기 음향분배부에서 조절된 음향을 믹싱하는 단계를 더 포함할 수 있다.

이하에서는 도면을 참조하여 본 발명에 따른 화자구분이 가능한 다중 화상대화 시스템 및 그 제공 방법에 대하여 상세히 설명한다.

대화상대방이 전화기(10) 등은 이용하여 음성 데이터를 전송하게 되면, 상기 음성 데이터는 PSTN 망(20)을 통해 사용자가 PC상에서 대화를 할 수 있게 서비스를 제공하는 서버(30)로 전송되고, 서버(30)에서 처리하여 인터넷 망(50)을 통해 사용자 단말기(100)로 전송될 수 있다. 대화상대방이 PC 등의 단말기(40a)를 이용하여 미디어 데이터를 서버(30)로 전송하면, 상기 미디어 데이터는 화상대화 서비스를 제공하는 서버(30)를 통해 사용자 단말기(100)로 전송될 수도 있다.

또한 중앙 집중식 서버(30)를 통하지 않고 집적 PC to PC 방식으로 대화상대방이 단말기(40b, 40c)를 이용하여 미디어 데이터를 인터넷 망(50)을 통해 사용자 단말기(100)로 직접 전송할 수도 있다.

여기서 본 발명에 따른 단말기(100)는, 디스플레이 화면상에 대화상대방에 대응하는 위치마커의 위치에 근거하여, 상기 대화상대방으로부터 전달되는 미디어 데이터에서 추출된 음향의 출력음량을 조절하여 출력함으로써, 복수의 대화상대방과 대화시에 각각의 대화상대방에 대한 출력음량의 차이로 화자의 구분을 가능하게 한다.

사용자 단말기(100)는 통신 수신부(110), 음향 추출부(120), 음향 분배부(130), 스테레오 믹서부(140), 스테레오 스피커(150), 디스플레이부(200) 및 위치 인식부(220)로 구성된다.

통신 수신부(110)는 인터넷 망 등을 통하여 전송된 대화상대방의 미디어 데이터 신호(Signal)를 수신하고, 음향 추출부(120)는 상기 수신된 미디어 데이터 신호에서 음향데이터를 추출하여 디코딩한다. 음향 분배부(130)는 추출된 음향데이터(Audio Stream)의 출력 음량을 조절하는데, 상기 음량은 디스플레이부(200) 화면상의 위치마커(210)의 위치에 기초하여 조절되게 된다. 여기서 위치 인식부(220)는 디스플레이부(200)의 화면상에서 위치마커(210)의 위치를 좌표화하고, 좌표화된 위 치마커(210)의 위치를 인식하여 상기 위치마커(210)의 좌표에 따른 위치신호를 생성한다. 음향 분배부(130)는 상기 위치신호에 근거하여 왼쪽 채널(Left channel)로 전송되는 상기 음향데이터의 음량과 오른쪽 채널(Right Channel)로 전송되는 상기 음향데이터의 음량을 조절하여 스테레오 믹서부(140)의 각 채널로 전달하게 된다. 스테레오 믹서부(140)는 상기 각 채널로 전달된 음향데이터를 믹싱하고, 스테레오 스피커(150)는 상기 믹싱된 음향데이터를 출력한다.

나아가서 복수의 대화상대자들로부터 미디어 데이터 신호가 수신되면 음향추출부(120)는 각각의 미디어 데이터 신호에서 음향 데이터를 추출하여 디코딩하고, 위치 인식부(220)는 각각의 음향 데이터 별로 대응되는 디스플레이부(200)의 화면상에 각각의 위치마커(210)의 위치에 근거한 위치신호를 발생시키며, 음향 분배부(130)는 상기 각각의 위치신호에 따라 각각의 음향 데이터의 출력음량을 조절하게 된다.

이로써 상기 사용자는 각각의 대화상대방의 음향 출력 차이로 대화상대방을 구별할 수 있게 된다.

또한 도 3은 본 발명에 따른 다중 화상대화 시스템에서 영상 데이터를 처리하는 구성부분을 포함하는 사용자 단말기의 구성을 개략적으로 도시한다.

음향데이터와 영상데이터를 함께 가지는 미디어 데이터 신호가 통신수신부(110)에 수신되면, 영상 추출부(230)는 상기 미디어 데이터 신호에서 영상 데이터를 추출하고 추출된 영상 데이터(Video Stream)를 디코딩한다. 이후 상기 도 3상에는 도시되지 않았지만 일반적으로 영상 데이터 등을 시현할 수 있는 동영상 플레 이어를 통해 디스플레이부(200)의 화면상에 영상창을 생성시키고 상기 영상창에 상기 영상 데이터를 시현한다. 여기서 상기 영상창을 위치마커(210)로 이용하게 된다. 상기 영상 데이터는 대화상대방이 캠(cam) 등의 영상 장비를 이용하여 상기 대화상대방의 실시간 모습을 담은 영상을 포함하고 있다.

또한 대화상대방이 PSTN망 등을 통한 일반적인 전화기를 이용함으로 인해 상기 미디어 데이터 신호가 음향데이터만을 가지고 있는 경우, 사용자는 위치마커로 아바타 등의 동적 또는 정적 이미지를 활용할 수 있다.

나아가서 상기 사용자 단말기로 인터넷 폰 등을 사용할 수도 있다.

인터넷 망(50) 등을 통해 미디어 데이터 신호가 사용자 단말기(100)의 통신 수신부(110)에 수신(S110)되면, 음향 추출부(120)를 통해 상기 미디어 데이터 신호에서 음향 데이터를 추출하여 디코딩하는 단계(S120)를 거치게 된다.

또한 상기 미디어 데이터 신호가 수신되면, 디스플레이부(200)의 화면상의 적절한 위치에 위치마커(210)를 시현(S180)하고, 위치 인식부(220)는 상기 화면상의 위치마커(210)의 위치를 인식(S190)하여 위치신호를 생성하게 된다.

상기 음향 데이터와 위치신호는 음향 분배부(130)로 전송되며, 음향 분배부(130)에서 상기 위치신호에 근거하여 상기 음향 데이터의 왼쪽 채널(Left channel)과 오른쪽 채널(Right Channel)로 전송되는 출력음량이 조절(S130)되어 스테레오 믹서부(140)의 각 채널로 전달된다. 상기 각 채널로 전달된 상기 음량이 조 절된 음향데이터는 스테레오 믹서부(140)에서 믹싱(S140)되어 스테레오 스피커(150)를 통해 출력(S150)된다.

이와 같은 본 발명에 의하여, 디스플레이부(200)의 화면상 위치마커(210)에 근거하여 음향의 좌우음량이 조절되므로 사용자는 마치 입체적인 공간에서 대화상대방과 대화를 나누는 느낌을 가지게 되며, 복수의 대화상대방들과 대화시에도 사용자는 각각의 다른 위치에서 화성이 들리는 느낌을 가지게 되므로 그에 따라 대화상대방을 구분할 수 있게 된다.

나아가서 도 5는 본 발명에 따른 다중 화상대화 시스템에서 상기 미디어 데이터가 영상 데이터를 포함하는 경우 화자구분이 가능한 다중 화상대화 제공 방법에 대한 개략적인 흐름도를 나타낸다.

대화상대방으로부터 전송된 미디어 데이터가 음향 데이터와 영상 데이터를 포함하고 있는 경우, 상기 미디어 데이터를 통신 수신부(110)에서 수신(S110)하여 상기 미디어 데이터로부터 음향 데이터는 음향 추출부(120)에서 추출하여 디코팅(S120)하고 영상 데이터는 영상 추출부(230)에서 추출하여 디코딩(S160)하게 된다. 이후 상기 영상 데이터(Video stream)는 동영상 플레이어를 통해 디스플레이부(200) 화면상에 위치마커 역할을 하는 영상창으로 시현(S170)되게 된다.

상기 위치마커가 디스플레이부(200) 화면상에 시현되면, 위치 인식부(220)에서 상기 화면을 좌표화하고 상기 위치마커가 화면상에서 위치하는 지점의 좌표를 위치신호로 생성하여 상기 위치 마커의 위치를 인식(S190)하게 된다. 상기 위치신호는 음향 분배부(130)로 전송되고, 상기 위치신호에 근거하여 상기 음향 데이터의 출력 음량을 조절(S130)하게 된다.

이로써 입체적인 음향과 실시간 대화상대방의 모습을 보면서 대화를 할 수 있으므로, 대화상대방의 상태 등을 느끼면서 실제적으로 동일한 장소에서 대화상대방과 대화를 나누는 느낌을 줄 수 있다.

한걸음 더 나아가서 도 6a 및 도 6b는 상기 위치마커의 이동에 따른 출력음향의 변화를 나타낸다.

도 6a에 도시된 바와 같이, 이동되기 이전의 위치마커(210a)의 위치에 근거하여 출력되는 음향은 위치마커(210a)가 디스플레이부(200)의 화면상에서 왼쪽에 위치하므로 음향 분배부(130)에 의하여 왼쪽 채널로 전송되는 음향의 음량을 상대적으로 오른쪽 채널로 전송되는 음향의 음량보다 크게 하여 스테레오 믹서부(140)로 전송된다. 허나 사용자 등에 의해 드래그 앤 드랍 형태로 상기 화면상에서 오른쪽으로 이동된 위치마커(210a')의 위치에 근거하여 출력되는 음향은 왼쪽 채널로 전송되는 음향의 음량보다 상대적으로 오른쪽 채널로 전송되는 음향의 음량을 크게 한다. 이로써 상기 사용자는 대화상대방이 왼쪽에서 오른쪽으로 이동하는 느낌을 받게 된다.

도 6b는 위치마커가 상하로 이동된 경우를 나타낸다. 상기 화면상에서 상단에 위치한 위치마커(150b)에 근거하여 출력되는 음향의 음량보다 상대적으로 상기 화면상에서 하단에 위치한 위치마커(150b')에 근거하여 출력되는 음향의 음량이 크게 된다. 이로써 상기 사용자는 대화상대방이 원거리에서 근거리로 이동한 느낌을 받게 된다.

한걸음 더 나아가서 도 3에 도시된 저장부(230)는 여러 가지 배경화면과 그에 대응하는 효과음을 저장하고 있고, 하나의 배경화면이 디스플레이부(200)의 화면에 시현되면 상기 배경화면에 대응하는 효과음을 스테레오 믹서부(140)에서 상기 음향 데이터와 믹싱하게 된다. 이에 대하여 도 7을 참조하여 보다 자세히 그 단계를 살펴보면, 저장부(230)에 저장된 여러 배경화면에 대한 리스트를 보고 사용자는 여러 배경화면 중 하나의 배경화면을 선택(S200)할 수 있고, 배경화면이 선택되면 상기 선택된 배경화면은 저장부(230)로부터 로딩(S210)되어 디스플레이부(200)의 배경화면으로 시현(S220)되고, 상기 배경화면상 위에 위치마커가 시현(S180,S180')되게 된다. 또한 상기 선택된 배경화면에 대응하는 효과음을 저장부(230)에서 로딩(S230)하여 스테레오 믹서부(140)로 전송하면 스테레오 믹서부(140)에서 상기 효과음을 상기 대화상대방에 대한 음향 데이터와 믹싱(S140)하여 스테레오 스피커(150)로 출력(S150)하게 된다.

도 8a 및 도 8b는 본 발명에 있어서 배경화면이 시현된 실시예를 나타낸다.

도 8a는 회의실로 설정된 배경화면이 시현된 실시예이며, 배경화면 창(310)에는 회의실의 화면이 시현되고 배경화면 창(310a) 하단에는 메시지 창(320)이 위치하고 있다. 배경화면 창(310a)안에 각각의 대화상대방에 대응하는 위치마커(210c, 210d)가 있으며, 각 위치마커(210c, 210d)의 배경화면 창(310)상의 위치에 따라 각각의 음향의 좌우음량출력이 조절되어 상기 사용자는 현재 출력되고 있는 음향이 어느 대화상대방에 대한 음향인가를 구분할 수 있게 된다.

도 8b는 바닷가로 설정된 배경화면이 시현된 실시예를 나타내며, 배경화면 창(310b)에는 바닷가 화면이 시현되고, 배경화면 창(310b)안에 각각의 대화상대방에 대응하는 아바타 위치마커(210f)와 실시간 대화상대방의 모습을 보여주는 영상창 위치마커(210e)가 위치하고 있으며, 각각의 위치마커(210f, 210e)의 위치에 근거하여 좌우음량이 조절된 각각의 음향이 상기 바닷가 화면에 대응하는 효과음과 스테레오 믹서부(140)에서 믹싱되어 스테레오 스피커(140)를 통해 출력된다.

바람직하게는 상기 배경화면을 3차원 입체 공간으로 시현하여 보다 실제감 있게 화상대화를 나눌 수 있다.

이와 같은 본 발명에 의해 상기 사용자는 현재 출력되고 있는 음향이 어느 대화상대방에 대한 음향인가를 구분할 수 있을뿐더러 상기 대화상대방과 바닷가 등의 장소에서 실제 대화하는 느낌을 받을 수 있게 된다.

본 발명에 의한, 화자구분이 가능한 다중 화상대화 장치 및 그 방법은 본 발명의 기술적 사상의 범위 내에서 다양한 형태로 변형, 응용 가능하며 상기 실시예에 한정되지 않는다. 또한, 상기 실시예와 도면은 발명의 내용을 상세히 설명하기 위한 목적일 뿐, 발명의 기술적 사상의 범위를 한정하고자 하는 목적은 아니며, 이상에서 설명한 본 발명은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형, 및 변경이 가능하므로 상기 실시예 및 첨부된 도면에 한정되는 것은 아님은 물론이며, 후술하는 청구범위뿐만이 아니라 청구범위와 균등 범위를 포함하여 판단되어야 한다.

이상과 같은 본 발명에 의하면, 디스플레이의 화면상에서 대화상대방에 대응하는 위치마커에 근거하여 음향의 좌우음량이 조절되므로, 사용자는 마치 입체적인 공간에서 대화상대방과 대화를 나누는 느낌을 가지게 되며, 복수 대화상대방과 대화시에도 사용자는 각각의 다른 위치에서 화성이 들리는 느낌을 가지게 되므로 그에 따라 대화상대방을 구분할 수 있게 된다.

또한 입체적인 음향과 실시간 대화상대방의 모습을 보면서 대화를 할 수 있으므로 대화상대방의 상태 등을 느끼면서 실제적으로 동일한 장소에서 대화상대방과 대화를 나누는 느낌을 줄 수 있다.

나아가서, 화면 창의 배경을 사용자가 선택할 수 있으며, 선택된 배경화면에 대응하는 효과음을 제공하여 사용자는 실제로 배경화면 상의 장소에서 대화상대방과 대화를 나누는 느낌을 받게 된다.

Claims

다중 화상대화를 가능하게 제공하는 시스템에 있어서,

사용자 단말기는, 디스플레이 화면상에 대화상대방에 대응하는 위치마커를 시현하고, 상기 디스플레이 화면상의 위치마커의 위치를 인식하여 위치신호를 생성하고, 상기 위치신호에 근거하여 상기 대화상대방으로부터 전달되는 미디어 데이터에서 추출된 음향의 스테레오 출력음향을 조절하여 출력하는 것을 특징으로 하는 화자구분이 가능한 다중 화상대화 시스템.
제 1항에 있어서,

상기 사용자 단말기는,

대화상대방으로부터 전달되는 미디어 데이터를 수신하기 위한 통신수신부;

상기 미디어 데이터에서 음향을 추출하기 위한 음향 추출부;

상기 대화상대방에 대응하는 위치마커를 시현하는 디스플레이부;

상기 디스플레이부 화면상의 위치마커의 위치를 인식하여 위치신호를 생성하는 위치인식부;

상기 위치신호에 근거하여 상기 추출된 음향의 출력음량을 조절하는 음향분배부;

상기 음향분배부에서 조절된 음향을 스테레오 출력장치에 믹싱하는 스테레오 믹서부; 및

상기 믹싱된 음향을 출력하는 스테레오 스피커부를 포함하는 것을 특징으로 하는 화자구분이 가능한 다중 화상대화 시스템.
제 2항에 있어서,

상기 미디어 데이터에서 영상을 추출하기 위한 영상 추출부를 더 포함하고, 상기 추출된 영상이 시현되는 영상창을 상기 위치마커로 이용하는 것을 특징으로 하는 화자구분이 가능한 다중 화상대화 시스템.
제 2항에 있어서,

상기 디스플레이부의 화면상에 시현하기 위한 적어도 하나이상의 배경화면과 상기 배경화면에 대응하는 효과음을 저장하고 있는 저장부를 더 포함하고, 사용자에 의해 선택된 배경화면이 상기 디스플레이부의 화면상에 시현되는 경우, 상기 스테레오 믹서부는 상기 선택된 배경화면에 대응하는 효과음과 상기 음향 분배부에서 조절된 음향을 스테레오 출력장치에 믹싱하는 것을 특징으로 하는 화자구분이 가능한 다중 화상대화 시스템.
제 4항에 있어서,

상기 배경화면은 3차원 입체 공간을 시현하는 것을 특징으로 하는 화자구분이 가능한 다중 화상대화 시스템.
제 3항에 있어서,

상기 추출된 영상은, 상기 대화상대방의 실시간 모습을 시현하는 화상인 것을 특징으로 하는 화자구분이 가능한 다중 화상대화 시스템.
제 2항에 있어서,

상기 디스플레이부 화면상에서 상기 위치마커의 위치를 이동시키기 위한 이동수단을 더 포함하는 것을 특징으로 하는 화자구분이 가능한 다중 화상대화 시스템.
제 2항에 있어서,

상기 사용자 단말기는 인터넷 폰인 것을 특징으로 하는 화자구분이 가능한 다중 화상대화 시스템.
다중 화상대화 시스템 상에서 다중 화상대화를 제공 방법에 있어서,

대화상대방으로부터 전송되는 미디어 데이터를 수신하는 단계;

상기 미디어 데이터에서 음향 데이터를 추출하여 디코딩하는 단계;

디스플레이의 화면상에 상기 대화상대방에 대응하는 위치마커를 시현하는 단계;

위치인식부에서 상기 위치마커의 위치를 인식하여 위치신호를 생성하는 단계;

음향분배장치에서 상기 위치마커에 대응하는 상기 디코딩된 음향 데이터의 음량을 상기 위치신호에 근거하여 조절하는 단계;

상기 음량이 조절된 음향 데이터를 스테레오 믹서에서 믹싱하는 단계; 및

상기 믹싱된 음향을 스테레오 스피커로 출력하는 단계를 포함하는 것을 특징으로 하는 화자구분이 가능한 다중 화상대화 제공 방법.
제 9항에 있어서,

상기 미디어 데이터에서 영상 데이터를 추출하여 디코딩하는 단계를 더 포함하고, 상기 위치마커는 상기 추출된 영상이 시현되는 영상창인 것을 특징으로 하는 화자구분이 가능한 다중 화상대화 제공 방법.
제 9항 또는 제 10항에 있어서,

상기 위치 인식부는, 상기 위치마커의 화면상 위치를 좌표화하여 상기 위치마커의 좌표에 근거하여 위치신호를 생성하는 것을 특징으로 하는 화자구분이 가능한 다중 화상대화 제공 방법.
제 11항에 있어서,

상기 디스플레이부 화면상에서 상기 위치마커가 이동된 경우, 상기 위치 인식부는 이동된 위치마커의 위치에 근거하여 변경된 위치신호를 생성하는 단계를 더 포함하는 것을 특징으로 하는 화자구분이 가능한 다중 화상대화 제공 방법.
제 9항에 있어서,

저장부에 저장된 적어도 하나의 배경화면 중 상기 디스플레이부의 화면상에 시현하기 위한 하나의 배경화면이 선택되는 단계;

상기 저장부로부터 상기 선택된 배경화면과 상기 배경화면에 대응하는 효과음이 로딩되는 단계;

상기 선택된 배경화면이 상기 디스플레이부의 화면상에 시현되는 단계; 및

상기 스테레오 믹서부에서 상기 선택된 배경화면에 대응하는 효과음과 상기 음향분배부에서 조절된 음향을 믹싱하는 단계를 더 포함하는 것을 특징으로 하는 화자구분이 가능한 다중 화상대화 제공 방법.