KR101626438B1

KR101626438B1 - 오디오 데이터 프로세싱을 위한 방법, 디바이스, 및 시스템

Info

Publication number: KR101626438B1
Application number: KR1020147023147A
Authority: KR
Inventors: 비찬 카리미-헤르칸디; 파로크 모함마드차데 코우히; 샤아 월리 알리
Original assignee: 유니파이 게엠베하 운트 코. 카게
Priority date: 2012-11-20
Filing date: 2012-11-20
Publication date: 2016-06-01
Also published as: CN104160443A; WO2014081408A1; TWI527024B; CN104160443B; US20190259406A1; US10803880B2; US20170330578A1; US20140379343A1; KR20140121447A; TW201430834A; US10325612B2; US20200411025A1; EP2786376A1

Abstract

본 발명은 스피킹하는 사람으로부터 수신된 오디오 데이터를 필터링하는 ― 그러한 스피커에 대한 특정 필터를 포함함 ― 방법 및 장치에 관한 것이다. 스피커의 보이스의 오디오 특징들이 수집될 수 있고, 특정 필터는, 보이스 품질을 또한 향상시키는 동시에, 잡음을 감소시키기 위해 형성될 수 있다. 예를 들어, 스피커의 보이스가 특정 주파수들을 포함하지 않는 경우, 필터는, 잡음 소거를 용이하게 하고, 필요하지 않은 클리닝을 위해 사운드 스펙트럼을 프로세싱하는 것을 감소시키기 위해, 그러한 주파수들에서의 잡음을 소거할 수 있다. 부가적으로, 스피커의 보이스의 세기 주파수들은 수집된 오디오 특징들로부터 식별될 수 있고, 그러한 스펙트럼들은, 통신 디바이스에 의해 전송되거나 또는 출력되는 스피커의 보이스 데이터의 보이스 품질을 향상시키는 스피커 특정 필터를 제공하기 위해 더 정밀한 세분성으로 필터링될 수 있다. 오디오 데이터는 또한 사용자의 미리 규정된 히어링 스펙트럼에 기초하여 출력될 수 있다.

Description

오디오 데이터 프로세싱을 위한 방법, 디바이스, 및 시스템 {METHOD, DEVICE, AND SYSTEM FOR AUDIO DATA PROCESSING}

본 발명은, 셀룰러폰(cellular phone)들, 모바일 컴퓨터 디바이스(mobile computer device)들, 태블릿(tablet)들, 랩톱(laptop)들, 또는 다른 단말 디바이스(terminal device)들을 이용하는 통신 시스템(communication system)들과 같은 통신 시스템들에 관한 것이다. 더욱 상세하게, 본 발명은, 기록 또는 송신을 위해 수신되는 보이스 데이터(voice data)의 보이스 품질(voice quality)을 개선하기 위해, 수신된 오디오 데이터(audio data)를 편집(edit)하도록 구성된 시스템, 방법, 및 디바이스에 관한 것이다.

원격통신 엔드포인트(telecommunication endpoint)들은 종종 잡음 감소 디바이스(noise reduction device)를 구비한다. 이러한 디바이스는 통상적으로, 보이스 데이터가 출력되거나 또는 출력된 오디오 데이터로서 전송될 때, 더 양호한 보이스 콘텐츠(voice content)를 전달하기 위해, 디바이스에 의해 수신되는 보이스 데이터를 필터링(filter)하도록 구성된다. 그러나, 이러한 잠음 감소 메커니즘(noise reduction mechanism)들에서 이용되는 필터(filter)들은 통상적으로, 일반적인 방식으로 오디오를 프로세싱(process)하도록 설계된 범용 필터(general purpose filter)들이다. 결과적으로, 잡음 감소는, 출력된 오디오 데이터에 대한 보이스 품질 또는 다른 속성들에서 큰 개선을 제공하는 데 실패할 수 있다.

본 발명자들은, 수신된 오디오 데이터에 기초하여 출력되는 오디오 출력의 오디오 특징들을 개선하기 위해, 새로운 방법 및 장치가 필요하다고 결정하였다. 본 발명자들의 방법 및 장치의 몇몇 실시예들에서, 출력되는 오디오는, 스피킹(speaking)을 수행하고 히어링(hearing)을 수행하는 사용자들의 스피킹 및 히어링 프로파일(speaking and hearing profile)들에 기초하는 히어링 및 스피킹 파라미터(hearing and speaking parameter)들을 이용하도록 구성될 수 있다.

보이스 데이터를 전송하는 방법이 제공된다. 방법의 실시예는, 통신 디바이스(communication device)가, 사용자의 보이스의 시간 도메인(time domain), 주파수 도메인(frequency domain), 보컬 도미넌트(vocal dominant)들, 및 보컬 범위(vocal range) 중 적어도 하나를 식별하기 위해, 사용자의 보이스의 샘플(sample)을 획득하기 위해 사용자에게 스피킹(speak)하도록 프롬프트(prompt)하는 단계, 통신 디바이스가 사용자의 보이스의 샘플에 기초하여 사용자의 보이스에 대한 보이스 메트릭(voice metric)들을 결정하는 단계, 통신 디바이스가 사용자의 보이스의 보이스 메트릭들을 저장하는 단계, 통신 디바이스가 사용자로부터 보이스 데이터를 수신하는 단계, 통신 디바이스가 사용자의 보이스의 보이스 메트릭들, 시간 도메인, 주파수 도메인, 보컬 도미넌트들, 및 보컬 범위 중 적어도 하나에 기초하여, 수신된 보이스 데이터를 수정(modify)하는 단계, 및 통신 디바이스가, 수정된 보이스 데이터가 적어도 하나의 수신자(recipient)에게 출력가능하도록, 수정된 보이스 데이터를 다른 디바이스에 전송하는 단계를 포함할 수 있다.

방법의 몇몇 실시예들은 부가적인 단계들 또는 수정들을 포함할 수 있다. 예를 들어, 방법은 또한, 사용자가 톤(tone)들을 히어링하도록, 통신 디바이스가 사용자에게 방출하기 위해 톤들을 발생하는 단계, 통신 디바이스가 볼륨 설정(volume setting)들을 식별하는 입력을 수신하는 단계 ― 상기 볼륨 설정들에서 톤들이 사용자에게 히어링가능함 ―, 및 통신 디바이스가 볼륨 설정들을 식별하였던 수신된 입력에 기초하여 사용자의 히어링 프로파일을 결정하는 단계 ― 상기 볼륨 설정들에서 톤들이 사용자에게 히어링가능함 ― 를 포함할 수 있다. 부가적으로, 방법의 실시예들은, 통신 디바이스가, 사용자의 히어링 프로파일에 기초하여 더 큰 볼륨으로 오디오 데이터를 출력하기 위해, 통신 디바이스에 의해 수신되는 오디오 데이터의 볼륨을 조정하는 단계를 포함할 수 있다.

일 실시예에서, 방법은, 통신 디바이스가 사용자의 히어링 프로파일을 다른 통신 디바이스에 전송하는 단계, 및 다른 통신 디바이스가 오디오 데이터를 통신 디바이스에 전송하기 전에, 사용자의 히어링 프로파일에 기초하여 그러한 오디오 데이터를 수정하는 단계를 포함할 수 있다. 일 실시예에서, 다른 디바이스는, 전송된 오디오 데이터가 사용자의 히어링불가한(unhearable) 오디오 스펙트럼(audio spectrum) 내의 오디오를 포함하지 않도록, 사용자의 히어링 프로파일이 표시하는, 사용자에게 히어링불가한 오디오 스펙트럼 내에 있는 오디오 데이터의 부분을 오디오 데이터로부터 생략함으로써, 오디오 데이터를 사용자에게 전송하기 전에 오디오 데이터를 수정할 수 있다. 다른 실시예들에서, 오디오 데이터는, 전송된 오디오 데이터 내의 모든 전송된 보이스 데이터가 사용자의 히어링가능한 오디오 스펙트럼 내에 있도록, 오디오 데이터의 볼륨을 증가시킴으로써 다른 통신 디바이스에 의해 수정될 수 있다.

특정 실시예들에서, 사용자의 보이스의 보이스 메트릭들은, 보이스에 대한 시간 도메인, 보이스에 대한 주파수 도메인, 보이스에 대한 보컬 도미넌트들, 및 사용자의 보이스의 보컬 범위에 기초하는 파라미터들로 구성된다. 통신 디바이스는 보이스 메트릭들, 시간 도메인, 주파수 도메인, 보컬 도미넌트들 중 적어도 하나에 기초하여 보이스 데이터를 수정할 수 있다. 사용자의 보이스의 보컬 범위는, 통신 디바이스가 사용자의 보이스의 주파수 도메인의 외부에 있는 주파수 범위 내에 있는 수신된 보이스 데이터의 부분을 제거한 것으로 구성될 수 있다. 통신 디바이스가 사용자의 보이스의 보이스 메트릭들, 시간 도메인, 주파수 도메인, 보컬 도미넌트들, 및 보컬 범위 중 적어도 하나에 기초하여 보이스 데이터를 수정하는 단계는 또한, 통신 디바이스가 사용자의 보이스의 보이스 메트릭들, 시간 도메인, 주파수 도메인, 보컬 도미넌트들, 및 보컬 범위 중 적어도 하나에 기초하는 파라미터를, 수신된 보이스 데이터의 잡음 소거 프로세싱(noise cancellation processing)에 적용하는 단계로 구성될 수 있다.

통신 디바이스는 다수의 유형들의 디바이스들 중 임의의 디바이스일 수 있다. 예를 들어, 통신 디바이스는 서버(server), 워크스테이션(workstation), 데스크톱 컴퓨터(desktop computer), 태블릿(tablet), 모바일 셀룰러폰(mobile cellular phone), 인터넷 기기(internet appliance), 랩톱 컴퓨터(laptop computer), 스마트폰(smart phone), PDA(personal digital assistant), 모바일 컴퓨터 디바이스(mobile computer device), 또는 통신 단말(communication terminal)일 수 있다. 몇몇 실시예들에서, 통신 디바이스는 또한, 그러한 수신된 보이스 데이터가 사용자로부터 비롯되었다는 것을 결정하도록 구성될 수 있다.

통신 시스템들이 또한 제공된다. 통신 시스템의 몇몇 실시예들은 상기 논의된 방법들의 실시예를 이용하도록 구성된 통신 시스템을 포함할 수 있으며, 이는 아래에서 추가로 논의된다.

비-일시적 컴퓨터 판독가능 매체(non-transitory computer readable medium)가 또한 제공된다. 비-일시적 컴퓨터 판독가능 매체는, 애플리케이션(application)이 통신 디바이스에 의해 실행될 때, 통신 디바이스에 의해 수행되는 방법을 규정하는, 상기 비-일시적 컴퓨터 판독가능 매체 상에 저장된 애플리케이션을 갖는다. 방법은, 방법의 상기 열거된 실시예들 중 임의의 실시예를 포함할 수 있고, 이는 아래에서 추가로 논의된다. 예를 들어, 방법의 실시예는, 통신 디바이스가, 사용자의 보이스의 시간 도메인, 주파수 도메인, 보컬 도미넌트들, 및 보컬 범위 중 적어도 하나를 식별하기 위해, 사용자의 보이스의 샘플을 획득하기 위해 사용자에게 스피킹하도록 프롬프트하는 단계, 통신 디바이스가 사용자의 보이스의 샘플에 기초하여 사용자의 보이스에 대한 보이스 메트릭들을 결정하는 단계, 통신 디바이스가 사용자의 보이스의 보이스 메트릭들을 저장하고 그러한 세이브(save)된 보이스 메트릭들을 사용자와 연관시키는 단계, 통신 디바이스가 사용자로부터 보이스 데이터를 수신하는 단계, 통신 디바이스가 사용자의 보이스의 시간 도메인, 주파수 도메인, 보컬 도미넌트들, 및 보컬 범위 중 적어도 하나에 기초하여, 수신된 보이스 데이터를 수정하는 단계, 및 통신 디바이스가, 수정된 보이스 데이터를 다른 디바이스에 전송하는 단계를 포함할 수 있다.

컴퓨터 판독가능 매체의 애플리케이션에 의해 규정된 방법의 몇몇 실시예들은 또한, 사용자가 톤들을 히어링하도록, 통신 디바이스가 사용자에게 방출하기 위해 톤들을 발생하는 단계, 통신 디바이스가 볼륨 설정들을 식별하는 입력을 수신하는 단계 ― 상기 볼륨 설정들에서 톤들이 사용자에게 히어링가능함 ―, 및 통신 디바이스가 볼륨 설정들을 식별하였던 수신된 입력에 기초하여, 사용자의 히어링 프로파일을 결정하는 단계 ― 상기 볼륨 설정들에서 톤들이 사용자에게 히어링가능함 ― 를 포함할 수 있다. 통신 디바이스는 또한, 사용자의 히어링 프로파일에 기초하여 더 큰 볼륨으로 오디오 데이터를 출력하기 위해, 통신 디바이스에 의해 수신되는 오디오 데이터의 볼륨을 조정할 수 있다. 통신 디바이스는 사용자의 히어링 프로파일을 다른 통신 디바이스에 전송할 수 있고, 다른 통신 디바이스는, 사용자의 히어링 프로파일에 기초하여 오디오 데이터를 통신 디바이스에 전송하기 전에, 사용자의 히어링 프로파일에 기초하여 그러한 오디오 데이터를 수정할 수 있다. 일 실시예에서, 다른 디바이스는, 전송된 오디오 데이터가 사용자의 히어링불가한 오디오 스펙트럼 내의 오디오를 포함하지 않도록, 사용자의 히어링 프로파일이 표시하는, 사용자에게 히어링불가한 오디오 스펙트럼 내에 있는 오디오 데이터의 부분을 오디오 데이터로부터 생략함으로써, 오디오 데이터를 사용자에게 전송하기 전에 오디오 데이터를 수정할 수 있다. 다른 실시예들에서, 오디오 데이터는, 전송된 오디오 데이터 내의 모든 전송된 보이스 데이터가 사용자의 히어링가능한 오디오 스펙트럼 내에 있도록, 오디오 데이터의 볼륨을 증가시킴으로써 다른 통신 디바이스에 의해 수정될 수 있다.

애플리케이션에 의해 규정된 방법의 특정 실시예들에서, 통신 디바이스가, 사용자의 보이스의 시간 도메인, 주파수 도메인, 보컬 도미넌트들, 및 보컬 범위 중 적어도 하나에 기초하여 보이스 데이터를 수정하는 단계는 다수의 단계들을 포함할 수 있다. 예를 들어, 이러한 수정은, 통신 디바이스가 사용자의 보이스의 주파수 도메인의 외부에 있는 주파수 범위 내에 있는 수신된 보이스 데이터의 부분을 제거하는 단계, 및 통신 디바이스가 사용자의 보이스의 시간 도메인, 주파수 도메인, 보컬 도미넌트들, 및 보컬 범위 중 적어도 하나에 기초하는 파라미터를, 수신된 보이스 데이터의 잡음 소거 프로세싱에 적용하는 단계로 구성될 수 있다.

본 발명의 다른 세부사항들, 목적들, 및 이점들은, 본 발명의 특정한 현재 바람직한 실시예들 및 이를 실시하는 특정한 현재 바람직한 방법들의 다음의 설명이 진행됨에 따라 명백해질 것이다.

다수의 통신 디바이스들 사이에 통신들을 제공하기 위한 현재의 바람직한 디바이스들, 시스템들, 및 장치들이 첨부 도면들에서 도시되고, 이를 실시하는 특정한 현재의 바람직한 방법들이 또한 첨부 도면들에서 예시된다. 도면들에서 이용된 동일한 참조 번호들은 동일한 컴포넌트들을 식별할 수 있다는 것이 이해되어야 한다.
도 1은, 예를 들어, 서버, 컴퓨터 디바이스, 워크스테이션, 태블릿, 랩톱 컴퓨터, 전화 디바이스(telephony device), 인터넷 기기, PDA(personal digital assistant), 스마트폰, 셀룰러폰, 전화기(telephone), 또는 다른 유형의 통신 단말일 수 있는 통신 디바이스의 예시적인 실시예의 블록도이다. 하나보다 많은 수의 마이크로폰(microphone) 및 하나보다 많은 수의 스피커(speaker)가, 통신 디바이스의 실시예들 내에 포함될 수 있다는 것이 이해되어야 한다(예를 들어, 통신 디바이스의 몇몇 실시예들은, 하나의 이어 스피커(ear speaker) 및 라우드 스피커(loud speaker)를 포함할 수 있고, 2개의 마이크로폰들 ― 주변 오디오 검출(audio detection)을 위한 하나의 마이크로폰 및 주변 잡음 소거(surrounding noise cancellation)를 위한 하나의 마이크로폰 ― 을 포함할 수 있음).
도 2는 보이스 데이터 또는 오디오 데이터를 전송하기 위한 예시적인 방법의 흐름도이다.
도 3은 보이스 데이터 또는 오디오 데이터를 출력하기 위한 예시적인 방법의 흐름도이다.
도 4는 통신 시스템의 예시적인 실시예의 블록도이다.

도 1 내지 도 4를 참조하면, 통신 디바이스는 컴퓨터 디바이스, 이를 테면, 서버 또는 워크스테이션 또는 단말 디바이스, 이를 테면, 데스크톱 컴퓨터, 태블릿, 모바일 셀룰러폰, 인터넷 기기, 랩톱 컴퓨터, 스마트폰, PDA(personal digital assistant), 모바일 컴퓨터 디바이스, 또는 통신 단말일 수 있다. 시스템의 일 실시예에서, 네트워크(24)는, 컴퓨터 디바이스(25)를 통해 확립 및 유지되는 통신 경로를 통해 통신가능하게 연결되는 제 1 및 제 2 통신 단말들(21, 22)을 포함할 수 있다. 네트워크(network)(24)는, 시스템의 몇몇 실시예들에서의 엔터프라이즈 네트워크(enterprise network)와 같은 로컬 영역 네트워크(local area network) 또는 광역 네트워크(wide area network)일 수 있다.

도 4에 도시된 시스템의 제 1 및 제 2 통신 단말들(21 및 22)은 각각 도 1에 도시된 통신 디바이스의 실시예일 수 있다. 대안적으로, 도 4에 도시된 컴퓨터 디바이스(25)는 텔레포니형 통신 디바이스(telephony type communication device) 또는 미디어 통신 디바이스(media communication device), 이를 테면, 스위치 디바이스(switch device), 미디어 서버(media server), 또는 원격회의 서버(teleconference server)로서 기능할 수 있고, 이는 도 1에 도시된 통신 디바이스의 실시예일 수 있다.

통신 디바이스는, 수신기 유닛(receiver unit)(3a) 및 송신기 유닛(transmitter unit)(3b)을 포함하는 트랜시버 유닛(transceiver unit)(3), 디스플레이 유닛(display unit)(2), 적어도 하나의 입력 디바이스(input device), 이를 테면, 마이크로폰(microphone)(6) 및 카메라 센서(camera sensor)(8), 메모리(memory)(5), 및 스피커(4)에 통신가능하게 연결되는 프로세서 유닛(processor unit)(1)을 포함할 수 있다. 트랜시버 유닛(3)은 셀룰러 네트워크(cellular network), 무선 네트워크 연결(wireless network connection), 또는 다른 네트워크 연결을 통해 데이터를 송신 및 수신하기 위한 수신기 유닛(3a) 및 송신기 유닛(3b)을 포함할 수 있거나, 또는 니어 필드 통신(near field communication), 블루투스 순응 통신(Bluetooth compliant communication), 또는 다른 유형의 무선 통신 메커니즘(wireless communication mechanism)을 통해 무선 연결을 형성하도록 또는 예를 들어, 범용 시리얼 버스 연결(universal serial bus connection)을 통해 이루어진 유선 연결과 같은 유선 연결을 허용하도록 구성될 수 있다. 몇몇 실시예들에서, 통신 디바이스는 부가적인 트랜시버 유닛들을 또한 포함할 수 있다.

프로세서 유닛(1)은 중앙 프로세싱 유닛(central processing unit), 이를 테면, 마이크로프로세서(microprocessor), 상호연결된 마이크로프로세서들, 또는 다른 하드웨어 프로세서 엘리먼트(hardware processor element)일 수 있다. 메모리(5)는, 예를 들어, 도 2 또는 도 3에 도시된 방법과 같은, 통신 디바이스에 의해 수행되는 방법을 규정하는, 비-일시적 컴퓨터 판독가능 매체 상에 저장된 적어도 하나의 애플리케이션(7)을 갖는 비-일시적 컴퓨터 판독가능 매체일 수 있다. 메모리(5)는 하드 드라이브(hard drive), 플래시 드라이브(flash drive), 광학 디스크(optical disk) 또는 하드 디스크(hard disk) 또는 비-일시적 시간 기간 동안 데이터를 저장할 수 있는 다른 유형의 컴퓨터 판독가능 매체를 포함할 수 있다. 데이터셋(dataset)들, 이를 테면, 보이스 데이터베이스(voice database)(12) 및 히어링 데이터베이스(hearing database)(13)뿐만 아니라, 애플리케이션(7)이 실행될 때 통신 디바이스에 의해 이용될 수 있는 다른 데이터가 또한 메모리(5)에 저장될 수 있다.

스피커(4)는 오디오를 방출하는 다수의 스피커들을 포함할 수 있고, 마이크로폰(6)은 오디오 데이터를 수신하기 위한, 사용자에 의해 방출되는 오디오를 기록하는 입력 디바이스일 수 있다. 예를 들어, 마이크로폰(6)은 주변 잡음을 검출하는 제 1 마이크로폰 및 주변 잡음의 소거를 위해 이용되는 제 2 마이크로폰을 포함할 수 있고, 스피커(4)는 하나의 사람 이어(ear)에 잡음을 방출하기 위한 제 1 스피커 및 라우드 스피커인 제 2 스피커를 포함할 수 있다. 디스플레이 유닛(2)은 액정 디스플레이(liquid crystal display) 또는 다른 디스플레이 디바이스일 수 있다. 디스플레이 유닛(2)은, 디스플레이의 상이한 부분들을 터치(touch)함으로써 사용자가 입력을 제공하도록 또한 허용하면서 데이터를 시각적으로 출력하도록 기능하는 터치 스크린 디스플레이(touch screen display)와 같은 입력 디바이스 및 출력 디바이스로서 구성될 수 있다. 다른 유형들의 입력 디바이스들, 이를 테면, 버튼(button), 키보드(keyboard), 블루투스 헤드셋(Bluetooth headset), 또는 블루투스 이어-셋(Bluetooth ear-set), 또는 마우스(mouse)가 또한 프로세서 유닛(1)에 연결가능할 수 있어서, 사용자는 입력을 디바이스에 제공하기 위해 그러한 입력 디바이스를 이용할 수 있다.

통신 디바이스는 프로세서 유닛(1)을 통해 애플리케이션(7)을 실행시킬 수 있다. 애플리케이션(7)은, 애플리케이션이 실행될 때 통신 디바이스에 의해 실행되는 방법을 규정할 수 있다. 이러한 방법의 예들은 도 2 및 도 3으로부터 이해될 수 있다. 예를 들어, 통신 디바이스는 수신된 오디오를 전송 또는 출력하는데 있어서의 이용을 위해 히어링 데이터베이스에 저장하기 위한 히어링 프로파일을 생성하도록 애플리케이션을 실행시킬 수 있거나, 또는 명료성(clarity)을 개선하도록, 수신된 보이스 데이터 내의 잡음을 감소시키도록, 또는 그렇지 않으면 전송된 보이스 데이터가 향상된 품질을 갖게 보이스 데이터를 향상시키도록, 수신된 보이스 데이터를 수정하기 위해, 그러한 보이스 데이터를 전송하기 전에, 마이크로폰(6)을 통해 수신된 보이스 데이터를 향상시키기 위해 이용될 수 있는 보이스 데이터베이스에서의 이용을 위해 보이스 프로파일을 발생시킬 수 있다.

예를 들어, 통신 디바이스는, 보이스 데이터베이스(12)에 세이브하기 위한 사용자 보이스 프로파일을 규정하기 위해 사용자의 보이스의 보이스 데이터가 수집(collect)될 수 있도록, 애플리케이션을 실행시키고, 마이크로폰(6)을 통해 보이스 입력을 엔터(enter)하도록 사용자에게 프롬프트할 수 있다. 사용자에 대한 특정 필터를 규정하는 보이스 프로파일이 준비되어 사용자 보이스 프로파일로서 보이스 데이터베이스(12)에 세이브될 수 있도록, 사용자의 스피킹된(spoken) 보이스가 기록될 수 있다. 대안적으로, 보이스 데이터베이스(12)는, 사용자가 스피커(speaker)로서 검출될 때 필터에 전송하기 위한 파라미터들을 세이브할 수 있어서, 그러한 사용자로부터의 기록된 임의의 보이스 데이터가, 그러한 사용자에 대해 보이스 데이터베이스(12)에서 규정된 보이스 파라미터들에 따라 필터에 의해 필터링된다.

통신 디바이스는, 사용자의 보이스의 샘플을 획득하기 위해, 상이한 볼륨들로 또는 상이한 속도들로 특정 보이스 데이터를 제공하도록 사용자에게 프롬프트하기 위해 디스플레이 유닛(2)을 통해 사용자에게 출력을 전송할 수 있다. 사용자의 보이스의 샘플링은, 사용자의 보이스의 상이한 보컬들 및 주파수들의 샘플링을 이용할 수 있다. 예를 들어, 출력을 사용자에게 프롬프트하는 것은, 상이한 옥타브(octave)들로(예를 들어, 낮은 보이스로 또는 높은 보이스로) 또는 상이한 속도들로(예를 들어, 천천히 또는 빨리) 특정 구절(phrase)을 스피킹하도록 사용자에게 요청하여, 그러한 조건(condition)들을 충족할 때 사용자에 의해 스피킹될 때의 특정 구절을 기록할 수 있다. 사용자는 또한, 보이스 분석을 위해 중요한 음소(significant phoneme)들을 갖는 사용자의 선호하는 언어로 특정 문장을 반복하도록 오디오를 통해 지시받을 수 있다. 기록된 보이스 데이터는 이후, 사용자의 스피킹된 보이스가 어떤 주파수들을 포함하지 않을 수 있는지 그리고 사용자의 보이스의 세기가 어떤 주파수들인지(예를 들어, 사용자가 스피킹할 때, 사용자의 보이스가 가장 자주 존재하는 주파수 범위들)를 결정하기 위해 평가(assess)된다.

사용자의 보이스가 평가된 후에, 통신 디바이스는, 사용자의 보이스가 특정 주파수들을 포함하지 않는다는 것을 결정할 수 있다. 그러므로, 사용자의 보이스 내에 존재하지 않는 주파수들의 범위는 필터에 의해 컷아웃(cut out)될 수 있어서, 통신 디바이스가 카메라 센서(8) 및 마이크로폰(6)을 통해 비디오(video)를 기록할 때 또는 사용자가 통신 디바이스를 이용한 폰콜(phone call)에 관여될 때 행해질 수 있는 바와 같이, 다른 디바이스로의 전송을 위해 사용자의 보이스를 기록할 때, 그러한 주파수들 내의 어떠한 사운드(sound)도 다른 디바이스로 전송되거나 또는 출력되지 않는다. 사용자의 보이스를 포함하지 않는 이러한 주파수 범위의 제거는, 사용자의 보이스의 기록 동안 존재할 수 있는 잡음을 제거할 수 있고, 기록된 보이스 데이터에 대해 ― 그러한 보이스 데이터를 세이브하거나 또는 그러한 보이스 데이터를 전송하기 전에 ― 수행될 수 있는 잡음 감소 또는 다른 보이스 데이터 클린업(cleanup)을 수행하기 위해 필요한 프로세싱을 감소시킬 수 있다.

부가적으로, 사용자의 보이스에 대해 강한 범위인 주파수 범위들(예를 들어, 사용자의 보이스가 거의 항상 존재하는 범위)이 사용자의 보이스의 샘플링으로부터 결정될 수 있다. 사용자의 보이스에 대한 세기일 것으로 결정되는 주파수 범위에서의 사용자의 보이스의 여과(filtration)가 식별될 수 있어서, 이러한 스펙트럼들이 더 미세한 세분성(finer granularity)으로 필터링될 수 있다.

일 실시예에서, 사용자에 대한 보이스 프로파일은, 디스플레이 유닛(2)을 통해 말하도록 사용자에게 프롬프트되는, 사용자가 스피킹하는 단어들 또는 구절들에 따라 기록되는, 기록된 보이스 샘플의 평가에 의해, 규정 및 분류(range)될 수 있다. 그 다음으로, 시간 도메인, 주파수 도메인, 및 사용자의 보컬들의 도미넌트들이, 기록된 보이스 샘플을 분석하는 통신 디바이스에 의해 평가될 수 있다. 그 다음으로, 사용자의 보이스의 평가된 파라미터들은, 보이스 채널(voice channel), 미디어 송신(media transmission), 폰콜, 또는 다른 보이스 데이터 송신(voice data transmission)을 통한 비디오 기록 또는 전송과 관련하여 세이브하기 위한 것인, 사용자로부터 수신된 임의의 보이스 데이터를 향상시키는 목적들을 위해 사용자의 보이스의 필터링을 규정하기 위해 보이스 데이터베이스(12) 내에 세이브될 수 있다. 전송될 보이스 데이터의 향상은, 통신 디바이스에 의해 수행될 수 있는 잡음 소거와 동시에 발생할 수 있다는 것이 이해되어야 한다. 잡음 소거 및 보이스 향상은, 잡음 소거 및 보이스 향상을 통해 수정되는 보이스 데이터의 패킷화(packetizing) 전에 발생할 수 있다. 그 다음으로, 패킷화된 수정된 보이스 데이터는 다른 디바이스에 전송될 수 있다.

통신 디바이스는 또한, 사용자에 대한 히어링 프로파일이 결정되어 히어링 데이터베이스(13)에 저장될 수 있도록, 적어도 하나의 스피커(4)를 통해 출력되는, 방출된 오디오에 응답하여, 통신 디바이스에 입력을 제공하도록 사용자에게 프롬프트할 수 있다. 그 다음으로, 히어링 데이터베이스(13)는, 수신된 오디오 데이터를 프로세싱하는데 이용될 수 있고, 다른 디바이스에 출력 또는 전송될 보이스 데이터를 프로세싱하는데 또한 이용될 수 있다. 예를 들어, 특정 사용자는, 사용자가 덜 감지가능한(sensible) 또는 어떠한 오디오도 히어링할 수 없는 ― 그러한 오디오가 그러한 주파수 스펙트럼 내에 속하는 경우 ― 주파수 스펙트럼을 가질 수 있다. 이러한 스펙트럼은 사용자의 히어링 프로파일에서 식별될 수 있고, 이후, 그러한 사용자에게 출력될 또는 그러한 사용자와 연관된 디바이스, 이를 테면, 사용자의 전화기 또는 셀룰러폰에 전송될 보이스 데이터를 수정하기 위해 이용될 수 있다.

예를 들어, 통신 디바이스는, 스피커(4)를 통해 상이한 소리세기(loudness) 레벨들로 방출되는 일련의 톤들에 응답하도록 사용자에게 프롬프트할 수 있다. 사용자에 의해 제공되는 입력은, 사용자가 상이한 방출 톤들을, 어떤 볼륨 또는 소리세기 레벨에서 히어링할 수 있는지를 표시할 수 있고, 하나의 이어 스피커(ear speaker)를 통해 개별적으로 각각의 이어(ear)에, 그리고 라우드 스피커를 통해 함께 이어들 양측 모두에, 상이한 소리세기 레벨들로 방출되는 동일한 일련의 톤들을 검출하도록 사용자에게 프롬프트할 수 있다. 그 다음으로, 사용자에 의해 제공된 입력은, 사용자의 각각의 이어에 대해서뿐만 아니라 사용자의 이어들 양측 모두에 대해 히어링 임계치들을 결정하기 위해 통신 디바이스에 의해 이용될 수 있다. 그 다음으로, 사용자의 히어링 프로파일은 사용자와 링크되어, 다수의 방식들로 이용될 수 있다. 부가적으로, 형성된 히어링 프로파일은 또한 통신 디바이스에 오디오 데이터를 송신할 수 있는 다른 디바이스들 또는 사용자와 연관된 다른 디바이스에 전송될 수 있어서, 사용자의 히어링 프로파일은, 그러한 사용자에 대한 그러한 데이터의 명료성을 향상시키기 위해, 사용자에게 전송될 보이스 데이터를 수정하기 위해 이용될 수 있다.

예를 들어, 히어링 프로파일은, 히어링 데이터베이스(13) 내에 존재함으로써, 통신 디바이스의 메모리(5)에 저장될 수 있다. 그 다음으로, 통신 디바이스는 수신된 보이스 데이터의 소리세기를 조정할 수 있어서, 사용자가 히어링할 수 있는 주파수 내에 있지 않은 보이스 데이터 또는 다른 오디오 데이터가 수정되어서, 출력되는 보이스 데이터가 사용자에 의해 히어링가능하다. 히어링 프로파일은, 예를 들어, 이러한 조정을 제공하기 위해 오디오 경로(audio path)를 통해 실시간 전송 프로토콜("RTP"; real-time transport protocol) 디코더(decoder) 또는 다른 오디오 이퀄라이저(audio equalizer)에 적용될 수 있다. 그러므로, 사용자 자신의 통신 디바이스 내의 히어링 프로파일은, 수신된 데이터가 방출될 볼륨 설정(volume setting)을 조정할 수 있어서, 사용자에 대한 그러한 데이터의 명료성을 개선한다.

다른 예로서, 히어링 프로파일은 다른 통신 디바이스에 전송될 수 있어서, 사용자의 통신 디바이스에 전송되는 오디오 데이터는, 사용자의 히어링 프로파일을 통해 사용자의 특정 히어링 능력들을 고려하여, 그러한 데이터를 사용자에게 전송하는 디바이스에 의해 수정될 수 있다. 예를 들어, 사용자의 히어링 프로파일을 수신하는 전송 통신 디바이스(transmitting communication device)는, 사용자의 히어링 프로파일에 기초하여, 사용자와 연관된 통신 디바이스에 전송될 보이스 데이터에 대한 그의 잡음 감소를 향상시킬 수 있다. 전송될 보이스 데이터는, 사용자에게 전송되는 데이터의 명료성을 개선하기 위해, 보이스 데이터가 사용자의 히어링 프로파일의 스펙트럼 내에 있도록 수정될 수 있다. 전송 디바이스(transmitting device)는 또한, 또는 대안적으로, 사용자가 전혀 감지력(sensibility)을 갖지 않는 스펙트럼 내의 오디오 또는 그러한 스펙트럼 내의 거의 들리지 않는(near deaf) 오디오를 회피, 삭제, 또는 그렇지 않으면 무효화(nullify)하도록 사용자의 통신 디바이스에 전송될 오디오 데이터를 수정할 수 있어서, 오디오 데이터의 그러한 부분의 송신 및 수신과 연관된 대역폭 및 프로세싱 파워(processing power)가 세이브될 수 있다.

사용자의 통신 디바이스는 사용자의 히어링 프로파일 또는 통신 디바이스의 히어링 데이터베이스(13)를 전송 디바이스(transmitting device)에 전송할 수 있어서, 이는 오디오 데이터의 미래의 콜(call)들 또는 다른 송신들을 위해 그러한 다른 디바이스에 의해 세이브될 수 있다. 다른 디바이스는 사용자의 히어링 프로파일을, 사용자의 통신 디바이스의 어드레스(address), 이를 테면, 그러한 디바이스의 전화 번호 또는 인터넷 프로토콜 어드레스와 연관시킬 수 있어서, 그러한 어드레스를 이용하는 임의의 통신은, 사용자의 통신 디바이스에 전송될 보이스 데이터 또는 다른 오디오 데이터를 수정하도록 사용자의 히어링 프로파일의 이용을 초래할 수 있다. 전송 디바이스(transmitting device)는, 사용자와 연관된 전화 번호와 같은 디바이스 어드레스의 연관성 및 그러한 어드레스를 갖는 디바이스와 확립되는 콜(call)에 또한 기초하여, 미래의 통신 세션(communication session)들에서의 이용을 위해 그러한 프로파일을 세이브할 수 있다. 사용자의 히어링 프로파일은 또한, 보이스 메일박스(voice mailbox) 또는 이메일 어드레스(email address)와 같이, 사용자가 연관되는 다른 디바이스들과 연관될 수 있어서, 이들 다른 디바이스들 또는 어드레스들에 전송되는 오디오 데이터는, 정보가 어드레싱되는 사용자에 대한 오디오 데이터의 명료성을 개선하기 위해 수정된다.

통신 디바이스의 몇몇 실시예들에서, 사용자는, 그러한 통신 세션에 관여되는 다른 디바이스로의 메시지의 전송을 작동(actuate)하기 위해, 콜 또는 다른 통신 세션 동안 입력을 엔터할 수 있다. 엔터되는 그러한 입력은, 사용자가, 특정 세션 동안 또는 임의의 미래의 콜 또는 미래의 통신 세션 동안 그러한 사용자와 연관된 히어링 프로파일이 적용되길 원하지 않는다는 것을 콜 파트너(call partner)에게 표시할 수 있다. 이러한 입력은, 진행중인 콜(ongoing call) 또는 다른 통신 세션 동안 이러한 디바이스에 전송될 다른 디바이스에 의해 히어링 프로파일의 이용을 비활성화하는 메시지를 작동시킬 수 있거나 또는 전송될 수 있다. 이러한 메시지는 대안적으로, 특정 통신 세션 전에 또는 후에 전송될 수 있다. 이러한 메시지는, 예를 들어, 사용자가 새로운 히어링 프로파일 또는 보이스 프로파일을 생성할 때 전송될 수 있다. 이러한 메시지는, 후속 통신 세션들에서의 이용을 위해 다른 디바이스에 의한 세이빙을 위해 대체 히어링 프로파일 또는 보이스 프로파일과 함께 전송될 수 있다.

그러한 데이터가 사용자에게 출력될 때, 특정 사용자에 대한 그러한 데이터의 명료성을 개선하기 위해 보이스 데이터 또는 다른 오디오 데이터의 수정이, 그러한 데이터를, 그러한 사용자가 더욱 감지가능한(sensible) 스펙트럼의 부분에 위치시키기 위해, 오디오 데이터를 스큐잉(skewing)하는 것을 초래할 수 있다는 것이 이해되어야 한다. 이러한 스큐잉은, 스피커의 보이스 특징이 변경되는 것을 초래할 수 있다. 그러나, 이는 또한, 사용자에 대한 통신의 명료성을 개선하는 것을 초래할 수 있어서, 텔레폰 콜(telephone call) 또는 컨퍼런스 콜(conference call)과 같은 통신 세션 동안 더 많은 데이터가 실제로 사용자에게 히어링되고 사용자에게 이해된다.

제 1 통신 단말(21) 및 제 2 통신 단말(22)은 2개의 디바이스들 사이의 텔레폰 콜 동안의 이용을 위해 보이스 데이터베이스 및 히어링 데이터베이스를 각각 가질 수 있다는 것이 이해되어야 한다. 각각의 통신 단말은 그러한 단말의 마이크로폰으로 스피킹하는 사용자의 보이스 데이터를 수정할 수 있어서, 전송된 보이스 데이터가, 수신 단말의 사용자에 대한 그의 명료성을 개선하기 위해, 수정된다. 하나의 고려되는 대체 실시예에서, 통신 세션 동안 2개의 단말들의 통신 경로 내에 있는 컴퓨터 디바이스(25)와 같은 스위치 디바이스는 히어링 및 보이스 데이터베이스들을 가질 수 있고, 그러한 오디오 데이터를 수신 파티(receiving party)에 전송하는 스피커의 보이스 프로파일 및 오디오 데이터의 출력을 수신하는 사용자의 히어링 프로파일에 기초하여 특정 사용자에게 전송될 오디오 데이터를 수정할 수 있다.

통신 디바이스의 몇몇 실시예들에서, 하나보다 많은 수의 사용자가 그러한 디바이스를 이용할 수 있다. 상이한 사용자들이 상이한 히어링 프로파일들 및 상이한 보이스 프로파일들을 생성할 수 있다. 예를 들어, 각각의 사용자는 상기 논의된 바와 같이 생성, 세이브, 및 전송되는 히어링 프로파일 및 보이스 프로파일을 갖는 통신 디바이스를 이용할 수 있다. 사용자들의 형성된 프로파일들은 동일한 디바이스의 메모리에 세이브되고, 상이한 사용자들을 구별하기 위해 사용자 식별과 링크될 수 있다. 그 다음으로, 각각의 사용자는 다수의 방식들 중 임의의 방식으로 자신들을 식별할 수 있다. 예를 들어, 각각의 사용자는, 그러한 사용자를, 디바이스를 현재 이용하고 있는 사용자로서 식별하는 고유 로그-온 식별(log-on identification) 또는 코드(code)를 엔터할 수 있다. 로그-온 식별은, 사용자의 참조 번호(reference number) 또는 식별 코드(identification code)를 엔터하기 위해, 개인 식별 번호를 엔터하는 것 또는 미리 규정된 터치들의 시퀀스(sequence)로 통신 디바이스의 터치 스크린 디스플레이의 특정 부분들을 누르는 것을 포함할 수 있다. 이러한 엔터된 사용자 식별의 검출시, 통신 디바이스는 식별된 사용자에 대한 보이스 및 히어링 데이터베이스들 내의 프로파일들을 이용할 수 있다. 다른 옵션으로서, 사용자는 사용자 특정 프로파일(user specific profile)들을 선택하기 위해 입력 디바이스를 통해 입력을 엔터함으로써, 사용자에 대한 특정 프로파일을 선택할 수 있다. 몇몇 실시예들에서, 통신 디바이스는 디폴트(default)로, 사용자의 히어링 및 보이스 프로파일들을, 엔터된 식별을 통해 식별된 사용자와 연관시킬 수 있다. 그 다음으로, 사용자는 이러한 설정을 비활성화하기 위해 또는 설정들을 변경하기 위해 입력을 제공할 수 있다.

통신 디바이스, 통신 시스템, 및 이를 이루고 이용하는 방법들의 특정한 현재 바람직한 실시예들이 도시되고 상술되었지만, 본 발명이 이에 제한되지 않고, 다음의 청구항들의 범주 내에서 다른 방식으로 다양하게 구현 및 실시될 수 있다는 것이 명백하게 이해될 것이다.

Claims

보이스 데이터(voice data)를 전송하는 방법으로서,
통신 디바이스(communication device)(21)가, 사용자의 보이스의 시간 도메인(time domain), 주파수 도메인(frequency domain), 보컬 도미넌트(vocal dominant)들, 상이한 옥타브들, 상이한 속도들, 상이한 볼륨들 및 보컬 범위(vocal range) 중 적어도 하나를 식별하기 위해, 상기 사용자의 보이스의 샘플(sample)을 획득하기 위해 사용자에게 스피킹(speak)하도록 프롬프트(prompt)하는 단계;
상기 통신 디바이스(21)가 상기 사용자의 보이스의 샘플에 기초하여 상기 사용자의 보이스에 대한 보이스 메트릭(voice metric)들을 결정하는 단계;
상기 통신 디바이스(21)가 상기 사용자의 보이스의 보이스 메트릭들을 저장하는 단계;
상기 통신 디바이스(21)가 상기 사용자로부터 보이스 데이터를 수신하는 단계;
상기 통신 디바이스(21)가 상기 사용자의 보이스의 상기 보이스 메트릭들, 상기 시간 도메인, 상기 주파수 도메인, 상기 보컬 도미넌트들, 상이한 옥타브들, 상이한 속도들, 상이한 볼륨들 및 상기 보컬 범위 중 적어도 하나에 기초하여, 상기 수신된 보이스 데이터를 수정(modify)하는 단계;
상기 수정된 보이스 데이터가 적어도 하나의 수신자(recipient)에게 출력가능하도록, 상기 통신 디바이스(21)가 상기 수정된 보이스 데이터를 다른 디바이스에 전송하는 단계;
사용자가 톤(tone)들을 히어링(hear)하도록, 상기 통신 디바이스(21)가 상기 사용자에게 방출하기 위해 상기 톤들을 발생시키는 단계;
상기 통신 디바이스(21)가 볼륨 설정(volume setting)들을 식별하는 입력을 수신하는 단계 ― 상기 볼륨 설정들에서 상기 톤들이 상기 사용자에게 히어링가능함 ―;
상기 통신 디바이스(21)가 상기 볼륨 설정들을 식별하였던 상기 수신된 입력에 기초하여, 상기 사용자의 히어링 프로파일(hearing profile)을 결정하는 단계 ― 상기 볼륨 설정들에서 상기 톤들이 상기 사용자에게 히어링가능함 ―;
상기 사용자의 히어링 프로파일이 오디오 데이터(audio data)의 미래의 콜(call) 또는 다른 전송들을 위한 다른 통신 디바이스(22)에 의해 세이브(save)될 수 있도록, 상기 통신 디바이스(21)가 상기 사용자의 히어링 프로파일을 상기 다른 통신 디바이스(22)로 전송하는 단계;
상기 다른 통신 디바이스(22)가 상기 오디오 데이터를 상기 통신 디바이스(21)에 전송하기 전에 상기 사용자의 히어링 프로파일에 기초하여 오디오 데이터를 수정하는 단계 ― 그 결과, 상기 통신 디바이스(21)에 전송된 오디오 데이터는 상기 사용자의 히어링 프로파일을 통해 상기 사용자의 특정 히어링 능력을 고려하여 상기 데이터를 상기 사용자에게 전송하는 상기 다른 통신 디바이스(22)에 의해 수정됨 ―
를 포함하는,
보이스 데이터를 전송하는 방법.
제 1 항에 있어서,
상기 사용자가, 통신 세션에 관여되는 상기 다른 통신 디바이스(22)로의 메시지의 전송을 작동시키기(actuate) 위해, 콜 또는 다른 통신 세션 전, 동안 또는 후에 입력(input)을 입력하는(enter) 단계
를 더 포함하고, 상기 입력된 입력은 상기 다른 통신 디바이스(22)에 의해 히어링 프로파일의 사용을 비활성화하는 메시지를 작동시키는,
보이스 데이터를 전송하는 방법.
제 1 항 또는 제 2 항에 있어서,
상기 다른 통신 디바이스(22)가, 상기 전송된 오디오 데이터 내의 모든 전송된 보이스 데이터가 상기 사용자의 히어링가능한 오디오 스펙트럼 내에 있도록, 상기 오디오 데이터의 볼륨을 증가시킴으로써 상기 오디오 데이터를 수정하는 단계
를 더 포함하는,
보이스 데이터를 전송하는 방법.
제 1 항 또는 제 2 항에 있어서,
상기 통신 디바이스가, 하나의 이어 스피커(ear speaker)를 통해 개별적으로 각각의 귀에, 그리고 또한 라우드 스피커(loud speaker)를 통해 양쪽 귀 모두에, 상이한 소리세기 레벨들로 방출되는 동일한 일련의 톤들을 검출하도록 상기 사용자에게 프롬프트하는 단계
를 더 포함하고, 그 다음에, 상기 사용자에 의해 제공된 상기 입력이, 상기 사용자의 각각의 귀에 대해서뿐만 아니라 사용자의 양쪽 귀 모두에 대해서 히어링 임계치들을 결정하기 위해 상기 통신 디바이스(21)에 의해 이용되는,
보이스 데이터를 전송하는 방법.
제 1 항 또는 제 2 항에 있어서,
상기 사용자의 보이스의 보이스 메트릭들은, 상기 보이스에 대한 시간 도메인, 상기 보이스에 대한 주파수 도메인, 상기 보이스에 대한 보컬 도미넌트들, 상이한 옥타브들, 상이한 속도들, 상이한 볼륨들 및 상기 사용자의 보이스의 보컬 범위에 기초하는 파라미터(parameter)들로 구성되고,
상기 다른 통신 디바이스(22)가 상기 오디오 데이터를 상기 통신 디바이스(21)에 전송하기 전에 상기 사용자의 히어링 프로파일에 기초하여 상기 오디오 데이터를 수정하는 단계는, 상기 사용자의 히어링 프로파일을 통해 사용자에게 히어링불가한(unhearable) 것으로 식별된 오디오 스펙트럼(audio spectrum) 내에 있는 오디오 데이터의 부분을 생략하는 단계를 포함하고, 그 결과 상기 전송된 오디오 데이터가 상기 오디오 데이터의 상기 부분을 포함하지 않아 상기 오디오 데이터의 상기 부분의 전송 및 수신에 연관된 대역폭 및 프로세싱 파워(processing power)가 세이브되는,
보이스 데이터를 전송하는 방법.
제 1 항 또는 제 2 항에 있어서,
상기 통신 디바이스(21)가 상기 사용자의 보이스의 상기 보이스 메트릭들, 상기 시간 도메인, 상기 주파수 도메인, 상기 보컬 도미넌트들, 상이한 옥타브들, 상이한 속도들, 상이한 볼륨들 및 상기 보컬 범위 중 적어도 하나에 기초하여 상기 보이스 데이터를 수정하는 단계는, 상기 통신 디바이스(21)가 상기 사용자의 보이스의 주파수 도메인의 외부에 있는 주파수 범위 내에 있는 상기 수신된 보이스 데이터의 부분을 제거하는 단계로 구성되고,
상기 주파수 범위의 제거는 상기 사용자 보이스의 기록 동안 존재하는 잡음을 제거하고, 상기 보이스 데이터를 세이브하거나 또는 상기 보이스 데이터를 전송하기 전에 기록된 보이스 데이터에 대해 수행되는 잡음 감소 또는 다른 보이스 데이터 클린업(cleanup)을 수행하기 위해 필요한 프로세싱을 감소시키는,
보이스 데이터를 전송하는 방법.
제 1 항 또는 제 2 항에 있어서,
상기 사용자의 히어링 프로파일은 상기 사용자와 링크되고, 적어도 상기 통신 디바이스(21)에 오디오 데이터를 전송할 수 있거나 상기 사용자에 연관된 상기 다른 통신 디바이스(22)에 송신되어, 그 결과 상기 사용자의 히어링 프로파일은 상기 사용자에 대한 상기 데이터의 명료성을 향상시키도록 상기 사용자에게 송신될 보이스 데이터를 수정하기 위해 이용되는,
보이스 데이터를 전송하는 방법.
제 1 항 또는 제 2 항에 있어서,
상기 통신 디바이스(21)는 서버(server), 워크스테이션(workstation), 데스크톱 컴퓨터(desktop computer), 태블릿(tablet), 모바일 셀룰러폰(mobile cellular phone), 인터넷 기기(internet appliance), 랩톱 컴퓨터(laptop computer), 스마트폰(smart phone), PDA(personal digital assistant), 모바일 컴퓨터 디바이스(mobile computer device), 또는 통신 단말(communication terminal) 중 하나이고,
상기 방법은,
상기 통신 디바이스(21)가 상기 수신된 보이스 데이터가 상기 사용자로부터 비롯되었다는 것을 결정하는 단계
를 더 포함하는,
보이스 데이터를 전송하는 방법.
제 1 항 또는 제 2 항에 있어서,
상기 사용자의 히어링 프로파일은,
상기 다른 통신 디바이스(22)에 의해, 상기 사용자의 통신 디바이스(21)의 어드레스에 연관되어, 상기 어드레스를 이용하는 임의의 통신이 상기 사용자의 통신 디바이스(21)에 전송될 보이스 데이터 또는 다른 오디오 데이터를 수정하도록 상기 사용자의 히어링 프로파일의 사용을 초래할 수 있거나,
상기 다른 통신 디바이스(22)에 의해, 디바이스 어드레스의 연관성 및 상기 어드레스를 갖는 디바이스와 확립되는 콜에 기초하여, 미래의 통신 세션들에서의 사용을 위해 세이브되거나, 또는
상기 사용자가 연관되는 적어도 상기 다른 디바이스들(22)과 연관되어, 상기 다른 디바이스들 또는 어드레스들에 전송되는 상기 오디오 데이터가 정보가 어드레싱되는 상기 사용자에 대한 상기 오디오 데이터의 명료성을 개선하기 위해 수정되는,
보이스 데이터를 전송하는 방법.
저장된 애플리케이션(application)(7)을 갖는 컴퓨터 판독가능 저장 매체(computer readable storage medium)로서,
상기 애플리케이션(7)은 상기 애플리케이션(7)이 통신 디바이스(21)에 의해 실행될 때, 상기 통신 디바이스(21)에 의해 수행되는 방법을 규정하고,
상기 방법은,
상기 통신 디바이스(21)가, 사용자의 보이스의 시간 도메인, 주파수 도메인, 보컬 도미넌트들, 상이한 옥타브들, 상이한 속도들, 상이한 볼륨들 및 보컬 범위 중 적어도 하나를 식별하기 위해, 상기 사용자의 보이스의 샘플을 획득하기 위해 사용자에게 스피킹하도록 프롬프트하는 단계;
상기 통신 디바이스(21)가 상기 사용자의 보이스의 샘플에 기초하여 상기 사용자의 보이스에 대한 보이스 메트릭들을 결정하는 단계;
상기 통신 디바이스(21)가 상기 사용자의 보이스의 보이스 메트릭들을 저장하고, 세이브된 보이스 메트릭들을 상기 사용자와 연관시키는 단계;
상기 통신 디바이스(21)가 상기 사용자로부터 보이스 데이터를 수신하는 단계;
상기 통신 디바이스(21)가 상기 사용자의 보이스의 상기 시간 도메인, 상기 주파수 도메인, 상기 보컬 도미넌트들, 상이한 옥타브들, 상이한 속도들, 상이한 볼륨들 및 상기 보컬 범위 중 적어도 하나에 기초하여, 상기 수신된 보이스 데이터를 수정하는 단계;
상기 통신 디바이스(21)가 상기 수정된 보이스 데이터를 다른 디바이스에 전송하는 단계;
사용자가 톤들을 히어링하도록 상기 통신 디바이스(21)가 상기 사용자에게 방출하기 위해 상기 톤들을 발생시키는 단계;
상기 통신 디바이스(21)가 볼륨 설정들을 식별하는 입력을 수신하는 단계 ― 상기 볼륨 설정들에서 상기 톤들이 상기 사용자에게 히어링가능함 ―;
상기 통신 디바이스(21)가 상기 볼륨 설정들을 식별하였던 상기 수신된 입력에 기초하여, 상기 사용자의 히어링 프로파일을 결정하는 단계 ― 상기 볼륨 설정들에서 상기 톤들이 상기 사용자에게 히어링가능함 ―;
상기 사용자의 히어링 프로파일이 오디오 데이터의 미래의 콜 또는 다른 전송들을 위한 제 2 통신 디바이스(22)에 의해 세이브될 수 있도록, 상기 통신 디바이스(21)가 상기 사용자의 히어링 프로파일을 상기 제 2 통신 디바이스(22)로 전송하는 단계; 및
상기 제 2 통신 디바이스(22)가 상기 오디오 데이터를 상기 통신 디바이스(21)에 전송하기 전에 상기 사용자의 히어링 프로파일에 기초하여 상기 오디오 데이터를 수정하는 단계 ― 그 결과, 상기 통신 디바이스(21)에 전송된 오디오 데이터는 상기 사용자의 히어링 프로파일을 통해 상기 사용자의 특정 히어링 능력을 고려하여 상기 데이터를 상기 사용자에게 전송하는 상기 제 2 통신 디바이스(22)에 의해 수정됨 ―
를 포함하는,
컴퓨터 판독가능 저장 매체.
제 10 항에 있어서,
상기 방법은,
상기 통신 디바이스(21)가,
수신된 오디오를 전송 또는 출력하는데 있어서의 사용을 위해 히어링 데이터베이스(13)에 저장하기 위한 히어링 프로파일을 생성하도록 애플리케이션(7)을 실행시킬 수 있거나, 또는
명료성을 개선하거나, 수신된 보이스 데이터 내의 잡음을 감소시키거나, 또는 그렇지 않으면 상기 보이스 데이터를 향상시켜 전송된 보이스 데이터가 향상된 품질을 갖도록, 수신된 보이스 데이터를 수정하기 위해, 상기 보이스 데이터를 전송하기 전에, 마이크로폰(6)을 통해 수신된 보이스 데이터를 향상시키기 위해 이용될 수 있는 보이스 데이터베이스(12)에서의 이용을 위해 보이스 프로파일을 발생시키는 단계
를 더 포함하고,
상기 보이스 데이터 베이스(12) 및 상기 히어링 데이터 베이스(13)뿐만 아니라 다른 데이터는 상기 애플리케이션(7)이 실행될 때 상기 통신 디바이스(21)에 의해 이용되는,
컴퓨터 판독가능 저장 매체.
제 10 항 또는 제 11 항에 있어서,
상기 통신 디바이스는 제 1 통신 디바이스이고,
상기 방법은,
상기 제 1 통신 디바이스(21)에 전송되는 수정된 오디오 데이터가 제 1 오디오 스펙트럼 내에 있는 오디오 데이터의 임의의 부분을 생략하도록, 상기 제 2 통신 디바이스(22)가 상기 오디오 데이터를 상기 제 1 통신 디바이스(21)에 전송하기 전에 상기 사용자의 상기 히어링 프로파일에 기초하여 상기 오디오 데이터를 수정하는 단계 ― 상기 제 1 오디오 스펙트럼은 상기 사용자의 상기 히어링 프로파일에 의해, 상기 사용자에게 히어링불가한 것으로서 식별된 오디오 스펙트럼임 ―
를 더 포함하고, 그 결과 상기 오디오 데이터의 상기 부분의 전송 및 수신에 연관된 대역폭 및 프로세싱 파워가 세이브되는,
컴퓨터 판독가능 저장 매체.
제 10 항 또는 제 11 항에 있어서,
상기 통신 디바이스(21)가, 상기 사용자의 보이스의 상기 시간 도메인, 상기 주파수 도메인, 상기 보컬 도미넌트들, 상이한 옥타브들, 상이한 속도들, 상이한 볼륨들 및 상기 보컬 범위 중 적어도 하나에 기초하여 상기 보이스 데이터를 수정하는 단계는, 상기 통신 디바이스(21)가, 상기 사용자의 보이스의 주파수 도메인의 외부에 있는 주파수 범위 내에 있는 상기 수신된 보이스 데이터의 부분을 제거하는 단계로 구성되는,
컴퓨터 판독가능 저장 매체.
제 10 항 또는 제 11 항에 있어서,
상기 통신 디바이스(21) 및 상기 제 2 통신 디바이스(22)는 각각 두 통신 디바이스들(21, 22) 간의 텔레폰 콜(telephone call) 동안의 사용을 위한 상기 보이스 데이터베이스(12) 및 상기 히어링 데이터베이스(13)을 갖고,
각각의 통신 디바이스(21, 22)는 상기 통신 디바이스(21, 22)의 마이크로폰으로 스피킹하는 사용자의 보이스 데이터를 수정하여, 전송된 보이스 데이터가 수신하는 통신 디바이스(21, 22)의 사용자에 대한 자신의 명료성을 개선하도록 수정되는,
컴퓨터 판독가능 저장 매체.
제 10 항 또는 제 11 항에 있어서,
통신 세션 동안 상기 통신 디바이스(21) 및 상기 제 2 통신 디바이스(22)의 전송 경로 내에 있는 스위치 디바이스가 상기 히어링 데이터베이스(12) 및 상기 보이스 데이터베이스(13)를 포함하고, 수신하는 사용자에 상기 오디오 데이터를 전송하고 있는 스피커의 보이스 프로파일 및 오디오 데이터의 출력을 수신하기 위해 상기 사용자의 히어링 프로파일에 기초하여 특정 사용자에게 전송될 오디오 데이터를 수정하는,
컴퓨터 판독가능 저장 매체.
제 9 항에 있어서,
상기 사용자의 통신 디바이스(21)의 어드레스는 상기 통신 디바이스(21)의 전화 번호 또는 인터넷 프로토콜 어드레스(internet protocol address)인,
보이스 데이터를 전송하는 방법.
제 9 항에 있어서,
상기 사용자와 연관된 상기 다른 통신 디바이스(22)는 보이스 메일박스(mailbox)인,
보이스 데이터를 전송하는 방법.
제 9 항에 있어서,
상기 사용자와 연관된 어드레스는 이메일(email) 어드레스인,
보이스 데이터를 전송하는 방법.
제 15 항에 있어서,
상기 스위치 디바이스는 컴퓨터 디바이스(25)인,
컴퓨터 판독가능 저장 매체.