KR101626438B1 - 오디오 데이터 프로세싱을 위한 방법, 디바이스, 및 시스템 - Google Patents

오디오 데이터 프로세싱을 위한 방법, 디바이스, 및 시스템 Download PDF

Info

Publication number
KR101626438B1
KR101626438B1 KR1020147023147A KR20147023147A KR101626438B1 KR 101626438 B1 KR101626438 B1 KR 101626438B1 KR 1020147023147 A KR1020147023147 A KR 1020147023147A KR 20147023147 A KR20147023147 A KR 20147023147A KR 101626438 B1 KR101626438 B1 KR 101626438B1
Authority
KR
South Korea
Prior art keywords
user
communication device
voice
data
voice data
Prior art date
Application number
KR1020147023147A
Other languages
English (en)
Other versions
KR20140121447A (ko
Inventor
비찬 카리미-헤르칸디
파로크 모함마드차데 코우히
샤아 월리 알리
Original Assignee
유니파이 게엠베하 운트 코. 카게
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 유니파이 게엠베하 운트 코. 카게 filed Critical 유니파이 게엠베하 운트 코. 카게
Publication of KR20140121447A publication Critical patent/KR20140121447A/ko
Application granted granted Critical
Publication of KR101626438B1 publication Critical patent/KR101626438B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/247Telephone sets including user guidance or feature selection means facilitating their use
    • H04M1/2474Telephone terminals specially adapted for disabled people
    • H04M1/2475Telephone terminals specially adapted for disabled people for a hearing impaired user

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Otolaryngology (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 스피킹하는 사람으로부터 수신된 오디오 데이터를 필터링하는 ― 그러한 스피커에 대한 특정 필터를 포함함 ― 방법 및 장치에 관한 것이다. 스피커의 보이스의 오디오 특징들이 수집될 수 있고, 특정 필터는, 보이스 품질을 또한 향상시키는 동시에, 잡음을 감소시키기 위해 형성될 수 있다. 예를 들어, 스피커의 보이스가 특정 주파수들을 포함하지 않는 경우, 필터는, 잡음 소거를 용이하게 하고, 필요하지 않은 클리닝을 위해 사운드 스펙트럼을 프로세싱하는 것을 감소시키기 위해, 그러한 주파수들에서의 잡음을 소거할 수 있다. 부가적으로, 스피커의 보이스의 세기 주파수들은 수집된 오디오 특징들로부터 식별될 수 있고, 그러한 스펙트럼들은, 통신 디바이스에 의해 전송되거나 또는 출력되는 스피커의 보이스 데이터의 보이스 품질을 향상시키는 스피커 특정 필터를 제공하기 위해 더 정밀한 세분성으로 필터링될 수 있다. 오디오 데이터는 또한 사용자의 미리 규정된 히어링 스펙트럼에 기초하여 출력될 수 있다.

Description

오디오 데이터 프로세싱을 위한 방법, 디바이스, 및 시스템 {METHOD, DEVICE, AND SYSTEM FOR AUDIO DATA PROCESSING}
본 발명은, 셀룰러폰(cellular phone)들, 모바일 컴퓨터 디바이스(mobile computer device)들, 태블릿(tablet)들, 랩톱(laptop)들, 또는 다른 단말 디바이스(terminal device)들을 이용하는 통신 시스템(communication system)들과 같은 통신 시스템들에 관한 것이다. 더욱 상세하게, 본 발명은, 기록 또는 송신을 위해 수신되는 보이스 데이터(voice data)의 보이스 품질(voice quality)을 개선하기 위해, 수신된 오디오 데이터(audio data)를 편집(edit)하도록 구성된 시스템, 방법, 및 디바이스에 관한 것이다.
원격통신 엔드포인트(telecommunication endpoint)들은 종종 잡음 감소 디바이스(noise reduction device)를 구비한다. 이러한 디바이스는 통상적으로, 보이스 데이터가 출력되거나 또는 출력된 오디오 데이터로서 전송될 때, 더 양호한 보이스 콘텐츠(voice content)를 전달하기 위해, 디바이스에 의해 수신되는 보이스 데이터를 필터링(filter)하도록 구성된다. 그러나, 이러한 잠음 감소 메커니즘(noise reduction mechanism)들에서 이용되는 필터(filter)들은 통상적으로, 일반적인 방식으로 오디오를 프로세싱(process)하도록 설계된 범용 필터(general purpose filter)들이다. 결과적으로, 잡음 감소는, 출력된 오디오 데이터에 대한 보이스 품질 또는 다른 속성들에서 큰 개선을 제공하는 데 실패할 수 있다.
본 발명자들은, 수신된 오디오 데이터에 기초하여 출력되는 오디오 출력의 오디오 특징들을 개선하기 위해, 새로운 방법 및 장치가 필요하다고 결정하였다. 본 발명자들의 방법 및 장치의 몇몇 실시예들에서, 출력되는 오디오는, 스피킹(speaking)을 수행하고 히어링(hearing)을 수행하는 사용자들의 스피킹 및 히어링 프로파일(speaking and hearing profile)들에 기초하는 히어링 및 스피킹 파라미터(hearing and speaking parameter)들을 이용하도록 구성될 수 있다.
보이스 데이터를 전송하는 방법이 제공된다. 방법의 실시예는, 통신 디바이스(communication device)가, 사용자의 보이스의 시간 도메인(time domain), 주파수 도메인(frequency domain), 보컬 도미넌트(vocal dominant)들, 및 보컬 범위(vocal range) 중 적어도 하나를 식별하기 위해, 사용자의 보이스의 샘플(sample)을 획득하기 위해 사용자에게 스피킹(speak)하도록 프롬프트(prompt)하는 단계, 통신 디바이스가 사용자의 보이스의 샘플에 기초하여 사용자의 보이스에 대한 보이스 메트릭(voice metric)들을 결정하는 단계, 통신 디바이스가 사용자의 보이스의 보이스 메트릭들을 저장하는 단계, 통신 디바이스가 사용자로부터 보이스 데이터를 수신하는 단계, 통신 디바이스가 사용자의 보이스의 보이스 메트릭들, 시간 도메인, 주파수 도메인, 보컬 도미넌트들, 및 보컬 범위 중 적어도 하나에 기초하여, 수신된 보이스 데이터를 수정(modify)하는 단계, 및 통신 디바이스가, 수정된 보이스 데이터가 적어도 하나의 수신자(recipient)에게 출력가능하도록, 수정된 보이스 데이터를 다른 디바이스에 전송하는 단계를 포함할 수 있다.
방법의 몇몇 실시예들은 부가적인 단계들 또는 수정들을 포함할 수 있다. 예를 들어, 방법은 또한, 사용자가 톤(tone)들을 히어링하도록, 통신 디바이스가 사용자에게 방출하기 위해 톤들을 발생하는 단계, 통신 디바이스가 볼륨 설정(volume setting)들을 식별하는 입력을 수신하는 단계 ― 상기 볼륨 설정들에서 톤들이 사용자에게 히어링가능함 ―, 및 통신 디바이스가 볼륨 설정들을 식별하였던 수신된 입력에 기초하여 사용자의 히어링 프로파일을 결정하는 단계 ― 상기 볼륨 설정들에서 톤들이 사용자에게 히어링가능함 ― 를 포함할 수 있다. 부가적으로, 방법의 실시예들은, 통신 디바이스가, 사용자의 히어링 프로파일에 기초하여 더 큰 볼륨으로 오디오 데이터를 출력하기 위해, 통신 디바이스에 의해 수신되는 오디오 데이터의 볼륨을 조정하는 단계를 포함할 수 있다.
일 실시예에서, 방법은, 통신 디바이스가 사용자의 히어링 프로파일을 다른 통신 디바이스에 전송하는 단계, 및 다른 통신 디바이스가 오디오 데이터를 통신 디바이스에 전송하기 전에, 사용자의 히어링 프로파일에 기초하여 그러한 오디오 데이터를 수정하는 단계를 포함할 수 있다. 일 실시예에서, 다른 디바이스는, 전송된 오디오 데이터가 사용자의 히어링불가한(unhearable) 오디오 스펙트럼(audio spectrum) 내의 오디오를 포함하지 않도록, 사용자의 히어링 프로파일이 표시하는, 사용자에게 히어링불가한 오디오 스펙트럼 내에 있는 오디오 데이터의 부분을 오디오 데이터로부터 생략함으로써, 오디오 데이터를 사용자에게 전송하기 전에 오디오 데이터를 수정할 수 있다. 다른 실시예들에서, 오디오 데이터는, 전송된 오디오 데이터 내의 모든 전송된 보이스 데이터가 사용자의 히어링가능한 오디오 스펙트럼 내에 있도록, 오디오 데이터의 볼륨을 증가시킴으로써 다른 통신 디바이스에 의해 수정될 수 있다.
특정 실시예들에서, 사용자의 보이스의 보이스 메트릭들은, 보이스에 대한 시간 도메인, 보이스에 대한 주파수 도메인, 보이스에 대한 보컬 도미넌트들, 및 사용자의 보이스의 보컬 범위에 기초하는 파라미터들로 구성된다. 통신 디바이스는 보이스 메트릭들, 시간 도메인, 주파수 도메인, 보컬 도미넌트들 중 적어도 하나에 기초하여 보이스 데이터를 수정할 수 있다. 사용자의 보이스의 보컬 범위는, 통신 디바이스가 사용자의 보이스의 주파수 도메인의 외부에 있는 주파수 범위 내에 있는 수신된 보이스 데이터의 부분을 제거한 것으로 구성될 수 있다. 통신 디바이스가 사용자의 보이스의 보이스 메트릭들, 시간 도메인, 주파수 도메인, 보컬 도미넌트들, 및 보컬 범위 중 적어도 하나에 기초하여 보이스 데이터를 수정하는 단계는 또한, 통신 디바이스가 사용자의 보이스의 보이스 메트릭들, 시간 도메인, 주파수 도메인, 보컬 도미넌트들, 및 보컬 범위 중 적어도 하나에 기초하는 파라미터를, 수신된 보이스 데이터의 잡음 소거 프로세싱(noise cancellation processing)에 적용하는 단계로 구성될 수 있다.
통신 디바이스는 다수의 유형들의 디바이스들 중 임의의 디바이스일 수 있다. 예를 들어, 통신 디바이스는 서버(server), 워크스테이션(workstation), 데스크톱 컴퓨터(desktop computer), 태블릿(tablet), 모바일 셀룰러폰(mobile cellular phone), 인터넷 기기(internet appliance), 랩톱 컴퓨터(laptop computer), 스마트폰(smart phone), PDA(personal digital assistant), 모바일 컴퓨터 디바이스(mobile computer device), 또는 통신 단말(communication terminal)일 수 있다. 몇몇 실시예들에서, 통신 디바이스는 또한, 그러한 수신된 보이스 데이터가 사용자로부터 비롯되었다는 것을 결정하도록 구성될 수 있다.
통신 시스템들이 또한 제공된다. 통신 시스템의 몇몇 실시예들은 상기 논의된 방법들의 실시예를 이용하도록 구성된 통신 시스템을 포함할 수 있으며, 이는 아래에서 추가로 논의된다.
비-일시적 컴퓨터 판독가능 매체(non-transitory computer readable medium)가 또한 제공된다. 비-일시적 컴퓨터 판독가능 매체는, 애플리케이션(application)이 통신 디바이스에 의해 실행될 때, 통신 디바이스에 의해 수행되는 방법을 규정하는, 상기 비-일시적 컴퓨터 판독가능 매체 상에 저장된 애플리케이션을 갖는다. 방법은, 방법의 상기 열거된 실시예들 중 임의의 실시예를 포함할 수 있고, 이는 아래에서 추가로 논의된다. 예를 들어, 방법의 실시예는, 통신 디바이스가, 사용자의 보이스의 시간 도메인, 주파수 도메인, 보컬 도미넌트들, 및 보컬 범위 중 적어도 하나를 식별하기 위해, 사용자의 보이스의 샘플을 획득하기 위해 사용자에게 스피킹하도록 프롬프트하는 단계, 통신 디바이스가 사용자의 보이스의 샘플에 기초하여 사용자의 보이스에 대한 보이스 메트릭들을 결정하는 단계, 통신 디바이스가 사용자의 보이스의 보이스 메트릭들을 저장하고 그러한 세이브(save)된 보이스 메트릭들을 사용자와 연관시키는 단계, 통신 디바이스가 사용자로부터 보이스 데이터를 수신하는 단계, 통신 디바이스가 사용자의 보이스의 시간 도메인, 주파수 도메인, 보컬 도미넌트들, 및 보컬 범위 중 적어도 하나에 기초하여, 수신된 보이스 데이터를 수정하는 단계, 및 통신 디바이스가, 수정된 보이스 데이터를 다른 디바이스에 전송하는 단계를 포함할 수 있다.
컴퓨터 판독가능 매체의 애플리케이션에 의해 규정된 방법의 몇몇 실시예들은 또한, 사용자가 톤들을 히어링하도록, 통신 디바이스가 사용자에게 방출하기 위해 톤들을 발생하는 단계, 통신 디바이스가 볼륨 설정들을 식별하는 입력을 수신하는 단계 ― 상기 볼륨 설정들에서 톤들이 사용자에게 히어링가능함 ―, 및 통신 디바이스가 볼륨 설정들을 식별하였던 수신된 입력에 기초하여, 사용자의 히어링 프로파일을 결정하는 단계 ― 상기 볼륨 설정들에서 톤들이 사용자에게 히어링가능함 ― 를 포함할 수 있다. 통신 디바이스는 또한, 사용자의 히어링 프로파일에 기초하여 더 큰 볼륨으로 오디오 데이터를 출력하기 위해, 통신 디바이스에 의해 수신되는 오디오 데이터의 볼륨을 조정할 수 있다. 통신 디바이스는 사용자의 히어링 프로파일을 다른 통신 디바이스에 전송할 수 있고, 다른 통신 디바이스는, 사용자의 히어링 프로파일에 기초하여 오디오 데이터를 통신 디바이스에 전송하기 전에, 사용자의 히어링 프로파일에 기초하여 그러한 오디오 데이터를 수정할 수 있다. 일 실시예에서, 다른 디바이스는, 전송된 오디오 데이터가 사용자의 히어링불가한 오디오 스펙트럼 내의 오디오를 포함하지 않도록, 사용자의 히어링 프로파일이 표시하는, 사용자에게 히어링불가한 오디오 스펙트럼 내에 있는 오디오 데이터의 부분을 오디오 데이터로부터 생략함으로써, 오디오 데이터를 사용자에게 전송하기 전에 오디오 데이터를 수정할 수 있다. 다른 실시예들에서, 오디오 데이터는, 전송된 오디오 데이터 내의 모든 전송된 보이스 데이터가 사용자의 히어링가능한 오디오 스펙트럼 내에 있도록, 오디오 데이터의 볼륨을 증가시킴으로써 다른 통신 디바이스에 의해 수정될 수 있다.
애플리케이션에 의해 규정된 방법의 특정 실시예들에서, 통신 디바이스가, 사용자의 보이스의 시간 도메인, 주파수 도메인, 보컬 도미넌트들, 및 보컬 범위 중 적어도 하나에 기초하여 보이스 데이터를 수정하는 단계는 다수의 단계들을 포함할 수 있다. 예를 들어, 이러한 수정은, 통신 디바이스가 사용자의 보이스의 주파수 도메인의 외부에 있는 주파수 범위 내에 있는 수신된 보이스 데이터의 부분을 제거하는 단계, 및 통신 디바이스가 사용자의 보이스의 시간 도메인, 주파수 도메인, 보컬 도미넌트들, 및 보컬 범위 중 적어도 하나에 기초하는 파라미터를, 수신된 보이스 데이터의 잡음 소거 프로세싱에 적용하는 단계로 구성될 수 있다.
본 발명의 다른 세부사항들, 목적들, 및 이점들은, 본 발명의 특정한 현재 바람직한 실시예들 및 이를 실시하는 특정한 현재 바람직한 방법들의 다음의 설명이 진행됨에 따라 명백해질 것이다.
다수의 통신 디바이스들 사이에 통신들을 제공하기 위한 현재의 바람직한 디바이스들, 시스템들, 및 장치들이 첨부 도면들에서 도시되고, 이를 실시하는 특정한 현재의 바람직한 방법들이 또한 첨부 도면들에서 예시된다. 도면들에서 이용된 동일한 참조 번호들은 동일한 컴포넌트들을 식별할 수 있다는 것이 이해되어야 한다.
도 1은, 예를 들어, 서버, 컴퓨터 디바이스, 워크스테이션, 태블릿, 랩톱 컴퓨터, 전화 디바이스(telephony device), 인터넷 기기, PDA(personal digital assistant), 스마트폰, 셀룰러폰, 전화기(telephone), 또는 다른 유형의 통신 단말일 수 있는 통신 디바이스의 예시적인 실시예의 블록도이다. 하나보다 많은 수의 마이크로폰(microphone) 및 하나보다 많은 수의 스피커(speaker)가, 통신 디바이스의 실시예들 내에 포함될 수 있다는 것이 이해되어야 한다(예를 들어, 통신 디바이스의 몇몇 실시예들은, 하나의 이어 스피커(ear speaker) 및 라우드 스피커(loud speaker)를 포함할 수 있고, 2개의 마이크로폰들 ― 주변 오디오 검출(audio detection)을 위한 하나의 마이크로폰 및 주변 잡음 소거(surrounding noise cancellation)를 위한 하나의 마이크로폰 ― 을 포함할 수 있음).
도 2는 보이스 데이터 또는 오디오 데이터를 전송하기 위한 예시적인 방법의 흐름도이다.
도 3은 보이스 데이터 또는 오디오 데이터를 출력하기 위한 예시적인 방법의 흐름도이다.
도 4는 통신 시스템의 예시적인 실시예의 블록도이다.
도 1 내지 도 4를 참조하면, 통신 디바이스는 컴퓨터 디바이스, 이를 테면, 서버 또는 워크스테이션 또는 단말 디바이스, 이를 테면, 데스크톱 컴퓨터, 태블릿, 모바일 셀룰러폰, 인터넷 기기, 랩톱 컴퓨터, 스마트폰, PDA(personal digital assistant), 모바일 컴퓨터 디바이스, 또는 통신 단말일 수 있다. 시스템의 일 실시예에서, 네트워크(24)는, 컴퓨터 디바이스(25)를 통해 확립 및 유지되는 통신 경로를 통해 통신가능하게 연결되는 제 1 및 제 2 통신 단말들(21, 22)을 포함할 수 있다. 네트워크(network)(24)는, 시스템의 몇몇 실시예들에서의 엔터프라이즈 네트워크(enterprise network)와 같은 로컬 영역 네트워크(local area network) 또는 광역 네트워크(wide area network)일 수 있다.
도 4에 도시된 시스템의 제 1 및 제 2 통신 단말들(21 및 22)은 각각 도 1에 도시된 통신 디바이스의 실시예일 수 있다. 대안적으로, 도 4에 도시된 컴퓨터 디바이스(25)는 텔레포니형 통신 디바이스(telephony type communication device) 또는 미디어 통신 디바이스(media communication device), 이를 테면, 스위치 디바이스(switch device), 미디어 서버(media server), 또는 원격회의 서버(teleconference server)로서 기능할 수 있고, 이는 도 1에 도시된 통신 디바이스의 실시예일 수 있다.
통신 디바이스는, 수신기 유닛(receiver unit)(3a) 및 송신기 유닛(transmitter unit)(3b)을 포함하는 트랜시버 유닛(transceiver unit)(3), 디스플레이 유닛(display unit)(2), 적어도 하나의 입력 디바이스(input device), 이를 테면, 마이크로폰(microphone)(6) 및 카메라 센서(camera sensor)(8), 메모리(memory)(5), 및 스피커(4)에 통신가능하게 연결되는 프로세서 유닛(processor unit)(1)을 포함할 수 있다. 트랜시버 유닛(3)은 셀룰러 네트워크(cellular network), 무선 네트워크 연결(wireless network connection), 또는 다른 네트워크 연결을 통해 데이터를 송신 및 수신하기 위한 수신기 유닛(3a) 및 송신기 유닛(3b)을 포함할 수 있거나, 또는 니어 필드 통신(near field communication), 블루투스 순응 통신(Bluetooth compliant communication), 또는 다른 유형의 무선 통신 메커니즘(wireless communication mechanism)을 통해 무선 연결을 형성하도록 또는 예를 들어, 범용 시리얼 버스 연결(universal serial bus connection)을 통해 이루어진 유선 연결과 같은 유선 연결을 허용하도록 구성될 수 있다. 몇몇 실시예들에서, 통신 디바이스는 부가적인 트랜시버 유닛들을 또한 포함할 수 있다.
프로세서 유닛(1)은 중앙 프로세싱 유닛(central processing unit), 이를 테면, 마이크로프로세서(microprocessor), 상호연결된 마이크로프로세서들, 또는 다른 하드웨어 프로세서 엘리먼트(hardware processor element)일 수 있다. 메모리(5)는, 예를 들어, 도 2 또는 도 3에 도시된 방법과 같은, 통신 디바이스에 의해 수행되는 방법을 규정하는, 비-일시적 컴퓨터 판독가능 매체 상에 저장된 적어도 하나의 애플리케이션(7)을 갖는 비-일시적 컴퓨터 판독가능 매체일 수 있다. 메모리(5)는 하드 드라이브(hard drive), 플래시 드라이브(flash drive), 광학 디스크(optical disk) 또는 하드 디스크(hard disk) 또는 비-일시적 시간 기간 동안 데이터를 저장할 수 있는 다른 유형의 컴퓨터 판독가능 매체를 포함할 수 있다. 데이터셋(dataset)들, 이를 테면, 보이스 데이터베이스(voice database)(12) 및 히어링 데이터베이스(hearing database)(13)뿐만 아니라, 애플리케이션(7)이 실행될 때 통신 디바이스에 의해 이용될 수 있는 다른 데이터가 또한 메모리(5)에 저장될 수 있다.
스피커(4)는 오디오를 방출하는 다수의 스피커들을 포함할 수 있고, 마이크로폰(6)은 오디오 데이터를 수신하기 위한, 사용자에 의해 방출되는 오디오를 기록하는 입력 디바이스일 수 있다. 예를 들어, 마이크로폰(6)은 주변 잡음을 검출하는 제 1 마이크로폰 및 주변 잡음의 소거를 위해 이용되는 제 2 마이크로폰을 포함할 수 있고, 스피커(4)는 하나의 사람 이어(ear)에 잡음을 방출하기 위한 제 1 스피커 및 라우드 스피커인 제 2 스피커를 포함할 수 있다. 디스플레이 유닛(2)은 액정 디스플레이(liquid crystal display) 또는 다른 디스플레이 디바이스일 수 있다. 디스플레이 유닛(2)은, 디스플레이의 상이한 부분들을 터치(touch)함으로써 사용자가 입력을 제공하도록 또한 허용하면서 데이터를 시각적으로 출력하도록 기능하는 터치 스크린 디스플레이(touch screen display)와 같은 입력 디바이스 및 출력 디바이스로서 구성될 수 있다. 다른 유형들의 입력 디바이스들, 이를 테면, 버튼(button), 키보드(keyboard), 블루투스 헤드셋(Bluetooth headset), 또는 블루투스 이어-셋(Bluetooth ear-set), 또는 마우스(mouse)가 또한 프로세서 유닛(1)에 연결가능할 수 있어서, 사용자는 입력을 디바이스에 제공하기 위해 그러한 입력 디바이스를 이용할 수 있다.
통신 디바이스는 프로세서 유닛(1)을 통해 애플리케이션(7)을 실행시킬 수 있다. 애플리케이션(7)은, 애플리케이션이 실행될 때 통신 디바이스에 의해 실행되는 방법을 규정할 수 있다. 이러한 방법의 예들은 도 2 및 도 3으로부터 이해될 수 있다. 예를 들어, 통신 디바이스는 수신된 오디오를 전송 또는 출력하는데 있어서의 이용을 위해 히어링 데이터베이스에 저장하기 위한 히어링 프로파일을 생성하도록 애플리케이션을 실행시킬 수 있거나, 또는 명료성(clarity)을 개선하도록, 수신된 보이스 데이터 내의 잡음을 감소시키도록, 또는 그렇지 않으면 전송된 보이스 데이터가 향상된 품질을 갖게 보이스 데이터를 향상시키도록, 수신된 보이스 데이터를 수정하기 위해, 그러한 보이스 데이터를 전송하기 전에, 마이크로폰(6)을 통해 수신된 보이스 데이터를 향상시키기 위해 이용될 수 있는 보이스 데이터베이스에서의 이용을 위해 보이스 프로파일을 발생시킬 수 있다.
예를 들어, 통신 디바이스는, 보이스 데이터베이스(12)에 세이브하기 위한 사용자 보이스 프로파일을 규정하기 위해 사용자의 보이스의 보이스 데이터가 수집(collect)될 수 있도록, 애플리케이션을 실행시키고, 마이크로폰(6)을 통해 보이스 입력을 엔터(enter)하도록 사용자에게 프롬프트할 수 있다. 사용자에 대한 특정 필터를 규정하는 보이스 프로파일이 준비되어 사용자 보이스 프로파일로서 보이스 데이터베이스(12)에 세이브될 수 있도록, 사용자의 스피킹된(spoken) 보이스가 기록될 수 있다. 대안적으로, 보이스 데이터베이스(12)는, 사용자가 스피커(speaker)로서 검출될 때 필터에 전송하기 위한 파라미터들을 세이브할 수 있어서, 그러한 사용자로부터의 기록된 임의의 보이스 데이터가, 그러한 사용자에 대해 보이스 데이터베이스(12)에서 규정된 보이스 파라미터들에 따라 필터에 의해 필터링된다.
통신 디바이스는, 사용자의 보이스의 샘플을 획득하기 위해, 상이한 볼륨들로 또는 상이한 속도들로 특정 보이스 데이터를 제공하도록 사용자에게 프롬프트하기 위해 디스플레이 유닛(2)을 통해 사용자에게 출력을 전송할 수 있다. 사용자의 보이스의 샘플링은, 사용자의 보이스의 상이한 보컬들 및 주파수들의 샘플링을 이용할 수 있다. 예를 들어, 출력을 사용자에게 프롬프트하는 것은, 상이한 옥타브(octave)들로(예를 들어, 낮은 보이스로 또는 높은 보이스로) 또는 상이한 속도들로(예를 들어, 천천히 또는 빨리) 특정 구절(phrase)을 스피킹하도록 사용자에게 요청하여, 그러한 조건(condition)들을 충족할 때 사용자에 의해 스피킹될 때의 특정 구절을 기록할 수 있다. 사용자는 또한, 보이스 분석을 위해 중요한 음소(significant phoneme)들을 갖는 사용자의 선호하는 언어로 특정 문장을 반복하도록 오디오를 통해 지시받을 수 있다. 기록된 보이스 데이터는 이후, 사용자의 스피킹된 보이스가 어떤 주파수들을 포함하지 않을 수 있는지 그리고 사용자의 보이스의 세기가 어떤 주파수들인지(예를 들어, 사용자가 스피킹할 때, 사용자의 보이스가 가장 자주 존재하는 주파수 범위들)를 결정하기 위해 평가(assess)된다.
사용자의 보이스가 평가된 후에, 통신 디바이스는, 사용자의 보이스가 특정 주파수들을 포함하지 않는다는 것을 결정할 수 있다. 그러므로, 사용자의 보이스 내에 존재하지 않는 주파수들의 범위는 필터에 의해 컷아웃(cut out)될 수 있어서, 통신 디바이스가 카메라 센서(8) 및 마이크로폰(6)을 통해 비디오(video)를 기록할 때 또는 사용자가 통신 디바이스를 이용한 폰콜(phone call)에 관여될 때 행해질 수 있는 바와 같이, 다른 디바이스로의 전송을 위해 사용자의 보이스를 기록할 때, 그러한 주파수들 내의 어떠한 사운드(sound)도 다른 디바이스로 전송되거나 또는 출력되지 않는다. 사용자의 보이스를 포함하지 않는 이러한 주파수 범위의 제거는, 사용자의 보이스의 기록 동안 존재할 수 있는 잡음을 제거할 수 있고, 기록된 보이스 데이터에 대해 ― 그러한 보이스 데이터를 세이브하거나 또는 그러한 보이스 데이터를 전송하기 전에 ― 수행될 수 있는 잡음 감소 또는 다른 보이스 데이터 클린업(cleanup)을 수행하기 위해 필요한 프로세싱을 감소시킬 수 있다.
부가적으로, 사용자의 보이스에 대해 강한 범위인 주파수 범위들(예를 들어, 사용자의 보이스가 거의 항상 존재하는 범위)이 사용자의 보이스의 샘플링으로부터 결정될 수 있다. 사용자의 보이스에 대한 세기일 것으로 결정되는 주파수 범위에서의 사용자의 보이스의 여과(filtration)가 식별될 수 있어서, 이러한 스펙트럼들이 더 미세한 세분성(finer granularity)으로 필터링될 수 있다.
일 실시예에서, 사용자에 대한 보이스 프로파일은, 디스플레이 유닛(2)을 통해 말하도록 사용자에게 프롬프트되는, 사용자가 스피킹하는 단어들 또는 구절들에 따라 기록되는, 기록된 보이스 샘플의 평가에 의해, 규정 및 분류(range)될 수 있다. 그 다음으로, 시간 도메인, 주파수 도메인, 및 사용자의 보컬들의 도미넌트들이, 기록된 보이스 샘플을 분석하는 통신 디바이스에 의해 평가될 수 있다. 그 다음으로, 사용자의 보이스의 평가된 파라미터들은, 보이스 채널(voice channel), 미디어 송신(media transmission), 폰콜, 또는 다른 보이스 데이터 송신(voice data transmission)을 통한 비디오 기록 또는 전송과 관련하여 세이브하기 위한 것인, 사용자로부터 수신된 임의의 보이스 데이터를 향상시키는 목적들을 위해 사용자의 보이스의 필터링을 규정하기 위해 보이스 데이터베이스(12) 내에 세이브될 수 있다. 전송될 보이스 데이터의 향상은, 통신 디바이스에 의해 수행될 수 있는 잡음 소거와 동시에 발생할 수 있다는 것이 이해되어야 한다. 잡음 소거 및 보이스 향상은, 잡음 소거 및 보이스 향상을 통해 수정되는 보이스 데이터의 패킷화(packetizing) 전에 발생할 수 있다. 그 다음으로, 패킷화된 수정된 보이스 데이터는 다른 디바이스에 전송될 수 있다.
통신 디바이스는 또한, 사용자에 대한 히어링 프로파일이 결정되어 히어링 데이터베이스(13)에 저장될 수 있도록, 적어도 하나의 스피커(4)를 통해 출력되는, 방출된 오디오에 응답하여, 통신 디바이스에 입력을 제공하도록 사용자에게 프롬프트할 수 있다. 그 다음으로, 히어링 데이터베이스(13)는, 수신된 오디오 데이터를 프로세싱하는데 이용될 수 있고, 다른 디바이스에 출력 또는 전송될 보이스 데이터를 프로세싱하는데 또한 이용될 수 있다. 예를 들어, 특정 사용자는, 사용자가 덜 감지가능한(sensible) 또는 어떠한 오디오도 히어링할 수 없는 ― 그러한 오디오가 그러한 주파수 스펙트럼 내에 속하는 경우 ― 주파수 스펙트럼을 가질 수 있다. 이러한 스펙트럼은 사용자의 히어링 프로파일에서 식별될 수 있고, 이후, 그러한 사용자에게 출력될 또는 그러한 사용자와 연관된 디바이스, 이를 테면, 사용자의 전화기 또는 셀룰러폰에 전송될 보이스 데이터를 수정하기 위해 이용될 수 있다.
예를 들어, 통신 디바이스는, 스피커(4)를 통해 상이한 소리세기(loudness) 레벨들로 방출되는 일련의 톤들에 응답하도록 사용자에게 프롬프트할 수 있다. 사용자에 의해 제공되는 입력은, 사용자가 상이한 방출 톤들을, 어떤 볼륨 또는 소리세기 레벨에서 히어링할 수 있는지를 표시할 수 있고, 하나의 이어 스피커(ear speaker)를 통해 개별적으로 각각의 이어(ear)에, 그리고 라우드 스피커를 통해 함께 이어들 양측 모두에, 상이한 소리세기 레벨들로 방출되는 동일한 일련의 톤들을 검출하도록 사용자에게 프롬프트할 수 있다. 그 다음으로, 사용자에 의해 제공된 입력은, 사용자의 각각의 이어에 대해서뿐만 아니라 사용자의 이어들 양측 모두에 대해 히어링 임계치들을 결정하기 위해 통신 디바이스에 의해 이용될 수 있다. 그 다음으로, 사용자의 히어링 프로파일은 사용자와 링크되어, 다수의 방식들로 이용될 수 있다. 부가적으로, 형성된 히어링 프로파일은 또한 통신 디바이스에 오디오 데이터를 송신할 수 있는 다른 디바이스들 또는 사용자와 연관된 다른 디바이스에 전송될 수 있어서, 사용자의 히어링 프로파일은, 그러한 사용자에 대한 그러한 데이터의 명료성을 향상시키기 위해, 사용자에게 전송될 보이스 데이터를 수정하기 위해 이용될 수 있다.
예를 들어, 히어링 프로파일은, 히어링 데이터베이스(13) 내에 존재함으로써, 통신 디바이스의 메모리(5)에 저장될 수 있다. 그 다음으로, 통신 디바이스는 수신된 보이스 데이터의 소리세기를 조정할 수 있어서, 사용자가 히어링할 수 있는 주파수 내에 있지 않은 보이스 데이터 또는 다른 오디오 데이터가 수정되어서, 출력되는 보이스 데이터가 사용자에 의해 히어링가능하다. 히어링 프로파일은, 예를 들어, 이러한 조정을 제공하기 위해 오디오 경로(audio path)를 통해 실시간 전송 프로토콜("RTP"; real-time transport protocol) 디코더(decoder) 또는 다른 오디오 이퀄라이저(audio equalizer)에 적용될 수 있다. 그러므로, 사용자 자신의 통신 디바이스 내의 히어링 프로파일은, 수신된 데이터가 방출될 볼륨 설정(volume setting)을 조정할 수 있어서, 사용자에 대한 그러한 데이터의 명료성을 개선한다.
다른 예로서, 히어링 프로파일은 다른 통신 디바이스에 전송될 수 있어서, 사용자의 통신 디바이스에 전송되는 오디오 데이터는, 사용자의 히어링 프로파일을 통해 사용자의 특정 히어링 능력들을 고려하여, 그러한 데이터를 사용자에게 전송하는 디바이스에 의해 수정될 수 있다. 예를 들어, 사용자의 히어링 프로파일을 수신하는 전송 통신 디바이스(transmitting communication device)는, 사용자의 히어링 프로파일에 기초하여, 사용자와 연관된 통신 디바이스에 전송될 보이스 데이터에 대한 그의 잡음 감소를 향상시킬 수 있다. 전송될 보이스 데이터는, 사용자에게 전송되는 데이터의 명료성을 개선하기 위해, 보이스 데이터가 사용자의 히어링 프로파일의 스펙트럼 내에 있도록 수정될 수 있다. 전송 디바이스(transmitting device)는 또한, 또는 대안적으로, 사용자가 전혀 감지력(sensibility)을 갖지 않는 스펙트럼 내의 오디오 또는 그러한 스펙트럼 내의 거의 들리지 않는(near deaf) 오디오를 회피, 삭제, 또는 그렇지 않으면 무효화(nullify)하도록 사용자의 통신 디바이스에 전송될 오디오 데이터를 수정할 수 있어서, 오디오 데이터의 그러한 부분의 송신 및 수신과 연관된 대역폭 및 프로세싱 파워(processing power)가 세이브될 수 있다.
사용자의 통신 디바이스는 사용자의 히어링 프로파일 또는 통신 디바이스의 히어링 데이터베이스(13)를 전송 디바이스(transmitting device)에 전송할 수 있어서, 이는 오디오 데이터의 미래의 콜(call)들 또는 다른 송신들을 위해 그러한 다른 디바이스에 의해 세이브될 수 있다. 다른 디바이스는 사용자의 히어링 프로파일을, 사용자의 통신 디바이스의 어드레스(address), 이를 테면, 그러한 디바이스의 전화 번호 또는 인터넷 프로토콜 어드레스와 연관시킬 수 있어서, 그러한 어드레스를 이용하는 임의의 통신은, 사용자의 통신 디바이스에 전송될 보이스 데이터 또는 다른 오디오 데이터를 수정하도록 사용자의 히어링 프로파일의 이용을 초래할 수 있다. 전송 디바이스(transmitting device)는, 사용자와 연관된 전화 번호와 같은 디바이스 어드레스의 연관성 및 그러한 어드레스를 갖는 디바이스와 확립되는 콜(call)에 또한 기초하여, 미래의 통신 세션(communication session)들에서의 이용을 위해 그러한 프로파일을 세이브할 수 있다. 사용자의 히어링 프로파일은 또한, 보이스 메일박스(voice mailbox) 또는 이메일 어드레스(email address)와 같이, 사용자가 연관되는 다른 디바이스들과 연관될 수 있어서, 이들 다른 디바이스들 또는 어드레스들에 전송되는 오디오 데이터는, 정보가 어드레싱되는 사용자에 대한 오디오 데이터의 명료성을 개선하기 위해 수정된다.
통신 디바이스의 몇몇 실시예들에서, 사용자는, 그러한 통신 세션에 관여되는 다른 디바이스로의 메시지의 전송을 작동(actuate)하기 위해, 콜 또는 다른 통신 세션 동안 입력을 엔터할 수 있다. 엔터되는 그러한 입력은, 사용자가, 특정 세션 동안 또는 임의의 미래의 콜 또는 미래의 통신 세션 동안 그러한 사용자와 연관된 히어링 프로파일이 적용되길 원하지 않는다는 것을 콜 파트너(call partner)에게 표시할 수 있다. 이러한 입력은, 진행중인 콜(ongoing call) 또는 다른 통신 세션 동안 이러한 디바이스에 전송될 다른 디바이스에 의해 히어링 프로파일의 이용을 비활성화하는 메시지를 작동시킬 수 있거나 또는 전송될 수 있다. 이러한 메시지는 대안적으로, 특정 통신 세션 전에 또는 후에 전송될 수 있다. 이러한 메시지는, 예를 들어, 사용자가 새로운 히어링 프로파일 또는 보이스 프로파일을 생성할 때 전송될 수 있다. 이러한 메시지는, 후속 통신 세션들에서의 이용을 위해 다른 디바이스에 의한 세이빙을 위해 대체 히어링 프로파일 또는 보이스 프로파일과 함께 전송될 수 있다.
그러한 데이터가 사용자에게 출력될 때, 특정 사용자에 대한 그러한 데이터의 명료성을 개선하기 위해 보이스 데이터 또는 다른 오디오 데이터의 수정이, 그러한 데이터를, 그러한 사용자가 더욱 감지가능한(sensible) 스펙트럼의 부분에 위치시키기 위해, 오디오 데이터를 스큐잉(skewing)하는 것을 초래할 수 있다는 것이 이해되어야 한다. 이러한 스큐잉은, 스피커의 보이스 특징이 변경되는 것을 초래할 수 있다. 그러나, 이는 또한, 사용자에 대한 통신의 명료성을 개선하는 것을 초래할 수 있어서, 텔레폰 콜(telephone call) 또는 컨퍼런스 콜(conference call)과 같은 통신 세션 동안 더 많은 데이터가 실제로 사용자에게 히어링되고 사용자에게 이해된다.
제 1 통신 단말(21) 및 제 2 통신 단말(22)은 2개의 디바이스들 사이의 텔레폰 콜 동안의 이용을 위해 보이스 데이터베이스 및 히어링 데이터베이스를 각각 가질 수 있다는 것이 이해되어야 한다. 각각의 통신 단말은 그러한 단말의 마이크로폰으로 스피킹하는 사용자의 보이스 데이터를 수정할 수 있어서, 전송된 보이스 데이터가, 수신 단말의 사용자에 대한 그의 명료성을 개선하기 위해, 수정된다. 하나의 고려되는 대체 실시예에서, 통신 세션 동안 2개의 단말들의 통신 경로 내에 있는 컴퓨터 디바이스(25)와 같은 스위치 디바이스는 히어링 및 보이스 데이터베이스들을 가질 수 있고, 그러한 오디오 데이터를 수신 파티(receiving party)에 전송하는 스피커의 보이스 프로파일 및 오디오 데이터의 출력을 수신하는 사용자의 히어링 프로파일에 기초하여 특정 사용자에게 전송될 오디오 데이터를 수정할 수 있다.
통신 디바이스의 몇몇 실시예들에서, 하나보다 많은 수의 사용자가 그러한 디바이스를 이용할 수 있다. 상이한 사용자들이 상이한 히어링 프로파일들 및 상이한 보이스 프로파일들을 생성할 수 있다. 예를 들어, 각각의 사용자는 상기 논의된 바와 같이 생성, 세이브, 및 전송되는 히어링 프로파일 및 보이스 프로파일을 갖는 통신 디바이스를 이용할 수 있다. 사용자들의 형성된 프로파일들은 동일한 디바이스의 메모리에 세이브되고, 상이한 사용자들을 구별하기 위해 사용자 식별과 링크될 수 있다. 그 다음으로, 각각의 사용자는 다수의 방식들 중 임의의 방식으로 자신들을 식별할 수 있다. 예를 들어, 각각의 사용자는, 그러한 사용자를, 디바이스를 현재 이용하고 있는 사용자로서 식별하는 고유 로그-온 식별(log-on identification) 또는 코드(code)를 엔터할 수 있다. 로그-온 식별은, 사용자의 참조 번호(reference number) 또는 식별 코드(identification code)를 엔터하기 위해, 개인 식별 번호를 엔터하는 것 또는 미리 규정된 터치들의 시퀀스(sequence)로 통신 디바이스의 터치 스크린 디스플레이의 특정 부분들을 누르는 것을 포함할 수 있다. 이러한 엔터된 사용자 식별의 검출시, 통신 디바이스는 식별된 사용자에 대한 보이스 및 히어링 데이터베이스들 내의 프로파일들을 이용할 수 있다. 다른 옵션으로서, 사용자는 사용자 특정 프로파일(user specific profile)들을 선택하기 위해 입력 디바이스를 통해 입력을 엔터함으로써, 사용자에 대한 특정 프로파일을 선택할 수 있다. 몇몇 실시예들에서, 통신 디바이스는 디폴트(default)로, 사용자의 히어링 및 보이스 프로파일들을, 엔터된 식별을 통해 식별된 사용자와 연관시킬 수 있다. 그 다음으로, 사용자는 이러한 설정을 비활성화하기 위해 또는 설정들을 변경하기 위해 입력을 제공할 수 있다.
통신 디바이스, 통신 시스템, 및 이를 이루고 이용하는 방법들의 특정한 현재 바람직한 실시예들이 도시되고 상술되었지만, 본 발명이 이에 제한되지 않고, 다음의 청구항들의 범주 내에서 다른 방식으로 다양하게 구현 및 실시될 수 있다는 것이 명백하게 이해될 것이다.

Claims (19)

  1. 보이스 데이터(voice data)를 전송하는 방법으로서,
    통신 디바이스(communication device)(21)가, 사용자의 보이스의 시간 도메인(time domain), 주파수 도메인(frequency domain), 보컬 도미넌트(vocal dominant)들, 상이한 옥타브들, 상이한 속도들, 상이한 볼륨들 및 보컬 범위(vocal range) 중 적어도 하나를 식별하기 위해, 상기 사용자의 보이스의 샘플(sample)을 획득하기 위해 사용자에게 스피킹(speak)하도록 프롬프트(prompt)하는 단계;
    상기 통신 디바이스(21)가 상기 사용자의 보이스의 샘플에 기초하여 상기 사용자의 보이스에 대한 보이스 메트릭(voice metric)들을 결정하는 단계;
    상기 통신 디바이스(21)가 상기 사용자의 보이스의 보이스 메트릭들을 저장하는 단계;
    상기 통신 디바이스(21)가 상기 사용자로부터 보이스 데이터를 수신하는 단계;
    상기 통신 디바이스(21)가 상기 사용자의 보이스의 상기 보이스 메트릭들, 상기 시간 도메인, 상기 주파수 도메인, 상기 보컬 도미넌트들, 상이한 옥타브들, 상이한 속도들, 상이한 볼륨들 및 상기 보컬 범위 중 적어도 하나에 기초하여, 상기 수신된 보이스 데이터를 수정(modify)하는 단계;
    상기 수정된 보이스 데이터가 적어도 하나의 수신자(recipient)에게 출력가능하도록, 상기 통신 디바이스(21)가 상기 수정된 보이스 데이터를 다른 디바이스에 전송하는 단계;
    사용자가 톤(tone)들을 히어링(hear)하도록, 상기 통신 디바이스(21)가 상기 사용자에게 방출하기 위해 상기 톤들을 발생시키는 단계;
    상기 통신 디바이스(21)가 볼륨 설정(volume setting)들을 식별하는 입력을 수신하는 단계 ― 상기 볼륨 설정들에서 상기 톤들이 상기 사용자에게 히어링가능함 ―;
    상기 통신 디바이스(21)가 상기 볼륨 설정들을 식별하였던 상기 수신된 입력에 기초하여, 상기 사용자의 히어링 프로파일(hearing profile)을 결정하는 단계 ― 상기 볼륨 설정들에서 상기 톤들이 상기 사용자에게 히어링가능함 ―;
    상기 사용자의 히어링 프로파일이 오디오 데이터(audio data)의 미래의 콜(call) 또는 다른 전송들을 위한 다른 통신 디바이스(22)에 의해 세이브(save)될 수 있도록, 상기 통신 디바이스(21)가 상기 사용자의 히어링 프로파일을 상기 다른 통신 디바이스(22)로 전송하는 단계;
    상기 다른 통신 디바이스(22)가 상기 오디오 데이터를 상기 통신 디바이스(21)에 전송하기 전에 상기 사용자의 히어링 프로파일에 기초하여 오디오 데이터를 수정하는 단계 ― 그 결과, 상기 통신 디바이스(21)에 전송된 오디오 데이터는 상기 사용자의 히어링 프로파일을 통해 상기 사용자의 특정 히어링 능력을 고려하여 상기 데이터를 상기 사용자에게 전송하는 상기 다른 통신 디바이스(22)에 의해 수정됨 ―
    를 포함하는,
    보이스 데이터를 전송하는 방법.
  2. 제 1 항에 있어서,
    상기 사용자가, 통신 세션에 관여되는 상기 다른 통신 디바이스(22)로의 메시지의 전송을 작동시키기(actuate) 위해, 콜 또는 다른 통신 세션 전, 동안 또는 후에 입력(input)을 입력하는(enter) 단계
    를 더 포함하고, 상기 입력된 입력은 상기 다른 통신 디바이스(22)에 의해 히어링 프로파일의 사용을 비활성화하는 메시지를 작동시키는,
    보이스 데이터를 전송하는 방법.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 다른 통신 디바이스(22)가, 상기 전송된 오디오 데이터 내의 모든 전송된 보이스 데이터가 상기 사용자의 히어링가능한 오디오 스펙트럼 내에 있도록, 상기 오디오 데이터의 볼륨을 증가시킴으로써 상기 오디오 데이터를 수정하는 단계
    를 더 포함하는,
    보이스 데이터를 전송하는 방법.
  4. 제 1 항 또는 제 2 항에 있어서,
    상기 통신 디바이스가, 하나의 이어 스피커(ear speaker)를 통해 개별적으로 각각의 귀에, 그리고 또한 라우드 스피커(loud speaker)를 통해 양쪽 귀 모두에, 상이한 소리세기 레벨들로 방출되는 동일한 일련의 톤들을 검출하도록 상기 사용자에게 프롬프트하는 단계
    를 더 포함하고, 그 다음에, 상기 사용자에 의해 제공된 상기 입력이, 상기 사용자의 각각의 귀에 대해서뿐만 아니라 사용자의 양쪽 귀 모두에 대해서 히어링 임계치들을 결정하기 위해 상기 통신 디바이스(21)에 의해 이용되는,
    보이스 데이터를 전송하는 방법.
  5. 제 1 항 또는 제 2 항에 있어서,
    상기 사용자의 보이스의 보이스 메트릭들은, 상기 보이스에 대한 시간 도메인, 상기 보이스에 대한 주파수 도메인, 상기 보이스에 대한 보컬 도미넌트들, 상이한 옥타브들, 상이한 속도들, 상이한 볼륨들 및 상기 사용자의 보이스의 보컬 범위에 기초하는 파라미터(parameter)들로 구성되고,
    상기 다른 통신 디바이스(22)가 상기 오디오 데이터를 상기 통신 디바이스(21)에 전송하기 전에 상기 사용자의 히어링 프로파일에 기초하여 상기 오디오 데이터를 수정하는 단계는, 상기 사용자의 히어링 프로파일을 통해 사용자에게 히어링불가한(unhearable) 것으로 식별된 오디오 스펙트럼(audio spectrum) 내에 있는 오디오 데이터의 부분을 생략하는 단계를 포함하고, 그 결과 상기 전송된 오디오 데이터가 상기 오디오 데이터의 상기 부분을 포함하지 않아 상기 오디오 데이터의 상기 부분의 전송 및 수신에 연관된 대역폭 및 프로세싱 파워(processing power)가 세이브되는,
    보이스 데이터를 전송하는 방법.
  6. 제 1 항 또는 제 2 항에 있어서,
    상기 통신 디바이스(21)가 상기 사용자의 보이스의 상기 보이스 메트릭들, 상기 시간 도메인, 상기 주파수 도메인, 상기 보컬 도미넌트들, 상이한 옥타브들, 상이한 속도들, 상이한 볼륨들 및 상기 보컬 범위 중 적어도 하나에 기초하여 상기 보이스 데이터를 수정하는 단계는, 상기 통신 디바이스(21)가 상기 사용자의 보이스의 주파수 도메인의 외부에 있는 주파수 범위 내에 있는 상기 수신된 보이스 데이터의 부분을 제거하는 단계로 구성되고,
    상기 주파수 범위의 제거는 상기 사용자 보이스의 기록 동안 존재하는 잡음을 제거하고, 상기 보이스 데이터를 세이브하거나 또는 상기 보이스 데이터를 전송하기 전에 기록된 보이스 데이터에 대해 수행되는 잡음 감소 또는 다른 보이스 데이터 클린업(cleanup)을 수행하기 위해 필요한 프로세싱을 감소시키는,
    보이스 데이터를 전송하는 방법.
  7. 제 1 항 또는 제 2 항에 있어서,
    상기 사용자의 히어링 프로파일은 상기 사용자와 링크되고, 적어도 상기 통신 디바이스(21)에 오디오 데이터를 전송할 수 있거나 상기 사용자에 연관된 상기 다른 통신 디바이스(22)에 송신되어, 그 결과 상기 사용자의 히어링 프로파일은 상기 사용자에 대한 상기 데이터의 명료성을 향상시키도록 상기 사용자에게 송신될 보이스 데이터를 수정하기 위해 이용되는,
    보이스 데이터를 전송하는 방법.
  8. 제 1 항 또는 제 2 항에 있어서,
    상기 통신 디바이스(21)는 서버(server), 워크스테이션(workstation), 데스크톱 컴퓨터(desktop computer), 태블릿(tablet), 모바일 셀룰러폰(mobile cellular phone), 인터넷 기기(internet appliance), 랩톱 컴퓨터(laptop computer), 스마트폰(smart phone), PDA(personal digital assistant), 모바일 컴퓨터 디바이스(mobile computer device), 또는 통신 단말(communication terminal) 중 하나이고,
    상기 방법은,
    상기 통신 디바이스(21)가 상기 수신된 보이스 데이터가 상기 사용자로부터 비롯되었다는 것을 결정하는 단계
    를 더 포함하는,
    보이스 데이터를 전송하는 방법.
  9. 제 1 항 또는 제 2 항에 있어서,
    상기 사용자의 히어링 프로파일은,
    상기 다른 통신 디바이스(22)에 의해, 상기 사용자의 통신 디바이스(21)의 어드레스에 연관되어, 상기 어드레스를 이용하는 임의의 통신이 상기 사용자의 통신 디바이스(21)에 전송될 보이스 데이터 또는 다른 오디오 데이터를 수정하도록 상기 사용자의 히어링 프로파일의 사용을 초래할 수 있거나,
    상기 다른 통신 디바이스(22)에 의해, 디바이스 어드레스의 연관성 및 상기 어드레스를 갖는 디바이스와 확립되는 콜에 기초하여, 미래의 통신 세션들에서의 사용을 위해 세이브되거나, 또는
    상기 사용자가 연관되는 적어도 상기 다른 디바이스들(22)과 연관되어, 상기 다른 디바이스들 또는 어드레스들에 전송되는 상기 오디오 데이터가 정보가 어드레싱되는 상기 사용자에 대한 상기 오디오 데이터의 명료성을 개선하기 위해 수정되는,
    보이스 데이터를 전송하는 방법.
  10. 저장된 애플리케이션(application)(7)을 갖는 컴퓨터 판독가능 저장 매체(computer readable storage medium)로서,
    상기 애플리케이션(7)은 상기 애플리케이션(7)이 통신 디바이스(21)에 의해 실행될 때, 상기 통신 디바이스(21)에 의해 수행되는 방법을 규정하고,
    상기 방법은,
    상기 통신 디바이스(21)가, 사용자의 보이스의 시간 도메인, 주파수 도메인, 보컬 도미넌트들, 상이한 옥타브들, 상이한 속도들, 상이한 볼륨들 및 보컬 범위 중 적어도 하나를 식별하기 위해, 상기 사용자의 보이스의 샘플을 획득하기 위해 사용자에게 스피킹하도록 프롬프트하는 단계;
    상기 통신 디바이스(21)가 상기 사용자의 보이스의 샘플에 기초하여 상기 사용자의 보이스에 대한 보이스 메트릭들을 결정하는 단계;
    상기 통신 디바이스(21)가 상기 사용자의 보이스의 보이스 메트릭들을 저장하고, 세이브된 보이스 메트릭들을 상기 사용자와 연관시키는 단계;
    상기 통신 디바이스(21)가 상기 사용자로부터 보이스 데이터를 수신하는 단계;
    상기 통신 디바이스(21)가 상기 사용자의 보이스의 상기 시간 도메인, 상기 주파수 도메인, 상기 보컬 도미넌트들, 상이한 옥타브들, 상이한 속도들, 상이한 볼륨들 및 상기 보컬 범위 중 적어도 하나에 기초하여, 상기 수신된 보이스 데이터를 수정하는 단계;
    상기 통신 디바이스(21)가 상기 수정된 보이스 데이터를 다른 디바이스에 전송하는 단계;
    사용자가 톤들을 히어링하도록 상기 통신 디바이스(21)가 상기 사용자에게 방출하기 위해 상기 톤들을 발생시키는 단계;
    상기 통신 디바이스(21)가 볼륨 설정들을 식별하는 입력을 수신하는 단계 ― 상기 볼륨 설정들에서 상기 톤들이 상기 사용자에게 히어링가능함 ―;
    상기 통신 디바이스(21)가 상기 볼륨 설정들을 식별하였던 상기 수신된 입력에 기초하여, 상기 사용자의 히어링 프로파일을 결정하는 단계 ― 상기 볼륨 설정들에서 상기 톤들이 상기 사용자에게 히어링가능함 ―;
    상기 사용자의 히어링 프로파일이 오디오 데이터의 미래의 콜 또는 다른 전송들을 위한 제 2 통신 디바이스(22)에 의해 세이브될 수 있도록, 상기 통신 디바이스(21)가 상기 사용자의 히어링 프로파일을 상기 제 2 통신 디바이스(22)로 전송하는 단계; 및
    상기 제 2 통신 디바이스(22)가 상기 오디오 데이터를 상기 통신 디바이스(21)에 전송하기 전에 상기 사용자의 히어링 프로파일에 기초하여 상기 오디오 데이터를 수정하는 단계 ― 그 결과, 상기 통신 디바이스(21)에 전송된 오디오 데이터는 상기 사용자의 히어링 프로파일을 통해 상기 사용자의 특정 히어링 능력을 고려하여 상기 데이터를 상기 사용자에게 전송하는 상기 제 2 통신 디바이스(22)에 의해 수정됨 ―
    를 포함하는,
    컴퓨터 판독가능 저장 매체.
  11. 제 10 항에 있어서,
    상기 방법은,
    상기 통신 디바이스(21)가,
    수신된 오디오를 전송 또는 출력하는데 있어서의 사용을 위해 히어링 데이터베이스(13)에 저장하기 위한 히어링 프로파일을 생성하도록 애플리케이션(7)을 실행시킬 수 있거나, 또는
    명료성을 개선하거나, 수신된 보이스 데이터 내의 잡음을 감소시키거나, 또는 그렇지 않으면 상기 보이스 데이터를 향상시켜 전송된 보이스 데이터가 향상된 품질을 갖도록, 수신된 보이스 데이터를 수정하기 위해, 상기 보이스 데이터를 전송하기 전에, 마이크로폰(6)을 통해 수신된 보이스 데이터를 향상시키기 위해 이용될 수 있는 보이스 데이터베이스(12)에서의 이용을 위해 보이스 프로파일을 발생시키는 단계
    를 더 포함하고,
    상기 보이스 데이터 베이스(12) 및 상기 히어링 데이터 베이스(13)뿐만 아니라 다른 데이터는 상기 애플리케이션(7)이 실행될 때 상기 통신 디바이스(21)에 의해 이용되는,
    컴퓨터 판독가능 저장 매체.
  12. 제 10 항 또는 제 11 항에 있어서,
    상기 통신 디바이스는 제 1 통신 디바이스이고,
    상기 방법은,
    상기 제 1 통신 디바이스(21)에 전송되는 수정된 오디오 데이터가 제 1 오디오 스펙트럼 내에 있는 오디오 데이터의 임의의 부분을 생략하도록, 상기 제 2 통신 디바이스(22)가 상기 오디오 데이터를 상기 제 1 통신 디바이스(21)에 전송하기 전에 상기 사용자의 상기 히어링 프로파일에 기초하여 상기 오디오 데이터를 수정하는 단계 ― 상기 제 1 오디오 스펙트럼은 상기 사용자의 상기 히어링 프로파일에 의해, 상기 사용자에게 히어링불가한 것으로서 식별된 오디오 스펙트럼임 ―
    를 더 포함하고, 그 결과 상기 오디오 데이터의 상기 부분의 전송 및 수신에 연관된 대역폭 및 프로세싱 파워가 세이브되는,
    컴퓨터 판독가능 저장 매체.
  13. 제 10 항 또는 제 11 항에 있어서,
    상기 통신 디바이스(21)가, 상기 사용자의 보이스의 상기 시간 도메인, 상기 주파수 도메인, 상기 보컬 도미넌트들, 상이한 옥타브들, 상이한 속도들, 상이한 볼륨들 및 상기 보컬 범위 중 적어도 하나에 기초하여 상기 보이스 데이터를 수정하는 단계는, 상기 통신 디바이스(21)가, 상기 사용자의 보이스의 주파수 도메인의 외부에 있는 주파수 범위 내에 있는 상기 수신된 보이스 데이터의 부분을 제거하는 단계로 구성되는,
    컴퓨터 판독가능 저장 매체.
  14. 제 10 항 또는 제 11 항에 있어서,
    상기 통신 디바이스(21) 및 상기 제 2 통신 디바이스(22)는 각각 두 통신 디바이스들(21, 22) 간의 텔레폰 콜(telephone call) 동안의 사용을 위한 상기 보이스 데이터베이스(12) 및 상기 히어링 데이터베이스(13)을 갖고,
    각각의 통신 디바이스(21, 22)는 상기 통신 디바이스(21, 22)의 마이크로폰으로 스피킹하는 사용자의 보이스 데이터를 수정하여, 전송된 보이스 데이터가 수신하는 통신 디바이스(21, 22)의 사용자에 대한 자신의 명료성을 개선하도록 수정되는,
    컴퓨터 판독가능 저장 매체.
  15. 제 10 항 또는 제 11 항에 있어서,
    통신 세션 동안 상기 통신 디바이스(21) 및 상기 제 2 통신 디바이스(22)의 전송 경로 내에 있는 스위치 디바이스가 상기 히어링 데이터베이스(12) 및 상기 보이스 데이터베이스(13)를 포함하고, 수신하는 사용자에 상기 오디오 데이터를 전송하고 있는 스피커의 보이스 프로파일 및 오디오 데이터의 출력을 수신하기 위해 상기 사용자의 히어링 프로파일에 기초하여 특정 사용자에게 전송될 오디오 데이터를 수정하는,
    컴퓨터 판독가능 저장 매체.
  16. 제 9 항에 있어서,
    상기 사용자의 통신 디바이스(21)의 어드레스는 상기 통신 디바이스(21)의 전화 번호 또는 인터넷 프로토콜 어드레스(internet protocol address)인,
    보이스 데이터를 전송하는 방법.
  17. 제 9 항에 있어서,
    상기 사용자와 연관된 상기 다른 통신 디바이스(22)는 보이스 메일박스(mailbox)인,
    보이스 데이터를 전송하는 방법.
  18. 제 9 항에 있어서,
    상기 사용자와 연관된 어드레스는 이메일(email) 어드레스인,
    보이스 데이터를 전송하는 방법.
  19. 제 15 항에 있어서,
    상기 스위치 디바이스는 컴퓨터 디바이스(25)인,
    컴퓨터 판독가능 저장 매체.
KR1020147023147A 2012-11-20 2012-11-20 오디오 데이터 프로세싱을 위한 방법, 디바이스, 및 시스템 KR101626438B1 (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2012/065995 WO2014081408A1 (en) 2012-11-20 2012-11-20 Method, device, and system for audio data processing

Publications (2)

Publication Number Publication Date
KR20140121447A KR20140121447A (ko) 2014-10-15
KR101626438B1 true KR101626438B1 (ko) 2016-06-01

Family

ID=47326378

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020147023147A KR101626438B1 (ko) 2012-11-20 2012-11-20 오디오 데이터 프로세싱을 위한 방법, 디바이스, 및 시스템

Country Status (6)

Country Link
US (4) US20140379343A1 (ko)
EP (1) EP2786376A1 (ko)
KR (1) KR101626438B1 (ko)
CN (1) CN104160443B (ko)
TW (1) TWI527024B (ko)
WO (1) WO2014081408A1 (ko)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10607625B2 (en) * 2013-01-15 2020-03-31 Sony Corporation Estimating a voice signal heard by a user
US9319019B2 (en) 2013-02-11 2016-04-19 Symphonic Audio Technologies Corp. Method for augmenting a listening experience
US9344793B2 (en) * 2013-02-11 2016-05-17 Symphonic Audio Technologies Corp. Audio apparatus and methods
US9344815B2 (en) 2013-02-11 2016-05-17 Symphonic Audio Technologies Corp. Method for augmenting hearing
TWI624183B (zh) * 2013-07-05 2018-05-11 元鼎音訊股份有限公司 電話語音處理之方法及其電腦程式
US10051120B2 (en) * 2013-12-20 2018-08-14 Ultratec, Inc. Communication device and methods for use by hearing impaired
US10324593B2 (en) * 2014-01-28 2019-06-18 International Business Machines Corporation Impairment-adaptive electronic data interaction system
US20160239253A1 (en) * 2014-01-31 2016-08-18 Matteo Staffaroni Method for audio correction in electronic devices
US10121488B1 (en) * 2015-02-23 2018-11-06 Sprint Communications Company L.P. Optimizing call quality using vocal frequency fingerprints to filter voice calls
CN104954555B (zh) * 2015-05-18 2018-10-16 百度在线网络技术(北京)有限公司 一种音量调节方法及***
US9407989B1 (en) 2015-06-30 2016-08-02 Arthur Woodrow Closed audio circuit
JP6374854B2 (ja) * 2015-11-10 2018-08-15 株式会社オプティム 画面共有システム及び画面共有方法
CN105788612B (zh) * 2016-03-31 2019-11-05 广州酷狗计算机科技有限公司 一种检测音质的方法和装置
CN108231089B (zh) * 2016-12-09 2020-11-03 百度在线网络技术(北京)有限公司 基于人工智能的语音处理方法及装置
US9973627B1 (en) 2017-01-25 2018-05-15 Sorenson Ip Holdings, Llc Selecting audio profiles
US20180271710A1 (en) * 2017-03-22 2018-09-27 Bragi GmbH Wireless earpiece for tinnitus therapy
CN108877822A (zh) * 2017-05-09 2018-11-23 塞舌尔商元鼎音讯股份有限公司 智能语音***、语音输出调整的方法及计算机可读取记忆媒体
US10521512B2 (en) * 2017-05-26 2019-12-31 Bose Corporation Dynamic text-to-speech response from a smart speaker
US10564928B2 (en) * 2017-06-02 2020-02-18 Rovi Guides, Inc. Systems and methods for generating a volume- based response for multiple voice-operated user devices
CN107945815B (zh) * 2017-11-27 2021-09-07 歌尔科技有限公司 语音信号降噪方法及设备
US10991379B2 (en) * 2018-06-22 2021-04-27 Babblelabs Llc Data driven audio enhancement
CN108986830B (zh) * 2018-08-28 2021-02-09 安徽淘云科技有限公司 一种音频语料筛选方法及装置
US11393478B2 (en) * 2018-12-12 2022-07-19 Sonos, Inc. User specific context switching
TW202027062A (zh) * 2018-12-28 2020-07-16 塞席爾商元鼎音訊股份有限公司 聲音播放系統及其調整輸出聲音之方法
US10971168B2 (en) * 2019-02-21 2021-04-06 International Business Machines Corporation Dynamic communication session filtering
TW202102010A (zh) 2019-05-24 2021-01-01 瑞典商赫爾桑茲股份有限公司 用於無損資料壓縮和解壓縮的方法、裝置、和電腦程式產品
US11818426B2 (en) * 2019-11-14 2023-11-14 Dish Network L.L.C. Method and system for adaptive audio modification
US11257480B2 (en) * 2020-03-03 2022-02-22 Tencent America LLC Unsupervised singing voice conversion with pitch adversarial network
KR20220081090A (ko) * 2020-12-08 2022-06-15 라인 가부시키가이샤 감정 기반 멀티미디어 컨텐츠 생성 방법 및 시스템
DE102021103310B4 (de) 2021-02-12 2024-01-04 Dr. Ing. H.C. F. Porsche Aktiengesellschaft Verfahren und vorrichtung zur verbesserung der sprachverständlichkeit in einem raum
TWI801085B (zh) * 2022-01-07 2023-05-01 矽響先創科技股份有限公司 智能網路通訊之雜訊消減方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102006015497A1 (de) * 2006-04-03 2007-10-11 Nebel, Wolfgang, Dr. Audiosystem und Verfahren sowie Computerprogramm und Datenträger der das Computerprogramm enthält zur Anpassung der Übertragungsfunktion eines Audiosystems mittels Sprachsteuerung
US20110300806A1 (en) * 2010-06-04 2011-12-08 Apple Inc. User-specific noise suppression for voice quality improvements

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CH633903A5 (de) * 1978-09-26 1982-12-31 Feller Ag Sprachschalter fuer ein an eine telefonleitung anzuschliessendes geraet.
US4538295A (en) * 1982-08-16 1985-08-27 Nissan Motor Company, Limited Speech recognition system for an automotive vehicle
US5706352A (en) 1993-04-07 1998-01-06 K/S Himpp Adaptive gain and filtering circuit for a sound reproduction system
AU740951C (en) 1997-04-16 2004-01-22 Emma Mixed Signal C.V. Method for Noise Reduction, Particularly in Hearing Aids
US5844983A (en) * 1997-07-10 1998-12-01 Ericsson Inc. Method and apparatus for controlling a telephone ring signal
WO2000027284A1 (en) * 1998-11-09 2000-05-18 Xinde Li System and method for processing low signal-to-noise ratio signals
US6463128B1 (en) * 1999-09-29 2002-10-08 Denso Corporation Adjustable coding detection in a portable telephone
DE19948308C2 (de) * 1999-10-06 2002-05-08 Cortologic Ag Verfahren und Vorrichtung zur Geräuschunterdrückung bei der Sprachübertragung
DE19956747C1 (de) * 1999-11-25 2001-01-11 Siemens Ag Verfahren und Vorrichtung zur Spracherkennung sowie ein Telekommunikationssystem
GB0116071D0 (en) * 2001-06-30 2001-08-22 Hewlett Packard Co Improvements in audio reproduction
US6944474B2 (en) * 2001-09-20 2005-09-13 Sound Id Sound enhancement for mobile phones and other products producing personalized audio for users
US7340231B2 (en) * 2001-10-05 2008-03-04 Oticon A/S Method of programming a communication device and a programmable communication device
US20050119894A1 (en) * 2003-10-20 2005-06-02 Cutler Ann R. System and process for feedback speech instruction
CA2454296A1 (en) 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
CN100440899C (zh) * 2004-11-15 2008-12-03 北京中星微电子有限公司 一种手机音量自动调节的方法及装置
CN1855704B (zh) * 2005-04-26 2011-07-20 佛山市顺德区顺达电脑厂有限公司 自动调整电子装置音量的方法
US20060282264A1 (en) * 2005-06-09 2006-12-14 Bellsouth Intellectual Property Corporation Methods and systems for providing noise filtering using speech recognition
WO2006130909A1 (en) * 2005-06-10 2006-12-14 Neuromonics Pty Ltd Digital playback device and method and apparatus for spectrally modifying a digital audio signal
US7720681B2 (en) * 2006-03-23 2010-05-18 Microsoft Corporation Digital voice profiles
US7616936B2 (en) * 2006-12-14 2009-11-10 Cisco Technology, Inc. Push-to-talk system with enhanced noise reduction
US8010366B1 (en) * 2007-03-20 2011-08-30 Neurotone, Inc. Personal hearing suite
US8270593B2 (en) * 2007-10-01 2012-09-18 Cisco Technology, Inc. Call routing using voice signature and hearing characteristics
US8259954B2 (en) * 2007-10-11 2012-09-04 Cisco Technology, Inc. Enhancing comprehension of phone conversation while in a noisy environment
US8027743B1 (en) 2007-10-23 2011-09-27 Adobe Systems Incorporated Adaptive noise reduction
DK2081405T3 (da) * 2008-01-21 2012-08-20 Bernafon Ag Høreapparat tilpasset til en bestemt stemmetype i et akustisk miljø samt fremgangsmåde og anvendelse
US20090287489A1 (en) * 2008-05-15 2009-11-19 Palm, Inc. Speech processing for plurality of users
WO2009143898A1 (en) 2008-05-30 2009-12-03 Phonak Ag Method for adapting sound in a hearing aid device by frequency modification and such a device
WO2010011963A1 (en) * 2008-07-25 2010-01-28 The Board Of Trustees Of The University Of Illinois Methods and systems for identifying speech sounds using multi-dimensional analysis
US8244535B2 (en) * 2008-10-15 2012-08-14 Verizon Patent And Licensing Inc. Audio frequency remapping
DE102008052176B4 (de) 2008-10-17 2013-11-14 Siemens Medical Instruments Pte. Ltd. Verfahren und Hörgerät zur Parameteradaption durch Ermittlung einer Sprachverständlichkeitsschwelle
US8582790B2 (en) 2010-02-12 2013-11-12 Audiotoniq, Inc. Hearing aid and computing device for providing audio labels
US8369549B2 (en) * 2010-03-23 2013-02-05 Audiotoniq, Inc. Hearing aid system adapted to selectively amplify audio signals
EP2375781B1 (en) 2010-04-07 2013-03-13 Oticon A/S Method for controlling a binaural hearing aid system and binaural hearing aid system
US8386252B2 (en) * 2010-05-17 2013-02-26 Avaya Inc. Estimating a listener's ability to understand a speaker, based on comparisons of their styles of speech
US8781836B2 (en) * 2011-02-22 2014-07-15 Apple Inc. Hearing assistance system for providing consistent human speech
US8918197B2 (en) * 2012-06-13 2014-12-23 Avraham Suhami Audio communication networks
US8700396B1 (en) * 2012-09-11 2014-04-15 Google Inc. Generating speech data collection prompts
WO2014062859A1 (en) * 2012-10-16 2014-04-24 Audiologicall, Ltd. Audio signal manipulation for speech enhancement before sound reproduction
EP2944097A4 (en) * 2013-01-09 2016-11-23 Ace Comm Ltd METHOD AND SYSTEM FOR AUTOGERATED SOUND ENHANCEMENT

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102006015497A1 (de) * 2006-04-03 2007-10-11 Nebel, Wolfgang, Dr. Audiosystem und Verfahren sowie Computerprogramm und Datenträger der das Computerprogramm enthält zur Anpassung der Übertragungsfunktion eines Audiosystems mittels Sprachsteuerung
US20110300806A1 (en) * 2010-06-04 2011-12-08 Apple Inc. User-specific noise suppression for voice quality improvements

Also Published As

Publication number Publication date
CN104160443A (zh) 2014-11-19
WO2014081408A1 (en) 2014-05-30
TWI527024B (zh) 2016-03-21
CN104160443B (zh) 2016-11-16
US20190259406A1 (en) 2019-08-22
US10803880B2 (en) 2020-10-13
US20170330578A1 (en) 2017-11-16
US20140379343A1 (en) 2014-12-25
KR20140121447A (ko) 2014-10-15
TW201430834A (zh) 2014-08-01
US10325612B2 (en) 2019-06-18
US20200411025A1 (en) 2020-12-31
EP2786376A1 (en) 2014-10-08

Similar Documents

Publication Publication Date Title
US10803880B2 (en) Method, device, and system for audio data processing
US20190156847A1 (en) Transparent near-end user control over far-end speech enhancement processing
US20190066710A1 (en) Transparent near-end user control over far-end speech enhancement processing
US8972251B2 (en) Generating a masking signal on an electronic device
CN107995360B (zh) 通话处理方法及相关产品
US8036375B2 (en) Automated near-end distortion detection for voice communication systems
WO2016184119A1 (zh) 一种音量调节方法、***、设备和计算机存储介质
JP2019530546A (ja) 音響信号の聴取試験および変調
EP1622349A1 (en) Teleconference volume level monitoring and feedback on the volume level
JP2017514392A (ja) ユーザ端末ならびに端末の音量を調整する方法および装置
EP2973559B1 (en) Audio transmission channel quality assessment
US20040162722A1 (en) Speech quality indication
US20160239253A1 (en) Method for audio correction in electronic devices
CN104580764A (zh) 电话会议***中的超声配对信号控制
TWI624183B (zh) 電話語音處理之方法及其電腦程式
TW201339894A (zh) 模式管理系統及其管理方法
US9661417B2 (en) System, method, and computer program product for voice decibel monitoring on electronic computing devices
US20150201057A1 (en) Method of processing telephone voice output and earphone
JP7410109B2 (ja) 電気通信装置、電気通信システム、電気通信装置を動作させる方法、およびコンピュータプログラム
US10178227B2 (en) Personalizing the audio visual experience during telecommunications
TWI566233B (zh) 可增加通訊內容清晰度之行動通訊方法
WO2023170470A1 (en) Hearing aid for cognitive help using speaker

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant