JP2013183315A - ハンズフリー通話装置 - Google Patents

ハンズフリー通話装置 Download PDF

Info

Publication number
JP2013183315A
JP2013183315A JP2012046229A JP2012046229A JP2013183315A JP 2013183315 A JP2013183315 A JP 2013183315A JP 2012046229 A JP2012046229 A JP 2012046229A JP 2012046229 A JP2012046229 A JP 2012046229A JP 2013183315 A JP2013183315 A JP 2013183315A
Authority
JP
Japan
Prior art keywords
speaker
voice
hands
unit
microphone array
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012046229A
Other languages
English (en)
Inventor
Daisuke Sugii
大介 杉井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Casio Mobile Communications Ltd
Original Assignee
NEC Casio Mobile Communications Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Casio Mobile Communications Ltd filed Critical NEC Casio Mobile Communications Ltd
Priority to JP2012046229A priority Critical patent/JP2013183315A/ja
Publication of JP2013183315A publication Critical patent/JP2013183315A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

【課題】簡単な演算処理で、話者の声を選択的に通話相手へ送話する。
【解決手段】ハンズフリー通話装置100は、受話部110と、超音波スピーカ120と、マイクロホンアレー130と、BSS(Blind Source Separation)処理部140と、送話部150と、を有する。受話部110は、受話音声を受信する。超音波スピーカ120は、受話部110が受信した受話音声を出力する。マイクロホンアレー130は、音声を集音する。BSS処理部140は、マイクロホンアレー130により集音された音声から送話音声を抽出する。送話部150は、BSS処理部140により抽出される送話音声を送信する。
【選択図】図1

Description

本発明は、ハンズフリー通話装置に関する。
装置と話者とが近接していなくても通話が可能なハンズフリー通話装置としては、例えば、特許文献1及び2の技術がある。
特許文献1のハンズフリー通話装置では、画像認識により話者の位置を検出し、その検出結果を、マイクロホン及びスピーカの指向性制御に利用する。マイクロホンの指向性制御は、複数のマイクロホンのうち話者の方向に対応するマイクロホンを選択的に使用すること、又は、駆動部によりマイクロホンの向きを変えることにより行う。
特許文献2のハンズフリー通話装置では、超音波センサにより話者の位置を検出し、その検出結果を、マイクロホン及びスピーカの指向性制御に利用する。特許文献2の技術では、複数のマイクロホンの音声入力の位相と振幅を制御することによって、特定した方向にマイクロホンの指向性を高める。
なお、特許文献3には、画像認識により話者の位置を認識し、パラメトリックスピーカアレイにより特定の方向に音声を出力し、前方に向かって指向性を有するマイクロホンにより集音する移動体(ロボット等)について記載されている。
また、特許文献4には、電話端末における着信時に、電話端末に設けた複数のマイクロホンで集音して音声信号を得て、この音声信号から着信音成分を除去したものを雑音信号と推定する技術が記載されている。
特開2010−232755号公報 特開2001−359187号公報 国際公開第2005/076661号パンフレット 特開2009−153053号公報
ハンズフリー通話装置において、話者の声を選択的に通話相手へ送話するためには、多くのマイクロホンを用いる必要がある。しかし、携帯通信端末装置などにおいては、実装スペースが限られているため、多くのマイクロホンを実装することが困難な場合もある。特許文献1において、駆動部によりマイクロホンの向きを変える場合も、駆動部が必要となるため、実装スペースが大型化する。
また、ハンズフリー通話装置における演算処理が複雑であると、消費電力が多くなるなどの弊害があるため、演算処理がなるべく簡単であることが望まれる。
本発明は、以下の何れかの課題を解決することが可能なハンズフリー通話装置を提供することにある。
1つ目の課題は、簡単な演算処理で、話者の声を選択的に通話相手へ送話することである。
2つ目の課題は、なるべく少ない数のマイクロホンを用いて、話者の声を選択的に通話相手へ送話することである。
本発明は、受話音声を受信する受話部と、
前記受話部が受信した受話音声を出力する超音波スピーカと、
音声を集音するマイクロホンアレーと、
前記マイクロホンアレーにより集音された音声から、送話音声を抽出するBSS(Blind Source Separation)処理部と、
前記BSS処理部により抽出される送話音声を送信する送話部と、
を有することを特徴とするハンズフリー通話装置を提供する。
また、本発明は、受話音声を受信する受話部と、
前記受話部が受信した受話音声を出力する超音波スピーカと、
音声を集音するAMNOR(Adaptive Microphone−array for NOise Reduction)方式のマイクロホンアレーと、
前記マイクロホンアレーにより集音される音声に基づいて送話音声を生成し、該送話音声を送話する送話部と、
を有することを特徴とするハンズフリー通話装置を提供する。
本発明によれば、簡単な演算処理で、話者の声を選択的に通話相手へ送話することができる。または、本発明によれば、なるべく少ない数のマイクロホンを用いて、話者の声を選択的に通話相手へ送話することができる。
第1の実施形態に係るハンズフリー通話装置の構成を示すブロック図である。 第1の実施形態に係るハンズフリー通話装置のより具体的な構成を示すブロック図である。 超音波スピーカの構成を示す模式的な平面図である。 超音波スピーカの個々の超音波振動子の構成を示す模式的な断面図である。 第1の実施形態の動作を説明するための模式図である。 超音波スピーカの超音波振動子の共振周波数の特性を示す図である。 超音波スピーカの指向性制御の例を説明するための模式図である。 話者が複数人の場合のハンズフリー通話装置の動作を説明するためのフローチャートである。 第2の実施形態に係るハンズフリー通話装置の構成を示すブロック図である。 第2の実施形態に係るハンズフリー通話装置のより具体的な構成を示すブロック図である。 第2の実施形態の動作を説明するための模式図である。
以下、本発明の実施形態について、図面を用いて説明する。なお、すべての図面において、同様の構成要素には同一の符号を付し、適宜に説明を省略する。
〔第1の実施形態〕
図1は第1の実施形態に係るハンズフリー通話装置100の構成を示すブロック図である。
本実施形態に係るハンズフリー通話装置100は、受話部110と、超音波スピーカ120と、マイクロホンアレー130と、BSS(Blind Source Separation)処理部140と、送話部150と、を有する。受話部110は、受話音声を受信する。超音波スピーカ120は、受話部110が受信した受話音声を出力する。マイクロホンアレー130は、音声を集音する。BSS処理部140は、マイクロホンアレー130により集音された音声から送話音声を抽出する。送話部150は、BSS処理部140により抽出される送話音声を送信する。
BSS処理部140は、ブラインド信号源分離(ブラインド音源分離)と呼ばれる処理を行う。この処理は、複数の音源が混在する環境下で集音された音声データから、それぞれの音源に由来する音声データを分離する処理である。
ハンズフリー通話装置100の使用者である話者の声以外に、何らかの雑音源が存在する場合、マイクロホンアレー130は、話者の声以外に、雑音源からの雑音を集音する。BSS処理部140は、マイクロホンアレー130により集音された音声(音声データ)を、話者の声と、雑音と、に分離する。更に、BSS処理部140は、分離した音声から、話者の声を送話音声として抽出する。送話部150は、BSS処理部140により抽出された話者の声を送話音声として、通話の相手方の通話装置へ送信する。
このように、本実施形態に係るハンズフリー通話装置100によれば、マイクロホンアレー130により集音された音声から、BSS処理部140により送話音声を抽出する。よって、話者の声を選択的に通話相手へ送話することができる。
ここで、ハンズフリー通話装置100においては、超音波スピーカ120により受話音声を出力する。このため、超音波スピーカ120から(ひいてはハンズフリー通話装置100から)ある程度の距離だけ離れた位置で受話音声が復調し、受話音声が可聴音として再生される。よって、マイクロホンアレー130が受話音声の音響エコーを収音してしまうことを抑制できる。その結果、BSS処理部140は、受話音声の音響エコーを分離する処理と、その音響エコーを雑音と判定する処理と、の何れも行う必要がない。つまり、BSS処理部140の処理が簡単になる。
要するに、簡単な演算処理で、話者の声を選択的に通話相手へ送話することができる。
以下、第1の実施形態をより詳細に説明する。
図2は第1の実施形態に係るハンズフリー通話装置100のより具体的な構成を示すブロック図である。
ハンズフリー通話装置100は、無線通信又は有線通信により、他の通話装置との間で通話を行うための装置である。受話部110は、他の通話装置から送信された受話音声を受信する。送話部150は、他の通話装置へ送話音声を送信する。
ハンズフリー通話装置100は、携帯電話機或いはその他の携帯通信端末装置であることが好ましい例であるが、固定電話などであっても良い。
図2に示すように、ハンズフリー通話装置100は、上記の構成に加えて、入力部20と、撮像部170と、位置特定部180と、画像判定部190と、を有している。
入力部20は、超音波スピーカ120にパラメトリックスピーカ用の変調信号を入力することによって、超音波スピーカ120より超音波を発振(出力)させる。超音波スピーカ120より出力された超音波は、ハンズフリー通話装置100からある程度離れた位置で復調し、可聴音として再生される。これにより、話者は、ハンズフリー状態、すなわち話者の口をハンズフリー通話装置100に近接させない状態(典型的には、ハンズフリー通話装置100を手で持たない状態)で、通話相手の通話装置(図示略)から送信された音声を聞くことができる。
入力部20は、超音波スピーカ120の指向性の制御を行う指向性制御部21を有している。
撮像部170は、話者等の画像を撮像するカメラである。
位置特定部180は、撮像部170による撮像結果に基づいて、話者の位置を特定する。すなわち、位置特定部180は、撮像部170により撮像された画像について、顔認識等の所定の画像認識処理を行うことによって、ハンズフリー通話装置100を基準とした話者の位置(方向及び距離)を判定する。
入力部20の指向性制御部21は、位置特定部180により特定された話者の位置で音声が再生されるように超音波スピーカ120の指向性を制御する。
画像判定部190は、撮像部170による撮像結果に基づいて、話者の発声タイミングを判定する。より具体的には、画像判定部190は、位置特定部180により特定された位置における画像(つまり話者の画像)について、口の動きを判定する。口が所定の動作を行っているタイミング(開閉を繰り返している場合など)を、話者の発声タイミングであると判定する。
BSS処理部140は、画像判定部190により判定された話者の発声タイミングにてマイクロホンアレー130により集音された音声から、送話音声を抽出する。このため、送話音声、つまり話者の音声を効率的に抽出することができる。
マイクロホンアレー130は、複数のマイクロホン131を備えて構成されている(図5参照)。
図3は超音波スピーカ120の構成を示す模式的な平面図である。
図3に示すように、超音波スピーカ120は、それぞれ超音波を出力する複数の超音波振動子30を有している。つまり、超音波スピーカ120は、複数の超音波振動子30からなる振動子アレーを含んで構成されている。入力部20は、各超音波振動子30にそれぞれ変調信号を入力することにより、各超音波振動子30からそれぞれ超音波を放射させる。
複数の超音波振動子30は、例えば、マトリクス状に配置されている。図3の例では、縦4列、横4列で合計16個の超音波振動子30がマトリクス状に配置されている。ただし、超音波スピーカ120が有する超音波振動子30の数や配置は、この例に限らない。
超音波スピーカ120は、例えば、複数の超音波振動子30を支持する枠状の支持部70を有している。
図4は超音波スピーカ120の個々の超音波振動子30の構成を示す模式的な断面図である。
超音波振動子30は、例えば、シート状の振動部材62と、振動子63と、を備えている。振動子63は圧電振動子であり、振動部材62の一方の面に取り付けられている。振動子63は、振動部材62に対向する面の全面が接着剤によって振動部材62に固定されている。これにより、振動子63の片面の全面が振動部材62によって拘束されている。
振動部材62の縁は支持部70により支持されている。
振動部材62を構成する材料は、金属や樹脂など、脆性材料である振動子63に対して高い弾性率を持つ材料であれば特に限定されないが、加工性やコストの観点からリン青銅やステンレスなどが好ましい。振動部材62は、振動子63から発生した振動によって振動し、例えば周波数が20kHz以上の音波を発振する。振動子63も、自身が振動することによって、例えば周波数が20kHz以上の音波を発振する。
振動子63は、圧電セラミック(図示略)と、圧電セラミックの両方の面にそれぞれ形成された電極膜と、からなる。
入力部20は、各超音波振動子30の振動子63を発振させる発振器として機能する。入力部20は、振動子63に入力する電気信号、すなわちパラメトリックスピーカ用の変調信号(発振信号)を生成する。変調信号の輸送波は、例えば、周波数が20kHz以上の超音波であり、具体的には、例えば100kHzの超音波である。入力部20は、所定の発振出力となるように超音波振動子30を制御する。
パラメトリックスピーカは、複数の発振源それぞれからAM変調やDSB変調、SSB変調、FM変調をかけた超音波(輸送波)を空気中に放射し、超音波が空気中に伝播する際の非線形特性により、可聴音を出現させるものである。ここでの非線形とは、流れの慣性作用と粘性作用の比で示されるレイノルズ数が大きくなると、層流から乱流に推移することを示す。音波は、流体内で微少にじょう乱しているため、非線形で伝播している。特に超音波周波数帯では音波の非線形性が容易に観察できる。そして超音波を空気中に放射した場合、音波の非線形性に伴う高調波が顕著に発生する。また音波は、空気中において分子密度に濃淡が生じる疎密状態である。そして空気分子が圧縮よりも復元するのに時間が生じた場合、圧縮後に復元できない空気が、連続的に伝播する空気分子と衝突し、衝撃波が生じる。この衝撃波により可聴音が発生する。可聴音、すなわち受話音声は、超音波スピーカ120から(ひいてはハンズフリー通話装置100から)ある程度の距離だけ離れた位置で再生される。
入力部20は、例えば、複数の超音波振動子30が互いに個別の位相で発振するように、複数の超音波振動子30を制御することができる。複数の超音波振動子30を互いに個別の位相で発振させることにより、指向性を高めたり、指向性を任意に制御したりすることができる。ただし、入力部20は、複数の超音波振動子30を互いに同一の位相で発振させても良い。
図5は第1の実施形態の動作を説明するための模式図である。
例えば図5に示すように、話者として第1話者210及び第2話者220の2人の話者が存在するものとする。また、ハンズフリー通話装置100の外部に、他のスピーカ50が存在し、このスピーカ50から雑音が放音されているものとする。
先ず、撮像部170が第1話者210及び第2話者220を含む画像を撮像する。位置特定部180は、撮像部170による撮像結果に基づいて、第1話者210及び第2話者220の位置を特定する。入力部20の指向性制御部21は、位置特定部180により特定された第1話者210及び第2話者220の位置で受話音声が再生されるように超音波スピーカ120の指向性を制御する。つまり、第1話者210及び第2話者220の近傍でのみ受話音声が再生されるように、超音波スピーカ120の指向性を制御する。その結果、図5に示す可聴領域40にて受話音声を聴くことが可能となる。
また、マイクロホンアレー130は、第1話者210及び第2話者220の発声と、スピーカ50からの雑音と、を含む音声(音声データ)を集音する。
BSS処理部140は、マイクロホンアレー130により集音された音声から、各音源(第1話者210、第2話者220及びスピーカ50)に由来する音声を分離する。
更に、BSS処理部140は、相互に分離された複数の音声から、雑音を判定し、雑音を除く音声を送話音声として抽出する。よって、送話部150は、第1話者210及び第2話者220の声を選択的に、通話相手の通話装置へ送信することができる。
ここで、BSS処理部140は、例えば、着信時にマイクロホンアレー130により集音された音声から着信音を除去した音声を雑音として認識するように構成されている。これにより、着信以前からスピーカ50から音声が放音されている場合に、その音声を容易に雑音と認識することができる。
また、画像判定部190は、撮像部170による撮像結果に基づいて、第1話者210及び第2話者220の発声タイミングを判定する。そして、BSS処理部140は、画像判定部190により判定された発声タイミングにて集音された音声から、送話音声を抽出する。このため、送話音声を効率的に抽出することができる。
次に、図6及び図7を参照して、超音波スピーカ120の指向性制御の一例を説明する。図6は超音波スピーカ120の超音波振動子30の共振周波数の特性を示す図である。図7(a)、(b)及び(c)は超音波スピーカ120の指向性制御の例を説明するための模式図である。
本実施形態の場合、指向性制御部21は、例えば、入力部20から超音波スピーカ120に入力される変調信号を調節することによって、超音波スピーカ120の共振周波数を変化させることにより、超音波スピーカ120の指向性を制御する。すなわち、入力部20から各超音波振動子30に入力される変調信号を調節することによって、各超音波振動子30の共振周波数を変化させることにより、超音波スピーカ120の指向性を制御する。
図6に示すように、超音波振動子30は、複数の共振周波数をもつ。すなわち、超音波振動子30は、キャリア周波数a1(例えば20kHz)、キャリア周波数a1の2倍の周波数の倍波周波数a2(例えば40kHz)、及び、キャリア周波数a1の3倍の周波数の3倍波周波数a3(例えば60kHz)を持つ。
超音波スピーカ120の指向性は、共振周波数が高域となるほど、つまり搬送波の周波数が高域となるほど高くなる。また、超音波スピーカ120の指向性は、共振周波数及び搬送波の周波数が低域となるほど低くなる。図7(a)は超音波振動子30の共振周波数をキャリア周波数a1としたときの指向性(可聴音が復調される領域の角度範囲)を模式的に示す。同様に、図7(b)は超音波振動子30の共振周波数を倍波周波数a2としたときの指向性を模式的に示し、図7(c)は超音波振動子30の共振周波数を3倍波周波数a3としたときの指向性を模式的に示す。図7(a)〜(c)において、θ1>θ2>θ3である。
従って、ハンズフリー通話装置100と話者との位置関係や話者の数に応じて、共振周波数をキャリア周波数a1、倍波周波数a2及び3倍波周波数a3の中から適宜選択することによって、超音波スピーカ120の指向性を適切に制御することができる。
次に、上記のように複数の話者が存在する場合のBSS処理部140の処理について、より詳細に説明する。
上記のように、BSS処理部140は、マイクロホンアレー130により集音された音声から、各音源に由来する音声を分離する。このため、BSS処理部140は、第1話者210の声と、第2話者220の声も、相互に分離する。このため、第1話者210の声と第2話者220の声とを合成(同期加算)することにより、送話音声を生成する。
図8は話者が複数人の場合のハンズフリー通話装置100の動作を説明するためのフローチャートである。
先ず、マイクロホンアレー130により音声を集音する(ステップS11)。次に、BSS処理部140により、各音源に由来する音声を分離する(ステップS12)。次に、BSS処理部140は、話者が複数であるか否かを判定する(ステップS13)。この処理は、相互に分離された複数の音声の中に、複数の声が存在するか否かを判定することにより行う。更に、この処理の補助として、撮像部170により撮像された画像中に複数の人物が存在するか否かの判定結果を利用しても良い。
話者が複数の場合(ステップS13のY)、複数の話者の音声(声)を合成することにより、送話音声を生成する(ステップS14)。一方、話者が1人だけの場合、その話者の音声(声)を送話音声とする(ステップS15)。
以上のような第1の実施形態によれば、ハンズフリー通話装置100は、受話部110と、受話部110が受信した受話音声を出力する超音波スピーカ120を有する。更に、ハンズフリー通話装置100は、音声を集音するマイクロホンアレー130と、マイクロホンアレー130により集音された音声から送話音声を抽出するBSS処理部140と、BSS処理部140により抽出される送話音声を送信する送話部150と、を有する。
よって、話者の声を選択的に通話相手へ送話することができる。
ここで、ハンズフリー通話装置100においては、超音波スピーカ120により受話音声を出力する。このため、超音波スピーカ120から(ひいてはハンズフリー通話装置100から)ある程度の距離だけ離れた位置で受話音声が復調し、受話音声が可聴音として再生される。よって、マイクロホンアレー130が受話音声の音響エコーを収音してしまうことを抑制できる。その結果、BSS処理部140は、受話音声の音響エコーを分離する処理と、その音響エコーを雑音と判定する処理と、の何れも行う必要がない。つまり、BSS処理部140の処理が簡単になる。
要するに、簡単な演算処理で、話者の声を選択的に通話相手へ送話することができる。
ハンズフリー通話装置100は、画像を撮像する撮像部170と、撮像部170による撮像結果に基づいて話者の発声タイミングを判定する画像判定部190と、を有している。そして、BSS処理部140は画像判定部190により判定された発声タイミングに集音された音声から、送話音声を抽出する。よって、送話音声の抽出処理を効率的に行うことができる。
BSS処理部140は、複数の話者による発声をそれぞれ送話音声の一部分ずつとして抽出し、抽出した複数の話者による発声を合成することにより、送話音声を生成する。よって、話者が複数の場合には、複数の話者の声を選択的に通話相手へ送話することができる。
ハンズフリー通話装置100は、撮像部170と、撮像部170による撮像結果に基づいて話者の位置を特定する位置特定部180と、指向性制御部21と、を有している。指向性制御部21は、位置特定部180により特定された話者の位置で音声が再生されるように超音波スピーカの指向性を制御する。よって、話者の位置において選択的に、音声を再生することができる。
〔第2の実施形態〕
図9は第2の実施形態に係るハンズフリー通話装置200の構成を示すブロック図である。図10は第2の実施形態に係るハンズフリー通話装置200のより具体的な構成を示すブロック図である。図11は第2の実施形態の動作を説明するための模式図である。
本実施形態に係るハンズフリー通話装置100は、受話部110と、超音波スピーカ120と、マイクロホンアレー230と、送話部150と、を有する。受話部110は、受話音声を受信する。超音波スピーカ120は、受話部110が受信した受話音声を出力する。マイクロホンアレー230は、音声を集音する。マイクロホンアレー230は、AMNOR(Adaptive Microphone−array for NOise Reduction)方式のものである。送話部150は、マイクロホンアレー230により集音される音声に基づいて送話音声を生成し、該送話音声を送話する。
AMNOR方式のマイクロホンアレー230は、雑音の方向に対するマイクロホンアレー230の指向性を低くする。雑音の方向に指向性の谷を形成する。その結果、話者の声を選択的に、送話部150より通話相手へ送話することができる。なお、AMNOR方式のマイクロホンアレー230は、目的音方向に感度は高い。ただし、AMNOR方式のマイクロホンアレー230は、目的音方向に鋭い指向性を形成する訳ではない。
ここで、AMNOR方式のマイクロホンアレー230においては、雑音の音源数が多いほど、多くのマイクロホン131(図11参照)が必要となる。形成可能な指向性の谷の数は、(マイクロホン131の個数−1)となるためである。
これに対し、本実施形態に係るハンズフリー通話装置200においては、超音波スピーカ120により受話音声を出力する。このため、超音波スピーカ120から(ひいてはハンズフリー通話装置200から)ある程度の距離だけ離れた位置で受話音声が復調し、受話音声が可聴音として再生される。よって、マイクロホンアレー230が受話音声の音響エコーを収音してしまうことを抑制できる。その結果、マイクロホンアレー230は、その音響エコーを雑音として判定する処理と、音響エコーの方向に対する指向性を低くする処理と、の何れも行う必要がない。つまり、マイクロホンアレー230の処理が簡単になる。
また、スピーカとして可聴音を出力する通常のスピーカを用いる場合と比べて、雑音の音源数が減るため、マイクロホンアレー230が必要とするマイクロホン131の数を低減することができる。
要するに、なるべく少ない数のマイクロホンを用いて、簡単な演算処理で、且つ、話者の声を選択的に通話相手へ送話することができる。
以下、第2の実施形態についてのより詳細な説明を、第1の実施形態との相違点を中心に行う。
ハンズフリー通話装置200は、ハンズフリー通話装置100と同様に、無線通信又は有線通信により、他の通話装置との間で通話を行うための装置である。受話部110は、他の通話装置から送信された受話音声を受信する。送話部150は、他の通話装置へ送話音声を送信する。ハンズフリー通話装置200は、携帯電話機或いはその他の携帯通信端末装置であることが好ましい例であるが、固定電話などであっても良い。
図10に示すように、本実施形態に係るハンズフリー通話装置200は、上記の第1の実施形態における画像判定部190及びBSS処理部140を有していない。
マイクロホンアレー230は、複数のマイクロホン131(図11)と、AMNOR処理部235(図10)と、を備えて構成されている。AMNOR処理部235は、雑音の音源(以下、雑音源)の方向に対して、マイクロホンアレー230の指向性を低くする処理を行う。すなわち、雑音源の方向に指向性の谷241、242(図11)を形成する。
以下、図11を参照して、本実施形態の動作を説明する。
AMNORにおいては、目的音方向が既知である事、及び、雑音のみを含んだ信号の受音が可能な事が必要(前提条件)である。
本実施形態の場合も、撮像部170は、第1話者210及び第2話者220を含む画像を撮像する。位置特定部180は、撮像部170による撮像結果に基づいて、第1話者210及び第2話者220の位置を目的音方向として特定する。AMNOR処理部235は、目的音方向については、マイクロホンアレー230の指向性を低くせず、目的音方向以外の方向について、マイクロホンアレー230の指向性を低くする。
マイクロホンアレー230は、位置特定部180により特定された第1話者210及び第2話者220の方向とは異なる方向からの音声を雑音と判定する。例えば、撮像部170の視野に写らない人物(図11の話者以外の発声者250)が存在する場合、AMNOR処理部235は、その人物(その方向の音源)については、雑音源と判定することができる。
なお、AMNOR処理部235は、予め顔の画像情報が登録されている人物(例えば第1話者210及び第2話者220)のみを話者と判定し、それ以外の人物(話者以外の発声者250)については、雑音源と判定するようにしても良い。
また、AMNOR処理部235は、着信時にマイクロホンアレー230により集音された音声から着信音を除去した音声を雑音として認識するように構成されている。これにより、着信以前からスピーカ50から音声が放音されている場合、AMNOR処理部235は、そのスピーカ50を雑音源と判定することができる。
これにより、AMNOR処理部235は、スピーカ50の方向、及び、話者以外の発声者250の方向に、それぞれ指向性の谷241、242が形成されるように、マイクロホンアレー230を制御する。その結果、第1話者210及び第2話者220の発声を含む音声が、送話音声として送話部150より通話相手の通話装置へ送信される。
以上のような第2の実施形態によれば、ハンズフリー通話装置200は、受話部110と、受話部110が受信した受話音声を出力する超音波スピーカ120と、を有する。ハンズフリー通話装置200は、更に、音声を集音するAMNOR方式のマイクロホンアレー230と、マイクロホンアレー230により集音される音声に基づいて送話音声を生成し、該送話音声を送話する送話部150と、を有する。
AMNOR方式のマイクロホンアレー230は、雑音の方向に対するマイクロホンアレー230の指向性を低くする。その結果、話者の声を選択的に、送話部150より通話相手へ送話することができる。
また、超音波スピーカ120により受話音声を出力するため、超音波スピーカ120から(ひいてはハンズフリー通話装置100から)ある程度の距離だけ離れた位置で受話音声が復調し、受話音声が可聴音として再生される。よって、マイクロホンアレー230が受話音声の音響エコーを収音してしまうことを抑制できる。その結果、マイクロホンアレー230は、その音響エコーを雑音として判定する処理と、音響エコーの方向に対する指向性を低くする処理と、の何れも行う必要がない。つまり、AMNOR処理部235の処理が簡単になる。
また、スピーカとして可聴音を出力する通常のスピーカを用いる場合と比べて、雑音の音源数が減るため、マイクロホンアレー230が必要とするマイクロホン131の数を低減することができる。よって、限られた実装スペースにマイクロホンアレー230を容易に実装できるため、本実施形態に係るハンズフリー通話装置200は、携帯通信端末装置としても容易に実現することができる。
20 入力部
21 指向性制御部
30 超音波振動子
40 可聴領域
50 スピーカ
62 振動部材
63 振動子
70 支持部
100 ハンズフリー通話装置
110 受話部
120 超音波スピーカ
130 マイクロホンアレー
131 マイクロホン
140 BSS処理部
150 送話部
170 撮像部
180 位置特定部
190 画像判定部
200 ハンズフリー通話装置
210 第1話者(話者)
220 第2話者(話者)
230 マイクロホンアレー
235 AMNOR処理部
241 指向性の谷
242 指向性の谷
250 話者以外の発声者
a1 キャリア周波数
a2 倍波周波数
a3 3倍波周波数

Claims (7)

  1. 受話音声を受信する受話部と、
    前記受話部が受信した受話音声を出力する超音波スピーカと、
    音声を集音するマイクロホンアレーと、
    前記マイクロホンアレーにより集音された音声から、送話音声を抽出するBSS(Blind Source Separation)処理部と、
    前記BSS処理部により抽出される送話音声を送信する送話部と、
    を有することを特徴とするハンズフリー通話装置。
  2. 画像を撮像する撮像部と、
    前記撮像部による撮像結果に基づいて、話者の発声タイミングを判定する画像判定部と、
    を有し、
    前記BSS処理部は、前記画像判定部により判定された前記発声タイミングに集音された音声から、前記送話音声を抽出することを特徴とする請求項1に記載のハンズフリー通話装置。
  3. 前記BSS処理部は、複数の話者による発声をそれぞれ前記送話音声の一部分ずつとして抽出し、抽出した前記複数の話者による発声を合成することにより、前記送話音声を生成することを特徴とする請求項1又は2に記載のハンズフリー通話装置。
  4. 受話音声を受信する受話部と、
    前記受話部が受信した受話音声を出力する超音波スピーカと、
    音声を集音するAMNOR(Adaptive Microphone−array for NOise Reduction)方式のマイクロホンアレーと、
    前記マイクロホンアレーにより集音される音声に基づいて送話音声を生成し、該送話音声を送話する送話部と、
    を有することを特徴とするハンズフリー通話装置。
  5. 画像を撮像する撮像部と、
    前記撮像部による撮像結果に基づいて、話者の位置を特定する位置特定部と、
    を有し、
    前記マイクロホンアレーは、前記位置特定部により特定された前記話者の方向とは異なる方向に対する指向性を、前記話者の方向の指向性よりも低くすることを特徴とする請求項4に記載のハンズフリー通話装置。
  6. 画像を撮像する撮像部と、
    前記撮像部による撮像結果に基づいて、話者の位置を特定する位置特定部と、
    前記位置特定部により特定された前記話者の位置で音声が再生されるように前記超音波スピーカの指向性を制御する指向性制御部と、
    を有することを特徴とする請求項1乃至5の何れか一項に記載のハンズフリー通話装置。
  7. 前記指向性制御部は、前記超音波スピーカに入力する変調信号を調節することによって、前記超音波スピーカの共振周波数を変化させることにより、前記超音波スピーカの指向性を制御することを特徴とする請求項6に記載のハンズフリー通話装置。
JP2012046229A 2012-03-02 2012-03-02 ハンズフリー通話装置 Pending JP2013183315A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012046229A JP2013183315A (ja) 2012-03-02 2012-03-02 ハンズフリー通話装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012046229A JP2013183315A (ja) 2012-03-02 2012-03-02 ハンズフリー通話装置

Publications (1)

Publication Number Publication Date
JP2013183315A true JP2013183315A (ja) 2013-09-12

Family

ID=49273682

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012046229A Pending JP2013183315A (ja) 2012-03-02 2012-03-02 ハンズフリー通話装置

Country Status (1)

Country Link
JP (1) JP2013183315A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170044393A (ko) * 2015-10-15 2017-04-25 현대모비스 주식회사 차량용 핸즈프리 제어 장치 및 방법
WO2017208820A1 (ja) * 2016-05-30 2017-12-07 ソニー株式会社 映像音響処理装置および方法、並びにプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170044393A (ko) * 2015-10-15 2017-04-25 현대모비스 주식회사 차량용 핸즈프리 제어 장치 및 방법
KR102157811B1 (ko) 2015-10-15 2020-09-18 현대모비스 주식회사 차량용 핸즈프리 제어 장치 및 방법
WO2017208820A1 (ja) * 2016-05-30 2017-12-07 ソニー株式会社 映像音響処理装置および方法、並びにプログラム
US11184579B2 (en) 2016-05-30 2021-11-23 Sony Corporation Apparatus and method for video-audio processing, and program for separating an object sound corresponding to a selected video object
US11902704B2 (en) 2016-05-30 2024-02-13 Sony Corporation Apparatus and method for video-audio processing, and program for separating an object sound corresponding to a selected video object

Similar Documents

Publication Publication Date Title
JP6041382B2 (ja) 音響機器および発振ユニット
JP5741580B2 (ja) 発振装置
EP1775988A1 (en) Speaker system, mobile terminal device, and electronic device
JP5952092B2 (ja) 電子機器
WO2013164999A1 (ja) 電子機器、制御方法及び制御プログラム
US7929725B2 (en) Acoustic apparatus and telephone conversation apparatus
US20140205134A1 (en) Electronic device
CN102165791A (zh) 双模扬声器
CN103283259A (zh) 电子设备
JP6535743B2 (ja) 圧電受話器と超音波発生器の複合構造
CN103339962A (zh) 电子设备
WO2012105254A1 (ja) 電子装置
JP5821241B2 (ja) スピーカ装置及び電子機器
EP2661099B1 (en) Electroacoustic transducer
JP2012015758A (ja) 発振装置、その製造方法、電子機器
JP2013183315A (ja) ハンズフリー通話装置
WO2013024573A1 (ja) 電子機器
JP2012029099A (ja) 音響機器
JP6099320B2 (ja) 電子機器、制御方法及び制御プログラム
JP2013058896A (ja) 電子装置
JP5943046B2 (ja) スピーカ装置及び電子機器
WO2014041587A1 (ja) スピーカ装置及び電子機器
JP2012029102A (ja) 音響システムおよび音響機器
JP5671945B2 (ja) 発振装置および電子機器
JP5817182B2 (ja) スピーカ装置及び電子機器