JP2004129174A - 情報通信装置、情報通信プログラム、及び記録媒体 - Google Patents

情報通信装置、情報通信プログラム、及び記録媒体 Download PDF

Info

Publication number
JP2004129174A
JP2004129174A JP2002320012A JP2002320012A JP2004129174A JP 2004129174 A JP2004129174 A JP 2004129174A JP 2002320012 A JP2002320012 A JP 2002320012A JP 2002320012 A JP2002320012 A JP 2002320012A JP 2004129174 A JP2004129174 A JP 2004129174A
Authority
JP
Japan
Prior art keywords
text
information
voice
input
text information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002320012A
Other languages
English (en)
Inventor
Yoshinaga Kato
加藤 喜永
Atsushi Ito
伊藤 篤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2002320012A priority Critical patent/JP2004129174A/ja
Publication of JP2004129174A publication Critical patent/JP2004129174A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】通信時の環境に応じて、音声あるいは文字の何れかで会話を行うことにより周囲に迷惑をかけない2者間情報通信装置を提供する。
【解決手段】本発明の情報通信装置100は、携帯電話のような持ち運ぶタイプの電話装置であり、携帯電話のキー等の手段によって入力されるテキスト入力手段1と、テキスト情報が音声データに変換されるテキスト音声合成手段2と、外部との通信を司る音声通信手段3と、音声データをスピーカーやイヤホン接続端子に出力する音声出力手段4と、イヤホン5により構成される。また、情報通信装置110は、外部との通信を司る音声通信手段6と、音声データをスピーカーやイヤホン接続端子に出力する音声出力手段8と、マイクロフォンなどの音声入力手段7により構成される。
【選択図】   図1

Description

【0001】
【発明の属する技術分野】
本発明は、情報通信装置に関し、さらに詳しくは、テキスト情報と音声情報を相互に変換する情報通信装置に関するものである。
【0002】
【従来の技術】
近年の携帯電話の普及にはめざましいものがあり、その保有者数は年々増大の一途をたどっている。その爆発的な普及の理由として、基地局との間で通信可能な範囲であれば、どこでも良好な通信状態で使用できることが挙げられる。しかし、その普及に伴って、携帯電話の使用環境によっては通話に伴う声や電波が他人へ迷惑を及ぼすことも指摘されている。例えば、混雑した電車やバス或いは多数の人が一同に会する場所などにおける通話は、他人に不快感を与えるばかりでなく、ペースメーカ等の医療用機器を携帯している人に悪影響を与える可能性もある。しかし、このような問題があるにも拘わらず、依然として車内等で通話する使用者が存在するのは、移動時の通話がコミュニケーション手段として非常に大きな利便性を提供するからである。この問題を解決する一つの方法として、音声通話の代わりに電子メールを使用することが考えられるが、電子メールの場合、相手側も携帯電話あるいはPCなどを使用できれば、電子メールを扱えるので問題ないが、家庭用の固定電話など音声でしか情報をやりとりできない機器から着信した場合、車内の携帯電話利用者は、やむを得ず通話するか、後から着信情報を調べてかけ直さなければならないという不都合があった。
この問題を解決するために、音声通信しか扱えない固定電話などでも電子メールを利用できるシステムが、特開平10−303969号公報や、特開平11−112550号公報に記載されている。この公報には、テキスト音声認識を用いて音声をテキストに変換して、携帯電話などの画面にテキストを表示する技術について開示されており、また、携帯電話からの電子メールをテキスト音声合成により音声データに変換し、固定電話に送信する技術が開示されている。
【特許文献1】特開平10−303969号公報
【特許文献2】特開平11−112550号公報
【0003】
【発明が解決しようとする課題】
このように、前記特開平10−303969号公報や、特開平11−112550号公報による発明では、音声を認識してテキスト情報に変換してPCに電子メールを送ったり、逆に、テキスト情報を音声合成音に変換して通話することができる。しかしながら、電子メールは、音声会話のような即時性をもつコミュニケーション形態には向いていない。つまり、送信したメールは、受信者が自分のメールを読もうとするまではメールサーバに蓄積されたままの状態であり、即座に反応することができない。従って、親密なコミュニケーションを求めるユーザにとって、電子メールのやりとりは、音声通話と同等程度のコミュニケーションができないという物足りなさがあり、利用者にとって十分に満足できるニ者間情報通信装置を提供できていないのが現状である。
本発明は、かかる課題に鑑み、通信時の環境に応じて、音声あるいは文字の何れかで会話を行うことにより周囲に迷惑をかけない2者間情報通信装置を提供することを目的とする。
【0004】
【課題を解決するための手段】
本発明はかかる課題を解決するために、請求項1は、音声若しくはテキスト情報の授受を有線若しくは無線により行う情報通信装置において、入力されたテキスト情報に基づいて音声データに変換するテキスト音声合成手段と、音声入力モードとテキスト入力モードを切り替える入力切り替え手段と、を更に備え、情報の送信に際して、前記入力切り替え手段によりテキスト入力モードに切り替えた後、音声に代わってテキスト情報を入力することにより、前記テキスト情報を前記テキスト音声合成手段により音声データに変換して送信することを特徴とする。
例えば、情報通信装置が携帯電話である場合、電車の車内等で、携帯電話に着信があった際、音声により通話をすることができない場合がある。そのような場合、入力切り替え手段により携帯電話をテキスト入力モードに切替え、相手の音声をイヤホンで聞きながら、キーによりテキスト情報を入力する。その情報は携帯電話のテキスト音声合成手段により音声データに変換され、相手に送信される。
かかる発明によれば、携帯電話にテキスト音声合成手段を搭載することにより、音声の代わりにキーからテキスト情報を入力し、その情報を音声に変換して送信するので、周囲に迷惑をかけることなく、通話が音声により可能となる。
【0005】
請求項2は、音声若しくはテキスト情報の授受を有線若しくは無線により行う情報通信装置において、入力されたテキスト情報に基づいて音声データに変換するテキスト音声合成手段と、受信した音声データに基づいてテキスト情報に変換する音声認識手段と、音声入力モードとテキスト入力モードを切り替える入力切り替え手段と、を更に備え、情報の送信に際して、前記入力切り替え手段によりテキスト入力モードに切り替えた後、音声に代わってテキスト情報を入力することにより、前記テキスト情報を前記テキスト音声合成手段により音声データに変換して送信し、情報の受信に際しては、受信した音声データを前記音声認識手段によりテキスト情報に変換して表示することを特徴とする。
前記請求項1の発明は、受信は通常の音声により行い、送信のみテキスト情報を音声に変換して通話するものである。しかし、この場合、返事はキーから入力するため相手の音声をイヤホンで聞かなければならず面倒であり、しかもイヤホンを常備しなければならない。これを解消するために、請求項2の発明では、音声認識手段を更に備えて、受信時の相手の音声をテキスト情報に変換して表示するものである。
かかる発明によれば、送信と受信をテキスト情報により行うため、イヤホンを必要とせず、しかも周囲に迷惑をかけることなく情報の授受が可能となる。
請求項3は、音声若しくはテキスト情報の授受を有線若しくは無線により行う情報通信装置において、受信したテキスト情報に基づいて音声データに変換するテキスト音声合成手段と、入力した音声データに基づいてテキスト情報に変換する音声認識手段と、音声入力モードとテキスト入力モードを切り替える入力切り替え手段と、を更に備え、情報の送信に際して、前記入力切り替え手段により音声入力モードに切り替えた後、音声データを入力することにより、前記音声データを前記音声認識手段によりテキスト情報に変換して送信し、情報の受信に際しては、受信したテキスト情報を前記テキスト音声合成手段により音声データに変換することを特徴とする。
例えば、車内の携帯電話とテキスト機能を持たない固定電話間、或いは車内の携帯電話と周囲に迷惑がかからない環境にある携帯電話間で情報の授受を行う場合、車内の携帯電話からはテキスト情報でのみ送受信が行えない状況にあるので、固定電話あるいは他の携帯電話側にテキスト音声合成手段と音声認識手段を備え、受信の際はテキスト音声合成手段によりテキスト情報を音声に変換し、送信の際は音声データを音声認識手段によりテキスト情報に変換する。
かかる発明によれば、テキスト情報を音声に、音声データをテキスト情報に変換するので、テキスト機能を持たない固定電話でも全てテキスト情報のみで情報の授受を行う車内の携帯電話との通信が可能となる。
【0006】
請求項4は、前記音声認識手段により受信した音声データをテキスト情報に変換して表示する際、送信したテキスト情報と受信したテキスト情報が同一表示画面の上下に分離して表示されることを特徴とする。
携帯電話の場合、必ず液晶等の表示部が備わっている。従って、メールなどのテキスト情報を送る場合その表示画面を見ながらキー操作を行うのは公知の技術である。本発明は送信のテキスト情報と、相手から受信したテキスト情報を、表示部の上下に分離して表示することにより、見やすい表示部を実現するものである。
かかる発明によれば、送受信のテキスト情報が同一表示画面上の上下に分離して表示されるので、送信情報と受信情報が見やすくなり、操作の誤りを減少することができる。
請求項5は、前記音声認識手段により受信した音声データをテキスト情報に変換して表示する際、送信したテキスト情報と受信したテキスト情報が時系列に同一表示画面に表示されることを特徴とする。
インターネットにチャット(chat)という通信モードがある。これは、メールの送受信のやり取りを、リアルタイムに時系列にテキスト表示して、あたかも、電話で会話しているように通信するものである。本発明はこれと同じように、送信したテキスト情報と変換された受信テキスト情報を時系列に表示するものである。
かかる発明によれば、送受信のテキスト情報が、時系列に表示部に表示されるので、情報の流れが容易にわかり、電話で会話しているように通信することができる。
【0007】
請求項6は、前記受信したテキスト情報の先頭部位に該テキスト情報を送信した送信元を特定する文字若しくは符号を表示することを特徴とする。
前記請求項5の場合、相手の受信テキスト情報と送信テキスト情報の区別ができないので、時系列に表示されていても、どちらが送信側か受信側かが判然としない。そこで、本発明では、相手の受信テキスト情報の先頭にそれを区別する文字、符号等を同時に表示するものである。例えば、相手の名前が電話番号、或いはメールアドレスと同時に登録されていれば、名前を表示することが可能である。
かかる発明によれば、受信相手のテキスト情報に識別のための文字、符号等を付加するので、受信と送信テキスト情報の区別が明確になり、通信の効率を高めることができる。
請求項7は、所定の特殊キーの組み合わせと、該組み合わせに対応付けられたテキスト情報を記憶するテキストデータベースを更に備え、前記テキスト入力モード時に前記特殊キーが入力された場合、該特殊キーに対応するテキスト情報を前記テキストデータベースにより検索し、該検索結果を前記テキスト音声合成手段に出力するか、若しくは前記テキスト情報をそのまま送信することを特徴とする。
テキスト情報で通信を行う場合、最大の欠点は、会話と異なりリアルタイム性が劣ることである。これは、入力手段がキーにより行うためである。そこで、本発明では、この課題を少しでも解消するために、キー入力の負荷を減らす目的で、通常あまり使われない特殊キーに会話で頻繁に使用される「うなずく」「感嘆詞」「返事」等のテキスト情報を対応付けてデータベースに登録しておく。そして、その特殊キーが入力されるとデータベースから登録テキスト情報を検索して出力するものである。
かかる発明によれば、特殊キーを頻繁に使用されるテキスト情報と対応付けてデータベースに登録しておくので、テキスト情報による通信のリアルタイム性を高めることができる。
【0008】
請求項8は、所定の特殊キーの組み合わせと、該組み合わせに対応付けられた音声データを記憶する音声データベースを更に備え、前記テキスト入力モード時に前記特殊キーが入力された場合、該特殊キーに対応する音声データを前記音声データベースに基づいて検索し、該検索結果を送信することを特徴とする。
前記請求項7では、特殊キーとテキスト情報を対応付けてデータベースに登録したが、本発明では、特殊キーと音声データを対応付けてデータベースに登録しておき、特殊キーが入力されるとデータベースから登録音声データを検索して出力するものである。
かかる発明によれば、特殊キーを頻繁に使用される音声データと対応付けてデータベースに登録しておくので、テキスト情報による通信のリアルタイム性を高めることができる。
請求項9は、前記テキスト音声合成手段は、複数の異なる声種が個別に登録されている音素片辞書と、性別が判断可能な情報により構成される送信者情報に基づいて前記音素片辞書から所定の音素片辞書を選択する送信者特定手段と、入力されたテキストに対応する音声を合成する音声合成エンジンと、を備え、前記テキスト入力モード時にテキスト情報が入力された場合、前記音声合成エンジンは前記送信者特定手段により選択された音素片辞書を用いて、前記テキスト情報を音声合成することを特徴とする。
テキスト情報から音声合成して音声として相手に送信する場合、音声合成の声の種類は一般的には機械的な合成音である。しかし、この合成音は場合によっては必要であるが、限られた仲間や親しい友人間の通信では味気ないものである。そこで、本発明では異なる種類の音種、例えば、男性、女性、機械的な合成音、或いは実際に本人の声等を音素片辞書と呼ばれるデータベースに登録しておき、送信者情報により音素片辞書を選択して、テキスト情報をこの選択された音種で変換して出力するものである。
かかる発明によれば、テキスト情報が選択された音種により音声合成されて出力されるので、さらに親密なコミュニケーションを実現することができる。
【0009】
請求項10は、前記送信者特定手段は、送信先の性別に対応した音素片辞書を選択することを特徴とする。
音素片辞書から特定の音素を選択するのは、送信者特定手段である。この送信者特定手段に対して指令を与えるのが、送信者情報である。送信者情報は主に送信先の性別を指定するものであり、送信者が男性であれば男性の音素を選択する。
かかる発明によれば、送信者の性別に応じて音素を選択するので、通信に自然の雰囲気を創り出すことができる。
請求項11は、前記入力切り替え手段は、通信が終了した時点で、前記音声入力モードに自動的に切り替わることを特徴とする。
本発明による通信装置には通常の音声入力モードと、テキスト入力モードがある。例えば、車内で相手から携帯電話に受信があった場合、音声による通信が不可能な場合、この入力切り替え手段によりテキスト入力モードに切替えて、通信を行うことができる。従って、通信が終了した時点で、音声入力モードに自動的に戻っておく必要がある。
かかる発明によれば、通信が終了した時点で、音声入力モードに自動的に戻るので、受信は必ず通常の音声モードで通話を行うことができる。
請求項12は、コンピュータを請求項1乃至11の何れか一項に記載の情報通信装置として機能させることを特徴とする。
コンピュータにより本発明の機能を実現するためには、そのコンピュータのOS(オペレーティングシステム)環境に合ったソフトウェアによりプログラミングされる必要がある。
かかる発明によれば、同じOS環境のコンピュータであれば、同じプログラムで何処でも本発明の情報通信装置として機能させることができる。
請求項13は、請求項12に記載の情報通信プログラムを記録したことを特徴とする。
また、前記プログラムが同じOS環境のコンピュータ上で機能するために、そのプログラムを持ち運び可能なフレキシブルディスク、CD、MO、MD等の記録媒体に記録しておくことが好ましい。
かかる発明によれば、本発明の情報通信プログラムを持ち運び可能な記録媒体に記録するので、同じOS環境のコンピュータであれば何処でも情報通信装置として機能させることができる。
【0010】
【発明の実施の形態】
以下、本発明を図に示した実施形態を用いて詳細に説明する。但し、この実施形態に記載される構成要素、種類、組み合わせ、形状、その相対配置などは特定的な記載がない限り、この発明の範囲をそれのみに限定する主旨ではなく単なる説明例に過ぎない。
図1は本発明の第1の実施形態に係る情報通信装置の構成図である。以下、各実施の形態の説明では、本発明の情報通信装置を電話(固定電話や携帯電話)に組み込んだものとして説明する。また、本発明の情報通信装置の組込み対象は、電話に限ったものではなく、小型携帯情報端末(PDA)など情報通信機能を有する装置であれば組み込むことで同様の効果を期待できる。
本発明の情報通信装置100は、携帯電話のような持ち運ぶタイプの電話装置であり、携帯電話のキー等の手段によって入力されるテキスト入力手段1と、テキスト情報が音声データに変換されるテキスト音声合成手段2と、外部との通信を司る音声通信手段3と、音声データをスピーカーやイヤホン接続端子に出力する音声出力手段4と、イヤホン5により構成される。また、情報通信装置110は、外部との通信を司る音声通信手段6と、音声データをスピーカーやイヤホン接続端子に出力する音声出力手段8と、マイクロフォンなどの音声入力手段7により構成される。
この実施形態において、情報通信装置100のテキスト入力手段1は、携帯電話のキー等の手段によって入力されるものであり、公知技術であるため詳細は省略する。これにより入力されたテキストは、テキスト音声合成手段2により、音声データに変換される。変換された音声データは、音声通信手段3によって情報通信装置110に伝えられ、情報通信装置110の音声出力手段8によりスピーカーやイヤホンによって出力される。情報通信装置110は通常の電話と呼ばれるものそのものである。また、情報通信装置110はマイクロフォンなどの音声入力手段7によって入力された音声データは、音声通信手段6によって、情報通信装置100に送られ、イヤホン5に接続された音声出力手段4によって出力される。以上のように、情報通信装置100が電車などのマナーを要求される場所においても、音声による通信をしないため、周りに迷惑をかけることなく、内容を情報通信装置110側に伝えることができ、また、情報通信装置110側の内容もイヤホン5等で聞いているため、周りに迷惑をかけることなく、内容を得ることができる。
【0011】
図2は、本発明の第2の実施形態に係る情報通信装置の構成図である。同じ構成要素には同じ参照番号が付されているので、重複する説明は省略する。本発明の情報通信装置120は、携帯電話のような持ち運ぶタイプの電話装置であり、携帯電話のキー等の手段によって入力されるテキスト入力手段10と、テキスト情報が音声データに変換されるテキスト音声合成手段11と、外部との通信を司る音声通信手段14と、音声データをテキスト情報に変換する音声認識手段13と、テキスト情報を表示若しくは印字するテキスト出力手段12により構成される。また、情報通信装置110は、前記第1の実施形態外部と同様であるので説明を省略する。図2が図1と異なる点は、音声出力手段4とイヤホン5の代わりに、音声認識手段13とテキスト出力手段12を備え、情報通信装置120において受信した音声データは、音声認識手段13によってテキストに変換される点である。これにより、ユーザはこれを見ることで、わざわざイヤホン等の装置をつけることもなく、マナーの必要な環境でBのユーザと会話をすることができる。
図3は、このときの情報通信装置120における画面例である。このように画面20の上部21では、情報通信装置110から送られた音声データからテキスト化されたテキストが順に表示される。画面20の下部22は、情報通信装置120から送るテキストを表示する。現在「てれび」という文字23を入力し、かな漢字変換をしようとしているところである。テキスト入力手段10では、一文が入力されるたびに、テキスト音声合成手段11に送り、音声データに変換する。このようにして、情報通信装置120側ではテキストのみで会話が可能となる。
【0012】
図4は別の画面例である。この例では、入出力されたテキスト25が時系列に表示される。その際、情報通信装置110から受信したもの26に関しては、先頭に送信者の名前をつけて表示する。この例では「太郎」26aとして名前を表示する。送信者の名前を知ることは、アドレス帳に登録しておき、電話番号からその電話番号を持つ人間の名前を表示すればよく、これは、携帯電話の着信表示などにおいて広く行われている方法であり、公知である。なお、アドレス帳に登録されていない送信者の場合は、「相手」または「不明」と表示すればよい。このようにして、ユーザは時系列を把握しつつ、テキストのみで会話ができる。
図5は、本発明の第3の実施形態に係る情報通信装置の構成図である。本発明の情報通信装置140は、携帯電話のような持ち運ぶタイプの電話装置であり、携帯電話のキー等の手段によって入力されるテキスト入力手段30と、外部との通信を司るテキスト通信手段32と、テキスト情報を表示若しくは印字するテキスト出力手段31により構成される。また、情報通信装置150は、外部との通信を司るテキスト通信手段33と、テキスト情報が音声データに変換されるテキスト音声合成手段34と、音声データをスピーカーやイヤホン接続端子に出力する音声出力手段35と、マイクロフォンなどの音声入力手段37と、音声データをテキスト情報に変換する音声認識手段36により構成される。
この実施形態では、図1、2の装置の場合と異なり、テキストによって通信を行なう。情報通信装置140は従来のテキストで通信が可能な携帯電話である。また、情報通信装置150は、固定電話や、マナーモードにする必要の無い場合の携帯電話である。情報通信装置140のテキスト入力手段30から入力したテキストは、そのままテキスト通信手段32によって情報通信装置150に送られる。情報通信装置150ではテキスト音声合成手段34によって、音声データに変換し、音声出力手段35によって、スピーカー等からユーザに伝えられる。情報通信装置150の音声入力手段37において入力された音声は、音声データに変換され、音声認識手段36によってテキストに変換されて、テキスト通信手段33によって、情報通信装置140に送られる。情報通信装置140では、テキスト出力手段31によって、情報通信装置140の画面に出力される。これにより、携帯電話側は従来の装置をそのまま使うことができ、さらに、固定電話などの音声会話が必要な相手に対しても、周りのマナーを気にせず、通信をすることができる。
【0013】
図6は、本発明の第1〜第3の実施形態に係る情報通信装置のテキスト入力手段の部分を説明する構成図である。テキスト入力手段40は、通常あまり使用されない特殊キーを入力する特殊キー入力手段41と、この特殊キーに対応したテキスト情報を登録するテキスト登録手段42と、特殊きーの組合わせと、それに対応するテキスト情報を記憶するテキストデータベース43から構成され、その結果がテキスト音声合成手段44と、テキスト通信手段45に出力される。この実施形態では、まずテキスト登録手段42によって、テキストがテキスト装置内のテキストデータベース43に登録される。これは、キーとテキスト情報の組合わせであり、次のようなものである。例えば、キーは、#や*などのような通常使わないキーを含むキーの列でよい。また、その装置に新たなキー(例えば図7の「☆」)を設けても良い。テキストを登録する手段については、携帯電話の定型句登録手段などの公知技術を使用することができ、ここでは説明を省略する。また、特殊キー入力手段41は、キーが入力されるたびに、テキストデータベース43にマッチするものがあるか否かを、データベース上の項目から順に調べる。マッチするものが見つかった場合、そのキーに対応するテキストをテキスト音声合成手段44またはテキスト通信手段45に出力する。これにより、事前に登録しておいたテキストを簡単なキー操作で出力できるため、相手が音声で会話をしていても、即座に応答することができる。また、テキストデータベース43には、図7の例のようにキー項目46の#に対応してテキスト項目47の「うん」といった、うなずきを意味するテキストを登録しておくので、対話をするにあたって、間を空けることなく、自然な会話ができる。また、キー項目46の*#に対応してテキスト項目47のように「えええー。」といった、否定を意味するテキストを登録しておくので、対話をするにあたって、相手の発言に異論がある場合、即座にその意を示すことができる。また、キー項目46の**#に対応してテキスト項目47のように「なんで?」といった、疑問を意味するテキストを登録しておくので、対話をするにあたって、相手の発言に疑問がある場合、即座にその意を示すことができる。
【0014】
図8は、本発明の第4の実施形態に係る情報通信装置のテキスト入力モード時における音声入力手段の部分を説明する構成図である。本実施形態は、第1、第2の実施形態におけるテキスト入力手段とテキスト音声合成手段とを図8で置き換えたものである。音声入力手段50は、通常あまり使用されない特殊キーを入力する特殊キー入力手段51と、この特殊キーに対応した音声情報を登録する音声データ登録手段52と、特殊キーの組合わせと、それに対応する音声情報を記憶する音声データベース53から構成され、その結果が音声通信手段54に出力される。この実施形態では、まず音声データ登録手段52によって、音声データが登録される。これは、留守番応答録音などによって知られる技術によって、携帯電話のマイクロフォンから録音することで実現できる。また、それ以外にも登録しておくデータがあっても構わない。
音声データベース53は図9のようなものなる。例えば、キー項目55の#に対応して音声データ項目57の「うん」といった、うなずきを意味する音声データを登録しておくので、対話をするにあたって、間を空けることなく、自然な会話ができる。また、キー項目55の*#に対応して音声データ項目57のように「えええー。」といった、否定を意味する音声データを登録しておくので、対話をするにあたって、相手の発言に異論がある場合、即座にその意を示すことができる。また、キー項目55の**#に対応して音声データ項目57のように「なんで?」といった、疑問を意味する音声データを登録しておくので、対話をするにあたって、相手の発言に疑問がある場合、即座にその意を示すことができる。このように、変更可項目56が「不可」になっている項目の音声データは事前に登録され変更できない。また、いくつかのデータは、ユーザがマイクロフォンから録音することで登録することができる。このように、特殊キーが押されたとき、このデータベース53を調べ、キーに一致する音声データを音声通信手段に出力する。これにより、あらかじめ録音しておいた音声データを出力するため、電車内などマナーを必要とする場所でも周りを気にすることなく、会話をすることができる。また、音声データベース53にはこの例のように「うん」といった、うなずきを意味する音声データを登録しておくので、対話をするにあたって、間を空けることなく、自然な会話ができる。また、音声データベース53にはこの例のように「えええー。」といった、否定を意味する音声データを登録しておくので、対話をするにあたって、相手の発言に異論がある場合、即座にその意を示すことができる。また、音声データベース53にはこの例のように「なんで?」といった、疑問を意味する音声データを登録しておくので、対話をするにあたって、相手の発言に疑問がある場合、即座にその意を示すことができる。
【0015】
図10は、本発明の第5の実施形態に係る情報通信装置のテキスト音声合成手段の部分を説明する構成図である。テキスト音声合成手段61は、複数の異なる声種が個別に登録されている音素片辞書65と、性別が判断可能な情報により構成される送信者情報63に基づいて、前記音素片辞書65から所定の音素片辞書を選択する送信者特定手段64と、テキスト入力手段60により入力されたテキストに対応する音声を合成する音声合成エンジン62により構成され、音声合成エンジン62により合成された音声データは音声通信手段66に出力される。ここで、音素片辞書65は性別を表す3種類(男性65a、女性65b、ロボット65c)が用意されている。この構成では、テキスト入力手段60によりテキストが音声合成エンジン62に入力されると、音声合成エンジン62は、送信者特定手段64が選択した音素片辞書を用いて、それぞれの声種で入力テキストを読み上げて音声データとして出力する。この時、送信者特定手段64が送信者情報63を用いて辞書を選択している。送信者情報63は、性別を判断できる情報であればどのような情報でもよい。例えば、図11のように携帯電話であれば登録リストの補助情報欄に性別を登録しておけばよい。図11は、従来のリストと同様に登録名70、電話番号73の他に、E−mail72などの補助情報を登録できるようになっている。ここで、補助情報として性別欄71を設け、登録名に対応する性別を登録しておく。また、一番目の行は、送信者自身を登録しておく。ここで、性別欄71の記号が♂であれば男性音素片辞書に、♀であれば女性音素片辞書に切替える。
【0016】
第1と第2の実施形態の場合、送信者本人の属性に適合した音声データを合成するので、その声種は送信者本人の性別にすればよいので、図11の登録リストの中から本人の行の性別情報を送信する。本実施形態において、本人の性別は♂であるので、送信者特定手段64は男性音素片辞書65aを選択する。一方、図5の第3の実施形態の場合、受信者側の音声データを合成する。例えば、図5の情報通信装置150が図11の相手1と通話している場合、性別が♀であるので、送信者特定手段は女性音素片辞書65bを選択する。このように登録リストに性別が登録されていれば、入力したテキストを自分または相手の属性(例では性別)に適合する合成音に変換して会話することができる。しかしながら、リストに登録されていない場合や、図11の相手2のように性別が登録されていない場合には、性別を判断できない。このような場合には、ロボット音声65cを選択する。この結果、受信者のテキスト音声合成データの声種を中性的に扱うことができる。
以上の例では、送信者情報に登録リストを利用したが、携帯電話に割り当てられたボタンを使用して、手動により送信者情報を送信者特定手段64に入力してもかまわない。この場合、例えば、図1、図2に示した構成において、送信者本人の属性を相手に知らせたくない場合は、手動でロボット音声に切替えて会話することも可能である。また、本実施形態では、属性を表すのに性別を取り上げ、その属性を表現するための音素片辞書を用意したが、属性はこれらに限ったものではない。例えば、属性を年代として、老人、子供などの声種をもつ音素片辞書を用意してもかまわない。この場合、送信者情報として年代の情報を送信者特定手段64に入力すればよい。これにより、テキストを自分または相手の属性に適合する声種に切替えて音声合成することができるので、どちらか一方がテキストによる会話を行なっていても、従来に比べて親密なコミュニケーションができる。
【0017】
なお、本発明による通信装置には、通常の音声入力モードと、テキスト入力モードとがある。通信開始時のモードについては、用途に応じて以下のように決めることができる。
(1)音声入力モードをデフォルトにする。テキストによる会話を行う場合は、常にテキスト入力モードに切替えてから使用する。もし、テキスト入力モードによる通信を行っていた場合、通信が終了した時点で、本装置が、音声入力モードに自動的に切替える。音声による通話を主に使用している人に便利である。
(2)テキスト入力モードをデフォルトにする。音声による通話を行う場合は、常に音声入力モードに切替えてから使用する。もし、テキスト入力モードによる通信を行っていた場合、通信が終了した時点で、本装置がテキスト入力モードに自動的に切替える。テキストによる会話を主に使用している人に便利である。
(3)前回の通信モードを保持しておく。音声による通話を行っていた場合は、通信終了時も音声入力モードのままにしておく。逆にテキストによる会話を行っていた場合は、テキスト入力モードのまま通信を終了する。通信開始時に所望するモードになっていなかった場合は、所望のモードに切替えてから使用する。どちらのモードも同じ頻度で使用している人に便利である。
【0018】
図12は、上述した実施形態を構成する各機能をそれぞれプログラム化し、あらかじめCD−ROM84などの記録媒体に書き込んでおき、このCD−ROM84をCD−ROMドライブ83のような媒体駆動装置を搭載したコンピュータに装着して、これらのプログラムをコンピュータのメモリ81あるいはハードディスク82のような記憶装置に格納し、それを実行することによっても、本発明の目的を達成できる。この場合、記録媒体から読み出されたプログラム自体が上述した実施の形態の機能を実現することになり、そのプログラムおよびそのプログラムを記録した記録媒体も本発明を構成することになる。なお、記録媒体としては半導体媒体(例えば、ROM、不揮発性メモリカードなど)、光媒体(例えば、DVD、MO、MD、CD−R等)、磁気媒体(例えば、磁気テープ、フレキシブルディスク等)のいずれであってもよい。また、ロードしたプログラムを実行することにより上述した実施形態の機能が実現されるだけでなく、そのプログラム82aの指示に基づき、オペレーティングシステム(OS)82bなどが実際の処理の一部または全部を行い、その処理によって上述した実施の形態の機能が実現される場合も含まれる。
また、上述した実施形態の機能を実現するプログラム82aが、機能拡張ボードや機能拡張ユニットに備わるメモリにロードされ、そのプログラムの指示に基き、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって、上述した実施例の機能が実現される場合も含まれる。さらに、上述したプログラムをサーバコンピュータの磁気ディスクなどの記憶装置に格納しておき、通信網で接続されたユーザのコンピュータからダウンロードの形式で頒布する場合、このサーバコンピュータの記憶装置も本発明の記録媒体に含まれる。
【0019】
【発明の効果】
以上記載のごとく請求項1の発明によれば、携帯電話にテキスト音声合成手段を搭載することにより、音声の代わりにキーからテキスト情報を入力し、その情報を音声に変換して送信するので、周囲に迷惑をかけることなく、通話が音声により可能となる。
また請求項2では、送信と受信をテキスト情報により行うため、イヤホンを必要とせず、しかも周囲に迷惑をかけることなく情報の授受が可能となる。
また請求項3では、テキスト情報を音声に、音声データをテキスト情報に変換するので、テキスト機能を持たない固定電話でも全てテキスト情報のみで情報の授受を行う車内の携帯電話との通信が可能となる。
また請求項4では、送受信のテキスト情報が同一表示画面上の上下に分離して表示されるので、送信情報と受信情報が見やすくなり、操作の誤りを減少することができる。
また請求項5では、送受信のテキスト情報が、時系列に表示部に表示されるので、情報の流れが容易にわかり、電話で会話しているように通信することができる。
また請求項6では、受信相手のテキスト情報に識別のための文字、符号等を付加するので、受信と送信テキスト情報の区別が明確になり、通信の効率を高めることができる。
また請求項7では、特殊キーを頻繁に使用されるテキスト情報と対応付けてデータベースに登録しておくので、テキスト情報による通信のリアルタイム性を高めることができる。
また請求項8では、特殊キーを頻繁に使用される音声データと対応付けてデータベースに登録しておくので、テキスト情報による通信のリアルタイム性を高めることができる。
また請求項9では、テキスト情報が選択された音種により音声合成されて出力されるので、さらに親密なコミュニケーションを実現することができる。
また請求項10では、送信者の性別に応じて音素を選択するので、通信に自然の雰囲気を創り出すことができる。
また請求項11は、通信が終了した時点で、音声入力モードに自動的に戻るので、必ず通常の音声モードで通話を行うことができる。
また請求項12は、同じOS環境のコンピュータであれば、同じプログラムで何処でも本発明の情報通信装置として機能させることができる。
また請求項13は、本発明の情報通信プログラムを持ち運び可能な記録媒体に記録するので、同じOS環境のコンピュータであれば何処でも情報通信装置として機能させることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る情報通信装置の構成図である。
【図2】本発明の第2の実施形態に係る情報通信装置の構成図である。
【図3】本発明の情報通信装置における画面例を表す図である。
【図4】本発明の情報通信装置における別の画面例を表す図である。
【図5】本発明の第3の実施形態に係る情報通信装置の構成図である。
【図6】本発明の第3の実施形態に係る情報通信装置のテキスト入力手段の部分を説明する構成図である。
【図7】本発明のテキストデータベースの一例を示す図である。
【図8】本発明の第4の実施形態に係る情報通信装置のテキスト入力モード時における音声入力手段の部分を説明する構成図である。
【図9】本発明の音声データベースの一例を示す図である。
【図10】本発明の第5の実施形態に係る情報通信装置のテキスト音声合成手段の部分を説明する構成図である。
【図11】本発明の登録リストの一例を示す図である。
【図12】本発明のプログラムとしての実施形態を説明する図である。
【符号の説明】
1 テキスト入力手段、2 テキスト音声合成手段、3、6 音声通信手段、4、8 音声出力手段、5 イヤホン、7 音声入力手段、110 情報通信装置

Claims (13)

  1. 音声若しくはテキスト情報の授受を有線若しくは無線により行う情報通信装置において、入力されたテキスト情報に基づいて音声データに変換するテキスト音声合成手段と、音声入力モードとテキスト入力モードを切り替える入力切り替え手段と、を更に備え、
    情報の送信に際して、前記入力切り替え手段によりテキスト入力モードに切り替えた後、音声に代わってテキスト情報を入力することにより、前記テキスト情報を前記テキスト音声合成手段により音声データに変換して送信することを特徴とする情報通信装置。
  2. 音声若しくはテキスト情報の授受を有線若しくは無線により行う情報通信装置において、入力されたテキスト情報に基づいて音声データに変換するテキスト音声合成手段と、受信した音声データに基づいてテキスト情報に変換する音声認識手段と、音声入力モードとテキスト入力モードを切り替える入力切り替え手段と、を更に備え、
    情報の送信に際して、前記入力切り替え手段によりテキスト入力モードに切り替えた後、音声に代わってテキスト情報を入力することにより、前記テキスト情報を前記テキスト音声合成手段により音声データに変換して送信し、情報の受信に際しては、受信した音声データを前記音声認識手段によりテキスト情報に変換して表示することを特徴とする情報通信装置。
  3. 音声若しくはテキスト情報の授受を有線若しくは無線により行う情報通信装置において、受信したテキスト情報に基づいて音声データに変換するテキスト音声合成手段と、入力した音声データに基づいてテキスト情報に変換する音声認識手段と、音声入力モードとテキスト入力モードを切り替える入力切り替え手段と、を更に備え、
    情報の送信に際して、前記入力切り替え手段により音声入力モードに切り替えた後、音声データを入力することにより、前記音声データを前記音声認識手段によりテキスト情報に変換して送信し、情報の受信に際しては、受信したテキスト情報を前記テキスト音声合成手段により音声データに変換することを特徴とする情報通信装置。
  4. 前記音声認識手段により受信した音声データをテキスト情報に変換して表示する際、送信したテキスト情報と受信したテキスト情報が同一表示画面の上下に分離して表示されることを特徴とする請求項1又は2又は3に記載の情報通信装置。
  5. 前記音声認識手段により受信した音声データをテキスト情報に変換して表示する際、送信したテキスト情報と受信したテキスト情報が時系列に同一表示画面に表示されることを特徴とする請求項1又は2又は3に記載の情報通信装置。
  6. 前記受信したテキスト情報の先頭部位に該テキスト情報を送信した送信元を特定する文字若しくは符号を表示することを特徴とする請求項5に記載の情報通信装置。
  7. 所定の特殊キーの組み合わせと、該組み合わせに対応付けられたテキスト情報を記憶するテキストデータベースを更に備え、前記テキスト入力モード時に前記特殊キーが入力された場合、該特殊キーに対応するテキスト情報を前記テキストデータベースにより検索し、該検索結果を前記テキスト音声合成手段に出力するか、若しくは前記テキスト情報をそのまま送信することを特徴とする請求項1乃至6の何れか一項に記載の情報通信装置。
  8. 所定の特殊キーの組み合わせと、該組み合わせに対応付けられた音声データを記憶する音声データベースを更に備え、前記テキスト入力モード時に前記特殊キーが入力された場合、該特殊キーに対応する音声データを前記音声データベースに基づいて検索し、該検索結果を送信することを特徴とする請求項1乃至6の何れか一項に記載の情報通信装置。
  9. 前記テキスト音声合成手段は、複数の異なる声種が個別に登録されている音素片辞書と、性別が判断可能な情報により構成される送信者情報に基づいて前記音素片辞書から所定の音素片辞書を選択する送信者特定手段と、入力されたテキストに対応する音声を合成する音声合成エンジンと、を備え、
    前記テキスト入力モード時にテキスト情報が入力された場合、前記音声合成エンジンは前記送信者特定手段により選択された音素片辞書を用いて、前記テキスト情報を音声合成することを特徴とする請求項1乃至6の何れか一項に記載の情報通信装置。
  10. 前記送信者特定手段は、送信先の性別に対応した音素片辞書を選択することを特徴とする請求項9に記載の情報通信装置。
  11. 前記入力切り替え手段は、通信が終了した時点で、前記音声入力モードに自動的に切り替わることを特徴とする請求項1乃至6の何れか一項に記載の情報通信装置。
  12. コンピュータを請求項1乃至11の何れか一項に記載の情報通信装置として機能させることを特徴とする情報通信プログラム。
  13. 請求項12に記載の情報通信プログラムを記録したことを特徴とするコンピュータ読取り可能な記録媒体。
JP2002320012A 2002-08-06 2002-11-01 情報通信装置、情報通信プログラム、及び記録媒体 Pending JP2004129174A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002320012A JP2004129174A (ja) 2002-08-06 2002-11-01 情報通信装置、情報通信プログラム、及び記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002228907 2002-08-06
JP2002320012A JP2004129174A (ja) 2002-08-06 2002-11-01 情報通信装置、情報通信プログラム、及び記録媒体

Publications (1)

Publication Number Publication Date
JP2004129174A true JP2004129174A (ja) 2004-04-22

Family

ID=32300863

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002320012A Pending JP2004129174A (ja) 2002-08-06 2002-11-01 情報通信装置、情報通信プログラム、及び記録媒体

Country Status (1)

Country Link
JP (1) JP2004129174A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005354320A (ja) * 2004-06-09 2005-12-22 Sony Corp 通信処理装置、通信処理システム及び通信処理方法
JP2007235810A (ja) * 2006-03-03 2007-09-13 Nec Corp 携帯電話システムおよび携帯電話装置
JP2008124972A (ja) * 2006-11-15 2008-05-29 Nec Corp 通信システム、通信方法、および携帯端末装置
JP2009044679A (ja) * 2007-08-10 2009-02-26 Sharp Corp 無声通話機能付携帯通信端末、及び無声通話機能付携帯通信端末の制御方法
WO2015083741A1 (ja) * 2013-12-03 2015-06-11 株式会社リコー 中継装置、表示装置および通信システム
KR20160005075A (ko) * 2013-05-02 2016-01-13 사로니코스 트레이딩 앤드 서비스즈, 유니페쏘알 엘디에이 전화 호출의 수신자가 말하기가 부적당하다고 판단할 때 전화 호출에 응답하는 장치, 및 관련 방법
JP2017517228A (ja) * 2014-05-23 2017-06-22 サムスン エレクトロニクス カンパニー リミテッド 音声/文字通話サービスを提供するシステム及びその方法
DE112017001987T5 (de) 2016-04-12 2018-12-20 Sony Corporation Datenverarbeitungsvorrichtung, Datenverarbeitungsverarbeitungsverfahren und Programm
US10917511B2 (en) 2014-05-23 2021-02-09 Samsung Electronics Co., Ltd. System and method of providing voice-message call service

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005354320A (ja) * 2004-06-09 2005-12-22 Sony Corp 通信処理装置、通信処理システム及び通信処理方法
JP2007235810A (ja) * 2006-03-03 2007-09-13 Nec Corp 携帯電話システムおよび携帯電話装置
JP2008124972A (ja) * 2006-11-15 2008-05-29 Nec Corp 通信システム、通信方法、および携帯端末装置
JP2009044679A (ja) * 2007-08-10 2009-02-26 Sharp Corp 無声通話機能付携帯通信端末、及び無声通話機能付携帯通信端末の制御方法
JP2016524365A (ja) * 2013-05-02 2016-08-12 サロニコス トレーディング アンド サービシス、ウニペッソアル リミターダSaronikos Trading And Services, Unipessoal Lda 装置及び方法
KR20160005075A (ko) * 2013-05-02 2016-01-13 사로니코스 트레이딩 앤드 서비스즈, 유니페쏘알 엘디에이 전화 호출의 수신자가 말하기가 부적당하다고 판단할 때 전화 호출에 응답하는 장치, 및 관련 방법
US9924012B2 (en) 2013-05-02 2018-03-20 Saronikos Trading And Services, Unipessoal Lda Apparatus for answering a phone call when a recipient of the phone call decides that it is inappropriate to talk, and related method
KR102038827B1 (ko) * 2013-05-02 2019-10-31 사로니코스 트레이딩 앤드 서비스즈, 유니페쏘알 엘디에이 전화 호출의 수신자가 말하기가 부적당하다고 판단할 때 전화 호출에 응답하는 장치, 및 관련 방법
WO2015083741A1 (ja) * 2013-12-03 2015-06-11 株式会社リコー 中継装置、表示装置および通信システム
JPWO2015083741A1 (ja) * 2013-12-03 2017-03-16 株式会社リコー 中継装置、表示装置および通信システム
US10255266B2 (en) 2013-12-03 2019-04-09 Ricoh Company, Limited Relay apparatus, display apparatus, and communication system
JP2017517228A (ja) * 2014-05-23 2017-06-22 サムスン エレクトロニクス カンパニー リミテッド 音声/文字通話サービスを提供するシステム及びその方法
US10917511B2 (en) 2014-05-23 2021-02-09 Samsung Electronics Co., Ltd. System and method of providing voice-message call service
DE112017001987T5 (de) 2016-04-12 2018-12-20 Sony Corporation Datenverarbeitungsvorrichtung, Datenverarbeitungsverarbeitungsverfahren und Programm
US11100944B2 (en) 2016-04-12 2021-08-24 Sony Corporation Information processing apparatus, information processing method, and program

Similar Documents

Publication Publication Date Title
US5969636A (en) Messaging terminal with voice notification
US6895257B2 (en) Personalized agent for portable devices and cellular phone
US7706510B2 (en) System and method for personalized text-to-voice synthesis
US20090198497A1 (en) Method and apparatus for speech synthesis of text message
WO2007034303A2 (en) Mobile terminal allowing impulsive non-language messaging
US20040203613A1 (en) Mobile terminal
CA2539649C (en) System and method for personalized text-to-voice synthesis
JP2004129174A (ja) 情報通信装置、情報通信プログラム、及び記録媒体
JP4118098B2 (ja) 無線通信装置
JP2006235856A (ja) 端末機器、入力候補辞書選択方法
US20110208523A1 (en) Voice-to-dactylology conversion method and system
JP5423970B2 (ja) 音声メール実現システム、音声メール実現サーバ、その方法及びそのプログラム
JP2007114582A (ja) 通信端末
WO2006033809A1 (en) Communication device with term analysis capability, associated function triggering and related method
WO2006042042A1 (en) Silent accept for incoming telephone calls
KR20030091834A (ko) 음성데이터와 문자데이터 상호 변환기능을 갖는 단말기 및단말기에서의 음성 데이터와 문자데이터 상호 변환 방법
JP3997278B2 (ja) 電話装置、音声合成システム、音素情報登録装置、音素情報登録・音声合成装置
JP2009170991A (ja) 情報送信方法及び装置
JP2003069732A (ja) ロボット
JP3686879B2 (ja) ファクシミリ装置
KR20070071881A (ko) 의사소통장애인을 위한 이동통신 단말기의 대화 중계 방법
JP4125708B2 (ja) 携帯電話端末およびメール送受信方法
JP2002374366A (ja) 通信装置および通信システム
KR100501896B1 (ko) 점자 입/출력 기능을 가진 무선통신 단말기 및 점자입/출력 방법
JP2001350493A (ja) 音声データ変換システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050308

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060919

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060926

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070327

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070911