JP3585190B2 - 音声出力装置および方法 - Google Patents

音声出力装置および方法 Download PDF

Info

Publication number
JP3585190B2
JP3585190B2 JP18012995A JP18012995A JP3585190B2 JP 3585190 B2 JP3585190 B2 JP 3585190B2 JP 18012995 A JP18012995 A JP 18012995A JP 18012995 A JP18012995 A JP 18012995A JP 3585190 B2 JP3585190 B2 JP 3585190B2
Authority
JP
Japan
Prior art keywords
image
mouth
changing
audio output
volume
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP18012995A
Other languages
English (en)
Other versions
JPH0934483A (ja
Inventor
利之 野口
恭則 大洞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP18012995A priority Critical patent/JP3585190B2/ja
Publication of JPH0934483A publication Critical patent/JPH0934483A/ja
Application granted granted Critical
Publication of JP3585190B2 publication Critical patent/JP3585190B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Controls And Circuits For Display Device (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、グラフィカルユーザインタフェースを用いて音声出力の音量を制御する音声出力装置および方法に関する。
【0002】
【従来の技術】
従来、コンピュータで音声を出力する場合に、機械的なボリュームスイッチや、キーボードから入力する音量調整コマンドや、画面に表示したスライドバーなどにより、音量を調整している。
【0003】
【発明が解決しようとする課題】
しかしながら、機械的なボリュームスイッチを設けるた場合は、装置の価格が高くなる。音量調節コマンドを用いた場合は、操作者がそのコマンドを覚えなくてはならない。スライドバーも操作者に対して直感的でなく、特に小児にとっては、操作方法が理解しにくいという課題があった。
【0004】
そこで本発明は、このような課題を解決し、音声出力の音量を容易に調整することのできる音声出力装置および方法を提供することを目的とする。
【0005】
【課題を解決するための手段】
このような目的を達成するために、発明は、少なくとも口画像を含む複数の画像要素を格納する画像データベースから読み出した画像要素を合成して顔画像を生成する生成手段と、
前記生成手段で生成した顔画像を表示するよう制御する表示制御手段と、
前記表示制御手段で表示された顔画像中の口画像の面積を変更する変更手段と、
前記変更手段で変更した口画像の面積に対応づけた音量の音声を出力する出力手段とを備えたことを特徴とする。
【0010】
また本発明は、少なくとも口画像を含む複数の画像要素を格納する画像データベースから読み出した画像要素を合成して生成された顔画像を表示するよう制御する表示制御ステップと、
前記表示制御ステップで表示された顔画像中の口画像の面積を変更する変更ステップと、
前記変更ステップで変更した口画像の面積に対応づけた音量の音声を出力する出力ステップとを備えたことを特徴とする。
【0020】
【発明の実施の形態】
以下、図面を参照して本発明の実施例を詳細に説明する。
【0021】
図1は、本発明の実施例に係る音声出力装置の構成を示すブロック図である。同図において、1はユーザからコマンド及びデータを入力する入力手段であり、例えば、キーボードおよびマウス等のポインティングデバイスから構成される。2は入力手段1からの入力に対応して画像の表示を制御する表示制御手段、3は表示制御手段2から出力された画像を表示する表示手段である。4は表示手段に表示する顔などの画像の要素を格納する画像データベースである。
【0022】
図2に、画像データベース4に格納した画像要素の一例を示す。画像データベース4は、人の顔の画像の各構成要素としての「目」、「鼻」、「口」、「輪郭」、「髪」の、画像要素ファイルを有する。各画像要素ファイルには、図2に示すように各構成要素のデフォルト画像の形態およびデフォルト画像を変形した変形画像の形態が格納されている。デフォルト画像および変形画像はスケーラブルであり、入力手段1からの入力等に基づいて拡大または縮小することができる。
【0023】
表示制御手段2は、各画像要素ファイルから必要な画像を取り出し、必要に応じて大きさを変更し、各画像を合成して表示手段3に表示する。また表示制御手段2は、1つの画像ファイルに格納された1つの画像要素の、複数の形態を補間することにより、複数の形態の中間的な画像を形成することができる。
【0024】
テキスト保持手段5は、音声合成を行う対象となる入力テキストを保存する。入力手段1から音声合成開始コマンドが入力されると、中央制御手段10は、入力テキスト保持手段6からテキストを読みだし、音声合成手段6に転送する。すると音声合成手段6は、転送されたテキストに基づいて音声を合成する。
【0025】
中央制御手段10は、入力手段1から入力された音量指示に従って音量制御手段7を制御する。音量制御手段7は、音声合成手段6から入力された音声を、中央制御手段10からの制御に従って拡大し、スピーカ8に出力する。
【0026】
図3は、図1の中央制御手段10の動作を示すフローチャートである。また図4に、図3のフローチャートに示す動作に従って、表示手段3に表示される顔の画像の例を表す。両図を用いて本音声出力装置の動作を説明する。ステップ(Sと略記する)101(図3)では、表示制御手段2を介して、画像データベース4に格納された画像ファイルから「目」、「鼻」、「口」、「輪郭」および「髪」の各画像データ要素のデフォルト画像を読み出し、読み出したデフォルト画像を合成して、画像41(図4)を表示手段3に表示する。
【0027】
S102では、表示した顔画像の中の「一部の画像要素」の一例としての、口の部分がポインティングデバイスにより指定されているかどうかを判断する。口の部分は、例えば画像42(図4)に示すようにマウスのポインタを口の上に移動してマウスのボタンを押すことにより指定することができる。
【0028】
中央制御装置10は、ポインタが口の部分にあることおよびマウスボタンが押されていることを条件に、口が指定されたと判断することができる。口の部分が指定されていない場合はS102に戻る。口の部分が指定されていた場合はS103に進み、口が中程度に開いた画像を画像データベース4から読み出して、口のデフォルト画像に換えて表示手段に表示する。S103で表示される画像の一例を画像43(図4)に示す。
【0029】
S104では、音声を中程度に拡大するように音量制御手段7を設定する。またテキスト保持手段からテキストを読みだし、音声合成手段6に転送する。すると音声合成手段6が音声を合成し、音量制御手段7が音声を中程度に拡大し、スピーカ8から音声が出力される。S105では、音声合成手段6が音声の出力が終了したか否かを判断する。音声の出力が終了していなければS106に進み、音声の出力が終了していればS115に進む。
【0030】
S106では、口の部分がポインティングデバイスにより指定されているか否かを検出する。口の部分が指定されていない場合は、S105に戻る。S106で口の部分が指定されていると、口の画像を大きくする指示が入力されているか否かを判断する(S107)。口の画像は、マウスボタンを押したままポインタを口の中心から遠ざけることにより拡大できる。S107で口の画像を大きくする操作でなかった場合はS110に進む。
【0031】
S107で口の画像を大きくする操作であった場合は、マウスの移動量に応じて、音量制御手段7を用いて音声の増幅率を高める(S108)。S109では、中程度に口が開いた画像と、口が大きく開いた画像とを補間することにより、マウスの移動量に応じて開かれた口の画像を形成して表示手段3に表示する。但し、多様な大きさに開いた口の画像を予め用意し、マウスの移動量に応じて適切な画像を読み出して表示手段3に表示しても良い。S109により表示される画像の一例を画像44(図4)に示す。
【0032】
S110では、口の画像を小さくする指示が入力されたか否かを判断する。口の画像は、マウスボタンを押したままポインタを口の中心へ近づける方向に移動させることにより縮小することができる。口を小さくする指示が入力された場合は、音声制御手段による音量の増幅率を、マウスの移動量に応じて小さくする(S111)。また表示制御手段2を介して画像データベース4から、小さな口の画像を読み出し、表示手段3に表示して(S112)、S105に戻る。
【0033】
例えば画像45(図4)のようにポインタが口画像から離れており、S110で口を小さくする指示が入力されていなかった場合は、音声の出力を停止する指示が入力されたか否かを判断する(S113)。音声は、例えば表示手段3に表示した顔画像の中の口画像をクリックすることにより停止できる。この場合中央制御手段10は、S113で、ポインタが口画像の上にあって、かつマウスのボタンが押されたことを条件として、音声の出力を停止する指示が入力されたと判断する。
【0034】
S113で出力の停止が指示されていなければS105に戻る。S113で出力を停止する指示が入力されていれば音声合成手段6による音声の合成を停止し(S114)、口画像ファイルの中からの閉じたデフォルト画像を画像データベース4の「口」画像ファイルから読み出し、既に表示している顔画像の口の部分と置き換えて表示する(S115)。S115により表示される画像を画像46(図4)に示す。S115の後に、S102に戻る。
【0035】
(その他)
実施例1では、ポインテインゲデバイスであるマウスを用いて口の画像を指示したが、画像の「指定手段」は、表示手段に表示された口の画像を指定できるものであれば足り、例えばペン、デジタイザなどの他の入力デバイスであってもよい。
【0036】
図4ではポインタの一例として矢印を表示したが、ポインタは表示手段に表示された口が指定されていることを表示できれば足り、例えば図5に示す様なマイクの形のポインタを用いても良い。
【0037】
実施例1では、音声を出力し始めると口が開いた画像に切り替えたが、口の画像の変化の方法は、これに限定されるものではない。例えば、口の部分をアニメーションのように動画として動かしてもよい。この場合、音声の大きさに応じて口の部分の動きを大きくしても良い。
【0038】
実施例1では、ポインタで口の画像をクリックすることにより音声の合成を開始したが、音声として出力したいテキストを表わすアイコンを、口の部分に移動することにより音声の出力を開始してもよい。
【0039】
実施例1では、音声をスピーカに出力したが、音声の「出力手段」はスピーカに限定されるものではなく、例えは音声記録デッキに出力することにより、記録テープに録昔させてもよい。
【0040】
実施例1では、ポインティングデバイスを用いて「口」の画像を指定し、拡大し、または縮小したが、ポインティングデバイスに換えて、キーボードにより拡大又は縮小しても良い。
【0041】
実施例1では口の画像をクリックすることにより音声を停止したが、例えば画面に表示した「停止」ボタンをクリックすることにより音声を停止しても良い。
【0042】
本発明は、複数の装置から構成されるシステムにも単体の装置にも適用できる。また、本発明はシステム或は装置にプログラムを読み込むことによっても実施できる。そのようなプログラムを記載した記録媒体に、本出願による特許権の特許法第101条の効力が及ぶことは言うまでもない。
【0043】
【発明の効果】
以上の説明から明らかなように、請求項1又は請求項に記載の発明によれば、出力する音声の音量を画像の面積に対応づけたので、ユーザにとって音量の制御が理解しやすく、制御が容易になる。特に、面積が最小の場合に音声の出力を停止することにより、音声出力の開始及び停止も容易に制御することができる。
【0044】
請求項2又は請求項に記載の発明によれば、表示する全ての画像の形態を予め格納するのではなく、第1の形態と第2の形態との中間形態を補間して出力するので、全ての形態を予め格納した場合と比較して、必要なデータの格納容量を小さくすることができる。
【0045】
請求項3又は請求項に記載の発明によれば、表示すべき複数の形態を予め格納しているので、表示する画像の面積を容易に変更することができる。
【0047】
請求項又は請求項に記載の発明によれば、テキストの読み出し時の音量を、理解しやすいインタフェースで容易に制御することができる。
【図面の簡単な説明】
【図1】本発明の一実施例にかかる音声出力装置の構成を示すブロック図である。
【図2】画像データベースに格納された各データファイルの画像の例を示す説明図である。
【図3】本発明の一実施例にかかる音声出力装置の処理手順を示すフローチャートである。
【図4】図3のフローチャートに示す動作により表示される画像を説明する説明図である。
【図5】本発明の一実施例により表示される画像を説明する説明図である。
【符号の説明】
1 入力手段
2 表示制御手段
3 表示手段
4 画像データベース
5 テキスト保持手段
6 音声合成手段
7 音量制御手段
8 スピーカ
10 中央制御手段

Claims (10)

  1. 少なくとも口画像を含む複数の画像要素を格納する画像データベースから読み出した画像要素を合成して顔画像を生成する生成手段と、
    前記生成手段で生成した顔画像を表示するよう制御する表示制御手段と、
    前記表示制御手段で表示された顔画像中の口画像の面積を変更する変更手段と、
    前記変更手段で変更した口画像の面積に対応づけた音量の音声を出力する出力手段とを備えたことを特徴とする音声出力装置。
  2. 前記画像データベースは、前記口画像の、音量がゼロであることを示す第1の形態と、音量が最大であることを示す第2の形態とを格納し、
    前記変更手段は、前記第1の形態、前記第2の形態、または前記第1及び第2の形態を補間して得られた中間形態に口画像を変更することを特徴とする請求項1記載の音声出力装置。
  3. 前記画像データベースは前記口画像の複数の形態を格納し、
    前記変更手段は、前記複数の形態から現在表示している形態とは異なる形態を選択して変更することを特徴とする請求項1記載の音声出力装置。
  4. テキストデータを格納するテキスト保持手段と、
    前記テキスト保持手段から読み出した前記テキストを音声に変換する変換手段を更に備え、
    前記音声出力手段は、当該変換手段により変換された音声を出力することを特徴とする請求項1記載の音声出力装置。
  5. 少なくとも口画像を含む複数の画像要素を格納する画像データベースから読み出した画像要素を合成して生成された顔画像を表示するよう制御する表示制御ステップと、
    前記表示制御ステップで表示された顔画像中の口画像の面積を変更する変更ステップと、
    前記変更ステップで変更した口画像の面積に対応づけた音量の音声を出力する出力ステップとを備えたことを特徴とする音声出力方法。
  6. 前記画像データベースは、前記口画像の、音量がゼロであることを示す第1の形態と、音量が最大であることを示す第2の形態とを格納し、
    前記変更ステップは、前記第1の形態、前記第2の形態、または前記第1及び第2の形態を補間して得られた中間形態に口画像を変更することを特徴とする請求項5記載の音声出力方法。
  7. 前記画像データベースは前記口画像の複数の形態を格納し、
    前記変更ステップは、前記複数の形態から現在表示している形態とは異なる形態を選択して変更することを特徴とする請求項5記載の音声出力方法。
  8. テキストデータを予めテキスト保持手段に保持しており、
    前記テキスト保持手段から読み出した前記テキストを音声に変換する変換ステップを更に備え、
    前記出力ステップは、前記変換ステップにより変換された音声を出力することを特徴とする請求項5記載の音声出力方法。
  9. 請求項5乃至8に記載の音声出力方法をコンピュータに実行させるための制御プログラム。
  10. 請求項9に記載の制御プログラムを記憶したコンピュータ読み取り可能な記憶媒体。
JP18012995A 1995-07-17 1995-07-17 音声出力装置および方法 Expired - Fee Related JP3585190B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP18012995A JP3585190B2 (ja) 1995-07-17 1995-07-17 音声出力装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18012995A JP3585190B2 (ja) 1995-07-17 1995-07-17 音声出力装置および方法

Publications (2)

Publication Number Publication Date
JPH0934483A JPH0934483A (ja) 1997-02-07
JP3585190B2 true JP3585190B2 (ja) 2004-11-04

Family

ID=16077930

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18012995A Expired - Fee Related JP3585190B2 (ja) 1995-07-17 1995-07-17 音声出力装置および方法

Country Status (1)

Country Link
JP (1) JP3585190B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4775368B2 (ja) 2007-12-12 2011-09-21 ブラザー工業株式会社 画像情報記憶装置、画像情報処理プログラム、及び画像情報処理システム
US8468450B2 (en) 2007-12-14 2013-06-18 Brother Kogyo Kabushiki Kaisha Output control device, computer readable medium for the same, and output control system
US8311192B2 (en) 2007-12-18 2012-11-13 Brother Kogyo Kabushiki Kaisha Communication device, communication system and computer readable medium for communication
JP2009159398A (ja) 2007-12-27 2009-07-16 Brother Ind Ltd 画像情報記憶装置、画像情報処理プログラム、及び、画像情報処理システム

Also Published As

Publication number Publication date
JPH0934483A (ja) 1997-02-07

Similar Documents

Publication Publication Date Title
JP7249392B2 (ja) アバター作成ユーザインターフェース
CN106502638B (zh) 用于提供视听反馈的设备、方法和图形用户界面
US5359712A (en) Method and apparatus for transitioning between sequences of digital information
JP4659505B2 (ja) 情報処理方法及び装置
JP2654283B2 (ja) アイコン表示方法
US7682893B2 (en) Method and apparatus for providing an instrument playing service
CN110046020B (zh) 电子设备、计算机可读存储介质及电子设备处执行的方法
JP3585190B2 (ja) 音声出力装置および方法
CN110109730A (zh) 用于提供视听反馈的设备、方法和图形用户界面
JP4168449B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP4245206B2 (ja) 表示用データとスクロール表示のための情報を記録した記録媒体及び表示装置
JP4240314B2 (ja) 編集装置及び編集方法並びに編集プログラム
JP2006189799A (ja) 選択可能な音声パターンの音声入力方法及び装置
JP4720974B2 (ja) 音声発生装置およびそのためのコンピュータプログラム
US20040194152A1 (en) Data processing method and data processing apparatus
JP3909218B2 (ja) 動画ヘルプガイダンス方法
JPH08179923A (ja) 音声合成出力方法とその装置
JP4414537B2 (ja) 画面データ作成方法、画面データ作成装置及び記録媒体
JP2979928B2 (ja) 楽譜認識結果表示システム
WO2003052370A1 (en) Information processing apparatus and method, and program
JPH08115335A (ja) マルチメディア処理装置
JP2006173796A (ja) 編集装置及び編集方法並びに編集プログラム
JPH0950437A (ja) マルチメディア情報再生装置およびマルチメディア情報記録装置
JP3469231B2 (ja) アニメーション検索装置
JPWO2021036871A5 (ja)

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040507

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040706

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040730

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040802

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070813

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080813

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080813

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090813

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090813

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100813

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110813

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees