JP3964724B2 - 音声入力装置及びその方法並びに音声入力プログラム - Google Patents
音声入力装置及びその方法並びに音声入力プログラム Download PDFInfo
- Publication number
- JP3964724B2 JP3964724B2 JP2002119409A JP2002119409A JP3964724B2 JP 3964724 B2 JP3964724 B2 JP 3964724B2 JP 2002119409 A JP2002119409 A JP 2002119409A JP 2002119409 A JP2002119409 A JP 2002119409A JP 3964724 B2 JP3964724 B2 JP 3964724B2
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- item
- word
- voice
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
【発明の属する技術分野】
本発明は、注文内容を受付けて処理する情報処理装置、例えばガソリンスタンド給油システムの伝票発行装置、航空券,乗車券などの券発行装置、レストラン,ファーストフード店でのオーダ登録装置等に対する注文内容の入力デバイスとして用いられる音声入力装置及びその方法並びに音声入力プログラムに関する。
【0002】
【従来の技術】
例えばガソリンスタンドにおいて、店員は、客が来店すると、先ず給油するガソリンの種類(レギュラーガソリン,ハイオクガソリン,軽油等)と、給油量(量単位又は金額単位)と、決済方法(現金払い,クレジット払い等)を客に尋ねる。これに対して、例えば客が「レギュラーを満タン、現金で。」と答えた場合には、店員は、給油するガソリンの種類が「レギュラーガソリン」であること、給油量は「満タン」であること、決済方法は「現金払い」であることをそれぞれ伝票発行装置に入力した後、給油を開始する。こうすることにより、給油が終了すると、伝票発行装置から自動的に実給油量に応じた決済伝票が印字発行されるので、店員は、決済伝票にしたがって客から給油代金の支払いを受けることになる。
【0003】
このようなガソリンスタンドの給油システムにおいて、従来、客の注文内容を伝票発行装置に入力する方法としては、キーボードやタッチパネル等の入力デバイスを用いた方法が一般的であった。しかし、この方法では、店員が客から聞いた内容を手入力しなければならなかったので、二度手間であった上、入力ミスも発生し易かった。また、客は店員が近づいて来るまで注文内容を告げるのを待たなければならず、また、注文を聞いた店員は、伝票発行装置が置かれている場所に行って客の注文内容を入力した後、車が停車している場所に戻って給油を始めなければならず、作業効率が悪かった。
【0004】
そこで近年、音声入力装置を入力デバイスとして伝票発行装置に接続し、給油に来た客が車内から直接音声で伝票発行装置に注文内容を入力することが考えられていた。こうすることにより、店員の手間を軽減でき、入力ミスもなくなる上、店員が車と伝票発行装置との間を往復して客の注文内容を手入力する無駄を省略できるので、作業効率の向上が期待できる。
【0005】
ところが従来の音声入力装置は、マイクロホンを通じて入力された音声データから認識された語句を1つずつ入力順に取り込み、その順番でコンピュータ等の情報処理装置に転送する形式であった。一方、注文内容を受付けて処理する伝票発行装置等の情報処理装置は、注文内容項目の受付け順序が予め決まっており、転送されてきた語句をその順番に該当項目の注文内容を示すデータとして処理することになる。
【0006】
このため、例えば、前記給油システムの伝票発行装置が、最初にガソリンの種類を受付け、次に給油量を受付け、最後に決済方法を受付けるようにプログラムされていたとした場合、伝票発行装置は、音声入力装置から最初に転送されてきた語句をガソリンの種類を示すデータとして処理し、次に転送されてきた語句を給油量を示すデータとして処理し、最後に転送されてきたデータを決済方法を示すデータとして処理することになる。したがって、音声入力を行なう者は、先ずガソリンの種類を注文し、次に給油量を注文し、最後に決済方法を注文するというように、予め決められた順番に注文内容を発声する必要があった。
【0007】
【発明が解決しようとする課題】
このように、注文内容の入力デバイスとして音声入力装置を用いた場合、従来は注文内容を入力する順番が固定化されていたので、例えばガソリンスタンドにおいて、客自身が音声入力装置を利用して給油の注文内容を伝票発行装置に入力するようにした給油システムを構築しても、不特定多数の客が利用するガソリンスタンドで全ての客に注文内容を告げる順番を徹底させるのは困難であり、伝票発行装置が注文内容を正しく認識できず、正常に機能しないおそれが高かった。
【0008】
本発明はこのような事情に基づいてなされたもので、その目的とするところは、音声入力する順番に捕われずに注文内容を正しく入力処理できる音声入力装置及びその方法並びに音声入力プログラムを提供しようとするものである。
【0009】
【課題を解決するための手段】
本発明の音声入力装置は、音声入力された注文内容から予め登録されている語句を一つずつ抽出する語句抽出手段と、この語句抽出手段により抽出された語句毎にその語句の意味が含まれる項目を判定する語句項目判定手段と、この語句項目判定手段により項目が判定された各語句を項目別に記憶する語句記憶手段と、この語句記憶手段により記憶された各語句の項目組合せパターンが注文品の種類,量および決済方法の項目からなる注文確定条件を満足するパターンか否かを判断する確定条件判断手段と、この確定条件判断手段により各語句の項目組合せパターンが注文確定条件を満足するパターンであると判断されると、語句記憶手段により記憶された各語句を音声入力注文データとして確定させる注文確定手段と、この注文確定手段により確定された音声入力注文データを、決済伝票を発行する伝票発行装置に転送する手段と、を備えたものである。
【0010】
したがって、音声入力された注文内容から抽出された各語句の意味がそれぞれ含まれる項目の組合せパターンが注文品の種類,量および決済方法の項目からなる注文確定条件を満足するパターンと一致したときには、その各語句が音声入力注文データとして確定されるので、注文内容を構成する語句の順番が異なっていてもよい。
【0011】
【発明の実施の形態】
以下、本発明の一実施の形態を図面を用いて説明する。
なお、この実施の形態は、ガソリンスタンド給油システムの伝票発行装置に対する注文内容入力デバイスとして用いられる音声入力装置に、本発明を適用した場合である。
【0012】
図1は本実施の形態における音声入力装置1の構成を示すブロック図である。この音声入力装置1は、音声入力部としてのマイクロホン11と、音声出力部としてのスピーカ12と、音声エンジン部13と、音声入力確定部14と、音声入力スイッチ15とから構成されている。音声入力確定部14には、注文内容を受付けて処理する情報処理装置、つまりこの実施の形態では、ガソリンスタンド給油システムの伝票発行装置2が接続されている。
【0013】
音声入力スイッチ15は、ユーザがマイクロホン11から音声入力する際にオンするスイッチで、その近傍にマイクロホン11とスピーカ12が設けられている。この実施の形態では、ガソリンスタンドの給油場所に停車した客が車内から操作できる位置に音声入力スイッチ15とマイクロホン11とスピーカ12が設けられている。
【0014】
音声エンジン部13は、マイクロホン11から入力されたアナログ音声信号をディジタル音声信号に変換するA/D(アナログ/ディジタル)コンバータ16、該ディジタル音声信号から1音節ずつ音声を認識して音声データを作成する音声認識部17、音声入力確定部14から供給されるガイダンスデータからディジタル音声信号を生成する音声生成部18、該ディジタル音声データをアナログ音声データに変換してスピーカ12に出力するD/A(ディジタル/アナログ)コンバータ19によって構成されている。
【0015】
音声入力確定部14は、音声入力スイッチ15がオンされている期間中、前記音声認識部17にて生成される音声データを取込み、この音声データから伝票発行装置2で処理すべき音声入力データを確定して伝票発行装置2に転送する機能を有するものである。
【0016】
なお、この実施の形態において、伝票発行装置2は、ガソリンの種類と給油量と決済方法の注文をこの順番に受付け、これらの注文内容が入力された後、給油が終了すると、実給油量に応じた決済伝票を印字発行するように構成されている。したがって、音声入力確定部14は、音声データからガソリンの種類を表わす語句と、給油量を表わす語句と、決済方法を表わす語句とがそれぞれ得られると、これらの語句から音声入力データを確定して、伝票発行装置2に転送する。これに対し、いずれかの注文内容を表わす語句が不足しているときには、その注文内容を表わす語句の音声再入力を促すガイダンスデータを音声生成部18に出力して、そのガイダンスを音声出力させる。また、語句の中に、例えば物の総称を表わすために注文内容を確定できない語句が含まれるときには、その語句を確定させる音声の再入力を促すガイダンスデータを音声生成部18に出力して、そのガイダンスを音声出力させる。
【0017】
以下、音声入力確定部14の具体的構成について説明する。
【0018】
図2は前記音声入力確定部14の構成を示すブロック図である。この音声入力装置1は、マイクロプロセッサとしてのCPU(Central Processing Unit)141、このCPU141が実行するプログラム等の固定的データが予め格納されたROM(Read Only Memory)142、このCPU141がデータの一時格納領域として使用する各種のメモリエリアが形成されるRAM(Random Access Memory)143、前記音声エンジン部13の音声認識部17から音声データが入力される一方、音声生成部18に対してガイダンスデータが出力されるI/O(Input/Output)ポート144、種々のデータファイル等を保存するHDD(Hard Disk Drive)装置145、前記伝票発行装置2に接続され、音声入力データを転送する通信インタフェース146、前記音声入力スイッチ15からの信号が入力される入力ポート147等で構成され、CPU141と、ROM142,RAM143,I/Oポート144,HDD装置145,通信インタフェース146,入力ポート147等とは、システムバス148で接続されている。ここに、音声入力確定部14は、CPU141,ROM142及びRAM143からなるマイクロコンピュータを主体に構成されている。
【0019】
前記HDD装置145には、特に図3に示すように、語彙ファイル31、辞書ファイル32、ガイダンスファイル33及び確定条件テーブル34が保存されている。
【0020】
前記語彙ファイル31は、図4(a)に示すように、所定の語句を発生したときの音声の特徴量を数値化した語句音声データと、その語句に対して予め設定された語句毎に異なる語句コードとからなるレコードを記憶するもので、特に、伝票発行装置2に注文内容を音声で入力するときに使用されると考えられる多数の語句が選出され、各語句のレコードがそれぞれ記憶されている。例えば、ガソリンの種類を注文するときに使用される語句として「レギュラー」,「レギュラーガソリン」,「ハイオク」,「ハイオクガソリン」,「軽油」,「ガソリン」等が選出され、これらの語句の語句音声データと語句コードとが語彙ファイル31に記憶されている。また、給油量を注文するときに使用される語句として「満タン」,「10リットル」,「20リットル」,「1000円」,「2000円」等が選出され、これらの語句の語句音声データと語句コードとが語彙ファイル31に記憶されている。また、決済方法を注文するときに使用される語句として「現金」,「現金払い」,「カード」,「クレジット」,「デビット」,「クレジットカード」,「デビットカード」等が選出され、これらの語句の語句音声データと語句コードとが語彙ファイル31に記憶されている。
【0021】
前記辞書ファイル32は、図4(b)に示すように、語句コード,項目コード,不確定フラグ,ガイダンス番号及び複数のリンク語句コードからなるレコードを記憶するもので、前記語彙ファイル31に記憶されている各語句の語句コードにそれぞれリンクする複数のレコードが記憶されている。
【0022】
この辞書ファイル32のレコード項目において、項目コードは、各種語句の意味別に設定された項目を識別するコードであり、この実施の形態では、ガソリンの種類を表わす意味の項目「アイテム」(項目コード=1)と、給油量を表わす意味の項目「数量」(項目コード=2)と、給油量相当の金額を表わす意味の項目「金額」(項目コード=3)と、決済方法を表わす意味の項目「決済方法」(項目コード=4)とを設定している。
【0023】
また、不確定フラグは、対応する語句が注文内容を確定できる語句か否かを識別するフラグであって、確定できる語句に対しては“0”がセットされ、物の総称などのように不確定な語句に対しては“1”がセットされる。そして、不確定語句に対してのみ、ガイダンス番号とリンク語句コードとが設定される。ガイダンス番号は、その不確定語句を確定させる音声の再入力を促すガイダンスデータに対して設定された番号である。リンク語句コードは、その不確定語句が分類された項目に含まれる語句で注文内容を確定できる一部又は全ての語句の語句コードである。
【0024】
例えば、ガソリンの種類を注文する際に音声入力される語句として、「レギュラー」,「ハイオク」,「ガソリン」等があり、前の2つはガソリンの種類を特定できるが、「ガソリン」だけではレギュラーガソリンなのかハイオクガソリンなのかを特定できない。そこで、語句「ガソリン」の語句コードに対して不確定フラグを“1”とし、ガイダンス番号としてガソリンの種類を確定させる音声再入力を促すガイダンスデータ(例えば「ガソリンは……ですか……ですか」)の番号とし、リンク語句コードとして語句「レギュラー」及び「ハイオク」の語句コードをそれぞれ設定する。同様に、決済方法を注文する際に音声入力される語句として、「クレジット」,「デビット」,「カード」等があり、前の2つは決済方法を特定できるが、「カード」だけではクレジットカード決済なのかデビットカード決済なのかを特定できない。そこで、語句「カード」の語句コードに対して不確定フラグを“1”とし、ガイダンス番号としてカードの種類を確定させる音声再入力を促すガイダンスデータ(例えば「カードは……ですか……ですか」)の番号とし、リンク語句コードとして語句「クレジット」及び「デビット」の語句コードをそれぞれ設定する。
【0025】
ガイダンスファイル33は、図4(c)に示すように、ガイダンス番号とガイダンスデータとからなるレコードを記憶するもので、音声入力データを確定するまでの間に音声出力が必要となる各種のガイダンスデータがそれぞれ異なるガイダンス番号とともに記憶されている。
【0026】
確定条件テーブル34は、図5に示すように、各種語句の意味別に設定された項目(この実施の形態では「アイテム」,「数量」,「金額」,「決済方法」の4種)の組合せパターンを識別する条件ナンバー別に、当該項目組合せパターンが対応する項目を含むパターンか否かを示すデータ(1:含む、0:含まない)と、当該項目組合せパターンが確定条件を満足するパターンでないとき、確定条件を満足するのに不足している項目の意味を有する語句の音声再入力を促すガイダンスデータのガイダンス番号とを記憶するものである。
【0027】
つまり、条件ナンバーP1で識別される項目組合せパターンは、データ“1”の項目「アイテム」,「数量」及び「決済方法」を含むパターンであり、条件ナンバーP2で識別される項目組合せパターンは、データ“1”の項目「アイテム」,「金額」及び「決済方法」を含むパターンであって、いずれも伝票発行装置2に対する音声入力データとしての確定条件を満足するので、ガイダンス番号は未設定(=0)となっている。
【0028】
一方、条件ナンバーP3〜P12でそれぞれ識別される項目組合せパターンは、いずれも伝票発行装置2に対する音声入力データとしての確定条件を満足しないので、それぞれ該当するガイダンスデータのガイダンス番号が設定されている。例えば、条件ナンバーP3及びP4で識別されるパターンは、いずれも項目「決済方法」の意味を有する語句が未入力であるため、決済方法の音声再入力を促すガイダンスデータ(例えば「決済方法は何ですか」)のガイダンス番号[100]が設定されている。また、条件ナンバーP5で識別されるパターンは、項目「数量」または「金額」の意味を有する語句が未入力であるため、給油量の音声再入力を促すガイダンスデータのガイダンス番号[101]が設定されている。以下、同様に、条件ナンバーP6及びP7で識別されるパターンは、項目「アイテム」の意味を有する語句が未入力であるため、ガソリン種類の音声再入力を促すガイダンスデータのガイダンス番号[102]が設定され、条件ナンバーP8で識別されるパターンは、項目「数量」または「金額」と「決済方法」の意味をそれぞれ有する語句がいずれも未入力であるため、給油量と決済方法の音声再入力を促すガイダンスデータのガイダンス番号[103]が設定され、条件ナンバーP9及びP10で識別されるパターンは、項目「アイテム」と「決済方法」の意味をそれぞれ有する語句がいずれも未入力であるため、ガソリン種類と決済方法の音声再入力を促すガイダンスデータのガイダンス番号[104]が設定され、条件ナンバーP11で識別されるパターンは、項目「アイテム」と「数量」または「金額」の意味をそれぞれ有する語句がいずれも未入力であるため、ガソリン種類と給油量の音声再入力を促すガイダンスデータのガイダンス番号[105]が設定されている。
【0029】
さて、CPU141は、ROM142に格納された音声入力プログラムにより、RAM143に図6に示すメモリエリア61,62を形成し、図7の流れ図に示す処理を繰返し実行するようになっている。
【0030】
メモリエリア61は、語彙ファイル31から抽出した語句音声データと語句コードとを、抽出順に記憶する領域で、以後、語句メモリ61と称する。メモリエリア62は、各種語句の意味別に設定された項目(この実施の形態では「アイテム」,「数量」,「金額」,「決済方法」の4種)別に、その項目の意味を有する語句の語句音声データ,語句コード及び不確定フラグを1つずつ記憶する領域(語句記憶手段)で、以後、項目別メモリ62と称する。
【0031】
RAM143に語句メモリ61及び項目別メモリ62を形成した状態で、CPU141は、ST(ステップ)1として音声入力スイッチ15がオン操作されるのを待機している。なお、初期状態として、語句メモリ61の語句音声データエリア及び語句コードエリアと、項目別メモリ62の語句音声データエリア,語句コードエリア及び不確定フラグエリアはいずれもクリアされている。
【0032】
入力ポート147に入力される信号により、音声入力スイッチ15がオン操作されたと判断すると、CPU141は、ST2として音声認識部17にて認識された音声データを取り込む。音声データは、ST3として音声入力スイッチ15がオフ操作されるまで継続して取り込む。
【0033】
入力ポート147に入力される信号により、音声入力スイッチ15がオフ操作されたと判断すると、CPU141は、ST4として語句抽出処理を実行する。すなわち、音声認識部17から取り込んだ音声データを入力順に語彙ファイル31に登録されている各種語句の語句音声データと比較照合して、当該語彙ファイル31に登録されている語句音声データと一致する語句を1つずつ抽出する。そして語句を抽出する毎に、その語句の語句音声データと対応する語句コードとを、語句メモリ61に抽出順に格納する(語句抽出手段)。なお、音声データから語句音声データと一致する語句を1つも抽出できないときにはエラーとし、音声入力スイッチ15が再度オン操作されるのを待機する。
【0034】
音声データから語句音声データを抽出し終えると、CPU141は、語句項目判定処理を実行する。すなわち、語句メモリ61に格納された語句音声データとその語句コードとをメモリナンバーの小さい順、つまり音声データから抽出された語句の順番に読み出す。そして、語句コードで辞書ファイル32を検索して、対応する項目コード及び不確定フラグを取得し、項目別メモリ62の該当項目エリアに、当該語句音声データ及び語句コードと不確定フラグとを格納する。このとき、該当項目エリアに既にデータが格納されていた場合には、その既存のデータに上書きして格納する。したがって、語句メモリ61の中に同一項目の意味を有する語句の語句音声データ及び語句コードが複数格納されていた場合には、最も後から抽出された語句,つまり最も後から音声入力された語句を有効とし、その語句の語句音声データ,語句コード及び不確定フラグを項目別メモリ62で記憶する(語句項目判定手段)。
【0035】
語句メモリ61に格納された各語句音声データの項目を判定し終えると、CPU141は、ST6として不確定語句の有無を判断する。すなわち、項目別メモリ62に格納された不確定フラグをチェックし、不確定フラグ“1”が格納されているか否かを判断する。そして、不確定フラグ“1”が格納されている場合には不確定語句有りと判断し、不確定フラグ“1”が格納されていない場合には不確定語句無しと判断する。
【0036】
不確定語句有りと判断した場合には、CPU141は、ST7としてこの不確定フラグ“1”に対応する語句コードで辞書ファイル32を再度検索し、対応するガイダンス番号とリンク語句コードとを読み出す。また、ガイダンス番号に対応するガイダンスデータをガイダンスファイル33から読み出すとともに、各リンク語句コードにそれぞれ対応する語句音声データを語彙ファイル31から読み出す。そして、ガイダンスデータと各語句音声データとから、不確定語句を確定させる音声の再入力を促すガイダンスデータ,いわゆる確定語句問合せガイダンスデータを作成する。しかる後、ST8としてこの確定語句問合せガイダンスデータを音声生成部18に出力して、スピーカ12より音声出力させる(確定語句催促手段)。その後、CPU141は、ST1に戻って、音声入力スイッチ15が再度オン操作されるのを待機する。
【0037】
不確定語句無しと判定した場合には、CPU141は、ST9として確定条件判断処理を実行する。すなわち、項目別メモリ62をチェックして語句音声データ,語句コード及び不確定フラグ“0”の各データが格納されている項目と格納されていない項目とを区別する。そして、各データが格納されている項目の組合せパターン,つまり音声データから抽出された各語句の項目組合せパターンで確定条件テーブル34を検索して、同一パターンのガイダンス番号を取得する。
【0038】
ここで、同一パターンのガイダンス番号が“0”以外の場合、つまりガイダンス番号が設定されている場合には、CPU141は、ST10として音声データから抽出された各語句の項目組合せパターンが確定条件を満足するパターンでないので、入力を確定させない。これに対し、同一パターンのガイダンス番号が“0”の場合には、音声データから抽出された各語句の項目組合せパターンが確定条件を満足するパターンであるので、入力を確定させる(確定条件判断手段)。
【0039】
入力を確定させない場合には、ST11としてそのガイダンス番号に対応するガイダンスデータをガイダンスファイル33から読み出し、確定条件を満足するのに不足している項目の意味を有する語句の音声再入力を促すガイダンスデータ、いわゆる不足項目語句問合せガイダンスデータを作成する。そして、ST12としてこの不足項目語句問合せガイダンスデータを音声生成部18に出力して、スピーカ12より音声出力させる(不足語句催促手段)。その後、ST1に戻って、音声入力スイッチ15が再度オン操作されるのを待機する。
【0040】
入力を確定させる場合には、ST13として項目別メモリ62に格納されている各項目の語句コードを、項目「アイテム」,「数量」又は「金額」,「決済方法」の順に読み出す。そして、これらの語句コードを順に組み合わせて音声入力確定データを作成したならば、この音声入力確定データを伝票発行装置2にインタフェース146を介して転送する(入力確定手段)。
【0041】
その後、CPU141は、ST14として語句メモリ61及び項目別メモリ62をクリアして初期状態に戻したならば、今回の処理を終了する。そして、音声入力スイッチ15が次にオン操作されるのを待機し、オン操作されたならば、ST1からの処理を繰り返すものとなっている。
【0042】
このように本実施の形態においては、ガソリン給油システムの伝票発行装置2に対する注文内容の入力デバイスとして、音声入力装置1が使用されている。そして、ガソリンの給油に来た客は、所定位置に停車後、車内から音声入力スイッチ15をオンし、マイクロホン11に向かって注文内容、つまりガソリンの種類と給油量と決済方法を発声する。このとき、注文内容を告げる順番は特に制限されない。
【0043】
今、例えば客が注文内容を「ガソリンを現金で2000円分」と発声したとする。そうすると、図8(a)に示すように、「ガソリンを現金で2000円分」という音声データが音声認識部17で認識され、音声入力確定部14に入力される。
【0044】
音声入力確定部14では、この音声データ「ガソリンを現金で2000円分」に対して、語句抽出処理が実行される。その結果、この音声データからガソリンの種類を表わす語句「ガソリン」と、支払方法を表わす語句「現金」と、給油量相当の金額を表わす語句「2000円」が抽出される。そして、図8(b)に示すように、語句メモリ61に各語句の語句音声データと語句コードとが抽出された順に格納される。
【0045】
次に、音声入力確定部14では、語句項目判定処理が実行される。これにより、項目別メモリ62には、図8(c)に示すように、項目「アイテム」に対して語句「ガソリン」の語句音声データ,語句コード及び不確定フラグがそれぞれ格納され、項目「金額」に対して語句「2000円」の語句音声データ,語句コード及び不確定フラグがそれぞれ格納され、項目「決済方法」に対して語句「現金」の語句音声データ,語句コード及び不確定フラグがそれぞれ格納される。
【0046】
この場合、語句「ガソリン」は不確定語句(不確定フラグ=1)なので、ガソリンの種類を確定させる音声の再入力を促すガイダンスデータ「ガソリンは……ですか……ですか」と、語句「ガソリン」のリンク語句コードに対応する語句「レギュラー」,「ハイオク」とから、図8(d)に示す確定語句問合せガイダンスデータ「ガソリンはレギュラーですかハイオクですか」が作成される。そして、この確定語句問合せガイダンスデータが音声生成部18に出力され、音声に変換されて、スピーカ12から出力される。
【0047】
このガイダンスを聞いた客が、同様にして例えば「レギュラー」と発声したとする。そうすると、図8(e)に示すように、「レギュラー」という音声データが音声認識部17で認識され、音声入力確定部14に入力される。音声入力確定部14では、この音声データ「レギュラー」に対して、語句抽出処理が実行される。その結果、この音声データからガソリンの種類を表わす語句「レギュラー」が抽出される。そして、図8(f)に示すように、語句「レギュラー」の語句音声データと語句コードとが語句メモリ61に追加される。
【0048】
次いで、音声入力確定部14では、語句項目判定処理が再度実行される。これにより、項目別メモリ62には、図8(g)に示すように、項目「アイテム」に対して語句「レギュラー」の語句音声データ,語句コード及び不確定フラグがそれぞれ上書きされる。
【0049】
その結果、不確定語句は存在しなくなったので、音声入力確定部14では、確定条件判断処理が実行される。この場合、項目別メモリ62には、項目「アイテム」,「金額」及び「決済方法」にそれぞれ属する語句のデータが格納されているので、条件ナンバーP2に一致するパターンであると認識される。このパターンは、ガイダンス番号が未設定、つまり確定条件を満足するパターンなので、語句「レギュラー」,「2000円」,「現金」の各語句コードから音声入力確定データが作成され、伝票発行装置2に転送される。
【0050】
伝票発行装置2においては、音声入力確定データの最初の語句コードをガソリンの種類を示すデータとして認識し、次の語句コードを給油量を示すデータとして認識し、最後の語句コードを決済方法を示すデータとして認識して処理する。したがって、正常に伝票発行が処理される。
【0051】
また、例えば別の客が注文内容を「レギュラーガソリンをカードで」と発声したとする。そうすると、図9(a)に示すように、「レギュラーガソリンをカードで」という音声データが音声認識部17で認識され、音声入力確定部14に入力される。
【0052】
音声入力確定部14では、この音声データ「レギュラーガソリンをカードで」に対して、語句抽出処理が実行される。その結果、この音声データからガソリンの種類を表わす語句「レギュラーガソリン」と、支払方法を表わす語句「カード」が抽出される。そして、図9(b)に示すように、語句メモリ61に各語句の語句音声データと語句コードとが抽出された順に格納される。
【0053】
次に、音声入力確定部14では、語句項目判定処理が実行される。これにより、項目別メモリ62には、図9(c)に示すように、項目「アイテム」に対して語句「レギュラーガソリン」の語句音声データ,語句コード及び不確定フラグがそれぞれ格納され、項目「決済方法」に対して語句「カード」の語句音声データ,語句コード及び不確定フラグがそれぞれ格納される。
【0054】
この場合、語句「カード」は不確定語句(不確定フラグ=1)なので、カードの種類を確定させる音声の再入力を促すガイダンスデータ「カードは……ですか……ですか」と、語句「カード」のリンク語句コードに対応する語句「クレジット」,「デビット」とから、図9(d)に示す確定語句問合せガイダンスデータ「カードはクレジットですかデビットですか」が作成される。そして、この確定語句問合せガイダンスデータが音声生成部18に出力され、音声に変換されて、スピーカ12から出力される。
【0055】
このガイダンスを聞いた客が、同様にして例えば「クレジットカードです」と発声したとする。そうすると、図9(e)に示すように、「クレジットカードです」という音声データが音声認識部17で認識され、音声入力確定部14に入力される。音声入力確定部14では、この音声データ「クレジットカードです」に対して、語句抽出処理が実行される。その結果、この音声データから決済方法を表わす語句「クレジットカード」が抽出される。そして、図9(f)に示すように、語句「クレジットカード」の語句音声データと語句コードとが語句メモリ61に追加される。
【0056】
次いで、音声入力確定部14では、語句項目判定処理が再度実行される。これにより、項目別メモリ62には、図9(g)に示すように、項目「決済方法」に対して語句「クレジットカード」の語句音声データ,語句コード及び不確定フラグがそれぞれ上書きされる。
【0057】
その結果、不確定語句は存在しなくなったので、音声入力確定部14では、確定条件判断処理が実行される。この場合、項目別メモリ62には、項目「アイテム」と「決済方法」にそれぞれ属する語句のデータが格納されているので、条件ナンバーP5に一致するパターンであると認識される。このパターンは、ガイダンス番号[101]が設定されているパターン、つまり確定条件を満足しないパターンなので、図9(h)に示すガイダンス番号[101]のガイダンスデータ、つまり給油量の音声再入力を促す不足項目語句問合せガイダンスデータ「給油予定量または予定金額を入力してください」が作成される。そして、この不足項目語句問合せガイダンスデータが音声生成部18に出力され、音声に変換されて、スピーカ12から出力される。
【0058】
このガイダンスを聞いた客が、同様にして例えば「満タン」と発声したとする。そうすると、図9(i)に示すように、「満タン」という音声データが音声認識部17で認識され、音声入力確定部14に入力される。音声入力確定部14では、この音声データ「満タン」に対して、語句抽出処理が実行される。その結果、この音声データから給油量を表わす語句「満タン」が抽出される。そして、図9(j)に示すように、語句「満タン」の語句音声データと語句コードとが語句メモリ61に追加される。
【0059】
次いで、音声入力確定部14では、語句項目判定処理が再度実行される。これにより、項目別メモリ62には、図9(k)に示すように、項目「数量」に対して語句「満タン」の語句音声データ,語句コード及び不確定フラグがそれぞれ格納される。次いで、不確定語句は存在しないので、音声入力確定部14では、確定条件判断処理が実行される。この場合、項目別メモリ62には、項目「アイテム」,「数量」及び「決済方法」にそれぞれ属する語句のデータが格納されているので、条件ナンバーP1に一致するパターンであると認識される。このパターンは、ガイダンス番号が未設定、つまり確定条件を満足するので、語句「レギュラーガソリン」,「満タン」,「クレジットカード」の各語句コードから音声入力確定データが作成され、順次伝票発行装置2に転送される。
【0060】
この場合も、伝票発行装置においては、音声入力確定データの最初の語句コードをガソリンの種類を示すデータとして認識し、次の語句コードを給油量を示すデータとして認識し、最後の語句コードを決済方法を示すデータとして認識して処理するので、正常に伝票発行が処理される。
【0061】
このように本実施の形態によれば、伝票発行装置2に対して給油の注文内容を音声入力する際の入力項目の順番が制限されないので、使い勝手がよく、不特定多数の客が自身で注文内容を伝票発行装置2に音声入力できるようになる。その結果、店員の手間を軽減でき、入力ミスもなくなる上、店員が車と伝票発行装置との間を往復して客の注文内容を手入力する無駄を省略できるので、作業効率を向上できる。
【0062】
また、本実施の形態では、最初に音声入力された語句だけでは、注文内容の確定条件が満足されないときには、当該確定条件を満足するのに不足している項目の意味を有する語句の音声再入力を促すガイダンスを自動的に生成し、ユーザに対して音声出力する。そして、その後に音声入力された語句から確定条件が満足されたならば、音声入力データを確定させるようにしている。したがって、注文内容を音声入力する際に入力漏れの項目があっても、その項目の注文内容のみを入力し直せばよいので、注文内容を誰もが容易にかつ正しく音声で入力できる効果を奏する。
【0063】
また、音声入力された語句の中に注文内容を確定できない不確定語句が含まれる場合には、その語句を確定させる音声の再入力を促すガイダンスを自動的に生成し、ユーザに対して音声出力する。そして、その後に音声入力された語句から不確定語句が確定されたならば、その後から入力された語句を有効にして音声入力データを確定させるようにしている。したがって、客が例えばガソリンの種類に関して「ガソリン」としか発声しなかったためにガソリンがレギュラーガソリンかハイオクガソリンかを特定できなかった場合でも、その後の音声入力によってガソリンの種類を確定できるので、やはり、注文内容を誰もが容易にかつ正しく音声で入力することができる。
【0064】
ところで、この実施の形態では、音声データから抽出されて語句メモリ61に格納された語句の中に同一項目の意味を有する語句が複数ある場合には、最も後から音声入力された語句を有効にして、項目別メモリ62に記憶するようにしている。したがって、例えばガソリンの種類を言い間違えて後から訂正した場合には、後から訂正した種類の語句が有効になるので、この点からも使い勝手のよいものである。
【0065】
なお、この実施の形態では、ガソリンスタンド給油システムの伝票発行装置に対する注文内容入力デバイスとして本発明を適用したが、本発明を適用できる情報処理装置はこれに限定されるものではなく、航空券,乗車券などの券発行装置や、レストラン,ファーストフード店でのオーダ登録装置等に対する注文内容入力デバイスとしても用いることができる。例えば航空券の券発行装置に対する入力デバイスとして用いた場合には、語句の意味が含まれる項目として出発日時,出発地,行先,航空会社,座席(禁煙席,窓側,通路側など)等が設定される。
【0066】
また、ファーストフード店でのオーダ登録装置に対する入力デバイスとして用いた場合には、語句の意味が含まれる項目として品名,数量,決済方法等が設定される。
【0067】
また、この実施の形態では、確定語句問合せガイダンスデータや不足項目語句問合せガイダンスデータを音声出力したが、音声入力確定部14に表示部を接続して、ガイダンスデータを画面に表示出力するように構成しても、同様な作用効果を奏し得る。
【0068】
また、この実施の形態では、ROM142に格納された音声入力プログラムをCPU141が実行することにより、音声入力装置としての機能を実現させたが、インタフェース146を介して外部機器からHDD装置145に音声入力プログラムをダウンロードし、このプログラムをCPU141が実行することによって、音声入力装置としての機能を実現させてもよい。
【0069】
【発明の効果】
以上詳述したように本発明の音声入力装置及び音声入力方法並びに音声入力プログラムであれば、音声入力する順番に捕われずに注文内容を正しく入力処理することができるので、音声入力装置の使い勝手を向上できる上、注文内容を誰もが容易にかつ正しく音声で入力できるようになる。
【図面の簡単な説明】
【図1】 本発明の一実施の形態である音声入力装置の構成を示すブロック図。
【図2】 図1における音声入力確定部の構成を示すブロック図。
【図3】 同音声入力確定部のHDD装置に記憶される主要なデータファイル及びデータテーブルを示す図。
【図4】 図3に示す各データファイルのレコード構成を示す図。
【図5】 図3に示すデータテーブルのデータ構成を示す図。
【図6】 同音声入力確定部のRAMに形成される主要なメモリエリアを示す図。
【図7】 同音声入力確定部のCPUが実行する主要なプログラム処理の手順を示す流れ図。
【図8】 同音声入力確定部の動作の一例におけるデータ例を示す図。
【図9】 同音声入力確定部の動作の他の例におけるデータ例を示す図。
【符号の説明】
1…音声入力装置
2…伝票発行装置
11…マイクロホン
12…スピーカ
13…音声エンジン部
14…音声入力確定部
15…音声入力スイッチ
31…語彙ファイル
32…辞書ファイル
33…ガイダンスファイル
34…確定条件テーブル
Claims (13)
- 音声入力された注文内容から予め登録されている語句を一つずつ抽出する語句抽出手段と、
この語句抽出手段により抽出された語句毎にその語句の意味が含まれる項目を判定する語句項目判定手段と、
この語句項目判定手段により項目が判定された各語句を項目別に記憶する語句記憶手段と、
この語句記憶手段により記憶された各語句の項目組合せパターンが注文品の種類,量および決済方法の項目からなる注文確定条件を満足するパターンか否かを判断する確定条件判断手段と、
この確定条件判断手段により各語句の項目組合せパターンが前記注文確定条件を満足するパターンであると判断されると、前記語句記憶手段により記憶された各語句を音声入力注文データとして確定させる注文確定手段と、
この注文確定手段により確定された音声入力注文データを、決済伝票を発行する伝票発行装置に転送する手段と、
を具備したことを特徴とする音声入力装置。 - 前記確定条件判断手段は、前記語句記憶手段により記憶された各語句の項目に基づいて予め設定された複数の項目組合せパターンの中から適合するパターンを抽出し、この抽出したパターンが注文品の種類,量および決済方法の項目からなる注文確定条件を満足するパターンか否かを判断する手段であることを特徴とする請求項1記載の音声入力装置。
- 前記確定条件判断手段により各語句の項目組合せパターンが前記注文確定条件を満足するパターンでないと判断されたとき、当該注文確定条件を満足するのに不足している項目の意味を有する語句の音声再入力を促す不足語句催促手段をさらに具備し、
前記注文確定手段は、前記不足語句催促手段により音声再入力を促した後に前記語句抽出手段により抽出された語句の意味が含まれる項目が前記注文確定条件を満足するのに不足していた項目であるとき、この語句と前記語句記憶手段により記憶された語句とを音声入力注文データとして確定させることを特徴とする請求項1または2記載の音声入力装置。 - 前記語句抽出手段により抽出された語句の中に不確定な語句が含まれるとき、その語句を確定させる音声の再入力を促す確定語句催促手段をさらに具備し、
前記語句記憶手段は、前記確定語句催促手段により音声再入力を促した後に前記語句抽出手段により抽出された語句を前記不確定な語句に代えて記憶することを特徴とする請求項1乃至3のいずれかに記載の音声入力装置。 - 前記語句抽出手段により抽出された語句の中に同一項目の意味を有する語句が複数あるとき、最も後から音声入力された語句を前記語句記憶手段により記憶することを特徴とする請求項1乃至4のいずれかに記載の音声入力装置。
- 音声入力された注文内容から予め登録されている語句を一つずつ抽出するステップと、抽出された語句毎にその語句の意味が含まれる項目を判定するステップと、前記抽出された各語句の項目組合せパターンが注文品の種類,量および決済方法の項目からなる注文確定条件を満足するパターンか否かを判断するステップと、前記抽出された各語句の項目組合せパターンが前記注文確定条件を満足するパターンであると判断されると前記各語句を音声入力注文データとして確定させるステップと、前記確定された音声入力注文データを、決済伝票を発行する伝票発行装置に転送するステップとからなることを特徴とする音声入力方法。
- 請求項6記載の音声入力方法において、
前記判断するステップは、前記抽出された各語句の項目に基づいて予め設定された複数の項目組合せパターンの中から適合するパターンを抽出し、この抽出したパターンが注文品の種類,量および決済方法の項目からなる注文確定条件を満足するパターンか否かを判断することを特徴とする音声入力方法。 - 請求項6または7記載の音声入力方法において、
前記抽出された各語句の項目組合せパターンが前記注文確定条件を満足するパターンでないと判断されたとき、当該注文確定条件を満足するのに不足している項目の意味を有する語句の音声再入力を促すステップを付加したことを特徴とする音声入力方法。 - 請求項6乃至8のいずれかに記載の音声入力方法において、
前記抽出された語句の中に不確定な語句が含まれるとき、その語句を確定させる音声の再入力を促すステップを付加したことを特徴とする音声入力方法。 - 音声入力機能を有し、決済伝票を発行する伝票発行装置に接続されたコンピュータに、
音声入力された注文内容から予め登録されている語句を一つずつ抽出する機能と、抽出された語句毎にその語句の意味が含まれる項目を判定する機能と、前記抽出された各語句の項目組合せパターンが注文品の種類,量および決済方法の項目からなる注文確定条件を満足するパターンか否かを判断する機能と、前記抽出された各語句の項目組合せパターンが前記注文確定条件を満足するパターンであると判断されると前記各語句を音声入力データとして確定させる機能と、前記確定された音声入力注文データを前記伝票発行装置へ転送する機能と、を実現させる音声入力プログラム。 - 請求項10記載の音声入力プログラムにおいて、
前記判断する機能は、前記抽出された各語句の項目に基づいて予め設定された複数の項目組合せパターンの中から適合するパターンを抽出し、この抽出したパターンが注文品の種類,量および決済方法の項目からなる注文確定条件を満足するパターンか否かを判断する機能であることを特徴とする音声入力プログラム。 - 請求項10または11記載の音声入力プログラムにおいて、前記コンピュータに、
前記抽出された各語句の項目組合せパターンが前記注文確定条件を満足するパターンでないと判断されたとき、当該注文確定条件を満足するのに不足している項目の意味を有する語句の音声再入力を促す機能をさらに実現させる音声入力プログラム。 - 請求項10乃至12のいずれかに記載の音声入力プログラムにおいて、前記コンピュータに、
前記抽出された語句の中に不確定な語句が含まれるとき、その語句を確定させる音声の再入力を促す機能をさらに実現させる音声入力プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002119409A JP3964724B2 (ja) | 2002-04-22 | 2002-04-22 | 音声入力装置及びその方法並びに音声入力プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002119409A JP3964724B2 (ja) | 2002-04-22 | 2002-04-22 | 音声入力装置及びその方法並びに音声入力プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003316388A JP2003316388A (ja) | 2003-11-07 |
JP3964724B2 true JP3964724B2 (ja) | 2007-08-22 |
Family
ID=29535979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002119409A Expired - Lifetime JP3964724B2 (ja) | 2002-04-22 | 2002-04-22 | 音声入力装置及びその方法並びに音声入力プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3964724B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4584615B2 (ja) * | 2004-04-21 | 2010-11-24 | 東芝テック株式会社 | 音声認識結果印字装置 |
JP5452407B2 (ja) * | 2010-07-30 | 2014-03-26 | 株式会社日立製作所 | オペレータ入力支援方法及び装置 |
JP6712940B2 (ja) * | 2016-10-27 | 2020-06-24 | トッパン・フォームズ株式会社 | 音声入力装置、音声入力方法 |
JP7334420B2 (ja) * | 2019-02-21 | 2023-08-29 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05197389A (ja) * | 1991-08-13 | 1993-08-06 | Toshiba Corp | 音声認識装置 |
JPH05216618A (ja) * | 1991-11-18 | 1993-08-27 | Toshiba Corp | 音声対話システム |
JPH07234694A (ja) * | 1994-02-21 | 1995-09-05 | N T T Data Tsushin Kk | 自動受付装置 |
JP3061343B2 (ja) * | 1994-03-07 | 2000-07-10 | 株式会社日立製作所 | 自動取引システム |
JPH11338494A (ja) * | 1998-05-22 | 1999-12-10 | Toshiba Corp | 音声認識システム及び方法 |
-
2002
- 2002-04-22 JP JP2002119409A patent/JP3964724B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2003316388A (ja) | 2003-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7860795B2 (en) | Systems and methods for processing check identifiers using replacement symbols | |
US5859416A (en) | Fuel pump system with automated transaction processing | |
US20030172030A1 (en) | Payee match positive pay banking | |
JP2002515993A (ja) | インボイス購入注文システム | |
US20150262119A1 (en) | Software application for the automated drop-off and pick-up of a service item at a service facility | |
JP3964724B2 (ja) | 音声入力装置及びその方法並びに音声入力プログラム | |
JP3915464B2 (ja) | チケット処理装置及びプログラム | |
KR20070053093A (ko) | 영업점 시스템에서의 거래 제휴 방법 | |
CN109191128A (zh) | 基于声纹识别及静态密码的车内支付方法与云端服务器 | |
JP2001283055A (ja) | 電子商取引システム及びその方法 | |
US7464037B2 (en) | Method for object delivery | |
CN112990868A (zh) | 车辆保险自动赔付方法、***、设备及存储介质 | |
US10885904B2 (en) | Electronic speech to text conversion systems and methods with natural language capture of proper name spelling | |
JP3945187B2 (ja) | 対話管理装置 | |
JPH1055196A (ja) | 音声認識装置および方法、情報記憶媒体 | |
CN112508547A (zh) | 提现执行方法、***、计算机设备及存储介质 | |
JP4516376B2 (ja) | 帳票処理システム | |
JPH11120269A (ja) | 音声入力会計システム及び音声入力会計プログラムを記憶した媒体 | |
JP2010266936A (ja) | 小口金精算装置、方法、及びコンピュータプログラム | |
JP2021128692A (ja) | 情報処理プログラム、装置、及び方法 | |
JP2010117805A (ja) | 自動取引システム | |
JPS6084665A (ja) | カ−ドを用いた信用取引処理装置 | |
JP2024046095A (ja) | 自動券売システム | |
CN117077659A (zh) | 一种报销信息处理方法及装置 | |
JP6974264B2 (ja) | 取引処理システム及び取引処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040316 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040525 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040723 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20041109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050107 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20050113 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20050204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070524 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 3964724 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100601 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110601 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120601 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130601 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130601 Year of fee payment: 6 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130601 Year of fee payment: 6 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |