JP2010271566A - 音声認識エンジンの管理方法、及び、その音声認識エンジンの管理方法を用いた管理システム、携帯端末、音声認識エンジン管理プログラム - Google Patents

音声認識エンジンの管理方法、及び、その音声認識エンジンの管理方法を用いた管理システム、携帯端末、音声認識エンジン管理プログラム Download PDF

Info

Publication number
JP2010271566A
JP2010271566A JP2009123874A JP2009123874A JP2010271566A JP 2010271566 A JP2010271566 A JP 2010271566A JP 2009123874 A JP2009123874 A JP 2009123874A JP 2009123874 A JP2009123874 A JP 2009123874A JP 2010271566 A JP2010271566 A JP 2010271566A
Authority
JP
Japan
Prior art keywords
recognition engine
worker
unit
voice recognition
portable terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2009123874A
Other languages
English (en)
Inventor
Fumitaka Sakai
文隆 酒井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2009123874A priority Critical patent/JP2010271566A/ja
Publication of JP2010271566A publication Critical patent/JP2010271566A/ja
Withdrawn legal-status Critical Current

Links

Images

Abstract

【課題】不特定多数の利用者が携帯端末を利用する場合においても、音声認識率を低下させることなく向上させることができる音声認識率の向上方法、管理システム、携帯端末及び携帯端末の音声認識率向上プログラムを提供する。
【解決手段】取得した音を音声認識エンジンにより音声として認識する音声認識部1−3を有した携帯端末1Aには、認識処理した作業者の個人特徴情報を管理サーバー2に送信させ、管理サーバー2は携帯端末1Aから送信された個人特徴情報を各業者毎に個人別データ記憶部2−3bに記憶すると共に、その携帯端末1Aを次回に使用する作業者について個人別データ記憶部2−3bに記憶されている個人特徴情報から次回作業者用音声認識エンジンを作成し、携帯端末1Aは次回の作業者の使用前に、音声認識エンジンを次回作業者用音声認識エンジンに更新する。
【選択図】図1

Description

本発明は、一台以上の携帯端末と管理用のサーバーとを備える管理システムにおいて音声認識率の向上を実現する音声認識エンジンの管理方法、及び、その音声認識エンジンの管理方法を用いた管理システム、携帯端末、音声認識エンジン管理プログラムに関する。
一般に、複数の作業者が従事する作業場所においては、作業者を管理する管理担当者を置き、各作業者の作業状態を把握している。従来、管理担当者の負担を軽減すべく、作業者自身が、実行中の作業内容を入力するシステムが提案されている(例えば、特許文献1参照)。
特許文献1に記載されたシステムでは、表示画面に作業者が行うべき業務が表示され、作業者は表示された業務を実行し、次の作業に移る毎にポインティングデバイスを操作して、実行中の作業の変更を入力するようになっている。
また、特許文献2には複数の作業者の作業状態を、作業者に複雑な操作を強いることなく、確実に記録することが可能な以下に記載の如き業務管理システムが記載されている。
すなわち、業務エリア内で作業者が発する音声を取得する集音装置と、前記集音装置が取得した音声を認識して文字データを生成する音声認識装置と、前記音声認識装置により生成された文字データから得られる情報と、この文字データに対応する音声を前記集音装置により取得した時刻を示す情報とを対応づけて、前記作業者毎に履歴記憶装置に記憶させる記憶制御装置と、を備えたことを特徴とする業務管理システムが記載されている。
この構成によれば、業務エリア内で作業者が発した音声から得た情報と、この音声を取得した時刻とが対応づけて記憶されるので、業務エリアにおける作業者の音声について正確な記録を行える。これにより、作業者が音声によって報告を行った場合に、この音声に基づいて文字データを生成して作業状態に関する情報を記録できる。また、作業者が顧客や他の作業者へ向けて発した音声を取得して、この音声に関するデータを取得することで、作業者が何ら意識しなくても作業状態を記録できる。このように、作業者に作業状態を記録するための特別な操作や作業を強いることなく、作業状態を確実に記録できる。
また、上記特許文献2には業務管理システムの構成要素として、以下の端末装置及び業務管理装置が記載されている。
図9は、特許文献2に記載の従来の端末装置20の機能的構成を示すブロック図である。図9に示すように、端末装置20は、端末装置20の各部を制御する制御部201と、制御部201により処理されるプログラムやデータ等を揮発的または不揮発的に記憶するメモリー203とを備える。制御部201は、音声認識ミドルウェア202を内部に記憶しており、この音声認識ミドルウェア202を実行することで、マイク24によって集音された従業員の音声をテキストデータに変換する機能を備える。また、制御部201は、メモリー203に記憶されたファームウェア204を読み出して実行することにより、端末装置20の各部を制御する。
端末装置20は、制御部201の制御のもとに、テキストデータとして入力された情報から音声信号を生成する音声発生LSI205と、音声発生LSI205により生成された音声信号を増幅するアンプ部206とを備え、アンプ部206により増幅された音声信号は本体部21が備えるイヤホン23に入力され、イヤホン23から従業員の耳に向けて音声が出力される。
また、端末装置20は、マイク24から出力された音声信号を増幅するアンプ部207と、アンプ部207により増幅されたアナログ音声信号をデジタル音声データに変換するA/Dコンバータ208とを備えている。A/Dコンバータ208は変換後のデジタル音声データを制御部201に出力し、制御部201は、音声認識ミドルウェア202の機能によって、入力されたデジタル音声データをテキストデータに変換する。
ここで、音声発生LSI205は、入力されたテキストデータを同じ言語の音声信号に変換する機能を備える。具体的には、音声発生LSI205は、日本語のテキストデータが入力された場合に、このテキストデータをもとに、内蔵する音声合成辞書データを参照して音声合成を行い、日本語の音声信号を生成する。また、音声発生LSI205に、中国語、英語、フランス語等の各種言語の音声合成辞書データを持たせた構成とすれば、音声発生LSI205によって、上記言語のテキストデータに基づいて、その同じ言語の音声信号を生成することができる。
この場合、図9に記載の業務管理装置30は無線通信ユニット32を介して中国語や英語のテキストデータを送信し、図8に記載の端末装置20は無線LANアンテナ215を介して、このテキストデータを受信して、音声信号を生成することにより、日本語以外の言語の音声を出力することも可能となる。例えば、日本語以外の言語を母語とする従業員がいた場合、この従業員に対して、イヤホン23から、母語の音声を出力して指示や連絡を行うことができる。
音声認識ミドルウェア202を実行する制御部201は、マイク24から出力された音声信号について、予め設定された言語(例えば、日本語)の音素解析等の処理を実行して音声認識を行い、上記設定された言語(例えば、日本語)のテキストデータを生成して出力する。
ここで、日本語以外の言語に係る音素解析用のデータを予め備えておくことにより、音声認識ミドルウェア202を多言語に対応可能なものとすれば、音声認識ミドルウェア202を実行する制御部201により、中国語や英語等の多言語の音声信号を認識して、その同じ言語のテキストデータを生成して出力することも可能である。
端末装置20は、業務管理装置30を含む無線LANを構成するための機能部として、無線LANベースバンド部211、無線LAN変復調部213、および無線LAN_RF部214を備えている。無線LANベースバンド部211は、制御部201から入力される情報を含むパケットを生成し、無線LAN変復調部213は、無線LANベースバンド部211により生成されたパケットを変調して無線LAN_RF部214に出力し、無線LAN_RF部214は、無線LAN変復調部213により生成された変調信号を、無線LANアンテナ215を介して無線送信する。
ここで、無線LANベースバンド部211は、端末装置20に固有のMAC(Media Access Control)アドレスを記憶したMACアドレスメモリー212を備えており、無線LANベースバンド部211により生成されるパケットには、MACアドレスメモリー212に記憶されたMACアドレスが含まれる。このMACアドレスは、上述した無線LANにおける通信制御において複数の端末装置20を識別する目的で使用される。
さらに、無線LAN_RF部214は、無線LANアンテナ215を介して受信した無線信号から変調信号を抽出して無線LAN変復調部213に出力し、無線LAN変復調部213は、この変調信号を復調してパケットを生成し、無線LANベースバンド部211は、無線LAN変復調部213により生成されたパケットに含まれる情報を制御部201に出力する。
図9に示す各部は、本体部21に内蔵されたバッテリー216から駆動電源の供給を受けて動作する。
図9に示すように構成される端末装置20は、ハードウェアとソフトウェアとの協働により、以下の機能を実現する。
無線通信機能:端末装置20は、制御部201によって、無線LANベースバンド部211、MACアドレスメモリー212、無線LAN変復調部213、無線LAN_RF部214および無線LANアンテナ215を制御することにより、業務管理装置30を含む無線LANを構成し、MACアドレス等の端末装置20を個体識別するための情報や、テキストデータ等を送受信する無線通信機能を実現する。
音声出力機能:端末装置20は、制御部201によって音声発生LSI205およびアンプ部206を制御し、アンプ部206からイヤホン23に音声信号を出力することにより、イヤホン23から音声を出力する音声出力機能を実現する。
音声認識機能:端末装置20は、制御部201によってアンプ部207、A/Dコンバータ208を制御するとともに、制御部201により音声認識ミドルウェア202を実行することによって、マイク24が集音した従業員の音声をテキストデータに変換して出力する音声認識機能を実現する。
図10は、業務管理装置30の機能的構成を示すブロック図である。
図10に示すように、業務管理装置30は、業務管理装置30の各部を制御する制御部301と、制御部301により処理されるプログラムやデータ等を揮発的または不揮発的に記憶するメモリー302とを備える。制御部301には、ディスプレイ31により各種画面を表示させる表示処理部303、無線通信ユニット32を介して各種データを送受信するネットワークインターフェイス部304、制御部301が実行するプログラム等を記憶する記憶部305、業務管理装置30に外部の装置を接続するための入出力インターフェイス部306、および、業務管理装置30外部のキー入力装置307が接続される。
表示処理部303は、制御部301の制御に従って、ディスプレイ31に各種画面を表示するための映像信号を生成してディスプレイ31へ出力する。ディスプレイ31は、CRT(Cathode Ray Tube)やLCD(液晶表示)パネル等の表示画面を備え、表示処理部303から入力される映像信号に基づいて各種の画像や文字からなる画面を表示する。
記憶部305は、磁気的または光学的に情報の記録・読取が可能な記録媒体または半導体記憶素子を用いた記憶装置であり、制御部301が実行する各種プログラムや、これらプログラムに係るデータ等を不揮発的に記憶する。
ネットワークインターフェイス部304は、無線通信ユニット32に接続され、制御部301の制御により、無線通信ユニット32を介して端末装置20との間で各種データを送受信する。
無線通信ユニット32は、業務エリアとしての遊技場において、端末装置20と共に無線LANを構成する装置であり、無線LANの規格に準拠した通信を実行するためのアンテナ、RF部、変復調部、ベースバンド部等を内蔵している。
入出力インターフェイス部306は、業務管理装置30に外部の装置を接続するためのインターフェイスであり、プリンタ33、および、記憶装置40が接続される。制御部301は、入出力インターフェイス部306を介して記憶装置40を制御することにより、記憶装置40内のデータベースに対し、データの格納、検索、抽出、更新、削除等の各種処理を実行する。また、制御部301は、入出力インターフェイス部306を介してプリンタ33を制御し、プリンタ33によって各種帳票を印刷出力させる。
また、キー入力装置307は、数字を含む文字キーや各種機能が割り当てられた機能キーを備えた装置であり、オペレータにより操作されたキーに対応する操作信号を生成して、制御部301に出力する。
図10に示すように構成される業務管理装置30は、ハードウェアとソフトウェアとの協働により、以下の機能を実現する。
無線通信機能:業務管理装置30は、制御部301によってネットワークインターフェイス部304を制御することにより、無線通信ユニット32と協働して、端末装置20との間で端末装置20を個体識別するための情報やテキストデータ等を送受信する無線通信機能を実現する。
スケジュール管理機能:業務管理装置30は、制御部301の機能により、キー入力装置307により入力されたスケジュールのデータを記憶部305に記憶する。このスケジュールのデータは、日付毎、および、従業員毎に入力され、記憶部305に記憶される。そして、制御部301は、例えばキー入力装置307の操作によってスケジュールの出力が指示された場合には、表示処理部303を制御してディスプレイ31にスケジュールを表示させ、さらに、入出力インターフェイス部306を介してプリンタ33を制御して、指定された従業員の指定された日付に係るスケジュールを、帳票として印刷出力する。
データベース管理機能:業務管理装置30は、制御部301によって、入出力インターフェイス部306を介して記憶装置40内のデータベースにアクセスし、記憶装置40内のデータベースに対し、データの格納、検索、抽出、更新、削除等の各種処理を実行する。
履歴記憶制御機能:業務管理装置30は、制御部301によって、端末装置20から無線通信ユニット32を介して受信したテキストデータと、端末装置20を識別するためのデータとに基づいて、端末装置20を装着している従業員の作業履歴に係る情報を取得し、この情報に基づいて、記憶装置40内のデータを更新する。
履歴出力機能:業務管理装置30は、制御部301によって入出力インターフェイス部306を介して記憶装置40内のデータを参照し、記憶装置40が記憶するデータベース内の履歴データを、帳票形式でプリンタ33により印刷出力させる。
特開平7−325870号公報 特開2008−293168号公報
上記のように従来の特許文献2に記載の端末装置には、端末装置の位置(即ち、当該端末装置を所持する作業者の位置)を検出する手段として、特許文献2の明細書の段落(0057)には、「これらの各種装置に加えて遊技場内の通路や壁等に、位置検出用の無線通信タグを設置し、この無線通信タグを端末装置20によって検出して位置を特定してもよい。この場合、端末装置20は、テキストデータとともに位置を示す情報を業務管理装置30へ無線送信することとなり、業務管理装置30は、従業員の位置を特定する必要がなく、無線送信されたテキストデータと位置情報を作業履歴データベース41に記憶させればよい。この場合、無線通信タグとしては、例えば、900MHz帯或いは2.45GHz帯の周波数を利用するRFID(Radio Frequency Identification)タグを用いることができる。」旨の記載がなされている。
このような、「通路や壁等に、位置検出用の無線通信タグ(例えば、RFIDタグ)を設置し、この無線通信タグを端末装置20によって検出して位置を特定する」方式では検出できる位置データは当該端末装置の存在する絶対位置データに限られるのが現状である。
しかし、近年の端末装置の用途の拡がりに応じて、端末装置の存在する絶対位置データのみでなく、端末装置の相対位置データ(端末装置が、所定の時間(時刻毎に)どの方向に、どのような速度、歩数で移動しているか)の取得が望まれていたが、端末装置の相対位置データを容易に取得できる端末装置は実現できてはいなかった。
上記のような課題を解決するため、既に出願人は以下の如き携帯端末及びその管理システムについて出願している。
図6及び図7を用いて出願人が先に出願している携帯端末及びその管理システムのハードウェア構成について説明する。
以下の説明では、携帯端末及びその管理システムが、飲食店で種々の作業を行う少なくとも1名の作業員(店員)の保持する携帯端末と前記携帯端末(作業員)を管理する管理サーバーに適用された場合を想定して説明する。
図6の1は少なくとも1名の作業員が保持する携帯端末であって、各作業員の頭部にセットされたマイクロフォンとスピーカーとを含むヘッドセットと対になって使用される。
前記携帯端末とヘッドセットとの間の通信は、有線でも無線でも良い。
図6の携帯端末1には、絶対位置検出部1−1と、相対位置検出部1−2と、音声認識部1−3と、後述の管理サーバーとの間で通信を行う通信部(図6では無線LAN通信部)1−4と、それらを制御する制御部(メインCPU)1−5と、図示しない電源(電池)が含まれている。
また、2は管理サーバー(プロセスコントローラー)であって、前記少なくとも1名の作業員の保持する携帯端末1と通信部(図6では無線LAN通信部1−4)を介して接続され、携帯端末1を介して当該携帯端末1を保持する作業員の管理若しくは作業に対する指示を与える等の本発明の全体的な管理を実行する。
また、管理サーバーの記憶部には、管理システムの適用分野に応じたデータベース(図6では、飲食店の管理であるので、飲食店のフロア地図データ等)が予め格納されている。
また、3は携帯端末1の絶対位置検出部1−1と対をなす絶対位置検出部(RFIDタグ等の固定部)であって、図6では、飲食店のフロアに配置された(少なくとも1つ以上又は)複数のテーブルに配置されている。
絶対位置検出部(RFIDタグ等の固定部)3には、近距離通信専用CPUを含む送受信部3−1とアンテナ3−2及び電池(固定部であるので必ずしも電池である必要はなく、商用電源でも良い。)が含まれている。
次に、図6の携帯端末1の構成を詳細に説明する。
図6の携帯端末1に設けられた絶対位置検出部1−1は、飲食店のフロアに配置された複数のテーブルに配置されている絶対位置検出部であるRFIDタグ3からアンテナ3−2を介して送信された近距離通信用の電波を絶対位置検出部1−1のアンテナ1−1aで受信して近距離通信専用CPU1−1bで処理して、当該携帯端末1の存在する絶対位置を算出する。
携帯端末1における通信に使用可能な近距離通信としては、上記RFIDによる近距離通信以外にも、「Bluetooth」(10m〜100m),「ZigBee」(10m〜70m),「Wibree」(10m),「UWB」(10m)等がある。
絶対位置検出部1−1の近距離通信専用CPU1−1bでは、フロアに配置された複数のアンテナ3−2から送信される電波を受信することによって、各アンテナ3−2の位置は予め定められているので、複数のアンテナ3−2から受信した電波の位相差等から、携帯端末1の存在する絶対位置の算出が可能である。
図6の相対位置検出部1−2には、相対位置検出センサーとして、3軸ジャイロセンサー1−2a、3軸加速度センサー1−2b、気圧センサー1−2c、地磁気センサー1−2dが設けられている。
図6の携帯端末1では、上記の4種類の相対位置検出センサーが設けられているが、携帯端末1及びその管理システムの適用分野に応じて、必ずしも4種類の相対位置検出センサーが必要とは限らず、前記4種類のセンサーの内のいずれか数種類若しくは、前記4種類とは別の相対位置検出センサーを設けることも可能である。
相対位置検出センサー1−2a〜1−2dで検出された相対位置データは、位置検出CPU1−2eで処理されて、当該携帯端末1及び管理システムが適用される用途に応じて、所定の時間(時刻毎に)どの方向に、どのような速度、歩数で移動しているのかという相対位置データが算出される。
この相対位置データの算出には、メモリー(ROM,RAM)1−2fに予め格納された相対位置演算用のプログラムが利用され、演算結果は、必要に応じて当該メモリーに格納される。
位置検出CPU1−2eで算出された、所定の時間(時刻毎に)どの方向に、どのような速度、歩数で移動しているのかという相対位置データは、メインCPU1−5に送信される。
1−4は無線LAN通信部であって、管理サーバー(プロセスコントローラー)2の無線LAN通信と対をなしている。管理サーバー2は、無線LAN通信によって作業指示のデータを携帯端末1のメインCPU1−5に送る。メインCPU1−5は、当該携帯端末1を保持する作業員の頭部にセットされたマイクロフォンとスピーカーとを含むヘッドセットを介して作業に対する指示を作業員に伝える。
1−3は上記携帯端末1に特有の音声認識部(モジュール)であって、主として携帯端末1を保持する作業員の頭部にセットされたマイクロフォンから作業員の発する音声を認識する。
音声認識部(モジュール)1−3の詳細については、図7を用いて以下に詳述する。
図7は、音声認識・発生部(モジュール)1−3を携帯端末1の他の部分である位置検出部(絶対位置検出部,相対位置検出部)1−1,1−2と制御部(メインCPU)1−5の、音声認識及び音声発生に関係する部分の機能構成を示した図である。
図7の音声認識部(モジュール)1−3は少なくとも1名の作業者が保持する携帯端末1の音声認識・発生部(モジュール)であって、作業員の頭部にセットされたヘッドセットのマイクロフォン1−6bとスピーカー1−6aとの間が有線若しくは無線で通信可能に接続されている。
音声認識・発生部(モジュール)は、音声認識・音声発生の専用ICで構成され、作業者の発する音声を作業者の頭部にセットされたヘッドセットのマイクロフォンで取得・認識(音声入力判別)してデジタルデータに変換(テキストデータ又はコードデータ等)して、制御部(メインCPU)に送出する。
また、制御部(メインCPU)から送出された作業者に対する指示等のデジタルデータ(テキストデータ又はコードデータ等)を音声データに変換(音声変換)して作業者の頭部にセットされたヘッドセットのスピーカーから送出する。
前記音声入力判別及び音声変換には、無条件での変換(判別)を実現するために、大きなデータベースと処理時間を要するが、本発明では、位置検出部による検出データを参照して、当該携帯端末1が存在する位置(場所)で使用される可能性のある用語に絞ったデータベースを使用することによって処理時間の短縮を図っている。
即ち、携帯端末1の存在する場所が異なった場合には、変換に使用するデータベースを変更することができる。
次に、上記携帯端末1及び管理サーバー2による位置検出に基づくデータ処理手順の例を図8のフローチャートを用いて以下に説明する。
まず、相対位置検出部1−2を構成する相対位置検出センサーである3軸ジャイロセンサー1−2a、3軸加速度センサー1−2b、気圧センサー1−2c、地磁気センサー1−2dの各検出出力を、位置検出CPU1−2eに送信する(ステップS1)。
次いで、位置検出CPU1−2eは、全てのセンサーの検出出力の内、各センサーの特性及び管理サーバー2が適用された用途等を考慮してメインCPU1−5に選択されたセンサー検出出力を送信する(ステップS2)。
次いで、メインCPU1−5は、3軸ジャイロセンサーの検出出力と、3軸加速度センサーの検出出力から移動距離を積分して算出する(ステップS3)。
メインCPU1−5は、3軸ジャイロセンサーの検出出力と、3軸加速度センサーの検出出力から歩数及び歩数に応じた移動距離を算出する(ステップS4)。
次いで、メインCPU1−5は、3軸ジャイロセンサーの検出出力から作業者の移動方向(向き)を算出する(ステップS5)。
次いで、絶対位置検出部1−1のアンテナ1−1aで受信した複数の受信電波の処理を近距離通信専用CPUで実行して得た携帯端末1の絶対位置データをメインCPU1−5に送信する(ステップS6)。
次いで、マイクロフォン1−6bで取得した音声を音声認識モジュール1−3でデジタルデータに変換(認識)され、その変換結果(認識結果)をメインCPU1−5に送信する(ステップS7)。
次いで、メインCPU1−5では、受信した絶対位置データを、メインCPU1−5で算出した、歩数、移動距離、端末の向き等のデータで補正をして、作業者(携帯端末)の向きを含むフロアにおける現在位置として算出する(ステップS8)。
作業者の音声認識結果データ及び作業者の補正された現在位置データに基づいて、予め蓄積された作業場所毎の作業者の作業に関する音声のデータベースに基づいて作業者の作業内容を特定する(ステップS9)。
メインCPU1−5では、前記作業者の作業内容データを作業者の補正された現在位置データと対応付けて、無線LAN通信部1−4を介して業務管理装置に送信する。(ステップS9’)
なお、ステップS3〜S5において算出した移動距離、歩数、移動方向等の相対位置データ、ステップS6において算出した絶対位置データは、データそのものを作業内容データと共に業務管理装置2に送信することもできる。ここでは、相対位置データを、主として絶対位置データを補正するために利用しているが、管理システムの適用分野に応じて管理サーバー2において他の用途のために利用することもできるからである。
次いで、管理サーバー2は、無線LANを介して受信した作業内容を基に、次に作業者に与える指示データを作成して無線LANを介して作業者端末に送信する(ステップS10)。
次いで、作業者端末1は、無線LANを介して受信した指示データを音声発生ICで音声に変換してスピーカーを介して音声で作業者に伝える(ステップS11)。
上述した発明では、携帯端末は、複数の作業者に汎用的に利用されることが前提である。このため、音声認識モジュール1−3も複数の作業者に共通(不特定話者)対応の音声認識・音声発生の専用ICで構成されている。
また、作業者の発する音声を作業者の頭部にセットされたヘッドセットのマイクロフォンで取得・認識(音声入力判別)してデジタルデータに変換(テキストデータ又はコードデータ等)し、制御部(メインCPU)に送出している。このため、予め登録されている音声辞書を使ってテキストデータを比較すれば音声認識はある程度は可能である。しかしながら、音声には作業者毎に個性があるため、作業者によっては確実な音声認識ができない場合がある。
本発明は、上記課題を解決するためになされたものであって、不特定多数の利用者が携帯端末を利用する場合においても、音声認識率を低下させることなく向上させることができる音声認識率の向上方法、管理システム、携帯端末及び携帯端末の音声認識率向上プログラムを提供することを目的とする。
上記課題を解決することのできる本発明は、音を取得する集音手段及び前記集音手段で取得した音を音声認識エンジンにより音声として認識処理する音声認識部と該音声認識部が取得したデータ等を記憶するデータ記憶部とを備えた少なくとも1台の携帯端末と、複数の作業者の勤務シフト管理表データを格納した管理表記憶部と各作業者に固有のデータを作業者毎に格納した個人別データ記憶部とを備えたサーバーと、を有する管理システムにおける音声認識エンジンの管理方法であって、
前記携帯端末は、
前記音声認識エンジンが取得した音声の個人特徴部分の情報を前記データ記憶部に記憶する個人特徴記憶ステップと、前記携帯端末に割り当てられている端末識別情報及び、前記携帯端末に割り当てられている作業者識別情報及び、前記個人特徴部分の情報を前記サーバーに送信する個識別情報送信ステップと、を実行し、
前記サーバーは、
前記携帯端末から受信した前記個人特徴部分の情報を前記作業者識別情報と共に個人別データ記憶部に記憶する受信データ記憶ステップと、前記管理表記憶部の勤務シフト管理表データに基づき特定した作業者の個人特徴部分の情報を前記個人別データ記憶部から読み出し、前記特定した作業者用に特化した次回作業者用音声認識エンジンを作成する認識エンジン作成ステップと、前記次回作業者用音声認識エンジンを、前記勤務シフト管理表データに基づき割り当てられる前記携帯端末へ送信する認識エンジン送信ステップと、を実行し、
更に前記携帯端末は、前記音声認識エンジンを前記サーバーから受信した前記次回作業者用音声認識エンジンに更新する音声認識エンジン更新ステップを実行することを特徴とする。
ここで、音声認識エンジンとは、入力された音を、保有している音声パターンと比較し、近似した音声パターンを抽出して出力するものである。
上記構成によれば、音声認識率を左右する重要な要素となる音声の個人特徴部分の情報が、携帯端末の使用時に収集されると共に携帯端末内のデータ記憶部に記憶され、更に、サーバーに送信され、サーバーの個人別データ記憶部に記憶・管理される。そして、サーバーは、携帯端末の次回の作業者を特定し、特定した作業者の個人特徴部分の情報が個人別データ記憶部に存在している場合には、その個人別データ記憶部内の個人特徴部分の情報を読み出して、次に使用する作業者用に特化した次回作業者用音声認識エンジンの作成を行い、サーバーから携帯端末に送信する。そして、次回作業者用音声認識エンジンを受信した携帯端末は、音声認識部で使用する音声認識エンジンをサーバーから受信した次回作業者用音声認識エンジンに更新する。
すなわち、不特定多数の作業者に使用される携帯端末であっても、携帯端末の使用経歴がある作業者が、再び携帯端末を使用する場合には、音声の個人特徴部分の情報がその作業者に特化された作業者専用の音声認識エンジンに更新される。このため、汎用の音声認識エンジンにより音声認識していた従来の場合と比較すると、作業者の個性により音声認識率が低下することがなく、高い音声認識率を確保できる。
また本発明において、前記サーバーは、前記携帯端末から前記個人特徴部分の情報を受信する度に、前記作業者識別情報に基づき、前記個人別データ記憶部に追加して記憶していくことを特徴とする。
上記構成によれば、サーバーの個人別データ記憶部に記憶される各作業者の個人特徴部分の情報は、携帯端末が作業者に使用されるほど情報量が増加していく。これにより、その個人特徴部分の情報を用いて作成される次回作業者用音声認識エンジンの内容が次第に充実し、作業者による携帯端末の使用量が増えるに従って、音声認識率が更に向上することが期待できる。
また本発明において、前記管理システムは、通信部を有するもので、前記携帯端末を充電する充電器を更に備え、
前記携帯端末は前記充電器を介して前記個人特徴部分の情報を前記サーバーへ送信し、前記携帯端末は前記充電器を介して前記次回作業者用音声認識エンジンを前記サーバーから受信することを特徴とする。
上記構成によれば、携帯端末を使用していた作業者が、作業終了時に携帯端末を充電器に装着すれば、上記音声認識エンジンの管理方法に示した個識別情報送信ステップ、受信データ記憶ステップ、認識エンジン作成ステップ、認識エンジン送信ステップ等の各処理ステップを自動的に実行させることが可能となる。また、携帯端末を使用していた作業者が特に意識して情報の更新操作を行わなくても、作業者に負担をかけずに、携帯端末に搭載される音声認識エンジンを次の作業者用に更新することができる。
また上記課題を解決することのできる本発明は、1台以上の携帯端末と、前記携帯端末とデータの送受信が可能なサーバーとを備えた管理システムであって、
前記携帯端末は、音を取得する集音手段と、前記集音手段で取得した音を音声認識エンジンにより音声として認識処理する音声認識部と、前記音声認識部が取得した音声の個人特徴部分の情報を記憶するデータ記憶部と、前記携帯端末に割り当てられている端末識別情報及び、前記携帯端末に割り当てられている作業者識別情報及び、前記個人特徴部分の情報を前記サーバーに送信する送信部と、を備え、
前記サーバーは、前記携帯端末を保有する複数の作業者の勤務シフト管理表データを格納した管理表記憶部と、前記携帯端末から受信した前記個人特徴部分の情報を前記作業者識別情報と共に記憶する個人別データ記憶部と、前記勤務シフト管理表データに基づき特定した作業者の個人特徴部分の情報を前記個人別データ記憶部から読み出して、前記特定した作業者用に特化した次回作業者用音声認識エンジンを作成する次回作業者用音声認識エンジン作成部と、前記次回作業者用音声認識エンジンを、前記勤務シフト管理表データに基づき割り当てられる前記携帯端末へ送信する送信部と、を備え、
更に前記携帯端末は、前記音声認識エンジンを前記サーバーから受信した前記次回作業者用音声認識エンジンに更新する音声認識エンジン更新部を備えていることを特徴とする。
上記構成によれば、上記記載の音声認識エンジンの管理方法を実行して、音声認識率の向上を図ると共に、音声認識処理用に音声認識部に備えるICやメモリーの、コスト低減を図ることができる。
また上記課題を解決することのできる本発明は、サーバーとデータの送受信が可能な携帯端末であって、
音を取得する集音手段と、前記集音手段で取得した音を音声認識エンジンにより音声として認識処理する音声認識部と、前記音声認識部が取得した音声の個人特徴部分の情報を記憶するデータ記憶部と、前記携帯端末に割り当てられている端末識別情報及び、前記携帯端末に割り当てられている作業者識別情報及び、前記個人特徴部分の情報を前記サーバーに送信する送信部と、前記サーバーから次回作業者用音声認識エンジンを受信すると、前記音声認識エンジンを前記サーバーから受信した前記次回作業者用音声認識エンジンに更新する音声認識エンジン更新部と、を備えていることを特徴とする。
上記構成によれば、音声認識部で使用する音声認識エンジンは、使用前に、使用する作業者個人に特化した音声認識エンジンに更新されるため、不特定多数の作業者に使用される携帯端末であっても、汎用の音声認識エンジンにより音声認識していた従来の携帯端末と比較すると、作業者の個性により音声認識率が低下することがなく、高い音声認識率を確保できる。
また上記課題を解決することのできる本発明は、サーバーとデータの送受信が可能な携帯端末に搭載されている制御部に実行させる音声認識エンジン管理プログラムであって、
前記制御部を、
集音手段から取得した音を音声認識エンジンにより音声として認識処理する音声認識部と、前記音声認識エンジンが取得した音声の個人特徴部分の情報を記憶するデータ記憶部と、前記携帯端末に割り当てられている端末識別情報及び、前記携帯端末に割り当てられている作業者識別情報及び、前記個人特徴部分の情報を前記サーバーに送信する送信部と、前記サーバーから次回作業者用音声認識エンジンを受信すると、前記音声認識エンジンを前記サーバーから受信した前記次回作業者用音声認識エンジンに更新する音声認識エンジン更新部と、して機能させることを特徴とする。
上記構成によれば、携帯端末のCPUなどから成る制御部にプログラムを実行させることで上記記載の携帯端末を実現することができ、上記記載の携帯端末の普及・利用を容易にすることができる。
本発明に係る音声認識エンジンの管理方法を実施する管理システムの一実施形態の概略構成を示すブロック図である。 図1に示した管理システムの携帯端末とサーバーとの間のデータの送受形態を示す概略図である。 本実施形態の携帯端末の音声認識モジュールと管理サーバーとの間の内部処理を説明するためのブロック図である。 本実施形態の管理サーバーが管理する勤務シフト管理表データの構成図である。 本実施形態の管理システムにおける音声認識エンジンの管理方法を示すフローチャートである。 本出願人が先に出願した管理システムの概略構成を示すブロック図である。 図6の携帯端末における音声認識モジュールの詳細な構成を示すブロックである。 図6の管理システムにおけるデータ処理手順を示すフローチャートである。 従来の携帯端末装置の機能的構成を示すブロック図である。 図9に示した携帯端末装置を介して業務管理を行う業務管理装置の概略構成を示すブロック図である。
以下、本発明に係る音声認識エンジンの管理方法、及び、その音声認識エンジンの管理方法に好適な管理システム、携帯端末、音声認識エンジン管理プログラムの好適な実施の形態について、図面を参照して詳細に説明する。
図1に示すように本実施形態の管理システム10は、例えば飲食店等において種々の作業を行う作業者の業務管理等を行うもので、1個以上の携帯端末1Aと、これらの携帯端末1Aを管理する管理サーバー2Aと、携帯端末1Aにおける絶対位置検出のために管理サーバー2Aの管理エリア内の適所に配置される1個以上の固定の絶対位置検出用タグ3とから構成されている。
絶対位置検出用タグ3には、固有の識別情報(ID)が付与されている。絶対位置検出用タグ3は、携帯端末1Aとの間で相互に通信可能に構成され、携帯端末1Aからの要求に応じて、自己に付与されているIDを含むID情報を携帯端末1Aに対して送信する。
携帯端末1Aと、絶対位置検出用タグ3とは、例えば900MHz帯或いは2.45GHz帯の周波数を利用するRFID(Radio Frequency Identification)の通信方式に従ってID情報等の各種情報を送受信する。例えば、管理サーバー2Aの管理エリアである飲食店のフロア内の所定の位置に固定装備されており、一定距離内の携帯端末1AへID情報データを送信する。
図1に示すように、携帯端末1Aの内部構成は、主として絶対位置検出部1−1、相対位置検出部1−2、音声認識モジュール1−3、無線LAN通信部1−4及びメインCPU1−5を備える。
絶対位置検出部1−1は、RFIDタグリーダーアンテナ1−1aを備えており、このRFIDタグリーダーアンテナ1−1aを介して、携帯端末1Aから所定距離以内に位置する絶対位置検出用タグ3との間で通信を実行する。近距離通信専用CPU1−1bは、具体的には店舗フロアに配置された絶対位置検出用タグ3から送信された近距離通信用の電波を解析し、各位置検出用タグに固有のIDを当該携帯端末1Aが存在する絶対位置として取得する。取得したIDはメインCPU1−5へ送信する。
なお、本発明に使用可能な近距離通信としては、上記RFIDによる近距離通信以外にも、「Bluetooth」(10m〜100m)、[ZigBee](10m〜70m)、[Wibree](10m)、[UWB](10m)等がある。
相対位置検出部1−2は、相対位置検出センサーとして、3軸ジャイロセンサー1−2a(角速度センサー)、3軸加速度センサー1−2bが設けられている。本実施形態の携帯端末1Aには、2種類の相対位置検出センサーが設けられているが、作業管理システム10の適用分野に応じて、2種類の相対位置検出センサーとは別のGPS等のような位置検出手段を使用することも可能である。位置検出CPU1−2eは、3軸ジャイロセンサー1−2a、3軸加速度センサー1−2bが検出した相対位置データを各データ特性に応じて最適化する。最適化された相対位置データは、メインCPU1−5へ送信される。
RAMやROMを備えるメモリー1−2fには、相対位置データ演算用のプログラムが格納されている。位置検出CPU1−2eはROMに記憶されている演算用のプログラムをRAM上に読み出し、相対位置の演算処理を実行する。演算結果は必要に応じてメモリー1−2fに格納される。
音声認識モジュール1−3には、管理サーバー2から出力される音声信号に基づいて音声を出力する不図示のスピーカーと、作業者が発した音声を集音する集音手段51(マイク)と、が接続されている。
また音声認識モジュール1−3は、音−デジタルデータ変換手段1−3aを備え、作業者の発する声を作業者の頭部にセットされたヘッドセットのマイク51から集音した音声データをデジタルデータに変換(テキストデータ又はコードデータ等)して、メインCPU1−5へ送信する。
また、音−デジタルデータ変換手段1−3aは、メインCPU1−5から送信されたデジタルデータ(テキストデータ又はコードデータ等)を音声データに変換して作業者の頭部にセットされたヘッドセットのスピーカーから送出することができる。音声認識モジュール1−3は不図示のROMに記憶されている演算用のプログラムをRAM上に読み出し、音声認識及び音声発生のための演算処理を実行する。
無線LAN通信部1−4は、上述したように管理サーバー2Aとの間で無線通信を実行する。
メインCPU1−5は、3軸加速度センサー1−2bから得られた加速度データを2回積分演算することで携帯端末1Aを携帯している作業者の移動距離を算出する(以降積分モデルと呼ぶ)。もしくは、3軸加速度センサー1−2bから得られた加速度データの強度を測定し、作業者の歩行の有無を判別することで作業者の歩数による移動距離を算出する方法を用いることもできる(以降歩行モデルと呼ぶ)。さらにメインCPU1−5は、3軸ジャイロセンサー1−2aから得られた角速度データを1回積分することによって携帯端末1Aの向き、すなわち作業者の向きを算出する。そして、積分モデルもしくは、歩行モデルにより算出された歩行者の移動距離と、端末の向き及び近距離通信用CPU1−1bから受信した絶対位置データに基づいて、携帯端末1Aの現在位置データと作業者が向いている方向を算出する。
算出された携帯端末1Aの現在位置データ及び作業者の向いている方向は、無線LAN通信部1−4を介して、管理サーバー2Aへ送信される。
また、メインCPU1−5は、音声認識モジュール1−3を制御し、音−デジタルデータ変換手段1−3aから受信したデジタルデータを、無線LAN通信部1−4を介して管理サーバー2Aへ送信する。
管理サーバー2Aは、コンピューターにインストールされている業務管理用のプログラムを実行することにより、管理エリア内に存在する各携帯端末1Aと情報の送受信を行って、所定の業務管理を遂行する。
管理サーバー2Aは、図1に示すように、複数の携帯端末1Aと無線通信によりデータの送受を可能にする無線LAN通信部2−1と、当該管理サーバー2Aの管理エリアのフロアの各部の位置データ(座標データ)が記録されたフロア地図データ2−2と、不図示の記憶部にインストールされている管理プログラムを実行して複数の携帯端末1Aとのデータの送受や、作業指示等を実行する制御部2−3とを備えている。
次に、本実施形態の携帯端末の音声認識モジュール1−3と、管理サーバー2Aと、の間で行う音声認識エンジンの更新処理について、図2〜図5を参照して詳細に説明する。
図2に示すように、本実施形態の携帯端末1Aは、携帯端末1Aを挿入装着する充電器13によって充電される。充電器13には、携帯端末1Aが装着される充電用端末収容部14が設けられ、さらに充電器13は管理サーバー2Aとサーバー接続コード73によって通信可能に接続されている。
充電用端末収容部14内には、図3に示すようにサーバー接続コード73に接続された管理サーバー2Aの受信部71を携帯端末1Aの送信部57に接続する端子と、サーバー接続コード73に接続された管理サーバー2Aの送信部72を携帯端末1Aの受信部58に接続する端子と、が装備されている。
すなわち、充電器13は、携帯端末1Aの送信部57と管理サーバー2Aの受信部71とを接続し、且つ携帯端末1Aの受信部58と管理サーバー2Aの送信部72とを接続する接続器を兼用していて、携帯端末1Aと管理サーバー2Aとの間の情報の送受信を可能にする。
図3に示すように音−デジタルデータ変換手段1−3aは、音声認識専用IC1−3b、音声認識辞書テーブル1−3c、データ記憶部1−3e及び音声認識エンジン更新手段1−3fを備えている。
音声認識IC1−3bは、集音手段51から入力する音に対して、音声認識に必要な各種の処理を行う。すなわち、音声認識IC1−3bには、音声認識エンジン1−3dが組み込まれており、音声認識辞書テーブル1−3cに基づいて、音データの解析、単語の照合等を行うことで、音声の認識を行う。
そして、音声認識IC1−3bは、音声認識結果を、テキストデータ等のデジタルデータとして、メインCPU1−5に送信する。メインCPU1−5は、音声認識モジュール1−3からの認識結果を、無線通信等で、逐次、管理サーバー2Aに送信する。管理サーバー2Aは、携帯端末1Aから無線通信で送られてくる認識結果により、その携帯端末1Aを使用している作業者の業務状況を把握することができる。
また、音声認識IC1−3bは、音声認識エンジン1−3dにより音声認識処理を実施した際に取得した音声の個人特徴部分の情報をファイル化し、データ記憶部1−3eに記憶させる。データ記憶部1−3eに記憶された個人特徴部分の情報ファイルは、充電器13を介して携帯端末1Aと管理サーバー2Aとが情報送受の可能な接続状態にされると、充電器13を介して管理サーバー2Aへ送信される。
なお、個人特徴部分の情報ファイルの他、自己端末に割り当てられている端末識別情報である端末ID及び自己端末をそれまで使用していた作業者に割り当てられている作業者識別情報であるユーザーIDもサーバー接続コード73を介して送信される。
個人特徴部分の情報ファイルは、テキストデータに変換される前のアナログの音声データであってもデジタルデータであってもよいが、個人の音声の抑揚やなまりなどの癖がデータに現れていれば良い。個人特徴部分の情報ファイルは、ユーザーIDとともにデータ記憶部1−3eに記憶される。
一方、管理サーバー2Aは、更に、携帯端末1Aの送信部57に充電器13を介して接続される受信部71と、携帯端末1Aの受信部58に充電器13を介して接続される送信部72を備えている。
また、管理サーバー2Aの制御部2−3は、携帯端末1Aを保有する複数の作業者の勤務シフト管理表データD1を格納した管理表記憶部2−3aと、充電器13を介して携帯端末1Aから受信した個人特徴部分の情報ファイルを作業者ID毎に記憶する個人別データ記憶部2−3bと、勤務シフト管理表データD1に基づき、次にその携帯端末1Aを使用する作業者の個人特徴部分の情報を個人別データ記憶部2−3bから読み出して、次に使用する作業者用に特化した個人用音声認識エンジンを作成する個人用音声認識エンジン作成部2−3cとを、備えている。
管理サーバー2Aに装備した送信部72は、充電器13を介して携帯端末1Aの受信部58に接続されると、個人用音声認識エンジン作成部2−3cが作成した次回作業者用音声認識エンジンを、携帯端末1Aに送信する。
個人用音声認識エンジン作成部2−3cは、個人別データ記憶部2−3bから読み出したエンジンの個人特徴部分2−3dと、不特定多数に共通なエンジンの基本部分2−3eとから、個人の個性に合わせた個人用音声認識エンジンを作成する。
管理表記憶部2−3aに記憶される勤務シフト管理表データD1は、図4に示すように、各就業日d1,d2,d3……毎に、就業する各作業者の作業者のユーザーID(図4では、01,02,03,04等の数字2桁のデータ)、各作業者の就業時間帯、各作業者が使用予定の携帯端末1Aの端末ID(図4では、aa,bb,cc,ddなど、アルファベット2文字のデータ)などを一覧表示している。
次に、以上に説明した管理システム10において実施する音声認識エンジンの管理方法を図4及び図5に基づいて説明する。
まず、作業者は携帯端末1Aを使用した業務を開始する際に、自己のユーザーIDを携帯端末1Aに登録しておく(ステップS101)。顧客との会話等による音声入力があると(ステップS102)、音声認識モジュール1−3において音声認識を開始する。音声認識エンジン1−3dが取得した音声の個人特徴部分の情報をファイル化してデータ記憶部1−3dに記憶する(ステップS103)。
そして、作業者によって勤務終了時に携帯端末1Aが充電器13の充電用端末収容部14に挿入設置されると(ステップS104)、携帯端末1Aと管理サーバー2Aとが接続状態になる。管理サーバー2Aは、充電器13を介して携帯端末1Aが接続されたことを検知する。
充電器13を介して携帯端末1Aが接続されたことを検知した管理サーバー2Aは、充電器13上の携帯端末1Aの端末IDと携帯端末1Aを使用していた作業者のユーザーIDを確認し(ステップS201)、更に管理表記憶部2−3aの勤務シフト管理表データD1に基づき、その携帯端末1Aを次回に使用する予定の作業者を特定する(ステップS202)。
例えば、現在、充電器13を介してサーバー2Aに接続されている携帯端末1Aは、図4の勤務シフト管理表データD1上で、4月20日の端末ID:aaである場合、その携帯端末を次回使用する予定の作業者は、勤務シフト管理表データD1上で4月21日に端末ID:aaを使用するユーザーID:06の田中さんであると特定することができる。
次に、管理サーバー2Aの制御部2−3は、携帯端末1A内のデータ記憶部1−3eの個人特徴部分の情報ファイルを確認し(ステップS203)、個人特徴部分の情報ファイルが更新されているか否かを判定する(ステップS204)。すなわち、携帯端末1Aを次に使用する作業者の個人特徴部分の情報ファイルに更新されているかを判定する。例えば、携帯端末1Aから取得したユーザーID:01によると、先に使用してした作業者は山田さんであることがわかる。次に使用する作業者はユーザーID:06の田中さんであるため、個人特徴部分の情報ファイルの更新がなされていないことがわかる。
個人特徴部分の情報ファイルが更新されていないと判定すると(ステップS204:No)、管理サーバーの制御部2−3は携帯端末1Aのデータ記憶部1−3eに記憶されている個人特徴部分の情報ファイルの送信を要求する(ステップS105)。携帯端末1Aから個人特徴部分の情報ファイルを受信すると、個人別データ記憶部2−3bに保存する(ステップS205)。
次に、管理サーバー2Aの音声認識エンジン作成部2−3cは、管理表記憶部2−3aの勤務シフト管理表データD1に基づき、次にその携帯端末1Aを使用する作業者(例えば、ユーザーID:06の田中さん)の個人特徴部分の情報ファイルを個人別データ記憶部2−3bから読み出す(ステップS206)。
個人特徴部分の情報ファイルを受けた次回作業者用音声認識エンジン作成部2−3cは、次に使用する作業者用に特化した次回作業者用音声認識エンジンを作成し(ステップS207)、作成した次回作業者用音声認識エンジンを携帯端末1Aへ送信する(ステップS208)。
携帯端末1Aは、管理サーバー2Aから次回作業者用音声認識エンジンを受信すると(ステップS106)、再起動する(ステップS107)。音声認識エンジン更新手段1−3fは、音声認識エンジン1−3dを管理サーバー2Aから受信した次回の作業者用音声認識エンジンに更新し(ステップS108)、携帯端末1Aの表示部に次回の端末使用予定者を表示して(ステップS109)、処理を終了する。
なお、本実施形態の音声認識エンジンの管理方法では、管理サーバー2Aは、携帯端末1Aから個人特徴部分の情報ファイルを受信する度に、受信した情報は、個人別データ記憶部2−3bに、ユーザーID毎に追加して記憶していくことで、個人特徴部分の情報ファイルを拡充していく。
以上に説明した音声認識エンジンの管理方法では、音声認識率を左右する重要な要素となる音声の個人特徴部分の情報ファイルが、携帯端末1Aの使用時に収集されると共に、ステップS103により携帯端末1A内のデータ記憶部1−3eに記憶される。更に、ステップS105により管理サーバー2Aに送信され、管理サーバー2AにおけるステップS205によって管理サーバー2Aの個人別データ記憶部2−3bに記憶・管理される。
そして、管理サーバー2Aは、携帯端末1Aの次回の作業者を特定し、特定した作業者の個人特徴部分の情報ファイルが個人別データ記憶部2−3bに存在している場合には、音声認識エンジン作成部2−3cがその個人別データ記憶部2−3b内の個人特徴部分の情報ファイルを読み出して、次に使用する作業者用に特化した音声認識エンジンを作成する。そして、作成された音声認識エンジンは管理サーバー2Aから携帯端末1Aに送信される。
そして、管理サーバー2Aから次に使用する作業者用の音声認識エンジンを受信した携帯端末1Aは、音声認識エンジン1−3dを管理サーバー2Aから受信した音声認識エンジンに更新する。すなわち、不特定多数の作業者に使用される携帯端末1Aであっても、音声の個人特徴部分の情報がその作業者に特化されているその作業者専用の音声認識エンジンに更新されているため、汎用の音声認識エンジンにより音声認識していた従来の場合と比較すると、作業者の個性により音声認識率が低下することがなく、高い音声認識率を確保できる。
また、本実施形態の場合、管理サーバー2Aは、携帯端末1Aから個人特徴部分の情報ファイルを受信する度に、作業者毎に個人別データ記憶部2−3bに記録を追加する。
そのため、管理サーバー2Aの個人別データ記憶部2−3bに記憶される作業者毎の個人特徴部分の情報ファイルは、携帯端末1Aが作業者に使用されるほど情報量が増加していく。これにより、その個人特徴部分の情報ファイルを用いて作成される次回作業者用音声認識エンジンも内容が次第に充実することになり、作業者による携帯端末1Aの使用量が増えるに従って、音声認識率が更に向上することが期待できる。
更に、上記実施の形態に示した音声認識エンジンの管理方法の場合、管理システム10には、携帯端末1Aを充電する充電器13を備えた構成としており、更に、携帯端末1Aは充電器13を介して個人特徴部分の情報を管理サーバー2Aへ送信し、携帯端末1Aは充電器13を介して音声認識エンジンを管理サーバー2Aから受信するようにしている。
このような構成では、携帯端末1Aを使用していた作業者が、作業の終了時に、携帯端末1Aの充電のために、携帯端末1Aを充電器13に装着すれば、図5の音声認識エンジンの管理方法に示した個識別情報送信ステップS105、受信データ記憶ステップS205、認識エンジン作成ステップS207、認識エンジン送信ステップS208等の各処理ステップを自動的に実行させることが可能になる。携帯端末1Aを使用していた作業者が特に意識して情報の更新操作を行わなくても上記の音声認識エンジンの管理方法を実現可能になる。
すなわち、作業者に負担をかけずに、携帯端末1Aに搭載される音声認識エンジンを次の作業者用に更新することができ、携帯端末1Aの取り扱い性を向上させることができる。
1A:携帯端末、1−3:音声認識モジュール、1−3b:音声認識IC、1−3c:音声認識辞書テーブル、1−3d:音声認識エンジン、1−3e:データ記憶部、1−3f:音声認識エンジン更新手段、2A:管理サーバー、2−3a:管理表記憶部、2−3b:個人別データ記憶部、2−3c:個人用音声認識エンジン作成部、10:管理システム、13:充電器、14:充電用端末収容部、51:集音手段、57,72:送信部、58,71:受信部、73:サーバー接続コード。

Claims (6)

  1. 音を取得する集音手段及び前記集音手段で取得した音を音声認識エンジンにより音声として認識処理する音声認識部と該音声認識部で取得したデータ等を記憶するデータ記憶部とを備えた少なくとも1台の携帯端末と、複数の作業者の勤務シフト管理表データを格納した管理表記憶部と各作業者に固有のデータを作業者毎に格納した個人別データ記憶部とを備えたサーバーと、を有する管理システムにおける音声認識エンジンの管理方法であって、
    前記携帯端末は、
    前記音声認識エンジンが取得した音声の個人特徴部分の情報を前記データ記憶部に記憶する個人特徴記憶ステップと、
    前記携帯端末に割り当てられている端末識別情報及び、前記携帯端末に割り当てられている作業者識別情報及び、前記個人特徴部分の情報を前記サーバーに送信する個識別情報送信ステップと、を実行し、
    前記サーバーは、
    前記携帯端末から受信した前記個人特徴部分の情報を前記作業者識別情報と共に個人別データ記憶部に記憶する受信データ記憶ステップと、
    前記管理表記憶部の勤務シフト管理表データに基づき特定した作業者の個人特徴部分の情報を前記個人別データ記憶部から読み出して、前記特定した作業者用に特化した次回作業者用音声認識エンジンを作成する認識エンジン作成ステップと、
    前記次回作業者用音声認識エンジンを、前記勤務シフト管理表データに基づき割り当てられる前記携帯端末へ送信する認識エンジン送信ステップと、を実行し、
    更に前記携帯端末は、前記音声認識エンジンを前記サーバーから受信した前記次回作業者用音声認識エンジンに更新する音声認識エンジン更新ステップを実行することを特徴とする音声認識エンジンの管理方法。
  2. 前記サーバーは、前記携帯端末から前記個人特徴部分の情報を受信する度に、前記作業者識別情報に基づき、前記個人別データ記憶部に追加して記憶していくことを特徴とする請求項1に記載の音声認識エンジンの管理方法。
  3. 前記管理システムは、通信部を有するもので、前記携帯端末を充電する充電器を更に備え、
    前記携帯端末は前記充電器を介して前記個人特徴部分の情報を前記サーバーへ送信し、前記携帯端末は前記充電器を介して前記次回作業者用音声認識エンジンを前記サーバーから受信することを特徴とする請求項1又は2に記載の音声認識エンジンの管理方法。
  4. 1台以上の携帯端末と、前記携帯端末とデータの送受信が可能なサーバーとを備えた管理システムであって、
    前記携帯端末は、音を取得する集音手段と、前記集音手段で取得した音を音声認識エンジンにより音声として認識処理する音声認識部と、前記音声認識部が取得した音声の個人特徴部分の情報を記憶するデータ記憶部と、前記携帯端末に割り当てられている端末識別情報及び、前記携帯端末に割り当てられている作業者識別情報及び、前記個人特徴部分の情報を前記サーバーに送信する送信部と、を備え、
    前記サーバーは、前記携帯端末を保有する複数の作業者の勤務シフト管理表データを格納した管理表記憶部と、前記携帯端末から受信した前記個人特徴部分の情報を前記作業者識別情報と共に記憶する個人別データ記憶部と、前記勤務シフト管理表データに基づき特定した作業者の個人特徴部分の情報を前記個人別データ記憶部から読み出して、前記特定した作業者用に特化した次回作業者用音声認識エンジンを作成する次回作業者用音声認識エンジン作成部と、前記次回作業者用音声認識エンジンを、前記勤務シフト管理表データに基づき割り当てられる前記携帯端末へ送信する送信部と、を備え、
    更に前記携帯端末は、前記音声認識エンジンを前記サーバーから受信した前記次回作業者用音声認識エンジンに更新する音声認識エンジン更新部を備えていることを特徴とする管理システム。
  5. サーバーとデータの送受信が可能な携帯端末であって、
    音を取得する集音手段と、
    前記集音手段で取得した音を音声認識エンジンにより音声として認識処理する音声認識部と、前記音声認識部が取得した音声の個人特徴部分の情報を記憶するデータ記憶部と、
    前記携帯端末に割り当てられている端末識別情報及び、前記携帯端末に割り当てられている作業者識別情報及び、前記個人特徴部分の情報を前記サーバーに送信する送信部と、
    前記サーバーから次回作業者用音声認識エンジンを受信すると、前記音声認識エンジンを前記サーバーから受信した前記次回作業者用音声認識エンジンに更新する音声認識エンジン更新部と、
    を備えていることを特徴とする携帯端末。
  6. サーバーとデータの送受信が可能な携帯端末に搭載されている制御部に実行させる音声認識エンジン管理プログラムであって、
    前記制御部を、
    集音手段から取得した音を音声認識エンジンにより音声として認識処理する音声認識部と、
    前記音声認識エンジンが取得した音声の個人特徴部分の情報を記憶するデータ記憶部と、
    前記携帯端末に割り当てられている端末識別情報及び、前記携帯端末に割り当てられている作業者識別情報及び、前記個人特徴部分の情報を前記サーバーに送信する送信部と、
    前記サーバーから次回作業者用音声認識エンジンを受信すると、前記音声認識エンジンを前記サーバーから受信した前記次回作業者用音声認識エンジンに更新する音声認識エンジン更新部と、して機能させることを特徴とする音声認識エンジン管理プログラム。
JP2009123874A 2009-05-22 2009-05-22 音声認識エンジンの管理方法、及び、その音声認識エンジンの管理方法を用いた管理システム、携帯端末、音声認識エンジン管理プログラム Withdrawn JP2010271566A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009123874A JP2010271566A (ja) 2009-05-22 2009-05-22 音声認識エンジンの管理方法、及び、その音声認識エンジンの管理方法を用いた管理システム、携帯端末、音声認識エンジン管理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009123874A JP2010271566A (ja) 2009-05-22 2009-05-22 音声認識エンジンの管理方法、及び、その音声認識エンジンの管理方法を用いた管理システム、携帯端末、音声認識エンジン管理プログラム

Publications (1)

Publication Number Publication Date
JP2010271566A true JP2010271566A (ja) 2010-12-02

Family

ID=43419627

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009123874A Withdrawn JP2010271566A (ja) 2009-05-22 2009-05-22 音声認識エンジンの管理方法、及び、その音声認識エンジンの管理方法を用いた管理システム、携帯端末、音声認識エンジン管理プログラム

Country Status (1)

Country Link
JP (1) JP2010271566A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113096668A (zh) * 2021-04-15 2021-07-09 北京蓦然认知科技有限公司 一种构建协作语音交互引擎簇的方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113096668A (zh) * 2021-04-15 2021-07-09 北京蓦然认知科技有限公司 一种构建协作语音交互引擎簇的方法及装置
CN113096668B (zh) * 2021-04-15 2023-10-27 国网福建省电力有限公司厦门供电公司 一种构建协作语音交互引擎簇的方法及装置

Similar Documents

Publication Publication Date Title
EP3382530B1 (en) Operating method of electronic device for function execution based on voice command in locked state and electronic device supporting the same
US10909982B2 (en) Electronic apparatus for processing user utterance and controlling method thereof
EP2952856B1 (en) Method and apparatus for providing location information
US8612221B2 (en) Portable terminal and management system
EP3410253A1 (en) Mobile communication device using a plurality of wearable devices in parallel
US20070296572A1 (en) Location system
CN108595275B (zh) 一种提示信息推送的方法及终端
KR20180047801A (ko) 전자 장치 및 전자 장치 제어 방법
US11537360B2 (en) System for processing user utterance and control method of same
KR102561572B1 (ko) 센서 활용 방법 및 이를 구현한 전자 장치
US10305993B2 (en) Terminal control system, method for controlling terminal, and electronic device
CN108235753A (zh) 电子设备及用于控制电子设备的操作的方法
US10026294B2 (en) Information processing system, terminal, information processing method, information processing method of terminal, and program
WO2017175997A1 (ko) 전자 장치 및 그 제어 방법
KR20180081922A (ko) 전자 장치의 입력 음성에 대한 응답 방법 및 그 전자 장치
US10334097B2 (en) Method and apparatus for disabling alarm in device, and storage medium
KR20150130854A (ko) 오디오 신호 인식 방법 및 이를 제공하는 전자 장치
CN106791174B (zh) 一种闹钟调整方法、装置及移动终端
JP5338475B2 (ja) 携帯端末及びその管理システム及び携帯端末の位置データの補正方法、及び補正プログラム
KR20150098493A (ko) 위급 상황 알림 시스템, 방법 및 컴퓨터 판독 가능한 기록 매체
JP2012008707A (ja) 連係管理装置、サービス連係支援システム及びサービス連係支援方法
US8558893B1 (en) Head-up security display
JP2010271566A (ja) 音声認識エンジンの管理方法、及び、その音声認識エンジンの管理方法を用いた管理システム、携帯端末、音声認識エンジン管理プログラム
CN107770172B (zh) 一种账号信息的找回方法及移动终端
JP2010186317A (ja) 指示方法、指示プログラムおよび指示システム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20120807