JP6718182B1

JP6718182B1 - 誤変換辞書作成システム

Info

Publication number: JP6718182B1
Application number: JP2019088361A
Authority: JP
Inventors: 潔関根
Original assignee: Interactive Solutions Inc
Current assignee: Interactive Solutions Inc
Priority date: 2019-05-08
Filing date: 2019-05-08
Publication date: 2020-07-08
Anticipated expiration: 2039-05-08
Also published as: CN112272847B; US20210225361A1; JP2020184024A; CA3105967C; CN112272847A; CA3105967A1; SG11202011297WA; WO2020225949A1

Abstract

【課題】適切な誤変換用語辞書を迅速かつ簡便に作成できるシステムを提供する。【解決手段】誤変換辞書作成システム１は、用語が入力される用語入力部３と、用語入力部に入力された用語である入力用語を音声データに変換し、入力用語音声データを得る音声データ変換部５と、音声データ変換部から出力された入力用語音声データを受け取り、音声解析を行って入力用語音声データを用語に変換し、音声解析用語を得る音声データ解析部７と、用語入力部又は音声データ変換部から、入力用語を受け取り、音声データ解析部から、音声解析用語を受け取りる。入力用語と音声解析用語とが一致しない場合、音声解析用語を入力用語の誤変換用語とする誤変換用語判別部９と誤変換用語判別部から、入力用語とその誤変換用語とを受取って、入力用語と、その誤変換用語とを関連付けて誤変換辞書１１に記憶する。【選択図】図１

Description

この発明は，誤変換辞書作成システムに関する。

特許第４８５２４４８号公報には，誤り傾向学習音声認識装置が記載されている。この誤り傾向学習音声認識装置は，正解候補の誤り傾向を表す素性関数とその重みとにより定義される誤り修正モデルを用いて，様々な計算を行い，誤り傾向を学習する。

特許第４８５２４４８号公報

特許第４８５２４４８号公報に記載される誤り傾向学習音声認識装置は，誤り傾向を把握するために様々な計算を行う必要がある。このため処理が複雑になるという問題がある。

この明細書に記載されるある発明は，適切な誤変換用語辞書を迅速かつ簡便に作成できるシステムやその誤変換用語辞書を用いた音声認識システムを提供することを目的とする。

この明細書に記載される発明のひとつは，システムに用語を入力し，それを音声情報に変換させ，変換された音声情報を音声解析する。そして，そのシステムは，音声解析されて得られた用語と，入力された用語が一致しない場合，音声解析されて得られた用語を，入力された用語の誤変換用語として記憶するというものである。

この明細書に記載される発明のひとつは，誤変換辞書作成システム１に関する。
このシステムは，用語が入力される用語入力部３と，
用語入力部に入力された用語である入力用語を音声データに変換し，入力用語音声データを得る音声データ変換部５と，
音声データ変換部から出力された入力用語音声データを受け取り，音声解析を行って入力用語音声データを用語に変換し，音声解析用語を得る音声データ解析部７と，
用語入力部又は音声データ変換部から，入力用語を受け取り，音声データ解析部から，音声解析用語を受け取り，入力用語と音声解析用語とが一致しない場合，音声解析用語を入力用語の誤変換用語とする誤変換用語判別部９と
誤変換用語判別部から，入力用語と，その誤変換用語とを受取って，入力用語と，その誤変換用語とを関連付けて誤変換辞書１１に記憶する。

この誤変換辞書作成システムの好ましい例は，
用語入力部が，電子ファイルを受け取る電子ファイル受取部と，電子ファイル受取部が受け取った電子ファイルに含まれる用語を抽出する用語抽出部と，を含む。

この明細書に記載される発明のひとつは，上記した誤変換辞書作成システムを含む音声認識システムであって，
音声が入力される音声入力部と，
音声入力部に入力された音声を音声解析し，解析語を得る音声解析部と，
解析語が，誤変換辞書に記憶されたいずれかの誤変換用語と一致するか判断する誤変換用語判断部と，
誤変換用語判断部が，解析語が，誤変換辞書に記憶されたいずれかの誤変換用語と一致すると判断した場合に，一致した誤変換用語と対応する入力用語を，正しい用語の候補として求める，修正語候補抽出部と，
を有するシステムに関する。

この発明によれば，適切な誤変換用語辞書を迅速かつ簡便に作成できる。そして，そのような誤変換用語辞書を用いれば音声認識の精度を容易に向上させることができる。

図１は，誤変換辞書作成システムの基本構成例を示す概念図である。図２は，コンピュータの基本構成を示すブロック図である。図３は，誤変換辞書作成システムの基本動作例を示すフローチャートである。図４は，用語入力部の例を説明するための概念図である。図５は，音声認識システムを説明するための概念図である。

以下，図面を用いて本発明を実施するための形態について説明する。本発明は，以下に説明する形態に限定されるものではなく，以下の形態から当業者が自明な範囲で適宜修正したものも含む。

図１は，誤変換辞書作成システムの基本構成例を示す概念図である。図１に示されるように，誤変換辞書作成システム１は，用語入力部３と，音声データ変換部５と，音声データ解析部７と，誤変換用語判別部９と，誤変換辞書１１とを有する。このシステムは，基本的にはコンピュータ（及びソフトウェア）により実装される。このシステムは，コンピュータにより自動的に処理がなされるシステムであることが望ましい。また，このシステムは，ユーザからの入力があった場合，その入力をも情報のひとつとして処理することができるものであってもよい。本明細書における各要素や部で表さされる要素は，コンピュータにおける各種処理を行う手段として機能する。

図２は，コンピュータの基本構成を示すブロック図である。この図に示されるように，コンピュータは，入力部２１，出力部２３，制御部２５，演算部２７及び記憶部２９を有しており，各要素は，バス３１などによって接続され，情報の授受を行うことができるようにされている。例えば，記憶部には，制御プログラムが記憶されていてもよいし，各種情報が記憶されていてもよい。入力部から所定の情報が入力された場合，制御部は，記憶部に記憶される制御プログラムを読み出す。そして，制御部は，適宜記憶部に記憶された情報を読み出し，演算部へ伝える。また，制御部は，適宜入力された情報を演算部へ伝える。演算部は，受け取った各種情報を用いて演算処理を行い，記憶部に記憶する。制御部は，記憶部に記憶された演算結果を読み出して，出力部から出力する。このようにして，各種処理が実行される。この各種処理を実行するものが，各手段である。

誤変換辞書作成システム１は，誤変換辞書を作成するためのシステムである。誤変換辞書は，ある用語群に含まれる用語と，その用語を音声認識した際に誤変換される可能性がある誤変換用語のリストである。誤変換辞書は，コンピュータにおいて用いられる電子的な辞書（記憶部）である。例えば，語変換辞書は，ある会話の音声解析をする際に，その会話に対応した誤変換辞書が読み出され，音声解析を行った語が，誤変換用語であれば，その関連する（正しい）用語に変換されたり，正しい用語を修正語候補として読み出すために用いられる。この誤変換用語辞書は，例えば，あるプレゼンテーション，ある疾患（の添付文書），ニュースのある原稿，通訳予定のある原稿，朗読予定の本，又はある技術分野のものであってもよい。

用語入力部３は，システムに用語を入力するための要素である。用語入力部３は，例えば，キーボードなどのポインティングデバイスであってもよい。例えば，ユーザが，キーボードを用いて，「糖尿病」と打ち込む。すると，キーボードは，用語「糖尿病」に関する情報をシステムに入力する。このようにして，用語がシステムに入力される。

音声データ変換部５は，用語入力部３に入力された用語である入力用語（例：糖尿病）を音声データに変換し，入力用語音声データ（例：周波数データで表された「とうにょうびょう」）を得るための要素である。音声データとは，スピーカーなどの出力装置から出力されると，人が聞き取れる音声（周波数データ）となるデータである。例えば，音声データ変換装置は，キーボードにより入力された用語を音声としてスピーカーから出力する。この音声データ変換部５は，公知の音声データ変換装置を適宜用いればよい。なお，音声データ変換部５は，スピーカーなどの出力装置から，実際に音声として（人が聞き取れる状態として）出力してもよい。また，音声データ変換部５は，入力用語をコンピュータが処理できる音声データに変換し，実際に音声を出力しなくてもよい。なお，この場合の音声データは，例えば，スピーカーを介することで，人が聞き取れる状態となるものが好ましい。また，あえて，雑音環境下に誤変換辞書作成システム１を置いて，その状態でスピーカーから音声を出力させるようにしてもよい。そのようにすることで，実際の会話環境下における音声認識状況を再現できる。雑音環境下の例は，学会，講演，外，病院，会社，及び工事現場である。なお，この誤変換辞書作成システムは，これらの雑音環境における雑音データを出力する雑音出力部を有し，音声データ変換部５が入力用語を音声データに変換する際に，入力用語と雑音データとを合わせたデータを用いて，音声データとしてもよい。この方法は，実際に，雑音をスピーカーから出力し，出力された入力された用語をスピーカーから出力して，音声データに変換してもよい。また，入力用語に基づく音声データと，雑音データを混合し，入力用語音声データを作成してもよい。

音声データ解析部７は，音声データ変換部５から入力用語音声データ（例：周波数データで表された「とうにょうびょう」）を受け取り，音声解析を行って入力用語音声データを用語に変換し，音声解析用語（例：豆乳鋲）を得るための要素である。音声データ解析部７は，例えば，入力された音声（振動情報）を，周波数を含む電子データである入力用語音声データに変換し，その周波数を含む電子データを解析して，用語に変換する。このようにして，音声データ解析部７は，音声解析用語（例：豆乳鋲）を得ることができる。音声データを用語に変換する音声変換装置は，公知である。よって，音声データ解析部７として，公知の音声変換アルゴリズムを有する装置を適宜用いることができる。

誤変換用語判別部９は，入力用語と音声解析用語とが一致しない場合，音声解析用語を入力用語の誤変換用語とするための要素である。
誤変換用語判別部９は，用語入力部３又は音声データ変換部５から，入力用語（例：糖尿病）を受け取る。一方，誤変換用語判別部９は，音声データ解析部７から，音声解析用語（例：豆乳鋲）を受け取る。そして，誤変換用語判別部９は，入力用語（例：糖尿病）と音声解析用語（例：豆乳鋲）とが一致するか否か判断する。そして，入力用語と音声解析用語とが一致しない場合，音声解析用語（例：豆乳鋲）を入力用語（糖尿病）の誤変換用語とする。このようにして求められた音声解析用語（例：豆乳鋲）は，対応する入力用語（糖尿病）の誤変換用語として，誤変換辞書１１に適宜記憶される。

図３は，誤変換辞書作成システムの基本動作例を示すフローチャートである。

例えば，複数の用語を含むプレゼンテーションファイル（例えば，パワーポイント（登録商標）で作成されたプレゼンファイル）が，音声認識アプリにドラック＆ドロップされる。すると，誤変換辞書作成システムが，プレゼンファイルに含まれる用語を解析し，誤変換辞書作成システム１にプレゼンファイルに含まれる用語（例：糖尿病）が入力される（用語入力工程：Ｓ１０１）。入力された用語などのデータは，適宜記憶部に記憶され，必要に応じて，記憶部から読み出され，各種の演算処理に用いられる。

誤変換辞書作成システム１に入力された用語（例：糖尿病）が，入力用語音声データ（例：とうにょうびょう；例：周波数データ）に変換される（音声データ変換工程：Ｓ１０２）。このようにして得られた入力用語音声データは，適宜記憶部に記憶され，必要に応じて，記憶部から読み出され，各種の演算処理に用いられる。

誤変換辞書作成システム１は，入力用語音声データ（例：とうにょうびょう）を受け取って，音声解析を行い，入力用語音声データを用語に変換し，音声解析用語（例：豆乳鋲）を得る（音声データ解析工程：Ｓ１０３）。音声解析には，公知のアルゴリズムを適宜用いればよい。このようにして得られた音声解析用語は，適宜記憶部に記憶され，必要に応じて，記憶部から読み出され，各種の演算処理に用いられる。

誤変換辞書作成システム１は，入力用語と音声解析用語を受け取り（これらは記憶部から読み出されてもよい），入力用語と音声解析用語とが一致するか否か判断する（誤変換用語判別工程：Ｓ１０４）。

入力用語と音声解析用語とが一致する場合（Ｓ１０５），誤変換辞書１１を更新しなくてもよい。

入力用語と音声解析用語とが一致しない場合（Ｓ１０６），音声解析用語（例：豆乳鋲）を入力用語（糖尿病）の誤変換用語とする。

このようにして求められた音声解析用語（例：豆乳鋲）は，対応する入力用語（糖尿病）の誤変換用語として，誤変換辞書１１に適宜記憶される。このようにして，誤変換辞書１１が更新される（誤変換辞書更新工程：Ｓ１０７）。

図４は，用語入力部の例を説明するための概念図である。この用語入力部３は，電子ファイル受取部４１と，用語抽出部４３とを含む。そして，電子ファイル受取部４１が電子ファイルを受け取り，用語抽出部４３が，受け取った電子ファイルに含まれる用語を抽出する。このようにして抽出した用語を入力用語としてシステムに入力する。電子ファイルの例は，ワード（登録商標）などの原稿であってもよいし，漫画の原作の電子データであってもよいし，シナリオや台本でもよいし，パワーポイント（登録商標）などのプレゼンテーション資料であってもよい。これらに含まれる用語は，電子状態で簡単に抽出することができる。そして，その用語は，それぞれ入力用語として，システムに入力される。

例えば，あるニュースを用語変換する場合，ニュースの台本から，用語を抽出してもよい。また，そのニュースに関連するトピックス語を用いて，ウェブサイトを自動的に検索し，ヒットしたウセブサイトに含まれる用語を抽出し，入力用語としてもよい。このようにすれば，あるニュースを報道する際の，誤変換用語を迅速に用意することができることとなる。

また，例えばＭＲがあるプレゼンテーションを行う場合，プレゼンテーション資料をシステムが受取り，そのプレゼンテーション資料に含まれる用語を自動的に抽出するようにしてもよい。さらに，そのプレゼンテーション資料に，特定の薬剤名又は疾患名が含まれている場合，その薬剤に関する添付文書などその薬剤に関する資料が自動的に記憶部から読み出され，添付文書などに含まれる用語を抽出するようにしてもよい。さらに，その薬剤に関する誤変換辞書がある場合は，その誤変換辞書に含まれる，誤変換用語と対応する用語のリストが自動的に読み出されるようにされていてもよい。疾患名についても同様である。

この明細書は，コンピュータを上記した誤変換辞書作成システムとして機能させるためのコンピュータ読み取り可能なプログラムや，そのプログラムを記憶した情報記録媒体（ＣＤ−ＲＯＭなど）をも提供する。

そのプログラムは，例えば，コンピュータを
用語が入力される用語入力手段と，
用語入力手段に入力された用語である入力用語を音声データに変換し，入力用語音声データを得る音声データ変換手段と，
音声データ変換手段から出力された入力用語音声データを受け取り，音声解析を行って入力用語音声データを用語に変換し，音声解析用語を得る音声データ解析手段と，
用語入力手段又は前記音声データ変換手段から，入力用語を受け取り，音声データ解析手段から，音声解析用語を受け取り，入力用語と音声解析用語とが一致しない場合，音声解析用語をその入力用語の誤変換用語とする誤変換用語判別手段と，
誤変換用語判別手段から，入力用語と，その誤変換用語とを受取って，入力用語と，その誤変換用語とを関連付けて誤変換辞書に記憶する，誤変換辞書作成システムとして機能させるものである。

その用語入力手段は，
電子ファイルを受け取る電子ファイル受取手段と，
電子ファイル受取手段が受け取った電子ファイルに含まれる用語を抽出する用語抽出手段と，を含むものであってもよい。

次に，音声認識システム５１について説明する。
図５は，音声認識システムを説明するための概念図である。図５に示されるように，この音声認識システム５１は，誤変換辞書１１と，音声入力部５３と，音声解析部５５と，誤変換用語判断部５７と，修正語候補抽出部５９とを含む。このシステムは，先に説明した誤変換辞書作成システムを含むものであってもよい。また，上記の誤変換辞書作成システムにより更新される誤変換辞書１１を含むものであってもよい。

音声認識システム５１は，音声情報を文字情報に変換するシステムである。音声情報を文字情報に変換する音声認識装置は，公知である。よって，音声認識システム５１は，公知の音声認識装置の要素を適宜採用すればよい。

音声入力部５３は，音声が入力される要素である。音声入力部５３の例は，マイクである。マイクは，受け取った周波数情報（振動情報）を，コンピュータが処理できる電気信号に変換する。

音声解析部５５は，音声入力部５３から音声情報（電気信号）を受け取って，解析するための要素である。この解析アルゴリズムは，公知である。例えば，音声解析部５５は，音声入力部に入力された音声に基づく電気信号に含まれる周波数を解析する。そして，音声解析部５５は，解析語を得る。

誤変換用語判断部５７は，解析語が，誤変換辞書１１に記憶されたいずれかの誤変換用語と一致するか判断する要素である。上記の通り，解析語が求められた場合，コンピュータは，誤変換辞書１１に記憶された誤変換用語を読み出す。そして，コンピュータは，読み出した誤変換用語と解析語が一致するか否か判断する。

修正語候補抽出部５９は，解析語が読み出したある誤変換用語と一致する場合に，その誤変換用語と対応する入力用語を，誤変換辞書１１から正しい用語の候補として読み出す。このようにして正しい用語の候補が求められる。

例えば，字幕付きのニュース報道を行っている場合は，報道と同時に字幕を放送することが望ましい。そのような場合は，正しい用語の候補を，報道用の用語として求め，出力（ニュースの字幕として放送）すればよい。

この明細書は，コンピュータを上記した音声認識システムとして機能させるためのコンピュータ読み取り可能なプログラムや，そのプログラムを記憶した情報記録媒体（ＣＤ−ＲＯＭなど）をも提供する。

そのプログラムは，コンピュータを
音声が入力される音声入力手段と，
音声入力手段に入力された音声を音声解析し，解析語を得る音声解析手段と，
解析語が，誤変換辞書に記憶されたいずれかの誤変換用語と一致するか判断する誤変換用語判断手段と，
誤変換用語判断手段が，解析語が，誤変換辞書に記憶されたいずれかの誤変換用語と一致すると判断した場合に，一致した誤変換用語と対応する入力用語を，正しい用語の候補として求める，修正語候補抽出手段と，
を有するシステムとして機能させるものである。
誤変換辞書は，例えば，先に説明したプログラムにより更新されるものである。

この発明は，音声認識システムに用いられるので，情報産業において利用され得る。

１誤変換辞書作成システム
３用語入力部
５音声データ変換部
７音声データ解析部
９誤変換用語判別部
１１誤変換辞書

Claims

誤変換辞書作成システムであって，
用語が入力される用語入力部と，
前記用語入力部に入力された用語である入力用語を音声データに変換し，入力用語音声データを得る音声データ変換部と，
前記音声データ変換部から出力された前記入力用語音声データを受け取り，音声解析を行って前記入力用語音声データを用語に変換し，音声解析用語を得る音声データ解析部と，
前記用語入力部又は前記音声データ変換部から，前記入力用語を受け取り，前記音声データ解析部から，前記音声解析用語を受け取り，前記入力用語と前記音声解析用語とが一致しない場合，前記音声解析用語を前記入力用語の誤変換用語とする誤変換用語判別部と
前記誤変換用語判別部から，前記入力用語と，その誤変換用語とを受取って，前記入力用語と，その誤変換用語とを関連付けて誤変換辞書に記憶する，誤変換辞書作成システム。
請求項１に記載の誤変換辞書作成システムであって，
前記用語入力部は，
電子ファイルを受け取る電子ファイル受取部と，
前記電子ファイル受取部が受け取った電子ファイルに含まれる用語を抽出する用語抽出部と，
を含む，誤変換辞書作成システム。
請求項１に記載の誤変換辞書作成システムを含む音声認識システムであって，
音声が入力される音声入力部と，
前記音声入力部に入力された音声を音声解析し，解析語を得る音声解析部と，
前記解析語が，前記誤変換辞書に記憶されたいずれかの誤変換用語と一致するか判断する誤変換用語判断部と，
前記誤変換用語判断部が，前記解析語が，前記誤変換辞書に記憶されたいずれかの誤変換用語と一致すると判断した場合に，前記一致した誤変換用語と対応する入力用語を，正しい用語の候補として求める，修正語候補抽出部と，
を有するシステム。