JP5184071B2 - 書き起こしテキスト作成支援装置、書き起こしテキスト作成支援プログラム、及び書き起こしテキスト作成支援方法 - Google Patents

書き起こしテキスト作成支援装置、書き起こしテキスト作成支援プログラム、及び書き起こしテキスト作成支援方法 Download PDF

Info

Publication number
JP5184071B2
JP5184071B2 JP2007337067A JP2007337067A JP5184071B2 JP 5184071 B2 JP5184071 B2 JP 5184071B2 JP 2007337067 A JP2007337067 A JP 2007337067A JP 2007337067 A JP2007337067 A JP 2007337067A JP 5184071 B2 JP5184071 B2 JP 5184071B2
Authority
JP
Japan
Prior art keywords
transcription
data
text
divided
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007337067A
Other languages
English (en)
Other versions
JP2009157774A (ja
Inventor
奇方 趙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP2007337067A priority Critical patent/JP5184071B2/ja
Publication of JP2009157774A publication Critical patent/JP2009157774A/ja
Application granted granted Critical
Publication of JP5184071B2 publication Critical patent/JP5184071B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Storage Device Security (AREA)

Description

本発明は、書き起こしテキスト作成支援装置及び書き起こしテキスト作成支援プログラムに関する。
従来、音声データをテキストデータに変換する、いわゆる書き起こし作業は、様々な分野で必要とされている。例えば、会議の録音から議事録を作成する、あるいはコールセンタにおけるユーザとオペレータとの対話の録音をテキストにし、さらに情報分析などに活用する。従来の書き起こし作業は、ほとんど人間の手作業に頼っていたが、近年、コンピュータによる音声認識技術の進歩によって一部では音声認識によるテキスト自動作成を導入するところもある。
しかし、現状の音声認識技術のレベルから考えると、誤認識がまだ多いため、音声認識による精度の高い書き起こしがほぼ不可能である。したがって、音声データの書き起こしにおいて音声認識を利用する場合には、まず、コンピュータによる音声認識で音声データをテキストに変換し、そして、音声認識の結果に対して手作業による確認、修正を行うやり方が一般的である。
例えば、音声情報を認識してテキスト化し、当該テキスト化した情報を小さな単位に分割し、テキスト化した情報を分割した単位で画面に表示し、分割単位でテキスト化された音声を確認しながら、テキストを更新する技術が提案されている(例えば、特許文献1参照)。
音声認識導入の有無にかかわらず、音声データの書き起こしは膨大な手作業が発生するため、たくさんの作業スタッフが必要である。しかし、書き起こし作業を請け負う業者などにとって、受託できる業務の量が時期による変動が大きいため、コスト的には、全ての作業を正社員のような専属スタッフに頼ることができない。通常、稼働可能な多くのスタッフを予め登録しておいて、必要なときだけ、作業量に応じて登録したスタッフを動員して作業に当たらせる。
特開2005−228178号公報
ところで、上述した従来技術においては、膨大な量の音声データの書き起こしにおいて、コスト的には大量の非専属スタッフに頼らざるを得ない状況もあり得る。ここで、音声データの中に機密情報や、プライバシー情報が混ざっている場合には、スタッフの経歴や、能力、守秘意識において、ばらつきが存在するため、スタッフを経由した情報の漏洩リスクを考慮することが望ましい。
従来の書き起こし技術においては、スタッフに誓約書を書かせたり、情報漏洩が発生した場合に損害賠償を求めたりするような措置で、情報漏洩リスクに対応してきた。しかし、このような対策では、モラルの高くない、あるいは悪意のあるスタッフによる情報漏洩には、対処できない可能性もある。
また、多様、かつ大量のスタッフが書き起こし作業にかかわっている現状においては、情報の秘密を守るため、個々のスタッフに対してそれぞれ違った対応を行う必要がある。さらにまた、音声データも機密情報の有無によって対処の仕方が変わる。すなわち、スタッフ及び音声データの状況に柔軟に対応できるようなシステムや、仕組みであることが望ましい。
しかしながら、従来技術では、音声データに含まれる機密情報に応じて、スタッフの守秘における信頼度に応じたきめ細かな作業配分を行うことができないという問題があった。
本発明は、このような事情を考慮してなされたものであり、その目的は、情報漏洩のリスクを大幅に軽減することができる書き起こしテキスト作成支援装置及び書き起こしテキスト作成支援プログラムを提供することにある。
上述した課題を解決するために、本発明は、音声データからテキストデータを書き起こすための書き起こしテキスト作成支援装置であって、書き起こし作業者毎に、それぞれの書き起こし作業者の信頼度に応じた信頼度値を記憶する信頼度記憶手段と、音声データを所定の区間に分割して分割音声データを生成する分割音声データ生成手段と、前記分割音声データ生成手段により分割された分割音声データ毎に音声認識を行い、複数の一次テキストデータに変換する変換手段と、機密情報に関するキーワードを記憶するキーワード記憶手段と、前記変換手段により変換された一次テキストデータ毎に、前記キーワード記憶手段に記憶されているキーワードが含まれるか否かを判定する判定手段と、前記判定手段による判定結果に基づいて、前記信頼度記憶手段の信頼度値を参照し、分割音声データ生成手段により分割された分割音声データ毎に、書き起こし作業を依頼すべき書き起こし作業者を選定する選定手段とを具備することを特徴とする書き起こしテキスト作成支援装置である。
本発明は、上記の発明において、前記選定手段により選定された書き起こし作業者の端末に、該当分割音声データを送信する送信手段と、前記書き起こし作業者による書き起こし作業結果のテキストデータを受信する受信手段と、前記受信手段により受信したテキストデータを統合し、元の音声データに対する書き起こしテキストデータとして保存する保存手段とを更に具備することを特徴とする。
本発明は、上記の発明において、前記選定手段は、前記信頼度記憶手段の信頼度値を参照し、前記判定手段により前記一次テキストに機密情報に関するキーワードが含まれていると判定された場合には、信頼度値が高い書き起こし作業者を選定し、前記一次テキストに機密情報に関するキーワードが含まれていないと判定された場合には、信頼度値が低い書き起こし作業者を選定することを特徴とする。
また、上述した課題を解決するために、本発明は、音声データからテキストデータを書き起こすための書き起こし作業を支援する書き起こしテキスト作成支援プログラムであって、コンピュータに、音声データを所定の区間に分割して分割音声データを生成するステップと、分割された分割音声データ毎に音声認識を行い、複数の一次テキストデータに変換するステップと、変換された一次テキストデータ毎に、機密情報に関するキーワードが含まれるか否かを判定するステップと、前記一次テキストに機密情報に関するキーワードが含まれていると判定された場合には、信頼度値が高い書き起こし作業者を選定し、前記一次テキストに機密情報に関するキーワードが含まれていないと判定された場合には、信頼度値が低い書き起こし作業者を選定するステップとを実行させることを特徴とする書き起こしテキスト作成支援プログラムである。
また、上述した課題を解決するために、本発明は、コンピュータで実行される、音声データからテキストデータを書き起こすための書き起こし作業を支援する書き起こしテキスト作成支援方法であって、分割音声データ生成手段が、音声データを所定の区間に分割して分割音声データを生成するステップと、変換手段が、分割された分割音声データ毎に音声認識を行い、複数の一次テキストデータに変換するステップと、判定手段が、変換された一次テキストデータ毎に、機密情報に関するキーワードが含まれるか否かを判定するステップと、選定手段が、前記一次テキストに機密情報に関するキーワードが含まれていると判定された場合には、信頼度値が高い書き起こし作業者を選定し、前記一次テキストに機密情報に関するキーワードが含まれていないと判定された場合には、信頼度値が低い書き起こし作業者を選定するステップとを含むことを特徴とする書き起こしテキスト作成支援方法である。
この発明によれば、音声データを所定の区間に分割して分割音声データを生成し、分割された分割音声データ毎に音声認識を行い、一次テキストデータに変換し、変換された一次テキストデータ毎に、機密情報に関するキーワードが含まれるか否かを判定し、判定結果に基づいて、分割音声データ生成手段により分割された分割音声データ毎に、書き起こし作業を依頼すべき書き起こし作業者を選定する。したがって、音声データを分割し、機密情報を含めた部分の書き起こし作業を信頼度の高いスタッフに依頼することで、情報漏洩のリスクを大幅に軽減することができるという利点が得られる。
また、本発明によれば、選定された書き起こし作業者の端末に、該当分割音声データを送信し、書き起こし作業者による書き起こし作業結果のテキストデータを受信し、受信したテキストデータを統合し、元の音声データに対する書き起こしテキストデータとして保存する。したがって、音声データを分割して、異なるスタッフに依頼することにより、情報漏洩のリスクをさらに軽減することができるとともに、最終的に元の音声データに対する書き起こしテキストデータが得られるという利点が得られる。
また、本発明によれば、信頼度記憶手段の信頼度値を参照し、前記判定手段により前記一次テキストに機密情報に関するキーワードが含まれていると判定された場合には、信頼度値が高い書き起こし作業者を選定し、前記一次テキストに機密情報に関するキーワードが含まれていないと判定された場合には、信頼度値が低い書き起こし作業者を選定する。したがって、音声データを分割し、機密情報を含めた部分の書き起こし作業を信頼度の高いスタッフに依頼することで、情報漏洩のリスクを大幅に軽減することができるという利点が得られる。
以下、本発明の一実施形態を、図面を参照して説明する。
図1は、本発明の実施形態による書き起こしテキスト作成支援装置の構成を示すブロック図である。図において、音声データ記憶部1は、書き起こしの対象である音声データを記憶する。音声分割装置2は、音声データ記憶部1から音声データを読み出し、発話中の無音区間を利用して、音声データを比較的に短い音声区間(例えば、文単位)に分割し、音声区間に分割した音声データを、それぞれ個別のファイルとして保存する。
また、音声分割装置(分割音声データ生成手段)2は、各音声区間の音声ファイル(以下、分割音声ファイルという)の管理を行う管理テーブルを作成し、各分割音声ファイルのファイル名を生成して上記分割音声ファイルと対応付けて管理テーブルに保存する。なお、管理テーブルの詳細については後述する。
次に、識別子付与装置(変換手段)3は、それぞれの分割音声ファイルに対して音声認識を行い、認識結果のテキストを管理テーブルに保存する。また、識別子付与装置3は、認識結果に対して、予め設定したキーワードリスト(機密情報に対応)を用いて照合を行い、キーワードを1つでも含む分割音声ファイルに対して、機密情報が含まれることを示す識別子を付与する。
書き起こし制御装置4は、各分割音声ファイルを、ネットワーク7を介して、クライアント端末(書き起こし作業を依頼する作業スタッフのPCなど)8−1〜8−nに割り振って送信し、書き起こし作業を実施させるとともに、クライアント端末8−1〜8−nから作業結果を受信して保存する。
作業スタッフについては、事前に機密保持における信頼度を評価し、信頼度の高いスタッフと一般スタッフとに分類する。クライアント端末(作業スタッフ)8−1〜8−nへの割り振りにおいては、機密情報の識別子が付与された分割音声ファイルの作業を信頼度の高いスタッフのみに依頼し、ほかの分割音声ファイルは、信頼度の高いスタッフと一般スタッフのどちらに依頼してもよい。
次に、テキスト抽出装置5は、クライアント端末から受信した各分割音声ファイルの作業結果からテキストを抽出し、連結して、分割前の元の音声データに対応するテキストデータを生成する。テキストデータ記憶部(保存手段)6は、ハードディスクなどの記憶装置からなり、分割前の元の音声データに対応する連結した書き起こしテキストデータを記憶する。ネットワーク7は、インターネット、LANなどからなる。クライアント端末8−1〜8−nは、書き起こし作業を行う作業スタッフの端末(PCなど)である。
次に、図2は、本実施形態による、音声分割装置2の構成を示すブロック図である。図において、管理テーブル生成部2−1は、作業中の情報を一元に記憶、管理する管理テーブルを生成する。無音区間閾値計算部2−2は、音声データのパワーの値(大きさ)を用いて無音区間と音声区間とを識別するため、まず、閾値を計算する。音声データの一番先端には、通常、数十ミリセカンドから数百ミリセカンドまでの無音区間があるので、この先端の無音区間を利用して閾値を計算する。
音声分割部2−3は、音声データのパワーを最初(始端)からフレーム単位で順次計算し、閾値よりも小さい区間が、ある程度、例えば、300ミリセカンド続いたら、この区間を無音区間とする。なお、デジタル信号処理では、音声波形が通常ブロック単位で逐次処理され、このブロックのことをフレームという。このフレームの長さは、20〜40ミリセカンドである場合が多い。
音声分割部2−3は、始端から無音区間の中間点までの音声データを切り出して分割音声ファイルとして分割音声ファイル記憶部2−5に保存する。このとき、音声分割部2−3は、その分割音声データのファイル名を管理テーブルに書き込み、同時に連番となる一意的なIndex番号を付与し、「機密度フラグ」、「スタッフ番号」、「作業状況フラグ」の3つの項目を初期化する。音声分割部2−3は、一回目の切り出しが終わったら、残った音声データに対して同じ作業を繰り返して行い、これによって全入力音声データを比較的に短い音声区間の分割音声データに分割する。分割音声データのファイル名及びIndexは、管理テーブルに保存される。管理テーブル記憶部2−4は、分割音声ファイルに関する各種情報を保持する、後述する管理テーブルを記憶する。また、分割音声ファイル記憶部2−5は、固有のファイル名が付与された分割音声ファイルを記憶する。
図3は、本実施形態による、管理テーブル2−4−1のデータ構成を示す概念図である。管理テーブル2−4−1は、「文書番号」「Index」、「ファイル名」、「認識結果」、「書き起こし」、「機密度フラグ」、「スタッフ番号」、「作業状況フラグ」の項目の情報が記憶される。「文書番号」は、書き起こし作業を行う所定の単位の音声ファイル(分割前)に付与される一意的な番号である。「Index」は、連番となる一意的な番号である。「ファイル名」は、分割音声ファイルの名前である。「認識結果」は、各分割音声ファイルに対して行う音声認識の結果(テキスト)である。「書き起こし」は、作業スタッフがクライアント端末を操作して行う書き起こし作業によって作成される該当分割音声ファイルのテキストである。
「機密度フラグ」は、該当分割音声ファイルに機密情報が含まれるかどうかを示すフラグであり、初期値(機密なし)は、「0」で、機密情報があると判断されたら「1」に書き換える。「スタッフ番号」は、該当分割音声ファイルの書き起こし作業を担当するスタッフを識別するための番号である。初期値は、「0」で、当該分割音声ファイルを担当するスタッフが決まった時点でスタッフ番号が書き込まれる。「作業状況フラグ」は、該当分割音声ファイルの全作業が終わっているかどうかを示すフラグであり、初期値(終わっていない)は「0」で、全部終わった場合には「1」に書き換えられる。
次に、図4は、本実施形態による識別子付与装置3の構成を示すブロック図である。図において、音声認識部3−1は、分割音声ファイル記憶部2−4の分割音声ファイルに対して、大語彙自由発話対応の音声認識エンジンを用いて音声認識を行い、各分割音声ファイルの認識結果であるテキストを、管理テーブル記憶部2−4の管理テーブル2−4−1の該当分割音声ファイルの「認識結果」に保存する。
キーワード記憶部(キーワード記憶手段)3−2は、機密情報となるキーワードを保存したキーワードテーブル(後述)を記憶する。キーワード照合部(判定手段)3−3は、管理テーブル記憶部2−4の管理テーブル2−4−1の最初のレコードの認識結果に対して、キーワード記憶部3−2のキーワードを1つずつ用いて逐次照合し、照合が成立した時点で該当分割音声ファイルに対する照合を終了し、管理テーブル2−4−1の「機密度フラグ」を「0」から「1」に書き換える。このとき、全てのキーワードで照合し終わっても照合が成立しなかったら、そのまま該当分割音声ファイルに対する照合を終了させる。また、キーワード照合部3−3は、最初の分割音声ファイルに対する照合が終わったら、同じ手順で順次残った全ての分割音声ファイルに対して照合を行う。
次に、図5は、本実施形態による、キーワードテーブル3−2−1の一例を示す概念図である。キーワードテーブル3−2−1は、各キーワードを識別するための「Index」と「キーワード」とからなる。該キーワードのリストは、書き起こしの依頼主であるユーザが提供するか、依頼主であるユーザの指示に従って作成する。「キーワード」には、通常、個人情報、企業機密情報などが含まれる。図5に示す例では、「キーワード」として、個人名、年齢、性別、住所などが登録されている。
次に、図6は、本実施形態による書き起こし制御装置4の構成を示すブロック図である。図において、スタッフ情報取得部4−1は、クライアント端末8−1〜8−nから作業スタッフの作業状況(ビジー/待機)とスタッフ番号とを取得し、作業状況を作業スタッフ情報記憶部4−2の作業スタッフ情報テーブル(後述)に保存する。また、スタッフ情報取得部4−1は、一定の時間間隔(例えば、30分)で、この情報を更新する。
ここで、図7は、本実施形態による、作業スタッフ情報テーブル4−2−1のデータ構成例を示す概念図である。作業スタッフ情報テーブル(信頼度記憶手段)4−2−1において、「スタッフ番号」は、作業スタッフを識別するための番号であり、「0」以外の数字を用いる。「氏名」は、作業スタッフの名前である。「信頼度」は、「一般」と「高」との2種類に分けられ、作業スタッフの経歴や、実績に基づいて予め決められる。なお、「信頼度」は、通常、「一般」と「高」との2種類に分けられるが、必要に応じて3種類以上に分けてもよい。「作業状況」は、作業スタッフの現況(ビジー/待機)を示し、クライアントから取得される。「連絡先」は、作業スタッフの連絡先であり、例えば、メールアドレスなどが記憶されている。
次に、図6の説明に戻ると、管理テーブル情報取得部4−3は、管理テーブル記憶部2−4の管理テーブル2−4−1の中で「スタッフ番号」が「0」になっている分割音声ファイル(作業依頼していない)の中から、「Index」が最も小さい分割音声ファイルを送信対象として選定する。そして、クライアント端末8−1〜8−nのいずれかに送信される情報を、管理テーブル記憶部2−4の管理テーブル2−4−1及び分割音声ファイル記憶部2−5から抽出する。最低限でも、「Index」、「ファイル名」、及び該「ファイル名」に対応した分割音声ファイルがクライアント端末8−1〜8−nのいずれかに送信されるが、「認識結果」も送信すれば、認識結果を確認修正することで、書き起こしテキストを容易に作成することができる。すなわち、スタッフの作業がより効率よく進められるので、通常、「認識結果」に保存されている認識結果のテキストも送信する。
送信部(選定手段、送信手段)4−4は、管理テーブル記憶部2−4の管理テーブル2−4−1から、選定した分割音声ファイルの「機密度フラグ」を参照し、送信先の作業スタッフを決め、管理テーブル情報取得部4−3で抽出した送信情報(「Index」、「ファイル名」、分割音声ファイル、「認識結果」)をクライアント端末8−1〜8−nのいずれかに送信する。具体的には、作業スタッフ情報テーブル4−2−1の「信頼度」と「作業状況」とを参照し、「機密度フラグ」が「0」の場合には、「信頼度」が「一般」で、「作業状況」が「待機」のスタッフを優先的に選択して、該選択した待機スタッフの「スタッフ番号」を管理テーブル2−4−1の「スタッフ番号」に保存し、上記送信情報を該「スタッフ番号」のスタッフの「連絡先」メールアドレスへ例えば電子メールで送信する。
一方、「機密度フラグ」が「1」の場合には、「信頼度」が「高」の待機スタッフのみを対象として選択し、該待機スタッフの「スタッフ番号」を管理テーブル2−4−1の「スタッフ番号」に保存して送信を行う。また、「信頼度」が「高」の待機スタッフがいない場合には、送信を一旦休止し、「信頼度」が「高」の待機スタッフが現れた時点で送信を再開する。上記管理テーブル情報取得部4−3及び送信部4−4は、管理テーブル2−4−1の「スタッフ番号」の内容が全て埋まるまで行われる。
受信部(受信手段)4−5は、書き起こし作業が終わったクライアント端末8−1〜8−nのいずれかから「Index」と書き起こしテキストとを受信し、該「Index」を参照して書き起こしテキストを管理テーブル2−4−1の「書き起こし」に保存する。このとき、管理テーブル2−4−1の「作業状況フラグ」を「0」から「1」に書き換える。
次に、図8(a)〜(d)は、本実施形態による、管理テーブル2−4−1の状態遷移を説明するための概念図である。まず、図8(a)には、音声分割が終わった時点での管理テーブル2−4−1の状態を示している。この時点では、分割音声ファイル名が保存され、「機密度フラグ」、「スタッフ番号」、及び「作業状況フラグ」は、「0」にリセットされている。次に、図8(b)には、音声ファイルの機密度に応じて、識別子が付与された時点での管理テーブル2−4−1の状態を示している。この場合、「Index」が「2」の、「ファイル名」が「sp2.wav」の分割音声ファイルの機密度フラグが「1」となる。
また、図8(c)には、分割音声ファイル等をクライアント端末8−1〜8−nのいずれかに送信した後の管理テーブル2−4−1の状態を示している。この時点では、各分割音声ファイルに対して、書き起こしを行う作業スタッフが決定されているので、管理テーブル2−4−1の各分割音声ファイルに対して、書き起こしを行う作業スタッフを示す「スタッフ番号」が保存されている。また、図8(d)には、クライアント端末8−1〜8−nのいずれかから受信した後の管理テーブル2−4−1の状態を示している。この場合、各分割音声ファイルに対して、作業の状況を示す「作業状況フラグ(「1」は作業終了)」と、書き起こし作業によって作成される該当分割音声ファイルのテキストである「書き起こし」とが保存されている。
次に、図9は、本実施形態によるテキスト抽出装置5の構成を示すブロック図である。図において、管理テーブル情報取得部5−1は、管理テーブル記憶部2−4の管理テーブル2−4−1の「作業状況フラグ」を取得し、作業の進捗を確認する。管理テーブル2−4−1の「作業状況フラグ」が全て「1」になるまで、この確認処理を繰り返し、作業状況をモニタする。全ての「作業状況フラグ」が「1」になると、管理テーブル2−4−1の内容を読み込む。
書き起こし抽出部5−2は、管理テーブル情報取得部5−1により読み込まれた管理テーブル2−4−1の内容から、「Index」が「1」の分割音声ファイルから順番に「書き起こし」項目のテキストを抽出し、最後のレコードまで続けて連結し、分割前の元の音声ファイルに対するテキストデータを生成してテキストデータ記憶部6に保存する。
次に、図10は、本実施形態による、クライアント端末8−1〜8−nの構成を示すブロック図である。図において、受信部9−1は、書き起こし制御装置4から、「Index」、「ファイル名」、分割音声ファイル、及び「認識結果」を受信する。情報表示部9−2は、受信した情報が閲覧できるように端末画面に表示する。音声ファイル再生部9−3は、受信した分割音声ファイルをスピーカまたはヘッドセットで再生する。作業スタッフは、分割音声を聞きながら、「認識結果」を確認する。
書き起こし入力部9−4は、作業スタッフから「認識結果」に誤りがないとの指示を受けると、それをそのままコピーして書き起こしのテキストとする。一方、作業スタッフから「認識結果」に誤りがあるとの指示を受けると、作業スタッフが入力するテキストで修正して正しい内容を書き起こしのテキストとする。受信した全ての音声ファイルに対して順次行う。送信部9−5は、書き起こし作業が完了した分割音声ファイルについて、「Index」と書き起こしテキストとを随時書き起こし制御装置4に例えば電子メールで送信する。
次に、上述した実施形態の動作について説明する。
図11は、本実施形態による書き起こしテキスト作成支援装置の動作を説明するためのフローチャートである。まず、音声分割装置2は、音声データ記憶部1から音声データを読み出し、発話中の無音区間を利用して、音声データを比較的に短い音声区間(例えば、文単位)に分割する(ステップS1)。次に、識別子付与装置3は、それぞれの分割音声ファイルに対して音声認識を行い(ステップS2)、認識結果に対して、キーワード記憶部3−2のキーワードリストを用いて照合を実行する(ステップS3)。
次に、書き起こし制御装置4は、分割音声ファイルの認識結果にキーワードが含まれるか否かを判定し(ステップS4)、機密情報に関するキーワードが含まれる場合には、信頼度の高いスタッフに書き起こしを依頼するべく、信頼度の高いスタッフのクライアント端末に、該当分割音声ファイルを送信し(ステップS5)、該スタッフによる書き起こし作業の実行を指示する(ステップS6)。一方、分割音声ファイルの認識結果に、機密情報に関するキーワードが含まれない場合には、一般スタッフに書き起こしを依頼するべく、一般スタッフのクライアント端末に、該当分割音声ファイルを送信し(ステップS7)、該スタッフによる書き起こし作業の実行を指示する(ステップS8)。いずれの場合も、書き起こし作業が終了すると、クライアント端末から送信される作業結果を受信し(ステップS9)、書き起こしテキストを抽出して統合し、分割前の元の音声データの書き起こしテキストデータとしてテキスト記憶部6に保存する(ステップS10)。
上述した実施形態によれば、音声データを分割し、機密情報を含めた部分の書き起こし作業を信頼度の高いスタッフに依頼することで、情報漏洩のリスクを大幅に軽減することができる。
また、分割なしで機密保持を保とうとすると、機密なしの部分を含めてすべての音声データを専属スタッフなどの信頼度の高いスタッフに依頼するしかないが、こういったスタッフは、一般スタッフより単価が高いため、コスト的に割高になる。上述した実施形態によれば、機密情報のない音声データを安心して単価の安い一般スタッフに依頼することができ、全体的にコストを削減することができる。
なお、上述した実施形態において、音声分割装置2、識別子付与装置3、書き起こし制御装置4、テキスト抽出装置5などの機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータ装置に読み込ませ、実行することにより、音声分割装置2、識別子付与装置3、書き起こし制御装置4、テキスト抽出装置5などの機能を実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
本発明の実施形態による書き起こしテキスト作成支援装置の構成を示すブロック図である。 本実施形態による、音声分割装置2の構成を示すブロック図である。 本実施形態による、管理テーブル2−4−1のデータ構成を示す概念図である。 本実施形態による識別子付与装置3の構成を示すブロック図である。 本実施形態による、キーワードテーブル3−2−1の一例を示す概念図である。 本実施形態による書き起こし制御装置4の構成を示すブロック図である。 本実施形態による、作業スタッフ情報テーブル4−2−1のデータ構成例を示す概念図である。 本実施形態による、管理テーブル2−4−1の状態遷移を説明するための概念図である。 本実施形態によるテキスト抽出装置5の構成を示すブロック図である。 本実施形態による、クライアント端末8−1〜8−nの構成を示すブロック図である。 本実施形態による書き起こしテキスト作成支援装置の動作を説明するためのフローチャートである。
符号の説明
1 音声データ記憶部
2 音声分割装置
2−1 管理テーブル生成部
2−2 無音区間閾値計算部
2−3 音声分割部
2−4 管理テーブル記憶部
2−4−1 管理テーブル
2−5 分割音声ファイル記憶部
3 識別子付与装置
3−1 音声認識部
3−2 キーワード記憶部
3−2−1 キーワードテーブル
3−3 キーワード照合部
4 書き起こし制御装置
4−1 スタッフ情報取得部
4−2 作業スタッフ情報記憶部
4−2−1 作業スタッフ情報テーブル
4−3 管理テーブル情報取得部
4−4 送信部
4−5 受信部
5 テキスト抽出装置
5−1 管理テーブル情報取得部
5−2 書き起こし抽出部
6 テキストデータ記憶部
7 ネットワーク
8−1〜8−n クライアント端末
9−1 受信部
9−2 情報表示部
9−3 音声ファイル再生部
9−4 書き起こし入力部
9−5 送信部

Claims (5)

  1. 音声データからテキストデータを書き起こすための書き起こしテキスト作成支援装置であって、
    書き起こし作業者毎に、それぞれの書き起こし作業者の信頼度に応じた信頼度値を記憶する信頼度記憶手段と、
    音声データを所定の区間に分割して分割音声データを生成する分割音声データ生成手段と、
    前記分割音声データ生成手段により分割された分割音声データ毎に音声認識を行い、複数の一次テキストデータに変換する変換手段と、
    機密情報に関するキーワードを記憶するキーワード記憶手段と、
    前記変換手段により変換された一次テキストデータ毎に、前記キーワード記憶手段に記憶されているキーワードが含まれるか否かを判定する判定手段と、
    前記判定手段による判定結果に基づいて、前記信頼度記憶手段の信頼度値を参照し、分割音声データ生成手段により分割された分割音声データ毎に、書き起こし作業を依頼すべき書き起こし作業者を選定する選定手段と
    を具備することを特徴とする書き起こしテキスト作成支援装置。
  2. 前記選定手段により選定された書き起こし作業者の端末に、該当分割音声データを送信する送信手段と、
    前記書き起こし作業者による書き起こし作業結果のテキストデータを受信する受信手段と、
    前記受信手段により受信したテキストデータを統合し、元の音声データに対する書き起こしテキストデータとして保存する保存手段と
    を更に具備することを特徴とする請求項1記載の書き起こしテキスト作成支援装置。
  3. 前記選定手段は、
    前記信頼度記憶手段の信頼度値を参照し、前記判定手段により前記一次テキストに機密情報に関するキーワードが含まれていると判定された場合には、信頼度値が高い書き起こし作業者を選定し、前記一次テキストに機密情報に関するキーワードが含まれていないと判定された場合には、信頼度値が低い書き起こし作業者を選定する
    ことを特徴とする請求項1または2に記載の書き起こしテキスト作成支援装置。
  4. 音声データからテキストデータを書き起こすための書き起こし作業を支援する書き起こしテキスト作成支援プログラムであって、
    コンピュータに、
    音声データを所定の区間に分割して分割音声データを生成するステップと、
    分割された分割音声データ毎に音声認識を行い、複数の一次テキストデータに変換するステップと、
    変換された一次テキストデータ毎に、機密情報に関するキーワードが含まれるか否かを判定するステップと、
    前記一次テキストに機密情報に関するキーワードが含まれていると判定された場合には、信頼度値が高い書き起こし作業者を選定し、前記一次テキストに機密情報に関するキーワードが含まれていないと判定された場合には、信頼度値が低い書き起こし作業者を選定するステップと
    を実行させることを特徴とする書き起こしテキスト作成支援プログラム。
  5. コンピュータで実行される、音声データからテキストデータを書き起こすための書き起こし作業を支援する書き起こしテキスト作成支援方法であって、
    分割音声データ生成手段が、音声データを所定の区間に分割して分割音声データを生成するステップと、
    変換手段が、分割された分割音声データ毎に音声認識を行い、複数の一次テキストデータに変換するステップと、
    判定手段が、変換された一次テキストデータ毎に、機密情報に関するキーワードが含まれるか否かを判定するステップと、
    選定手段が、前記一次テキストに機密情報に関するキーワードが含まれていると判定された場合には、信頼度値が高い書き起こし作業者を選定し、前記一次テキストに機密情報に関するキーワードが含まれていないと判定された場合には、信頼度値が低い書き起こし作業者を選定するステップと
    を含むことを特徴とする書き起こしテキスト作成支援方法。
JP2007337067A 2007-12-27 2007-12-27 書き起こしテキスト作成支援装置、書き起こしテキスト作成支援プログラム、及び書き起こしテキスト作成支援方法 Active JP5184071B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007337067A JP5184071B2 (ja) 2007-12-27 2007-12-27 書き起こしテキスト作成支援装置、書き起こしテキスト作成支援プログラム、及び書き起こしテキスト作成支援方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007337067A JP5184071B2 (ja) 2007-12-27 2007-12-27 書き起こしテキスト作成支援装置、書き起こしテキスト作成支援プログラム、及び書き起こしテキスト作成支援方法

Publications (2)

Publication Number Publication Date
JP2009157774A JP2009157774A (ja) 2009-07-16
JP5184071B2 true JP5184071B2 (ja) 2013-04-17

Family

ID=40961708

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007337067A Active JP5184071B2 (ja) 2007-12-27 2007-12-27 書き起こしテキスト作成支援装置、書き起こしテキスト作成支援プログラム、及び書き起こしテキスト作成支援方法

Country Status (1)

Country Link
JP (1) JP5184071B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020072367A (ja) * 2018-10-31 2020-05-07 株式会社ジェイ・エックス・ウィンド 情報処理システムおよび文字起こし方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113204786B (zh) * 2021-05-06 2021-12-14 北京连山科技股份有限公司 一种去中心的数据保护方法和***

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003091696A (ja) * 2001-09-18 2003-03-28 Sg Engineering Kk 業務代行システム及び業務代行プログラム
JP2004013576A (ja) * 2002-06-07 2004-01-15 Nec Corp 広域ネットワークを利用したデータ入力システム
JP2006011916A (ja) * 2004-06-28 2006-01-12 National Printing Bureau 編集物のネットワーク校正方法
JP4747573B2 (ja) * 2004-12-22 2011-08-17 日本電気株式会社 音声情報加工システム、音声情報加工方法及び音声情報加工プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020072367A (ja) * 2018-10-31 2020-05-07 株式会社ジェイ・エックス・ウィンド 情報処理システムおよび文字起こし方法

Also Published As

Publication number Publication date
JP2009157774A (ja) 2009-07-16

Similar Documents

Publication Publication Date Title
KR101143034B1 (ko) 음성 명령을 명확하게 해주는 중앙집중식 방법 및 시스템
CN106971009B (zh) 语音数据库生成方法及装置、存储介质、电子设备
TWI304538B (en) System, method and recording medium for efficient presentation of database query results through audio user interfaces
EP2835798B1 (en) Interfacing device and method for supporting speech dialogue service
RU2525440C2 (ru) Основанные на языке разметки выбор и использование распознавателей для обработки произнесения
KR101242040B1 (ko) 포터블 기기의 재생 목록 자동 생성 방법 및 장치
US20030046071A1 (en) Voice recognition apparatus and method
JP2019046468A (ja) インターフェイススマートインタラクティブ制御方法、装置、システム及びプログラム
JP2020079921A (ja) 音声インタラクション実現方法、装置、コンピュータデバイス及びプログラム
JP3265131B2 (ja) イベント生成分配方式
JP2010078979A (ja) 音声録音装置、録音音声検索方法及びプログラム
US7624016B2 (en) Method and apparatus for robustly locating user barge-ins in voice-activated command systems
CN110555072A (zh) 数据访问方法、装置、设备和介质
CN111899859A (zh) 手术器械清点方法及装置
KR102036721B1 (ko) 녹음 음성에 대한 빠른 검색을 지원하는 단말 장치 및 그 동작 방법
JP5184071B2 (ja) 書き起こしテキスト作成支援装置、書き起こしテキスト作成支援プログラム、及び書き起こしテキスト作成支援方法
US10990351B2 (en) Voice-based grading assistant
JP7073797B2 (ja) 情報処理プログラム、情報処理方法及び情報処理装置
JP5892598B2 (ja) 音声文字変換作業支援装置、音声文字変換システム、音声文字変換作業支援方法及びプログラム
US20080091719A1 (en) Audio tags
WO2019017027A1 (ja) 情報処理装置および情報処理方法
JP7103681B2 (ja) 音声認識プログラム、音声認識方法、音声認識装置および音声認識システム
JP7304269B2 (ja) 書き起こし支援方法及び書き起こし支援装置
US20240070193A1 (en) Reducing metadata transmitted with automated assistant requests
WO2022215201A1 (ja) 処理装置、処理方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100318

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120626

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120809

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130116

R150 Certificate of patent or registration of utility model

Ref document number: 5184071

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160125

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250