JP5642037B2 - 検索装置、検索方法およびプログラム - Google Patents

検索装置、検索方法およびプログラム Download PDF

Info

Publication number
JP5642037B2
JP5642037B2 JP2011208051A JP2011208051A JP5642037B2 JP 5642037 B2 JP5642037 B2 JP 5642037B2 JP 2011208051 A JP2011208051 A JP 2011208051A JP 2011208051 A JP2011208051 A JP 2011208051A JP 5642037 B2 JP5642037 B2 JP 5642037B2
Authority
JP
Japan
Prior art keywords
word
words
unknown word
text
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011208051A
Other languages
English (en)
Other versions
JP2013069170A (ja
Inventor
西山 修
修 西山
信宏 下郡
信宏 下郡
朋男 池田
朋男 池田
上野 晃嗣
晃嗣 上野
鈴木 博和
博和 鈴木
学 永尾
学 永尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2011208051A priority Critical patent/JP5642037B2/ja
Priority to US13/527,763 priority patent/US20130080174A1/en
Publication of JP2013069170A publication Critical patent/JP2013069170A/ja
Application granted granted Critical
Publication of JP5642037B2 publication Critical patent/JP5642037B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/221Announcement of recognition results

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明の実施形態は、検索装置、検索方法およびプログラムに関する。
従来、音声データをテキスト化する書き起こし作業の効率化を図るための様々な技術が知られている。例えば発音を正確に聞き取ることができずに表記(綴り)が不明な語句については、当該語句の推定された発音(読み)を示す情報を用いて、類似する発音を有する語句を検索する技術が知られている。例えばユーザーが入力した音素記号列を所定の規則に従って補正して補正音素記号列を生成し、綴りと音素記号列とが対応付けられた複数の組が記憶された綴りテーブルから、生成した補正音素記号列と一致又は類似する音素記号列を検索することで、当該補正音素記号列の綴りを検索する技術が知られている。
しかしながら、従来の技術では、発音の類似度のみに基づいて語句の検索が行われるので、書き起こされるテキストの内容とは無関係な語句も検索結果として表示されることがある。
特開2006−309469号公報
本発明が解決しようとする課題は、書き起こされるテキストの内容と無関係な語句が検索結果として表示されることを防止可能な検索装置、検索方法およびプログラムを提供することである。
実施形態の検索装置は、テキスト入力部と第1抽出部と検索部と第2抽出部と取得部と選択部とを備える。テキスト入力部は、ユーザーが書き起こせなかった語句である未知語であることを示す未知語情報を含むテキストを入力する。第1抽出部は、テキストに含まれる未知語情報以外の語句のうち、未知語に関連する語句を示す関連語を抽出する。検索部は、関連語を含む文書を示す関連文書を検索する。第2抽出部は、関連文書に含まれる複数の語句から、未知語の候補を示す候補語を抽出する。取得部は、ユーザーにより推定された、未知語発音を示す読み情報を取得する。選択部は、候補語のうち、その発音が読み情報と類似する候補語を選択する。
実施形態の検索方法は、テキスト入力ステップと第1抽出ステップと検索ステップと第2抽出ステップと取得ステップと選択ステップとを備える。テキスト入力ステップは、プロセッサが、ユーザーが書き起こせなかった語句である未知語であることを示す未知語情報を含むテキストを入力する。第1抽出ステップは、プロセッサが、テキストに含まれる未知語情報以外の語句のうち、未知語に関連する語句を示す関連語を抽出する。検索ステップは、プロセッサが、関連語を含む文書を示す関連文書を検索する。第2抽出ステップは、プロセッサが、関連文書に含まれる複数の語句から、未知語の候補を示す候補語を抽出する。取得ステップは、プロセッサが、ユーザーにより推定された未知語発音を示す読み情報を取得する。選択ステップは、プロセッサが、候補語のうち、その発音が読み情報と類似する候補語を選択する。
実施形態のプログラムは、テキスト入力ステップと第1抽出ステップと検索ステップと第2抽出ステップと取得ステップと選択ステップとをコンピュータに実行させるためのプログラムである。テキスト入力ステップは、ユーザーが書き起こせなかった語句である未知語であることを示す未知語情報を含むテキストを入力する。第1抽出ステップは、テキストに含まれる未知語情報以外の語句のうち、未知語に関連する語句を示す関連語を抽出する。検索ステップは、関連語を含む文書を示す関連文書を検索する。第2抽出ステップは、関連文書に含まれる複数の語句から、未知語の候補を示す候補語を抽出する。取得ステップは、ユーザーにより推定された、未知語発音を示す読み情報を取得する。選択ステップは、候補語のうち、その発音が読み情報と類似する候補語を選択する。
実施形態に係る検索装置の概略構成例を示すブロック図。 実施形態の検索装置による処理動作の一例を示すフローチャート。 実施形態の候補語抽出処理の一例を示すフローチャート。 実施形態の選択処理の一例を示すフローチャート。 実施形態のスコアの算出結果の一例を示す図。 変形例に係る検索装置の概略構成例を示すブロック図。
以下、添付図面を参照しながら、本発明に係る検索装置、検索方法およびプログラムの実施の形態を詳細に説明する。なお、以下の実施形態では、検索装置として、音声データを再生する機能、および、ユーザーの操作に応じてテキストを作成するテキスト作成機能を有するPC(Personal Computer)を例に挙げて説明するが、これに限定されるものではない。以下の実施形態では、書き起こし作業を行う場合、ユーザーは、収録された音声データを再生しながらキーボードを操作してテキスト入力を行い、音声データをテキスト化していく。
図1は、本実施形態の検索装置100の概略構成例を示すブロック図である。図1に示すように、検索装置100は、テキスト入力部10と、第1抽出部20と、検索部30と、第2抽出部40と、推定部50と、読み情報入力部60と、取得部70と、選択部80と、表示部90とを含む。
テキスト入力部10は、ユーザーが書き起こせなかった語句(単語や句を含む概念)である未知語であることを示す未知語情報を含むテキストを入力する。本実施形態では、テキスト入力部10は、ユーザーによるキーボード操作に応じてテキストを作成する機能を有し、作成したテキストを入力する。なお、これに限らず、例えばユーザーの操作に応じてテキストを作成する機能を有するテキスト作成部がテキスト入力部10とは別に設けられてもよい。この場合、テキスト入力部10は、テキスト作成部で作成されたテキストを受け取り、その受け取ったテキストを入力することができる。
書き起こし作業を行う場合、ユーザーは、収録された音声データを再生しながらキーボードを操作してテキストを作成するが、例えば発音を正確に聞き取ることができず、表記(綴り)が不明な語句については、未知語であることを示す未知語情報を入力する。本実施形態では、語句ではない記号「●」を未知語情報として採用しているが、これに限らず、未知語情報は、ユーザーが書き起こせなかった語句(未知語)であることを示す情報であればよく、その種類は任意である。
第1抽出部20は、テキスト入力部10で入力されたテキストに含まれる未知語情報以外の語句のうち、未知語に関連する語句を示す関連語を抽出する。より具体的には、第1抽出部20は、テキスト入力部10で入力されたテキストに対して、形態素解析などの言語処理技術を施すことで、当該テキストに含まれる未知語情報以外の語句を抽出する。この抽出された語句は、ユーザーが書き起こすことができた語句(可聴語)であると捉えることができる。そして、第1抽出部20は、そのようにして抽出した可聴語のうち、未知語情報の前後に隣接する複数の語句を関連語として抽出する。一例として、本実施形態では、第1抽出部20は、抽出した可聴語のうち、未知語情報の前後に隣接する2つの語句を関連語として抽出する。なお、関連語の抽出方法はこれに限られるものではない。
検索部30は、関連語を含む文書を示す関連文書を検索する。例えば検索部30は、第1抽出部20で抽出された関連語をクエリとして、検索装置100の内部に設けられた不図示の文書データベースや、WWW(World Wide Web)などで公開されている文書データなどから公知の検索技術を利用して、関連文書を検索することができる。そして、検索部30は、検索結果として得られた所定数の関連文書を収集(取得)する。
第2抽出部40は、検索部30により収集された関連文書に含まれる複数の語句から、未知語の候補を示す候補語を抽出する。より具体的には以下のとおりである。本実施形態では、第2抽出部40は、検索部30で検索された関連文書に対して、形態素解析などの言語処理技術を施すことで、当該関連文書に含まれる複数の語句を抽出する。そして、抽出した複数の語句のうち、前述の可聴語と一致する語句以外の語句を候補語として抽出する。
推定部50は、第2抽出部40で抽出された候補語の発音(読み)を示す情報(「候補語読み情報」と呼ぶ)を推定する。一例として、本実施形態では、推定部50は、音声合成などで利用されている公知の発音推定技術などを利用して、第2抽出部40で抽出された候補語の表記(綴り)からそれぞれの候補語読み情報を推定することができる。推定部50で推定された候補語読み情報は選択部80に渡される。
読み情報入力部60は、未知語の推定された発音を示す読み情報を入力する。本実施形態では、ユーザーは、自身が推定した未知語の発音を示す文字列を入力するためのキーボード操作を行う。そして、読み情報入力部60は、ユーザーによるキーボード操作に応じて文字列を生成し、その生成した文字列を読み情報として入力する。
取得部70は、読み情報を取得する。本実施形態では、取得部70は、読み情報入力部60により入力された読み情報を取得する。取得部70で取得された読み情報は選択部80に渡される。
選択部80は、第2抽出部40で抽出された候補語のうち、その発音が、取得部70で取得された読み情報と類似する候補語を選択する。より具体的には以下のとおりである。本実施形態では、選択部80は、取得部70で取得された読み情報と、推定部50で推定された各候補語の候補語読み情報とを比較する。そして、選択部80は、候補語ごとに、候補語読み情報と、取得部70で取得された読み情報との類似度を算出する。類似度の算出方法は任意であり、公知の様々な技術を利用可能である。例えばモーラ単位での編集距離を利用する方法であってもよいし、単音単位での聴覚的類似度や構音様式の類似度などに基づいた距離計算を行う方法であってもよい。そして、選択部80は、第2抽出部40で抽出された候補語のうち、上述の類似度が高い候補語を所定数だけ選択する。
表示部90は、選択部80で選択された候補語を表示する。詳細な図示は省略するが、本実施形態の検索装置100は、各種の情報を表示する表示装置を備えている。表示装置は、例えば液晶パネルなどで構成され得る。そして、表示部90は、選択部80で選択された候補語を表示するように表示装置を制御する。
図2は、本実施形態の検索装置100による処理動作の一例を示すフローチャートである。図2に示すように、テキスト入力部10により未知語情報(この例では「●」)を含むテキストが入力された場合(ステップS1の結果:YES)、検索装置100は、候補語を抽出する候補語抽出処理を実行する(ステップS2)。より具体的には以下のとおりである。図3は、候補語抽出処理の一例を示すフローチャートである。図3に示すように、まず第1抽出部20は、テキスト入力部10で入力されたテキストに対して、形態素解析などの言語処理技術を施すことで、当該テキストに含まれる未知語情報以外の語句(可聴語)を抽出する(ステップS11)。次に、第1抽出部20は、ステップS11で抽出した可聴語のうち、未知語情報の前後に隣接する2つの語句を関連語として抽出する(ステップS12)。
次に、検索部30は、関連語を含む文書を示す関連文書を検索する(ステップS13)。次に、第2抽出部40は、ステップS13で検索された関連文書に含まれる複数の語句から、候補語を抽出する(ステップS14)。前述したように、本実施形態では、第2抽出部40は、ステップS13で検索された関連文書に対して、形態素解析などの言語処理技術を施すことで、当該関連文書に含まれる複数の語句を抽出し、その抽出した語句のうち、可聴語と一致する語句以外の語句を候補語として抽出する。以上が候補語抽出処理の内容である。
再び図2に戻って説明を続ける。前述の候補語抽出処理の後(ステップS2の後)、推定部50は、ステップS2で抽出された複数の候補語の各々の候補語読み情報を推定する(ステップS3)。次に、取得部70は、読み情報入力部60により入力された読み情報を取得する(ステップS4)。次に、選択部80は、表示対象の候補語を選択する選択処理を実行する(ステップS5)。より具体的には以下のとおりである。
図4は、選択部80が実行する選択処理の一例を示すフローチャートである。図4に示すように、まず選択部80は、ステップS4で取得された読み情報と、ステップS3で推定された各候補語の候補語読み情報とを比較し、候補語ごとに、当該候補語の候補語読み情報と、ステップS4で取得された読み情報との類似度を算出する(ステップS21)。次に、選択部80は、ステップS2で抽出された候補語のうち、ステップS21で算出された類似度が高い候補語を所定数だけ選択する(ステップS22)。以上が選択処理の内容である。
再び図2に戻って説明を続ける。前述の選択処理の後(ステップS5の後)、表示部90は、ステップS4で選択された候補語を表示するように表示装置を制御する(ステップS6)。例えば、この表示内容を見たユーザーが、何れかの候補語を選択することにより、入力されたテキストにおける未知語情報の部分を、選択された候補語に置き換えることもできる。これにより、書き起こし作業の作業効率を向上させることができる。
いま、具体例として、「先程も申し上げました通り、そのような教育法、●などの規定の中に、」というテキストがテキスト入力部10によって入力され、「しじゅづつがっこうほう」という読み情報(未知語の推定された読みを示す文字列)が読み情報入力部60によって入力される場合を想定する。この場合、ユーザーは、テキストの中の「●」で記述された部分の発音(読み)を「しじゅづつがっこうほう」と推定しており、検索装置100は、この「●」の部分の語句の候補語を検索する。
まず、テキスト入力部10により「先程も申し上げました通り、そのような教育法、●などの規定の中に、」というテキストが入力された場合(図2のステップS1の結果:)YES)、前述の候補語抽出処理が実行される(図2のステップS2)。この例では、第1抽出部20は、入力された「先程も申し上げました通り、そのような教育法、●などの規定の中に、」というテキストに対して、形態素解析などの言語処理技術を施すことで、当該テキストに含まれる「先程」、「申し上げました」、「通り」、「教育法」、「規定」、「中」を可聴語として抽出する(図3のステップS11)。そして、第1抽出部20は、抽出した可聴語のうち、未知語情報である「●」に隣接する2つの語句「教育法」、「規定」を関連語として抽出する(図3のステップS12)。次に、検索部30は、関連語として抽出された「教育法」、「規定」をクエリとして公知のWeb検索エンジンなどを利用して、関連文書を検索する(図3のステップS13)。そして、その検索結果として得られた所定数の関連文書を収集する。
次に、第2抽出部40は、検索部30により収集された関連文書のテキスト部分に対して、形態素解析などの言語処理技術を施すことで、当該関連文書に含まれる「学校教育法施行規則」、「昭和」、「学校」、「教育法」、「規定」、「校地」、「幼稚園」、「教員」、「私立学校法」などの複数の語句を抽出する。そして、第2抽出部40は、その抽出した語句のうち、可聴語(「先程」、「申し上げました」、「通り」、「教育法」、「規定」、「中」)と一致する語句以外の語句(「学校教育法施行規則」、「昭和」、「学校」、「校地」、「幼稚園」、「教員」、「私立学校法」などの語句)を候補語として抽出する(図3のステップS14)。
次に、推定部50は、抽出された候補語に対して、音声合成技術などで利用されている公知の発音推定処理を適用して、それぞれの候補語読み情報を推定する(図2のステップS3)。この例では、候補語「学校教育法施行規則」の候補語読み情報として「がっこうきょういくほうしこうきそく」が推定される。同様に、候補語「昭和」の候補語読み情報として「しょうわ」が推定される。同様に、候補語「学校」の候補語読み情報として「がっこう」が推定される。同様に、候補語「校地」の候補語読み情報として「こうち」が推定される。同様に、候補語「幼稚園」の候補語読み情報として「ようちえん」が推定される。同様に、候補語「教員」の候補語読み情報として「きょういん」が推定される。同様に、候補語「私立学校法」の候補語読み情報として「しりつがっこうほう」が推定される。
次に、取得部70は、読み情報入力部60により入力された読み情報「しじゅづつがっこうほう」を取得する(図2のステップS4)。そして、選択部80は、取得部70で取得された読み情報「しじゅづつがっこうほう」と、推定部50で推定された各候補語の候補語読み情報「がっこうきょういくほうしこうきそく」、「しょうわ」、「がっこう」、「こうち」、「ようちえん」、「きょういん」、「しりつがっこうほう」の各々との類似度を算出する(図4のステップS21)。この例では、読み情報と候補語読み情報との編集距離をモーラ単位で算出することにより類似度を求める。例えば置換コストを2、削除・挿入コストを1として、読み情報「しじゅづつがっこうほう」と各候補語読み情報との類似度を示すスコアを計算した場合、候補語読み情報「がっこうきょういくほうしこうきそく」のスコアは16、候補語読み情報「しょうわ」のスコアは11、候補語読み情報「がっこう」のスコアは7、候補語読み情報「こうち」のスコアは10、候補語読み情報「ようちえん」のスコアは14、候補語読み情報「きょういん」のスコアは14、「しりつがっこうほう」のスコアは4と算出される。なお、この例では、スコアの値が小さいほど、候補読み情報が示す発音は、読み情報が示す発音に近い(類似度が高い)ことを示す。
次に、選択部80は、候補語のうち、スコアの値が小さい(つまりは類似度が高い)所定数の候補語を選択する(図4のステップS22)。この例では、図5に示すように、スコアの値が小さい順に、4個の候補語「私立学校法(しりつがっこうほう)」、「学校(がっこう)」、「校地(こうち)」、「学校教育法(がっこうきょういくほう)」が選択される。次に、表示部90は、選択部80で選択された4つの候補語の各々の表記(綴り)と発音(読み)を示す候補語読み情報との組を、スコアの小さい順に表示するように表示装置を制御する(図2のステップS6)。
以上に説明したように、本実施形態では、入力されたテキストに含まれる未知語情報以外の語句のうち当該未知語情報と関連する語句(関連語)を含む関連文書から、未知語の候補を示す候補語が抽出されるので、未知語とは無関係であって発音だけが近いような語句が候補語として表示されることを防止できる。上述の具体例を例に挙げると、例えば読み情報「しじゅづつがっこうほう」との類似度を示すスコアの値が「7」の「手術(しゅじゅつ)」、スコアの値が「11」の「手術教育(しゅじゅつきょういく)」などといった、未知語の関連分野である「学校」や「教育」などとは全く無関係であって発音だけが近いような語句が検索結果として表示されることを防止できる。
なお、本発明の実施形態に係る検索装置は、例えば汎用のコンピュータ装置(例えばPC)を基本ハードウェアとして用いることでも実現可能である。すなわち、上述のテキスト入力部10、第1抽出部20、検索部30、第2抽出部40、推定部50、読み情報入力部60、取得部70、選択部80および表示部90の各々は、上記のコンピュータ装置に搭載されたCPUがROMなどに格納されたプログラムを実行することにより実現することができる。なお、これに限らず、例えばテキスト入力部10、第1抽出部20、検索部30、第2抽出部40、推定部50、読み情報入力部60、取得部70、選択部80および表示部90のうちの少なくとも一部がハードウェア回路で構成されてもよい。
また、検索装置は、上記のプログラムをコンピュータ装置に予めインストールすることで実現してもよいし、CD−ROMなどの記憶媒体に記憶して、あるいはネットワークを介して上記のプログラムを配布して、当該プログラムをコンピュータ装置に適宜インストールすることで実現してもよい。また、言語処理技術や発音推定技術を用いるために利用する各種データファイルが必要であれば、それらを保持する記憶媒体は、上記のコンピュータ装置に内蔵あるいは外付けされたメモリ、ハードディスクもしくはCD−R、CD−RW、DVD−RAM、DVD−Rなどを適宜利用して実現することができる。
以上、本発明の実施形態を説明したが、この実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。また、例えば上記実施形態に示される全構成要素(テキスト入力部10、第1抽出部20、検索部30、第2抽出部40、推定部50、読み情報入力部60、取得部70、選択部80および表示部90)から、表示部90を除いた構成を、本発明に係る検索装置として捉えることもできる。要するに、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。
以下に変形例を記載する。以下の変形例は、任意に組み合わせることが可能である。
(1)変形例1
上述の実施形態では、取得部70は、読み情報入力部60により入力された読み情報を取得しているが、これに限らず、取得部70による読み情報の取得方法は任意である。例えばテキスト入力部10により入力されるテキストに含まれる未知語情報は、読み情報を含んで構成され、取得部70は、テキスト入力部10により入力されたテキストに含まれる未知語情報から読み情報を抽出して取得することもできる。この場合、図6に示すように、読み情報入力部60は不要となる。
例えば未知語情報は、読み情報を示す文字列と、当該文字列の前後に付される特定の記号とから構成されてもよい。例えば前述の具体例において、テキストに含まれる未知語情報は、●の代わりに、<しじゅづつがっこうほう>と表すこともできる。つまり、「先程も申し上げました通り、そのような教育法、<しじゅづつがっこうほう>などの規定の中に、」というテキストがテキスト入力部10により入力され、取得部70は、テキストに含まれる未知語情報<しじゅづつがっこうほう>から、読み情報である「しじゅづつがっこうほう」を取得することができる。
(2)変形例2
上述の実施形態では、第1抽出部20は、抽出した可聴語のうち、未知語情報の前後に隣接する複数(例えば2つ)の語句を関連語として抽出しているが、これに限らず、例えば第1抽出部20は、入力されたテキストに含まれる未知語情報以外の語句(可聴語)のうち、出現頻度の高い語句を関連語として抽出することもできる。例えば、出現頻度が所定の順位以上、或いは、出現頻度が所定の数値以上となる可聴語を関連語として抽出することもできる。要するに、第1抽出部20は、可聴語のうち、未知語に関連する語句を関連語として抽出するものであればよい。
(3)変形例3
上述の具体例では、選択部80は、表音文字を平仮名としてモーラ単位で算出した編集距離を発音の類似度としているが、各モーラを音素記号や単音記号に置換して各記号単位での編集距離を算出して発音の類似度を求めてもよい。さらに、表音文字(音素記号、単音記号など)の間の発音の類似度などを記述した表を参照して発音の類似度を算出することもできる。
(4)変形例4
上述の実施形態では、検索部30は、第1抽出部20で抽出された関連語をクエリとして、検索装置100の内部に設けられた不図示の文書データベースや、WWW(World Wide Web)などで公開されている文書データなどから公知の検索技術を利用して、関連文書を検索しているが、これに限らず、関連文書の検索方法は任意である。例えば検索装置100内に専用の文書ファイルを記憶した関連文書記憶部を備えた上で、第1抽出部20で抽出された関連語を含む文書(関連文書)を検索することもできる。
(5)変形例5
上述の実施形態では、第2抽出部40は、関連文書に含まれる複数の語句のうち、可聴語と一致する語句については候補語から除外しているが、これに限らず、例えば関連文書に含まれる複数の語句のうち、可聴語と一致する語句を候補語から除外せずに、関連文書に含まれる複数の語句の各々を候補語として抽出することもできる。ただし、上述の実施形態のように、関連文書に含まれる複数の語句のうち可聴語と一致する語句については候補語から除外する構成の方が、関連文書に含まれる複数の語句の各々を候補語として抽出する構成に比べて、候補語を絞り込むことができる。
(6)変形例6
上述の実施形態では、検索装置100に入力されるテキストの言語(書き起こし作業の対象となる言語)は日本語であるが、これに限らず、入力されるテキストの言語の種類は任意である。例えば入力されるテキストの言語は英語であってもよいし、中国語であってもよい。入力されるテキストの言語が英語であっても中国語であっても、検索装置は、日本語と同一の構成となる。
10 テキスト入力部
20 第1抽出部
30 検索部
40 第2抽出部
50 推定部
60 読み情報入力部
70 取得部
80 選択部
90 表示部
100 検索装置

Claims (10)

  1. ユーザーが書き起こせなかった語句である未知語であることを示す未知語情報を含むテキストを入力するテキスト入力部と、
    前記テキストに含まれる前記未知語情報以外の語句のうち、前記未知語に関連する語句を示す関連語を抽出する第1抽出部と、
    前記関連語を含む文書を示す関連文書を検索する検索部と、
    前記関連文書に含まれる複数の語句から、前記未知語の候補を示す候補語を抽出する第2抽出部と、
    前記ユーザーにより推定された、前記未知語発音を示す読み情報を取得する取得部と、
    前記候補語のうち、その発音が前記読み情報と類似する前記候補語を選択する選択部と、を備える、
    検索装置。
  2. 前記第2抽出部は、前記関連文書に含まれる複数の語句のうち、前記テキストに含まれる前記未知語情報以外の語句と一致する語句については前記候補語から除外する、
    請求項1の検索装置。
  3. 前記読み情報を入力する読み情報入力部をさらに備え、
    前記取得部は、前記読み情報入力部で入力された前記読み情報を取得する、
    請求項1の検索装置。
  4. 前記未知語情報は前記読み情報を含んで構成され、
    前記取得部は、前記テキストに含まれる前記未知語情報から前記読み情報を抽出して取得する、
    請求項1の検索装置。
  5. 前記第1抽出部は、前記テキストに含まれる前記未知語情報以外の語句のうち、出現頻度の高い語句を関連語として抽出する、
    請求項1の検索装置。
  6. 前記第1抽出部は、前記テキストに含まれる前記未知語情報以外の語句のうち、前記未知語情報の前後に隣接する複数の語句を前記関連語として抽出する、
    請求項1の検索装置。
  7. 前記選択部で選択された前記候補語を表示する表示部をさらに備える、
    請求項1の検索装置。
  8. 前記未知語情報は記号である、
    請求項1の検索装置。
  9. プロセッサが、ユーザーが書き起こせなかった語句である未知語であることを示す未知語情報を含むテキストを入力するテキスト入力ステップと、
    プロセッサが、前記テキストに含まれる前記未知語情報以外の語句のうち、前記未知語に関連する語句を示す関連語を抽出する第1抽出ステップと、
    プロセッサが、前記関連語を含む文書を示す関連文書を検索する検索ステップと、
    プロセッサが、前記関連文書に含まれる複数の語句から、前記未知語の候補を示す候補語を抽出する第2抽出ステップと、
    プロセッサが、前記ユーザーにより推定された、前記未知語発音を示す読み情報を取得する取得ステップと、
    プロセッサが、前記候補語のうち、その発音が前記読み情報と類似する前記候補語を選択する選択ステップと、を備える、
    検索方法。
  10. ユーザーが書き起こせなかった語句である未知語であることを示す未知語情報を含むテキストを入力するテキスト入力ステップと、
    前記テキストに含まれる前記未知語情報以外の語句のうち、前記未知語に関連する語句を示す関連語を抽出する第1抽出ステップと、
    前記関連語を含む文書を示す関連文書を検索する検索ステップと、
    前記関連文書に含まれる複数の語句から、前記未知語の候補を示す候補語を抽出する第2抽出ステップと、
    前記ユーザーにより推定された、前記未知語発音を示す読み情報を取得する取得ステップと、
    前記候補語のうち、その発音が前記読み情報と類似する前記候補語を選択する選択ステップと、をコンピュータに実行させるためのプログラム。
JP2011208051A 2011-09-22 2011-09-22 検索装置、検索方法およびプログラム Expired - Fee Related JP5642037B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011208051A JP5642037B2 (ja) 2011-09-22 2011-09-22 検索装置、検索方法およびプログラム
US13/527,763 US20130080174A1 (en) 2011-09-22 2012-06-20 Retrieving device, retrieving method, and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011208051A JP5642037B2 (ja) 2011-09-22 2011-09-22 検索装置、検索方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2013069170A JP2013069170A (ja) 2013-04-18
JP5642037B2 true JP5642037B2 (ja) 2014-12-17

Family

ID=47912250

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011208051A Expired - Fee Related JP5642037B2 (ja) 2011-09-22 2011-09-22 検索装置、検索方法およびプログラム

Country Status (2)

Country Link
US (1) US20130080174A1 (ja)
JP (1) JP5642037B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5404726B2 (ja) * 2011-09-26 2014-02-05 株式会社東芝 情報処理装置、情報処理方法およびプログラム
US20160062979A1 (en) * 2014-08-27 2016-03-03 Google Inc. Word classification based on phonetic features
US11392646B2 (en) * 2017-11-15 2022-07-19 Sony Corporation Information processing device, information processing terminal, and information processing method
CN116186203B (zh) * 2023-03-01 2023-10-10 人民网股份有限公司 文本检索方法、装置、计算设备及计算机存储介质

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3647518B2 (ja) * 1994-10-06 2005-05-11 ゼロックス コーポレイション コード化したワードトークンを使用して文書画像をハイライトで強調する装置
US6085162A (en) * 1996-10-18 2000-07-04 Gedanken Corporation Translation system and method in which words are translated by a specialized dictionary and then a general dictionary
JPH10240739A (ja) * 1997-02-27 1998-09-11 Toshiba Corp 情報検索装置および情報検索方法
US6377949B1 (en) * 1998-09-18 2002-04-23 Tacit Knowledge Systems, Inc. Method and apparatus for assigning a confidence level to a term within a user knowledge profile
US7720682B2 (en) * 1998-12-04 2010-05-18 Tegic Communications, Inc. Method and apparatus utilizing voice input to resolve ambiguous manually entered text input
US6535850B1 (en) * 2000-03-09 2003-03-18 Conexant Systems, Inc. Smart training and smart scoring in SD speech recognition system with user defined vocabulary
WO2001084535A2 (en) * 2000-05-02 2001-11-08 Dragon Systems, Inc. Error correction in speech recognition
JP4154118B2 (ja) * 2000-10-31 2008-09-24 株式会社リコー 関連語選出装置、その方法および記録媒体、並びに文書検索装置、その方法および記録媒体
US7231351B1 (en) * 2002-05-10 2007-06-12 Nexidia, Inc. Transcript alignment
US8793127B2 (en) * 2002-10-31 2014-07-29 Promptu Systems Corporation Method and apparatus for automatically determining speaker characteristics for speech-directed advertising or other enhancement of speech-controlled devices or services
US7478033B2 (en) * 2004-03-16 2009-01-13 Google Inc. Systems and methods for translating Chinese pinyin to Chinese characters
US7813928B2 (en) * 2004-06-10 2010-10-12 Panasonic Corporation Speech recognition device, speech recognition method, and program
US7822597B2 (en) * 2004-12-21 2010-10-26 Xerox Corporation Bi-dimensional rewriting rules for natural language processing
US20070073533A1 (en) * 2005-09-23 2007-03-29 Fuji Xerox Co., Ltd. Systems and methods for structural indexing of natural language text
US8364468B2 (en) * 2006-09-27 2013-01-29 Academia Sinica Typing candidate generating method for enhancing typing efficiency
US8442972B2 (en) * 2006-10-11 2013-05-14 Collarity, Inc. Negative associations for search results ranking and refinement
JP4331257B2 (ja) * 2006-11-06 2009-09-16 パナソニック株式会社 情報検索装置
US20080255835A1 (en) * 2007-04-10 2008-10-16 Microsoft Corporation User directed adaptation of spoken language grammer
US8457946B2 (en) * 2007-04-26 2013-06-04 Microsoft Corporation Recognition architecture for generating Asian characters
JP2009053757A (ja) * 2007-08-23 2009-03-12 Toshiba Corp 情報処理装置、入力方法およびプログラム
US7475033B1 (en) * 2007-08-29 2009-01-06 Barclays Bank Plc Method of protecting an initial investment value of an investment
US8229732B2 (en) * 2007-08-31 2012-07-24 Google Inc. Automatic correction of user input based on dictionary
JP5295605B2 (ja) * 2008-03-27 2013-09-18 株式会社東芝 検索キーワード改良装置、サーバ装置、および方法
KR101462932B1 (ko) * 2008-05-28 2014-12-04 엘지전자 주식회사 이동 단말기 및 그의 텍스트 수정방법
US9892730B2 (en) * 2009-07-01 2018-02-13 Comcast Interactive Media, Llc Generating topic-specific language models
US8374864B2 (en) * 2010-03-17 2013-02-12 Cisco Technology, Inc. Correlation of transcribed text with corresponding audio
US20130124984A1 (en) * 2010-04-12 2013-05-16 David A. Kuspa Method and Apparatus for Providing Script Data
US20120035905A1 (en) * 2010-08-09 2012-02-09 Xerox Corporation System and method for handling multiple languages in text
US8650031B1 (en) * 2011-07-31 2014-02-11 Nuance Communications, Inc. Accuracy improvement of spoken queries transcription using co-occurrence information
US20130060560A1 (en) * 2011-09-01 2013-03-07 Google Inc. Server-based spell checking

Also Published As

Publication number Publication date
JP2013069170A (ja) 2013-04-18
US20130080174A1 (en) 2013-03-28

Similar Documents

Publication Publication Date Title
US10216725B2 (en) Integration of domain information into state transitions of a finite state transducer for natural language processing
US7979268B2 (en) String matching method and system and computer-readable recording medium storing the string matching method
JP5599662B2 (ja) 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法
JP4791984B2 (ja) 入力された音声を処理する装置、方法およびプログラム
KR100760301B1 (ko) 부분 검색어 추출을 통한 미디어 파일 검색 방법 및 장치
CN108140019B (zh) 语言模型生成装置、语言模型生成方法以及记录介质
WO2019096068A1 (zh) 语音识别纠错方法以及语音识别纠错***
JP3983265B1 (ja) 辞書作成支援システム、方法及びプログラム
JP5403696B2 (ja) 言語モデル生成装置、その方法及びそのプログラム
JP2015506515A (ja) タグをドキュメントに自動的に追加するための方法、装置およびコンピュータ記憶媒体
JP2008216756A (ja) 語句として新たに認識するべき文字列等を取得する技術
Ljubešić et al. Standardizing tweets with character-level machine translation
JP2011113570A (ja) 音声検索装置と音声検索方法
CN103123644A (zh) 声音数据检索***及用于该***的程序
JP5642037B2 (ja) 検索装置、検索方法およびプログラム
JP4738847B2 (ja) データ検索装置および方法
JP5404726B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP5853595B2 (ja) 形態素解析装置、方法、プログラム、音声合成装置、方法、プログラム
JP5189413B2 (ja) 音声データ検索システム
JP4592629B2 (ja) 文書検索支援方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
CN112732885A (zh) 用于问答***的答案扩展方法、装置及电子设备
JP6055267B2 (ja) 文字列分割装置、モデルファイル学習装置および文字列分割システム
JP2011113426A (ja) 辞書作成装置,辞書作成プログラムおよび辞書作成方法
JP4941495B2 (ja) ユーザ辞書作成システム、方法、及び、プログラム
JP2019008477A (ja) 判別プログラム、判別装置及び判別方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131001

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140307

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140422

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140617

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140930

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141028

R151 Written notification of patent or utility model registration

Ref document number: 5642037

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

Free format text: JAPANESE INTERMEDIATE CODE: R313114

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees