JP4595415B2 - 音声検索システムおよび方法ならびにプログラム - Google Patents
音声検索システムおよび方法ならびにプログラム Download PDFInfo
- Publication number
- JP4595415B2 JP4595415B2 JP2004207650A JP2004207650A JP4595415B2 JP 4595415 B2 JP4595415 B2 JP 4595415B2 JP 2004207650 A JP2004207650 A JP 2004207650A JP 2004207650 A JP2004207650 A JP 2004207650A JP 4595415 B2 JP4595415 B2 JP 4595415B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- string
- candidate
- search
- recognition result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
なお、f (x|u, Σ)は、平均ベクトルu、分散共分散行列ΣのK次元ガウス分布であって、(2)式で表される。
12、22 連続単語認識手段
13、23 認識結果単語列記憶手段
14、24 検索文字列入力手段
15、25 検索文字列展開手段
16、26 検索手段
17、27 検索結果出力手段
18、28 単語候補記憶手段
29 単語抽出手段
51 入出力部
52 データ処理部
53 記憶部
54 プログラム記憶部
55 単語候補記憶部
56 音声データ記憶部
57 認識結果単語列記憶部
Claims (20)
- 検索対象となる音声データの単語単位の音声認識結果を認識結果単語列として記憶する認識結果単語列記憶手段と、
前記音声認識結果に出現し得る単語を候補単語として記憶する単語候補記憶手段と、
入力された検索文字列を音素列に変換し、前記単語候補記憶手段に記憶されている前記候補単語または前記候補単語の組み合わせからなる候補単語列を音素列に変換し、前記それぞれ音素列に含まれる音素同士の一致の程度に基づいて前記検索文字列を前記候補単語または前記候補単語列に展開する検索文字列展開手段と、
前記検索文字列展開手段によって展開された前記候補単語または前記候補単語列を前記認識結果単語列記憶手段から検索する検索手段と、
を備えることを特徴とする音声検索システム。 - 前記単語候補記憶手段が、前記音声データから前記認識結果単語列を得るときの認識語彙を記憶していることを特徴とする請求項1に記載の音声検索システム。
- 前記認識結果単語列記憶手段に記憶された認識結果に現れる単語のリストを抽出する単語抽出手段を備え、前記単語候補記憶手段が前記リストを記憶することを特徴とする請求項1に記載の音声検索システム。
- 前記単語抽出手段が、前記リストを抽出する時に、前記認識結果において各単語の前後に現れる単語について調べて、前後に現れる単語にのみ接続を許した単語間の接続テーブルを作成し、前記単語候補記憶手段が前記リストと共に前記接続テーブルを記憶し、前記検索文字列展開手段は、前記単語候補記憶手段の記憶する前記リストと前記接続テーブルとを参照して、前記検索文字列を接続可能な前記候補単語または前記候補単語列のみに展開する機能を含むことを特徴とする請求項3に記載の音声検索システム。
- 前記検索文字列展開手段が、前記検索文字列の音素列を入力特徴ベクトル系列とし、前記候補単語を認識語彙として連続単語音声認識アルゴリズムによって単語展開する機能を含むことを特徴とする請求項1に記載の音声検索システム。
- 前記検索文字列展開手段が、前記検索文字列を前記単語候補記憶手段が記憶している前記候補単語を用いて展開する時に、前記音素同士の一致の程度に基づいて前記検索文字列と前記候補単語または前記候補単語列との間の距離を求めて距離があらかじめ定めた閾値以内となるように展開する機能を含むことを特徴とする請求項1に記載の音声検索システム。
- 前記音素の認識誤り傾向を表す混同行列を記憶する混同行列記憶手段を備え、前記検索文字列展開手段が、前記混同行列に基づいて、前記音素同士の一致の程度を求める機能を含むことを特徴とする請求項6に記載の音声検索システム。
- 前記検索文字列展開手段が、前記音声データから前記認識結果単語列を得るときに使用した音響モデル中のモデル間距離に基づいて前記音素同士の一致の程度を求める機能を含むことを特徴とする請求項6に記載の音声検索システム。
- 前記検索文字列展開手段が、前記距離に加えて、前記音声データから前記認識結果単語列を得るときに使用した言語モデルを参照して言語的に現れにくい単語や単語列に対して前記距離をより遠くなるようにする距離加算機能を含むことを特徴とする請求項6に記載の音声検索システム。
- 入力手段と、展開手段と、検索手段と、検索対象となる音声データの単語単位の音声認識結果に出現し得る単語を候補単語として記憶する記憶手段とを備える音声検索システムが単語列を検索する方法であって、
前記入力手段が検索文字列を入力するステップと、
前記展開手段が、前記記憶手段内の前記候補単語または前記候補単語の組み合わせからなる候補単語列を音素列に変換し、前記検索文字列を音素列に変換し、前記それぞれ音素列に含まれる音素同士の一致の程度に基づいて前記検索文字列を前記候補単語または前記候補単語列に展開するステップと、
前記検索手段が前記音声認識結果を認識結果単語列として表し、展開された前記候補単語または前記候補単語列を前記認識結果単語列から検索するステップと、
を含むことを特徴とする音声検索方法。 - 音声検索システムは、さらに音声認識手段を備え、
前記音声認識手段が、前記検索文字列を入力するステップに先立ち、前記音声データに対して音声認識を行い、認識結果として前記候補単語を得るステップを含むことを特徴とする請求項10に記載の音声検索方法。 - 音声検索システムは、さらに音声認識手段を備え、
前記音声認識手段が、前記検索文字列を入力するステップに先立ち、前記音声データに対して音声認識を行い、認識結果から抽出された単語のリストを作成するステップを含み、前記検索文字列を展開する前記ステップは、作成された前記リストを参照して展開することを特徴とする請求項10に記載の音声検索方法。 - 展開手段と、検索手段と、音声認識手段と、認識結果単語列記憶手段と、単語候補記憶手段とを備える音声検索システムが単語列を検索する方法であって、
前記音声認識手段が検索対象となる音声データの単語単位の音声認識結果を認識結果単語列として前記認識結果単語列記憶手段に記憶させるステップと、
前記認識結果に出現し得る単語を候補単語として前記単語候補記憶手段が記憶しておき、前記展開手段が、入力された検索文字列を音素列に変換し、前記単語候補記憶手段に記憶されている前記候補単語または前記候補単語の組み合わせからなる候補単語列を音素列に変換し、前記それぞれ音素列に含まれる音素同士の一致の程度に基づいて前記検索文字列を前記候補単語または前記候補単語列に展開するステップと、
前記検索手段が、前記展開された前記候補単語または前記候補単語列を前記認識結果単語列記憶手段から検索するステップと、
を含むことを特徴とする音声検索方法。 - 前記音声データから前記認識結果単語列を得るときの認識語彙を前記単語候補記憶手段が記憶しておくことを特徴とする請求項13記載の音声検索方法。
- 音声検索システムは、さらに単語抽出手段を備え、
前記単語抽出手段が前記認識結果単語列記憶手段に記憶された認識結果に現れる単語のリストを抽出するステップと、前記単語抽出手段が前記抽出された単語のリストを前記単語候補記憶手段に記憶させるステップと、をさらに含み、前記候補単語列に展開するステップは、前記記憶された前記リストを参照して展開することを特徴とする請求項13記載の音声検索方法。 - 認識結果単語列記憶手段と単語候補記憶手段とを備える音声検索システムを構成するコンピュータに、
検索対象となる音声データの単語単位の音声認識結果を認識結果単語列として前記認識結果単語列記憶手段に記憶させる処理と、
前記認識結果に出現し得る単語を候補単語として前記単語候補記憶手段に記憶させる処理と、
入力された検索文字列を音素列に変換し、前記単語候補記憶手段に記憶されている前記候補単語または前記候補単語の組み合わせからなる候補単語列を音素列に変換し、前記それぞれ音素列に含まれる音素同士の一致の程度に基づいて前記検索文字列を前記候補単語または前記候補単語列に展開する検索文字列展開処理と、
前記検索文字列展開処理によって展開された前記候補単語または前記候補単語列を前記認識結果単語列記憶手段から検索する検索処理と、
を実行させるプログラム。 - 前記音声データから前記認識結果単語列を得るときの認識語彙を前記単語候補記憶手段に記憶させる処理をさらに実行させる請求項16に記載のプログラム。
- 前記認識結果単語列記憶手段に記憶された認識結果に現れる単語のリストを抽出する単語抽出処理と、前記単語抽出処理によって抽出された単語のリストを前記単語候補記憶手段に記憶させる処理と、をさらに実行させ、前記記憶された前記リストを参照して展開するように前記検索文字列展開処理を実行させる請求項16に記載のプログラム。
- 認識結果単語列記憶手段と単語候補記憶手段とを備える音声検索システムを構成するコンピュータに、
検索対象となる音声データの単語単位の音声認識結果に出現し得る単語を予め記憶してある前記単語候補記憶手段中の候補単語または前記候補単語の組み合わせからなる候補単語列を音素列に変換し、入力された検索文字列を音素列に変換し、前記それぞれ音素列に含まれる音素同士の一致の程度に基づいて前記検索文字列を前記候補単語または前記候補単語列に展開する検索文字列展開処理と、
前記音声認識結果を認識結果単語列として予め記憶してある前記認識結果単語列記憶手段から、前記検索文字列展開処理によって展開された前記候補単語または前記候補単語列を検索する検索処理と、
を実行させるプログラム。 - 前記音声データに対して音声認識を行い、認識結果として前記候補単語を得る処理をさらに実行させる請求項19に記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004207650A JP4595415B2 (ja) | 2004-07-14 | 2004-07-14 | 音声検索システムおよび方法ならびにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004207650A JP4595415B2 (ja) | 2004-07-14 | 2004-07-14 | 音声検索システムおよび方法ならびにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006031278A JP2006031278A (ja) | 2006-02-02 |
JP4595415B2 true JP4595415B2 (ja) | 2010-12-08 |
Family
ID=35897564
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004207650A Expired - Fee Related JP4595415B2 (ja) | 2004-07-14 | 2004-07-14 | 音声検索システムおよび方法ならびにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4595415B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2044524A4 (en) * | 2006-07-03 | 2010-10-27 | Intel Corp | METHOD AND DEVICE FOR QUICK AUDIO SEARCH |
JP5189413B2 (ja) * | 2008-06-09 | 2013-04-24 | 株式会社日立製作所 | 音声データ検索システム |
JP5326169B2 (ja) * | 2009-05-13 | 2013-10-30 | 株式会社日立製作所 | 音声データ検索システム及び音声データ検索方法 |
CN102081634B (zh) * | 2009-11-27 | 2015-07-08 | 株式会社理光 | 语音检索装置和语音检索方法 |
JP5210440B2 (ja) * | 2012-01-04 | 2013-06-12 | インテル・コーポレーション | 高速音声検索のための方法、プログラムおよび装置 |
KR101537370B1 (ko) * | 2013-11-06 | 2015-07-16 | 주식회사 시스트란인터내셔널 | 녹취된 음성 데이터에 대한 핵심어 추출 기반 발화 내용 파악 시스템과, 이 시스템을 이용한 인덱싱 방법 및 발화 내용 파악 방법 |
CN105632499B (zh) | 2014-10-31 | 2019-12-10 | 株式会社东芝 | 用于优化语音识别结果的方法和装置 |
KR102651200B1 (ko) * | 2022-01-07 | 2024-03-26 | 주식회사 킨트 | 음성인식 매칭시스템 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08115330A (ja) * | 1994-10-14 | 1996-05-07 | Hitachi Ltd | 類似文書検索方法および装置 |
JP2000020551A (ja) * | 1998-06-30 | 2000-01-21 | Brother Ind Ltd | 音声データ検索装置および記憶媒体 |
JP2000029494A (ja) * | 1998-07-10 | 2000-01-28 | Nec Corp | 音声認識装置及び方法 |
JP2000259645A (ja) * | 1999-03-05 | 2000-09-22 | Fuji Xerox Co Ltd | 音声処理装置及び音声データ検索装置 |
JP2002149187A (ja) * | 2000-11-07 | 2002-05-24 | Sony Corp | 音声認識装置および音声認識方法、並びに記録媒体 |
JP2002189747A (ja) * | 2000-12-19 | 2002-07-05 | Hitachi Ltd | 文書情報の検索方法 |
JP2002278579A (ja) * | 2001-03-16 | 2002-09-27 | Ricoh Co Ltd | 音声データ検索装置 |
JP2003085197A (ja) * | 2000-10-13 | 2003-03-20 | Nippon Telegr & Teleph Corp <Ntt> | 音声入力された複合名詞の検索装置、検索方法およびデータベース |
-
2004
- 2004-07-14 JP JP2004207650A patent/JP4595415B2/ja not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08115330A (ja) * | 1994-10-14 | 1996-05-07 | Hitachi Ltd | 類似文書検索方法および装置 |
JP2000020551A (ja) * | 1998-06-30 | 2000-01-21 | Brother Ind Ltd | 音声データ検索装置および記憶媒体 |
JP2000029494A (ja) * | 1998-07-10 | 2000-01-28 | Nec Corp | 音声認識装置及び方法 |
JP2000259645A (ja) * | 1999-03-05 | 2000-09-22 | Fuji Xerox Co Ltd | 音声処理装置及び音声データ検索装置 |
JP2003085197A (ja) * | 2000-10-13 | 2003-03-20 | Nippon Telegr & Teleph Corp <Ntt> | 音声入力された複合名詞の検索装置、検索方法およびデータベース |
JP2002149187A (ja) * | 2000-11-07 | 2002-05-24 | Sony Corp | 音声認識装置および音声認識方法、並びに記録媒体 |
JP2002189747A (ja) * | 2000-12-19 | 2002-07-05 | Hitachi Ltd | 文書情報の検索方法 |
JP2002278579A (ja) * | 2001-03-16 | 2002-09-27 | Ricoh Co Ltd | 音声データ検索装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2006031278A (ja) | 2006-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108305634B (zh) | 解码方法、解码器及存储介质 | |
CN109410914B (zh) | 一种赣方言语音和方言点识别方法 | |
JP6188831B2 (ja) | 音声検索装置および音声検索方法 | |
JP5040909B2 (ja) | 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム | |
US7299178B2 (en) | Continuous speech recognition method and system using inter-word phonetic information | |
US5878390A (en) | Speech recognition apparatus equipped with means for removing erroneous candidate of speech recognition | |
JPH08278794A (ja) | 音声認識装置および音声認識方法並びに音声翻訳装置 | |
JP2000075895A (ja) | 連続音声認識用n最良検索方法 | |
US11450320B2 (en) | Dialogue system, dialogue processing method and electronic apparatus | |
KR101424193B1 (ko) | 타 언어권 화자음성에 대한 음성인식 시스템의 성능 향상을위한 비직접적 데이터 기반 발음변이 모델링 시스템 및방법 | |
JP4595415B2 (ja) | 音声検索システムおよび方法ならびにプログラム | |
JP2010078877A (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
KR101483947B1 (ko) | 핵심어에서의 음소 오류 결과를 고려한 음향 모델 변별 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체 | |
KR101424496B1 (ko) | 음향 모델 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체 | |
JP4269625B2 (ja) | 音声認識辞書作成方法及びその装置と音声認識装置 | |
JP3364631B2 (ja) | 統計的言語モデル生成装置及び音声認識装置 | |
JP6001944B2 (ja) | 音声コマンド制御装置、音声コマンド制御方法及び音声コマンド制御プログラム | |
JP4528540B2 (ja) | 音声認識方法及び装置及び音声認識プログラム及び音声認識プログラムを格納した記憶媒体 | |
JP4987530B2 (ja) | 音声認識辞書作成装置および音声認識装置 | |
JP4733436B2 (ja) | 単語・意味表現組データベースの作成方法、音声理解方法、単語・意味表現組データベース作成装置、音声理解装置、プログラムおよび記憶媒体 | |
JP2965529B2 (ja) | 音声認識装置 | |
JPH09134192A (ja) | 統計的言語モデル生成装置及び音声認識装置 | |
JP2001312293A (ja) | 音声認識方法およびその装置、並びにコンピュータ読み取り可能な記憶媒体 | |
JP2938865B1 (ja) | 音声認識装置 | |
KR20210052564A (ko) | 빅 데이터를 이용한 최적의 언어 모델 생성 방법 및 이를 위한 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070611 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100223 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100426 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100824 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100906 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4595415 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131001 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |