JP2004053979A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2004053979A5 JP2004053979A5 JP2002212058A JP2002212058A JP2004053979A5 JP 2004053979 A5 JP2004053979 A5 JP 2004053979A5 JP 2002212058 A JP2002212058 A JP 2002212058A JP 2002212058 A JP2002212058 A JP 2002212058A JP 2004053979 A5 JP2004053979 A5 JP 2004053979A5
- Authority
- JP
- Japan
- Prior art keywords
- text
- speech recognition
- pronunciation
- recognition dictionary
- language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Claims (9)
コンピュータシステムにおいて、前記音声認識辞書によって認識対象とするテキストを、当該テキストに含まれる所定の記号文字をスペース文字に置き換えたテキストに変換する変換ステップと、
コンピュータシステムにおいて、前記変換ステップで変換されたテキストの発音を表す発音データを生成する発音データ生成ステップと、
コンピュータシステムにおいて、前記発音データ生成ステップで生成された発音データを、前記認識対象とするテキストを認識するための発音データとして前記音声認識辞書に格納するステップとを有することを特徴とする音声認識辞書作成方法。A speech recognition dictionary creation method for creating a speech recognition dictionary used for recognizing speech uttered by a human using a computer system,
In the computer system, a conversion step of converting a text to be recognized by the speech recognition dictionary into a text in which a predetermined symbol character included in the text is replaced with a space character;
In a computer system, a pronunciation data generation step for generating pronunciation data representing the pronunciation of the text converted in the conversion step;
In the computer system, the speech recognition dictionary comprising the step of storing the pronunciation data generated in the pronunciation data generation step in the speech recognition dictionary as pronunciation data for recognizing the text to be recognized How to make.
コンピュータシステムを用いて、人間が発声した音声を認識するために用いられる音声認識辞書を作成する音声認識辞書作成方法であって、
コンピュータシステムにおいて、前記音声認識辞書によって認識対象とするテキストを、当該テキストに含まれる記号文字"#"の文字列"number"への置き換えと、当該テキストに含まれる記号文字"&"の文字列"and"への置き換えと、当該テキストに含まれる記号文字"@"の文字列"at"への置き換えとのうちの少なくとも一つの置き換えを行ったテキストに変換する変換ステップと、
コンピュータシステムにおいて、前記変換ステップで変換されたテキストの発音を表す発音データを生成する発音データ生成ステップと、
コンピュータシステムにおいて、前記発音データ生成ステップで生成された発音データを、前記認識対象とするテキストを認識するための発音データとして前記音声認識辞書に格納するステップとを有することを特徴とする音声認識辞書作成方法。The speech recognition dictionary creation method according to claim 1,
A speech recognition dictionary creation method for creating a speech recognition dictionary used for recognizing speech uttered by a human using a computer system,
In the computer system, the text to be recognized by the speech recognition dictionary is replaced with the character string “number” of the symbol character “#” included in the text, and the character string of the symbol character “&” included in the text a conversion step for converting the text into at least one of the replacement of "and" and the replacement of the symbol character "@" included in the text with the character string "at";
In a computer system, a pronunciation data generation step for generating pronunciation data representing the pronunciation of the text converted in the conversion step;
In the computer system, the speech recognition dictionary comprising the step of storing the pronunciation data generated in the pronunciation data generation step in the speech recognition dictionary as pronunciation data for recognizing the text to be recognized How to make.
コンピュータシステムにおいて、前記音声認識辞書によって認識対象とするテキストを、当該テキストに含まれる第1の言語に含まれ第2の言語に含まれない文字を、当該第1の言語の文字の発音に相当または近似する発音を有する前記第2の言語の文字に置き換えたテキストに変換する変換ステップと、
コンピュータシステムにおいて、前記変換ステップで変換されたテキストの前記第2の言語の発音ルールに従った発音を表す発音データを生成する発音データ生成ステップと、
コンピュータシステムにおいて、前記発音データ生成ステップで生成された発音データを、前記認識対象とするテキストを認識するための発音データとして前記音声認識辞書に格納するステップとを有することを特徴とする音声認識辞書作成方法。A speech recognition dictionary creation method for creating a speech recognition dictionary used for recognizing speech uttered by a human using a computer system,
In the computer system, the text to be recognized by the speech recognition dictionary is a character included in the first language included in the text but not included in the second language, and corresponds to the pronunciation of the character in the first language. Or a conversion step of converting to text replaced with characters of the second language having approximate pronunciation;
In the computer system, a pronunciation data generation step for generating pronunciation data representing pronunciation according to the pronunciation rules of the second language of the text converted in the conversion step;
In the computer system, the speech recognition dictionary comprising the step of storing the pronunciation data generated in the pronunciation data generation step in the speech recognition dictionary as pronunciation data for recognizing the text to be recognized How to make.
コンピュータシステムにおいて、前記音声認識辞書によって認識対象とするテキストが、第1の言語によって対象を略記したテキストであった場合に、当該テキストが表す対象を略記せずに第1の言語によって表したテキストに含まれる第1の言語に含まれ第2の言語に含まれない文字を、当該第1の言語による文字の発音に相当または近似する発音を有する第2の言語の文字に置き換えたテキストに、前記認識対象とするテキストを変換する変換ステップと、
コンピュータシステムにおいて、前記変換ステップで変換されたテキストの前記第2の言語の発音ルールに従った発音を表す発音データを生成する発音データ生成ステップと、
コンピュータシステムにおいて、前記発音データ生成ステップで生成された発音データを、前記認識対象とするテキストを認識するための発音データとして前記音声認識辞書に格納するステップとを有することを特徴とする音声認識辞書作成方法。A speech recognition dictionary creation method for creating a speech recognition dictionary used for recognizing speech uttered by a human using a computer system,
In the computer system, when the text to be recognized by the speech recognition dictionary is a text in which the object is abbreviated in the first language, the text expressed in the first language without abbreviating the object to be represented by the text A character that is included in the first language and is not included in the second language is replaced with a character in the second language having a pronunciation equivalent to or similar to the pronunciation of the character in the first language, A conversion step of converting the text to be recognized;
In the computer system, a pronunciation data generation step for generating pronunciation data representing pronunciation according to the pronunciation rules of the second language of the text converted in the conversion step;
In the computer system, the speech recognition dictionary comprising the step of storing the pronunciation data generated in the pronunciation data generation step in the speech recognition dictionary as pronunciation data for recognizing the text to be recognized How to make.
テキストの変換ルールを格納した変換ルールテーブルと、
前記音声認識辞書によって認識対象とするテキストを、前記変換ルールテーブルの変換ルールに従って変換する変換手段と、
前記変換手段で変換されたテキストの発音を表す発音データを生成する発音データ生成手段と、
前記発音データ生成ステップで生成された発音データを、前記認識対象とするテキストを認識するための発音データとして前記音声認識辞書に格納する格納手段とを有し、
前記変換ルールテーブルに格納された変換ルールは、テキストを、当該テキストに含まれる所定の記号文字をスペース文字に置き換えたテキストに変換するものであることを特徴とする音声認識辞書作成システム。A speech recognition dictionary creation system that creates a speech recognition dictionary used to recognize speech uttered by a human,
A conversion rule table storing text conversion rules;
Conversion means for converting the text to be recognized by the speech recognition dictionary according to the conversion rule of the conversion rule table;
Pronunciation data generation means for generating pronunciation data representing the pronunciation of the text converted by the conversion means;
Storage means for storing the pronunciation data generated in the pronunciation data generation step in the speech recognition dictionary as pronunciation data for recognizing the text to be recognized;
The speech recognition dictionary creation system, wherein the conversion rule stored in the conversion rule table converts text into text obtained by replacing a predetermined symbol character included in the text with a space character.
テキストと当該テキストに対応する発音データとの対応が登録された音声認識辞書を記憶した記憶手段と、
マイクと、
前記マイクから入力した音声に整合する発音データに対応して前記音声認識辞書に登録されているテキストをユーザが音声入力した内容を表すテキストとして認識する音声認識手段とを有し、
前記音声認識辞書において、所定の記号文字を含むテキストについては、当該テキストに対応する発音データとして、当該テキストに含まれる所定の記号文字をスペース文字に置き換えたテキストを音声データ化して得られた発音データが登録されていることを特徴とするナビゲーション装置。A navigation device that accepts voice input from a user,
Storage means for storing a speech recognition dictionary in which correspondence between text and pronunciation data corresponding to the text is registered;
With a microphone,
Speech recognition means for recognizing text registered in the speech recognition dictionary corresponding to pronunciation data matched with speech input from the microphone as text representing the content input by the user;
In the speech recognition dictionary, for a text including a predetermined symbol character, as a pronunciation data corresponding to the text, a pronunciation obtained by converting the text obtained by replacing the predetermined symbol character included in the text with a space character into speech data A navigation apparatus characterized in that data is registered.
テキストと当該テキストに対応する発音データとの対応が登録された音声認識辞書を記憶した記憶手段と、
マイクと、
前記マイクから入力した音声に整合する発音データに対応して前記音声認識辞書に登録されているテキストをユーザが音声入力した内容を表すテキストとして認識する音声認識手段とを有し、
前記音声認識辞書において、記号文字"#"を含むテキストについては、当該テキストに対応する発音データとして、当該テキストに含まれる記号文字"#"を文字列"number"に置き換えたテキストを音声データ化して得られた発音データが登録されており、記号文字"&"を含むテキストについては、当該テキストに対応する発音データとして、当該テキストに含まれる記号文字"&"を文字列"and"に置き換えたテキストを音声データ化して得られた発音データが登録されており、記号文字"@"を含むテキストについては、当該テキストに対応する発音データとして、当該テキストに含まれる記号文字"@"を文字列"at"に置き換えたテキストを音声データ化して得られた発音データが登録されていることを特徴とするナビゲーション装置。A navigation device that accepts voice input from a user,
Storage means for storing a speech recognition dictionary in which correspondence between text and pronunciation data corresponding to the text is registered;
With a microphone,
Speech recognition means for recognizing text registered in the speech recognition dictionary corresponding to pronunciation data matched with speech input from the microphone as text representing the content input by the user;
In the speech recognition dictionary, for text that includes the symbol character “#”, as pronunciation data corresponding to the text, the text in which the symbol character “#” included in the text is replaced with the character string “number” is converted into speech data. The phonetic data obtained in this way is registered, and for text that includes the symbol character "&", the symbol character "&" contained in the text is replaced with the string "and" as the pronunciation data corresponding to the text. The pronunciation data obtained by converting the text to speech data is registered. For text containing the symbol character "@", the symbol character "@" contained in the text is used as the pronunciation data corresponding to the text. A navigation device, wherein pronunciation data obtained by converting the text replaced with the column "at" into speech data is registered.
テキストと当該テキストに対応する発音データとの対応が登録された音声認識辞書を記憶した記憶手段と、
マイクと、
前記マイクから入力した音声に整合する発音データに対応して前記音声認識辞書に登録されているテキストをユーザが音声入力した内容を表すテキストとして認識する音声認識手段とを有し、
前記音声認識辞書において、第1の言語に含まれ第2の言語に含まれない文字を含むテキストについては、当該テキストに対応する発音データとして、当該テキストに含まれる第1の言語に含まれ第2の言語に含まれない文字を、当該第1の言語の文字の発音に相当または近似する発音を有する前記第2の言語の文字に置き換えたテキストを音声データ化して得られた発音データが登録されていることを特徴とするナビゲーション装置。A navigation device that accepts voice input from a user,
Storage means for storing a speech recognition dictionary in which correspondence between text and pronunciation data corresponding to the text is registered;
With a microphone,
Speech recognition means for recognizing text registered in the speech recognition dictionary corresponding to pronunciation data matched with speech input from the microphone as text representing the content input by the user;
In the speech recognition dictionary, text that includes characters that are included in the first language and not included in the second language is included in the first language included in the text as pronunciation data corresponding to the text. Phonetic data obtained by converting text that is not included in the second language to text in the second language having a pronunciation equivalent to or similar to the pronunciation of the first language is registered as speech data The navigation apparatus characterized by being made.
テキストと当該テキストに対応する発音データとの対応が登録された音声認識辞書を記憶した記憶手段と、
マイクと、
前記マイクから入力した音声に整合する発音データに対応して前記音声認識辞書に登録されているテキストをユーザが音声入力した内容を表すテキストとして認識する音声認識手段とを有し、
前記音声認識辞書において、第1の言語によって対象を略記したテキストについては、当該テキストに対応する発音データとして、当該テキストが表す対象を略記せずに第1の言語によって表したテキストに含まれる第1の言語に含まれ第2の言語に含まれない文字を、当該第1の言語による文字の発音に相当または近似する発音を有する第2の言語の文字に置き換えたテキストを音声データ化して得られた発音データが登録されていることを特徴とするナビゲーション装置。A navigation device that accepts voice input from a user,
Storage means for storing a speech recognition dictionary in which correspondence between text and pronunciation data corresponding to the text is registered;
With a microphone,
Speech recognition means for recognizing text registered in the speech recognition dictionary corresponding to pronunciation data matched with speech input from the microphone as text representing the content input by the user;
In the speech recognition dictionary, for a text in which an object is abbreviated in a first language, the phonetic data corresponding to the text is included in the text expressed in the first language without abbreviating the object represented by the text. A text obtained by replacing a character included in one language and not included in the second language with a character in the second language having a pronunciation equivalent to or similar to the pronunciation of the character in the first language is obtained as voice data. Navigation device characterized in that recorded pronunciation data is registered.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002212058A JP2004053979A (en) | 2002-07-22 | 2002-07-22 | Method and system for generating speech recognition dictionary |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002212058A JP2004053979A (en) | 2002-07-22 | 2002-07-22 | Method and system for generating speech recognition dictionary |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004053979A JP2004053979A (en) | 2004-02-19 |
JP2004053979A5 true JP2004053979A5 (en) | 2005-09-22 |
Family
ID=31935095
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002212058A Pending JP2004053979A (en) | 2002-07-22 | 2002-07-22 | Method and system for generating speech recognition dictionary |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004053979A (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7590533B2 (en) * | 2004-03-10 | 2009-09-15 | Microsoft Corporation | New-word pronunciation learning using a pronunciation graph |
JP5465926B2 (en) | 2009-05-22 | 2014-04-09 | アルパイン株式会社 | Speech recognition dictionary creation device and speech recognition dictionary creation method |
JP2011033874A (en) * | 2009-08-03 | 2011-02-17 | Alpine Electronics Inc | Device for multilingual voice recognition, multilingual voice recognition dictionary creation method |
JP5318230B2 (en) * | 2010-02-05 | 2013-10-16 | 三菱電機株式会社 | Recognition dictionary creation device and speech recognition device |
-
2002
- 2002-07-22 JP JP2002212058A patent/JP2004053979A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6251958B2 (en) | Utterance analysis device, voice dialogue control device, method, and program | |
JP4536323B2 (en) | Speech-speech generation system and method | |
JP2001296880A (en) | Method and device to generate plural plausible pronunciation of intrinsic name | |
JP6806662B2 (en) | Speech synthesis system, statistical model generator, speech synthesizer, speech synthesis method | |
JP2011033874A (en) | Device for multilingual voice recognition, multilingual voice recognition dictionary creation method | |
CN104899192B (en) | For the apparatus and method interpreted automatically | |
US8170876B2 (en) | Speech processing apparatus and program | |
US7676364B2 (en) | System and method for speech-to-text conversion using constrained dictation in a speak-and-spell mode | |
JP3616250B2 (en) | Synthetic voice message creation method, apparatus and recording medium recording the method | |
JP2016521383A (en) | Method, apparatus and computer readable recording medium for improving a set of at least one semantic unit | |
JP5073024B2 (en) | Spoken dialogue device | |
JP2008243080A (en) | Device, method, and program for translating voice | |
US11817079B1 (en) | GAN-based speech synthesis model and training method | |
JP2004053979A5 (en) | ||
JP5088109B2 (en) | Morphological analyzer, morphological analyzer, computer program, speech synthesizer, and speech collator | |
JP2016161935A (en) | Method and device for improving set of at least one semantic unit by using voice, and computer readable recording medium | |
KR20050080671A (en) | Emoticon processing method for text to speech system | |
JP2012255867A (en) | Voice recognition device | |
JP2004021207A (en) | Phoneme recognizing method, phoneme recognition system and phoneme recognizing program | |
JP2007535692A (en) | System and method for computer recognition and interpretation of arbitrarily spoken characters | |
CN113506559B (en) | Method for generating pronunciation dictionary according to Vietnam written text | |
TW201411577A (en) | Voice processing method of point-to-read device | |
Win et al. | Review and perspectives of natural language processing for speech recognition | |
Safarik et al. | Methods for rapid development of automatic speech recognition system for Russian | |
Deshpande et al. | Integration of Speech, Image & Text Processing Technologies |