JP2020129080A - 音声認識システム - Google Patents
音声認識システム Download PDFInfo
- Publication number
- JP2020129080A JP2020129080A JP2019021924A JP2019021924A JP2020129080A JP 2020129080 A JP2020129080 A JP 2020129080A JP 2019021924 A JP2019021924 A JP 2019021924A JP 2019021924 A JP2019021924 A JP 2019021924A JP 2020129080 A JP2020129080 A JP 2020129080A
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- file
- voice
- digital audio
- recognition system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 claims abstract description 47
- 238000013139 quantization Methods 0.000 claims abstract description 6
- 238000012544 monitoring process Methods 0.000 abstract 1
- 238000000034 method Methods 0.000 description 38
- 238000005070 sampling Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 208000032041 Hearing impaired Diseases 0.000 description 1
- 101000911772 Homo sapiens Hsc70-interacting protein Proteins 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
Description
ビットレート=サンプリング周波数×量子化ビット数×チャネル数 (1)
2 集音部
3 処理部
4 モニタ部
5 文字変換サーバ
6 話者特定サーバ
IN インターネット
Claims (8)
- 話者が発声した音声を含むアナログ音データに基づいて、デジタル音声データから成るデジタル音声ファイルを生成する処理部と、該処理部の処理結果を表示するモニタ部とから構成され、
インターネットを介して接続され、自己学習機能を備える文字変換サーバに対して、前記デジタル音声ファイルを送信し、前記文字変換サーバから前記デジタル音声ファイルをテキスト化した文章ファイルを受信し、該文章ファイルを前記モニタ部に表示する音声認識システムであって、
前記処理部は、前記アナログ音データに対して、所定のビットレートでデジタル化すると共に、雑音を除去する第1の閾値と、騒音を除去する第2の閾値に基づいて、ノイズを除去して前記デジタル音声データを生成することを特徴とする音声認識システム。 - 前記第1の閾値は、前記話者が発声していない状態において、前記所定のビットレートに則してデジタル化した量子化値に基づいて設定されることを特徴とする請求項1に記載の音声認識システム。
- 前記第2の閾値は、前記話者が発声した際に、前記所定のビットレートに則してデジタル化した量子化値に基づいて設定されることを特徴とする請求項1又は請求項2に記載の音声認識システム。
- 前記所定のビットレートは、人間の発声の周波数帯域を中心に変換する値であることを特徴とする請求項1〜3の何れか1項に記載の音声認識システム。
- 前記話者の発言と発言との間の無音状態が所定時間以上の場合に、前記デジタル音声データを区切り、区切れた直前の前記デジタル音声データに基づいて前記デジタル音声ファイルを生成することを特徴とする請求項1〜4の何れか1項に記載の音声認識システム。
- 前記話者の発言と発言との間の無音状態が所定時間以上の場合に、前記発言の始点より手前の時点から前記デジタル音声データを区切り、区切れた直前の前記デジタル音声データに基づいて、前記デジタル音声ファイルを生成することを特徴とする請求項5に記載の音声認識システム。
- インターネットを介して接続され、自己学習機能を備えた話者特定サーバに対して、前記デジタル音声ファイル及び話者のユーザID情報を送信し、前記デジタル音声ファイルに対する前記話者の特定結果を受信し、前記文章ファイルと前記話者の特定結果とを併せて前記モニタ部に表示することを特徴とする請求項1〜6の何れか1項に記載の音声認識システム。
- 前記モニタ部は前記デジタル音声ファイルに対応する前記文章ファイルと前記特定結果の前記話者とを対応付けて時系列順に表示することを特徴とする請求項7に記載の音声認識システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019021924A JP7296214B2 (ja) | 2019-02-08 | 2019-02-08 | 音声認識システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019021924A JP7296214B2 (ja) | 2019-02-08 | 2019-02-08 | 音声認識システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020129080A true JP2020129080A (ja) | 2020-08-27 |
JP7296214B2 JP7296214B2 (ja) | 2023-06-22 |
Family
ID=72174544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019021924A Active JP7296214B2 (ja) | 2019-02-08 | 2019-02-08 | 音声認識システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7296214B2 (ja) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59124399A (ja) * | 1982-12-30 | 1984-07-18 | 富士通株式会社 | 音声認識装置 |
JPH0720892A (ja) * | 1993-06-30 | 1995-01-24 | Fujitsu Ltd | 音声認識装置におけるノイズキャンセリング装置 |
JP2000029486A (ja) * | 1998-07-09 | 2000-01-28 | Hitachi Ltd | 音声認識システムおよび方法 |
JP2000352995A (ja) * | 1999-06-14 | 2000-12-19 | Canon Inc | 会議音声処理方法および記録装置、情報記憶媒体 |
JP2012073361A (ja) * | 2010-09-28 | 2012-04-12 | Fujitsu Ltd | 音声認識装置及び音声認識方法 |
JP2013182150A (ja) * | 2012-03-02 | 2013-09-12 | National Institute Of Information & Communication Technology | 発話区間検出装置及び発話区間検出のためのコンピュータプログラム |
JP2013200423A (ja) * | 2012-03-23 | 2013-10-03 | Toshiba Corp | 音声対話支援装置、方法、およびプログラム |
-
2019
- 2019-02-08 JP JP2019021924A patent/JP7296214B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59124399A (ja) * | 1982-12-30 | 1984-07-18 | 富士通株式会社 | 音声認識装置 |
JPH0720892A (ja) * | 1993-06-30 | 1995-01-24 | Fujitsu Ltd | 音声認識装置におけるノイズキャンセリング装置 |
JP2000029486A (ja) * | 1998-07-09 | 2000-01-28 | Hitachi Ltd | 音声認識システムおよび方法 |
JP2000352995A (ja) * | 1999-06-14 | 2000-12-19 | Canon Inc | 会議音声処理方法および記録装置、情報記憶媒体 |
JP2012073361A (ja) * | 2010-09-28 | 2012-04-12 | Fujitsu Ltd | 音声認識装置及び音声認識方法 |
JP2013182150A (ja) * | 2012-03-02 | 2013-09-12 | National Institute Of Information & Communication Technology | 発話区間検出装置及び発話区間検出のためのコンピュータプログラム |
JP2013200423A (ja) * | 2012-03-23 | 2013-10-03 | Toshiba Corp | 音声対話支援装置、方法、およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP7296214B2 (ja) | 2023-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108922538B (zh) | 会议信息记录方法、装置、计算机设备及存储介质 | |
CN110300001B (zh) | 会议音频控制方法、***、设备及计算机可读存储介质 | |
CN110049270B (zh) | 多人会议语音转写方法、装置、***、设备及存储介质 | |
Ortega-Garcia et al. | AHUMADA: A large speech corpus in Spanish for speaker characterization and identification | |
US20200012724A1 (en) | Bidirectional speech translation system, bidirectional speech translation method and program | |
US20160314781A1 (en) | Computer-implemented method, computer system and computer program product for automatic transformation of myoelectric signals into audible speech | |
JP2023539888A (ja) | 声変換および音声認識モデルを使用した合成データ拡大 | |
Gallardo | Human and automatic speaker recognition over telecommunication channels | |
US20220084543A1 (en) | Cognitive Assistant for Real-Time Emotion Detection from Human Speech | |
JP4587854B2 (ja) | 感情解析装置、感情解析プログラム、プログラム格納媒体 | |
JP2023548157A (ja) | 通話およびオーディオメッセージからのその他の話者の音声フィルタリング | |
JP6268916B2 (ja) | 異常会話検出装置、異常会話検出方法及び異常会話検出用コンピュータプログラム | |
JP2012048119A (ja) | 音声区間検出方法、音声認識方法、音声区間検出装置、音声認識装置、そのプログラム及び記録媒体 | |
WO2021127975A1 (zh) | 一种声音采集对象声纹检测方法、装置和设备 | |
EP2541544A1 (en) | Voice sample tagging | |
Cenceschi et al. | Speaker’s identification across recording modalities: a preliminary phonetic experiment | |
JP7296214B2 (ja) | 音声認識システム | |
Amarasingha et al. | Speaker independent sinhala speech recognition for voice dialling | |
KR102319101B1 (ko) | 쉰목소리 잡음 제거시스템 | |
JP7110057B2 (ja) | 音声認識システム | |
CN111179943A (zh) | 一种对话辅助设备及获取信息的方法 | |
Valenta et al. | Inter-annotator agreement on spontaneous Czech language: Limits of automatic speech recognition accuracy | |
JP2015122682A (ja) | 遠隔会議プログラム、端末装置および遠隔会議方法 | |
Sedigh | Application of polyscale methods for speaker verification | |
Dutta et al. | A comparison of three spectral features for phone recognition in sub-optimal environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190227 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220207 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230217 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230516 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230612 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7296214 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |