JP7026004B2 - 会話補助装置、会話補助方法及びプログラム - Google Patents
会話補助装置、会話補助方法及びプログラム Download PDFInfo
- Publication number
- JP7026004B2 JP7026004B2 JP2018112706A JP2018112706A JP7026004B2 JP 7026004 B2 JP7026004 B2 JP 7026004B2 JP 2018112706 A JP2018112706 A JP 2018112706A JP 2018112706 A JP2018112706 A JP 2018112706A JP 7026004 B2 JP7026004 B2 JP 7026004B2
- Authority
- JP
- Japan
- Prior art keywords
- speed
- speaker
- voice recognition
- processing
- utterance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 19
- 238000012545 processing Methods 0.000 claims description 51
- 238000004148 unit process Methods 0.000 claims 1
- 238000004891 communication Methods 0.000 description 24
- 239000002245 particle Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 239000000470 constituent Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
従って、共通語となる言語に対する習熟度が異なる人の間でも、無理なく円滑な会話によるコミュニケーションを実現することが可能となる。
これらの各機能部のうち、入出力制御部11、通話音声処理部12、通話音声ログ更新部13および音声認識部14は、いずれも例えば図示しないプログラムメモリに格納されたプログラムを、通話補助サーバSVが備えるプロセッサに実行させることにより実現される。
また、通話音声ログデータベース(DB)15、及び音声認識結果データベース(DB)16は、例えばHDD(Hard Disk Device)またはSSD(Solid State Device)等の随時書き込みおよび読み出しが可能な不揮発性のメモリに設けられる。
なお、通信端末TM,TM間でのテレビ電話機能による通話の開始時には、通話で使用する共通語となる言語でNSとなる側のユーザが操作する通信端末TMにおいて、例えばユーザによるマニュアル操作に応じて、後述する発話補助の字幕映像を重畳した表示を行なうものとする。
通話音声処理部12は、通話音声ログ更新部13により通話音声ログデータベース15に記憶している最新のNSの発話者の音声データを読み出させて音声認識部14に転送させ、その発話速度を計測させた上で(ステップS101)、音声認識処理を実行させる(ステップS102)。
Claims (7)
- 発話者の発話速度を取得する速度取得部と、
前記発話者の発話内容を音声認識する音声認識部と、
前記速度取得部により取得された発話速度と、基準となる発話速度との比較結果に基づいて、前記音声認識部により得られた認識結果の一部の品詞を加工する加工部と、
前記加工部により加工された音声認識結果を前記発話者に提示させる提示部と、を備える会話補助装置。 - 前記加工部は、前記速度取得部で取得した発話速度が、基準となる発話速度より速い場合に、それら速度の差の度合いに応じて、前記音声認識部で得た認識結果に対する加工の程度を複数段階に分けて加工する、請求項1記載の会話補助装置。
- 前記加工部は、前記認識結果に対する加工の程度を品詞に応じた複数段階に分けて加工する、請求項2記載の会話補助装置。
- 発話者の発話速度を取得する速度取得部と、
前記発話者の発話内容を音声認識する音声認識部と、
前記速度取得部により取得された発話速度と、基準となる発話速度との比較結果に基づいて、前記音声認識部により得られた認識結果の一部を加工する加工部と、
前記加工部により加工された音声認識結果を前記発話者に提示させる提示部と、を備え、
前記加工部は、前記速度取得部で取得した発話速度が、基準となる発話速度より速い場合に、それら速度の差の度合いに応じて、前記音声認識部で得た認識結果に対する加工の程度を品詞に応じた複数段階に分けて加工する、
会話補助装置。 - 発話者の発話速度を取得する速度取得工程と、
前記発話者の発話内容を音声認識する音声認識工程と、
前記速度取得工程により取得された発話速度と、基準となる発話速度との比較結果に基づいて、前記音声認識工程により得られた認識結果の一部の品詞を加工する加工工程と、
前記加工工程により加工された音声認識結果を前記発話者に提示させる提示工程と、を有する会話補助方法。 - 発話者の発話速度を取得する速度取得工程と、
前記発話者の発話内容を音声認識する音声認識工程と、
前記速度取得工程により取得された発話速度と、基準となる発話速度との比較結果に基づいて、前記音声認識工程により得られた認識結果の一部を加工する加工工程と、
前記加工工程により加工された音声認識結果を前記発話者に提示させる提示工程と、を有し、
前記加工工程は、前記速度取得工程によりで取得された発話速度が、基準となる発話速度より速い場合に、それら速度の差の度合いに応じて、前記音声認識工程によりで得られた認識結果に対する加工の程度を品詞に応じた複数段階に分けて加工する、
会話補助方法。 - 請求項1乃至4のいずれか1項に記載の会話補助装置が備える各部の処理を、前記会話補助装置のプロセッサに実行させるプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018112706A JP7026004B2 (ja) | 2018-06-13 | 2018-06-13 | 会話補助装置、会話補助方法及びプログラム |
US16/973,285 US11978443B2 (en) | 2018-06-13 | 2019-06-07 | Conversation assistance device, conversation assistance method, and program |
PCT/JP2019/022720 WO2019240035A1 (ja) | 2018-06-13 | 2019-06-07 | 会話補助装置、会話補助方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018112706A JP7026004B2 (ja) | 2018-06-13 | 2018-06-13 | 会話補助装置、会話補助方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019215449A JP2019215449A (ja) | 2019-12-19 |
JP7026004B2 true JP7026004B2 (ja) | 2022-02-25 |
Family
ID=68841857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018112706A Active JP7026004B2 (ja) | 2018-06-13 | 2018-06-13 | 会話補助装置、会話補助方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11978443B2 (ja) |
JP (1) | JP7026004B2 (ja) |
WO (1) | WO2019240035A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7316971B2 (ja) * | 2020-03-30 | 2023-07-28 | 本田技研工業株式会社 | 会議支援システム、会議支援方法、およびプログラム |
CN111654658B (zh) * | 2020-06-17 | 2022-04-15 | 平安科技(深圳)有限公司 | 音视频通话的处理方法、***、编解码器及存储装置 |
JP7498077B2 (ja) | 2020-09-25 | 2024-06-11 | エフサステクノロジーズ株式会社 | 表示制御装置、表示制御方法および表示制御プログラム |
KR102442528B1 (ko) * | 2020-11-17 | 2022-09-13 | 주식회사 한글과컴퓨터 | 음성 인식 처리를 위한 음성 발화의 끝점을 사용자 맞춤형으로 검출하는 음성 인식 처리 장치 및 그 동작 방법 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009171336A (ja) | 2008-01-17 | 2009-07-30 | Nec Corp | 携帯通信端末 |
JP2017097093A (ja) | 2015-11-20 | 2017-06-01 | 株式会社Jvcケンウッド | 端末装置、通信方法 |
WO2018016139A1 (ja) | 2016-07-19 | 2018-01-25 | ソニー株式会社 | 情報処理装置、および情報処理方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6785649B1 (en) * | 1999-12-29 | 2004-08-31 | International Business Machines Corporation | Text formatting from speech |
JP2010256391A (ja) | 2009-04-21 | 2010-11-11 | Takeshi Hanamura | 音声情報処理装置 |
US9344821B2 (en) * | 2014-03-21 | 2016-05-17 | International Business Machines Corporation | Dynamically providing to a person feedback pertaining to utterances spoken or sung by the person |
US9972342B2 (en) | 2015-11-20 | 2018-05-15 | JVC Kenwood Corporation | Terminal device and communication method for communication of speech signals |
EP3474276A4 (en) * | 2016-06-15 | 2019-07-31 | Sony Corporation | INFORMATION PROCESSING DEVICE AND INFORMATION PROCESSING METHOD |
JP6548045B2 (ja) * | 2017-03-31 | 2019-07-24 | 本田技研工業株式会社 | 会議システム、会議システム制御方法、およびプログラム |
-
2018
- 2018-06-13 JP JP2018112706A patent/JP7026004B2/ja active Active
-
2019
- 2019-06-07 US US16/973,285 patent/US11978443B2/en active Active
- 2019-06-07 WO PCT/JP2019/022720 patent/WO2019240035A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009171336A (ja) | 2008-01-17 | 2009-07-30 | Nec Corp | 携帯通信端末 |
JP2017097093A (ja) | 2015-11-20 | 2017-06-01 | 株式会社Jvcケンウッド | 端末装置、通信方法 |
WO2018016139A1 (ja) | 2016-07-19 | 2018-01-25 | ソニー株式会社 | 情報処理装置、および情報処理方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2019240035A1 (ja) | 2019-12-19 |
US11978443B2 (en) | 2024-05-07 |
US20210249007A1 (en) | 2021-08-12 |
JP2019215449A (ja) | 2019-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7026004B2 (ja) | 会話補助装置、会話補助方法及びプログラム | |
US10542141B2 (en) | Semiautomated relay method and apparatus | |
US9280539B2 (en) | System and method for translating speech, and non-transitory computer readable medium thereof | |
WO2015125549A1 (ja) | 情報処理装置 | |
JP2015060332A (ja) | 音声翻訳装置、音声翻訳方法およびプログラム | |
WO2016194740A1 (ja) | 音声認識装置、音声認識システム、当該音声認識システムで使用される端末、および、話者識別モデルを生成するための方法 | |
US20090144048A1 (en) | Method and device for instant translation | |
JP2014191030A (ja) | 音声認識端末およびコンピュータ端末を用いる音声認識方法 | |
US20190147851A1 (en) | Information processing apparatus, information processing system, information processing method, and storage medium which stores information processing program therein | |
US20220231873A1 (en) | System for facilitating comprehensive multilingual virtual or real-time meeting with real-time translation | |
JP2018174439A (ja) | 会議支援システム、会議支援方法、会議支援装置のプログラム、および端末のプログラム | |
JP2018170743A (ja) | 会議支援システム、会議支援方法、会議支援装置のプログラム、および端末のプログラム | |
WO2018079294A1 (ja) | 情報処理装置及び情報処理方法 | |
JP2020113150A (ja) | 音声翻訳対話システム | |
JP5727777B2 (ja) | 会議支援装置および会議支援方法 | |
US9881611B2 (en) | System and method for providing voice communication from textual and pre-recorded responses | |
JP6832503B2 (ja) | 情報提示方法、情報提示プログラム及び情報提示システム | |
JP5046589B2 (ja) | 電話システムと通話補助方法とプログラム | |
JP2005283972A (ja) | 音声認識方法及びこの音声認識方法を利用した情報提示方法と情報提示装置 | |
JP2019176375A (ja) | 動画出力装置、動画出力方法および動画出力プログラム | |
JP4760452B2 (ja) | 発話訓練装置、発話訓練システム、発話訓練支援方法およびプログラム | |
CN115171645A (zh) | 一种配音方法、装置、电子设备以及存储介质 | |
US20210233516A1 (en) | Agent system, agent server, and computer readable recording medium | |
JP6401488B2 (ja) | 外国語会話理解支援装置、外国語会話理解支援方法及びプログラム | |
CN111179943A (zh) | 一种对话辅助设备及获取信息的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20180628 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201002 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210907 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211105 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20220121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220208 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220214 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7026004 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |