JP2022080074A - 情報処理システム、情報処理方法及びプログラム - Google Patents
情報処理システム、情報処理方法及びプログラム Download PDFInfo
- Publication number
- JP2022080074A JP2022080074A JP2020191039A JP2020191039A JP2022080074A JP 2022080074 A JP2022080074 A JP 2022080074A JP 2020191039 A JP2020191039 A JP 2020191039A JP 2020191039 A JP2020191039 A JP 2020191039A JP 2022080074 A JP2022080074 A JP 2022080074A
- Authority
- JP
- Japan
- Prior art keywords
- time
- analysis section
- section
- boundary
- utterance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 72
- 238000003672 processing method Methods 0.000 title claims description 18
- 238000004458 analytical method Methods 0.000 claims abstract description 502
- 238000004891 communication Methods 0.000 claims abstract description 111
- 238000000034 method Methods 0.000 description 40
- 230000007704 transition Effects 0.000 description 36
- 230000008569 process Effects 0.000 description 23
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01H—MEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
- G01H17/00—Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves, not provided for in the preceding groups
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
- H04M3/568—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
- H04M3/568—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
- H04M3/569—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants using the instant speaker's algorithm
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
このような構成により、実際分析区間の長さが基準分析区間の長さにより近くなる。したがって、複数の実際分析区間の長さのバラツキを抑制することが可能となる。
このような構成により、複数の実際分析区間の境界の時点を一度に設定することができるので、処理を簡略化することが可能となる。
このような構成により、実際分析区間の長さと基準分析区間の長さとのズレを抑制することが可能となる。
このような構成により、複数の実際分析区間の境界を順次設定することを、より確実に実行することが可能となる。
以下、図面を参照して本発明の実施の形態について説明する。なお、各図面において、同一の要素には同一の符号が付されており、必要に応じて重複説明は省略されている。
次に、実施の形態2について説明する。実施の形態2においては、実際分析区間の境界を設定する方法が、実施の形態1と異なる。なお、実施の形態2にかかる情報処理システム1のハードウェア構成については、図1に示した実施の形態1にかかる情報処理システム1のハードウェア構成と実質的に同様であるので、説明を省略する。また、実施の形態2にかかる情報処理装置100の構成については、図2に示したものと実質的に同様であるので、説明を省略する。
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、上述したフローチャートにおいて、複数の処理の順序は、適宜、変更可能である。また、上述したフローチャートにおいて、複数の処理のうちの1つは、省略されてもよい。例えば、図3のS120及びS122の処理は、省略されてもよい。図8についても同様である。
10 集音装置
60 基準分析区間
70,72 実際分析区間
100 情報処理装置
112 発話取得部
114 発話判定部
120 分析区間決定部
122 基準分析区間設定部
124 実際分析区間設定部
132 分析部
134 分析結果出力部
Claims (7)
- 複数の参加者が参加するコミュニケーションにおける前記複数の参加者それぞれの発話の時系列上の区間である発話区間を判定する発話判定部と、
予め定められた時間長さの基準分析区間を用いて、実際に前記コミュニケーションの分析を行うための時間区間である複数の実際分析区間の境界の時点が前記複数の参加者のどの前記発話区間にも属さない時間である無発話時間に対応する時間となるように、複数の前記実際分析区間の境界を設定する分析区間決定部と、
を有する情報処理システム。 - 前記分析区間決定部は、前記コミュニケーションについて、前記基準分析区間の境界を設定し、前記設定された前記基準分析区間の境界が前記複数の参加者の前記発話区間の少なくとも1つに含まれる場合に、当該基準分析区間の境界に最も近い前記無発話時間に対応する時点を、前記実際分析区間の境界の時点と設定する、
請求項1に記載の情報処理システム。 - 前記分析区間決定部は、予め、前記コミュニケーションの開始時点から終了時点まで、前記基準分析区間に対応する間隔で複数の前記基準分析区間の境界を設定し、設定された複数の前記基準分析区間の境界それぞれを用いて、複数の前記実際分析区間の境界の時点が前記無発話時間に対応する時間となるように、複数の前記実際分析区間の境界を設定する、
請求項1又は2に記載の情報処理システム。 - 前記分析区間決定部は、
前記基準分析区間の境界を設定し、設定された前記基準分析区間の境界を用いて前記実際分析区間の境界の時点が前記無発話時間に対応する時間となるように前記実際分析区間の境界を設定することを、前記コミュニケーションの開始時点から、順次行う、
請求項1又は2に記載の情報処理システム。 - 前記分析区間決定部は、
前記コミュニケーションの開始時点から前記基準分析区間に対応する時間だけ後に前記基準分析区間の境界を設定する第1の工程を実行し、
設定された前記基準分析区間の境界を用いて、前記実際分析区間の境界の時点が前記無発話時間に対応する時間となるように、前記実際分析区間の境界を設定する第2の工程を実行し、
設定された前記実際分析区間の境界の時点から、前記基準分析区間に対応する時間だけ後に前記基準分析区間の境界を設定する第3の工程を実行し、
前記第2の工程と前記第3の工程とを繰り返すことで、複数の前記実際分析区間の境界の時点をそれぞれ設定する、
請求項4に記載の情報処理システム。 - 複数の参加者が参加するコミュニケーションにおける前記複数の参加者それぞれの発話の時系列上の区間である発話区間を判定し、
予め定められた時間長さの基準分析区間を用いて、実際に前記コミュニケーションの分析を行うための時間区間である複数の実際分析区間の境界の時点が前記複数の参加者のどの前記発話区間にも属さない時間である無発話時間に対応する時間となるように、複数の前記実際分析区間の境界を設定する、
情報処理方法。 - 複数の参加者が参加するコミュニケーションにおける前記複数の参加者それぞれの発話の時系列上の区間である発話区間を判定するステップと、
予め定められた時間長さの基準分析区間を用いて、実際に前記コミュニケーションの分析を行うための時間区間である複数の実際分析区間の境界の時点が前記複数の参加者のどの前記発話区間にも属さない時間である無発話時間に対応する時間となるように、複数の前記実際分析区間の境界を設定するステップと、
をコンピュータに実行させるプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020191039A JP7509008B2 (ja) | 2020-11-17 | 情報処理システム、情報処理方法及びプログラム | |
US17/526,389 US20220157296A1 (en) | 2020-11-17 | 2021-11-15 | Information processing system, information processing method, and program |
CN202111351387.1A CN114509157B (zh) | 2020-11-17 | 2021-11-16 | 信息处理***、信息处理方法以及程序 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020191039A JP7509008B2 (ja) | 2020-11-17 | 情報処理システム、情報処理方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022080074A true JP2022080074A (ja) | 2022-05-27 |
JP7509008B2 JP7509008B2 (ja) | 2024-07-02 |
Family
ID=
Also Published As
Publication number | Publication date |
---|---|
CN114509157A (zh) | 2022-05-17 |
CN114509157B (zh) | 2024-04-05 |
US20220157296A1 (en) | 2022-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6171617B2 (ja) | 応答対象音声判定装置、応答対象音声判定方法および応答対象音声判定プログラム | |
US10388279B2 (en) | Voice interaction apparatus and voice interaction method | |
CN108922538A (zh) | 会议信息记录方法、装置、计算机设备及存储介质 | |
US20120296642A1 (en) | Method and appratus for temporal speech scoring | |
US20180122377A1 (en) | Voice interaction apparatus and voice interaction method | |
CN108039181B (zh) | 一种声音信号的情感信息分析方法和装置 | |
JP4587854B2 (ja) | 感情解析装置、感情解析プログラム、プログラム格納媒体 | |
JP2020034835A (ja) | 音声対話システム、音声対話方法、プログラム、学習モデル生成装置及び学習モデル生成方法 | |
JP6969491B2 (ja) | 音声対話システム、音声対話方法及びプログラム | |
JP6576968B2 (ja) | 話し終わり判定装置、話し終わり判定方法およびプログラム | |
JPWO2018147193A1 (ja) | モデル学習装置、推定装置、それらの方法、およびプログラム | |
JP2000172295A (ja) | 低複雑性スピ―チ認識器の区分ベ―スの類似性方法 | |
JP6270661B2 (ja) | 音声対話方法、及び音声対話システム | |
JP2022080074A (ja) | 情報処理システム、情報処理方法及びプログラム | |
JP7509008B2 (ja) | 情報処理システム、情報処理方法及びプログラム | |
JP6801587B2 (ja) | 音声対話装置 | |
JP5339426B2 (ja) | ケプストラムノイズ減算を用いた音声認識システム及び方法 | |
KR20040038419A (ko) | 음성을 이용한 감정인식 시스템 및 감정인식 방법 | |
JP6736225B2 (ja) | 対話装置、対話装置の制御方法およびプログラム | |
JP2003044078A (ja) | 発声速度正規化分析を用いた音声認識装置 | |
CN111354351B (zh) | 控制装置、语音交互装置、语音识别服务器以及存储介质 | |
Lykartsis et al. | Prediction of dialogue success with spectral and rhythm acoustic features using dnns and svms | |
EP3291228B1 (en) | Audio processing method, audio processing device, and audio processing program | |
JP7323936B2 (ja) | 疲労推定装置 | |
Rajeswari et al. | Improved emotional speech recognition algorithms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221018 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231005 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240402 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240426 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240521 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240603 |