JP7113047B2 - 人工知能基盤の自動応答方法およびシステム - Google Patents
人工知能基盤の自動応答方法およびシステム Download PDFInfo
- Publication number
- JP7113047B2 JP7113047B2 JP2020124156A JP2020124156A JP7113047B2 JP 7113047 B2 JP7113047 B2 JP 7113047B2 JP 2020124156 A JP2020124156 A JP 2020124156A JP 2020124156 A JP2020124156 A JP 2020124156A JP 7113047 B2 JP7113047 B2 JP 7113047B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- reply
- automatic response
- processor
- response method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000004044 response Effects 0.000 title claims description 129
- 238000000034 method Methods 0.000 title claims description 78
- 238000013473 artificial intelligence Methods 0.000 claims description 65
- 230000015654 memory Effects 0.000 claims description 27
- 230000014509 gene expression Effects 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 18
- 230000001755 vocal effect Effects 0.000 claims description 17
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 18
- 238000004891 communication Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 9
- 238000012384 transportation and delivery Methods 0.000 description 6
- 238000013519 translation Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 241000282412 Homo Species 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000009118 appropriate response Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 230000004308 accommodation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011112 process operation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000013403 standard screening design Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4936—Speech interaction details
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Evolutionary Computation (AREA)
- Machine Translation (AREA)
- Telephonic Communication Services (AREA)
Description
(外1)
が認識されれば韓国語モデルとして、「hello(もしもしに該当する英語)」が認識されれば英語モデルとして、「もしもし」が認識されれば日本語モデルとして、翻訳機460の言語モデルを分岐して自動応答サービスを提供してよい。言い換えれば、ダイアログマネージャ420は、外国人と電話が繋がった場合でも、最初の発話の言語を感知し、該当の言語モデルを利用してレストランへの問い合わせや予約、配達注文などのための自動応答サービスを提供することができる。
401:ゲートウェイ
410:音声認識器
420:ダイアログマネージャ
430:返答生成器
440:音声合成器
450:感知部
460:翻訳機
Claims (16)
- コンピュータシステムが実行する人工知能基盤の自動応答方法であって、
前記コンピュータシステムは、メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、
前記人工知能基盤の自動応答方法は、
前記少なくとも1つのプロセッサにより、ユーザと通話が繋がることにより前記ユーザの発話音声を受信する段階、
前記少なくとも1つのプロセッサにより、前記発話音声の中間結果を利用して意図を分析した後に返答を予め生成する段階、および
前記少なくとも1つのプロセッサにより、前記ユーザの発話終了後に前記発話音声に対して前記予め生成された返答を送出する段階
を含む、
人工知能基盤の自動応答方法。 - 前記生成する段階は、
自動応答サービスの会話ログからサンプル文章を抽出する段階、および
前記サンプル文章から語尾を除いた文章を学習データとして利用する会話学習により、前記中間結果から前記意図を分析する段階
を含む、
請求項1に記載の人工知能基盤の自動応答方法。 - 前記生成する段階は、
前記中間結果として取得した音節単位で前記意図を分析する段階を含む、
請求項1に記載の人工知能基盤の自動応答方法。 - 前記生成する段階は、
前記中間結果を利用した意図分析結果に対するコンフィデンスに基づいて前記返答の生成時点を決定する段階を含む、
請求項1に記載の人工知能基盤の自動応答方法。 - 前記生成する段階は、
前記中間結果を利用した意図分析結果に対するコンフィデンスが、閾値に達する時点を前記返答の生成時点として決定する段階、および
前記発話音声が終了する前に、前記決定された生成時点に前記返答を予め生成する段階を含み、
前記閾値は、語尾を除いた文章を利用した会話学習によって決定されるものであり、前記中間結果に対するコンフィデンスが最終結果と比べて誤差範囲内にある数値を見つけ出す過程を繰り返した後、繰り返しの過程によって得られた値の統計値として決定される、
請求項1に記載の人工知能基盤の自動応答方法。 - 前記送出する段階は、
前記発話音声からエンドポイントが感知されれば、前記返答を音声信号で送出することを特徴とする、
請求項1に記載の人工知能基盤の自動応答方法。 - コンピュータシステムが実行する人工知能基盤の自動応答方法であって、
前記コンピュータシステムは、メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、
前記人工知能基盤の自動応答方法は、
前記少なくとも1つのプロセッサにより、ユーザの通話が繋がることにより前記ユーザの発話音声を受信する段階、
前記少なくとも1つのプロセッサにより、前記発話音声の中間結果を利用して意図を分析した後に返答を予め生成する段階、
前記少なくとも1つのプロセッサにより、前記ユーザの発話終了後に前記発話音声に対して予め生成された返答を送出する段階、および
前記少なくとも1つのプロセッサにより、前記返答が送出される途中に前記ユーザの発話音声が受信されれば、前記返答の送出を中断する段階
を含む、
人工知能基盤の自動応答方法。 - 前記中断する段階は、
前記ユーザの発話音声が受信されれば、前記返答の送出を、即時にまたはフェードアウトを適用した後に中断することを特徴とする、
請求項7に記載の人工知能基盤の自動応答方法。 - 前記中断する段階は、
非言語的表現を分類して学習する段階、および
前記返答が送出される途中に受信された発話音声が前記学習された非言語的表現に該当する場合には前記返答の送出を維持し、前記学習された非言語的表現に該当しない場合には前記返答の送出を中断する段階を含む、
請求項7に記載の人工知能基盤の自動応答方法。 - 前記人工知能基盤の自動応答方法は、
前記少なくとも1つのプロセッサにより、前記発話音声の認識結果として返答に必要な情報が足りない場合、前記情報を誘導するための問い返しの質問を提供する段階をさらに含む、
請求項1または7に記載の人工知能基盤の自動応答方法。 - 前記人工知能基盤の自動応答方法は、
前記少なくとも1つのプロセッサにより、前記発話音声の認識結果によって複数の意図が認識された場合、意図認識順にしたがって各意図に対する返答を順に提供する段階をさらに含む、
請求項1または7に記載の人工知能基盤の自動応答方法。 - 前記人工知能基盤の自動応答方法は、
前記少なくとも1つのプロセッサにより、前記ユーザの発話速度を認識する段階、および
前記少なくとも1つのプロセッサにより、前記ユーザの発話速度によって前記返答の発話速度を決定する段階
をさらに含む、
請求項1または7に記載の人工知能基盤の自動応答方法。 - 前記人工知能基盤の自動応答方法は、
前記少なくとも1つのプロセッサにより、前記ユーザの発話言語を認識する段階、および
前記少なくとも1つのプロセッサにより、自動応答サービスのための言語モデルを前記ユーザの発話言語に対応する言語モデルに切り換える段階
をさらに含む、
請求項1または7に記載の人工知能基盤の自動応答方法。 - 請求項1~9のうちのいずれか一項に記載の人工知能基盤の自動応答方法をコンピュータに実行させるためのプログラムが記録されている、非一時なコンピュータ読み取り可能な記録媒体。
- コンピュータシステムであって、
メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、
前記少なくとも1つのプロセッサは、
ユーザと通話が繋がることにより前記ユーザの発話音声を受信する過程、
前記発話音声の中間結果を利用して意図を分析した後に返答を予め生成する過程、および
前記ユーザの発話終了後に前記発話音声に対して前記予め生成された返答を送出する過程
を処理する、
コンピュータシステム。 - コンピュータシステムであって、
メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、
前記少なくとも1つのプロセッサは、
ユーザと通話が繋がることにより前記ユーザの発話音声を受信する過程、
前記発話音声の中間結果を利用して意図を分析した後に返答を予め生成する段階、
前記ユーザの発話終了後に前記発話音声に対して前記予め生成された返答を送出する過程、および
前記返答が送出される途中に前記ユーザの発話音声が受信されれば、前記返答の送出を中断する過程
を処理する、
コンピュータシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190089399A KR102170088B1 (ko) | 2019-07-24 | 2019-07-24 | 인공지능 기반 자동 응답 방법 및 시스템 |
KR10-2019-0089399 | 2019-07-24 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021022928A JP2021022928A (ja) | 2021-02-18 |
JP7113047B2 true JP7113047B2 (ja) | 2022-08-04 |
Family
ID=73006448
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020124156A Active JP7113047B2 (ja) | 2019-07-24 | 2020-07-21 | 人工知能基盤の自動応答方法およびシステム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7113047B2 (ja) |
KR (1) | KR102170088B1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113571038B (zh) * | 2021-07-14 | 2024-06-25 | 北京小米移动软件有限公司 | 语音对话方法、装置、电子设备及存储介质 |
CN113643696B (zh) * | 2021-08-10 | 2024-06-21 | 阿波罗智联(北京)科技有限公司 | 语音处理方法、装置、设备、存储介质及程序 |
CN114240454A (zh) * | 2021-12-03 | 2022-03-25 | 山东远联信息科技有限公司 | 一种基于深度学习的智能交互方法、***及终端 |
KR102640944B1 (ko) * | 2022-04-05 | 2024-02-23 | 에스케이텔레콤 주식회사 | 자동 통화 서비스 제공 방법 및 장치 |
KR102490519B1 (ko) * | 2022-07-21 | 2023-01-19 | 주식회사 라피치 | 발신자의 텍스트데이터에 대응하여 암호화를 하는 개인정보 보호 기능을 가지는 자동응답 시스템 및 방법 |
KR20240068017A (ko) * | 2022-11-08 | 2024-05-17 | 한국전자기술연구원 | 턴프리 대화 방법 및 장치 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006293830A (ja) | 2005-04-13 | 2006-10-26 | Fuji Xerox Co Ltd | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム |
JP2018017936A (ja) | 2016-07-28 | 2018-02-01 | 国立研究開発法人情報通信研究機構 | 音声対話装置、サーバ装置、音声対話方法、音声処理方法およびプログラム |
JP2018151631A (ja) | 2017-03-10 | 2018-09-27 | サウンドハウンド,インコーポレイテッド | ドメイン曖昧性除去を含む音声対応システム |
JP2018160798A (ja) | 2017-03-23 | 2018-10-11 | 沖電気工業株式会社 | 通信装置、通信方法、および、通信プログラム |
WO2019098038A1 (ja) | 2017-11-15 | 2019-05-23 | ソニー株式会社 | 情報処理装置、及び情報処理方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3398401B2 (ja) * | 1992-03-16 | 2003-04-21 | 株式会社東芝 | 音声認識方法及び音声対話装置 |
KR101627402B1 (ko) * | 2014-03-26 | 2016-06-03 | 포항공과대학교 산학협력단 | 자연어를 점진적으로 분석하는 장치와 이를 이용한 적응적인 응답 장치 및 방법 |
KR20190004495A (ko) * | 2017-07-04 | 2019-01-14 | 삼성에스디에스 주식회사 | 챗봇을 이용한 태스크 처리 방법, 장치 및 시스템 |
KR20190008663A (ko) * | 2017-07-17 | 2019-01-25 | 삼성전자주식회사 | 음성 데이터 처리 방법 및 이를 지원하는 시스템 |
KR102428782B1 (ko) * | 2017-12-29 | 2022-08-03 | 엘지전자 주식회사 | 세탁기 및 세탁기의 동작방법 |
-
2019
- 2019-07-24 KR KR1020190089399A patent/KR102170088B1/ko active IP Right Grant
-
2020
- 2020-07-21 JP JP2020124156A patent/JP7113047B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006293830A (ja) | 2005-04-13 | 2006-10-26 | Fuji Xerox Co Ltd | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム |
JP2018017936A (ja) | 2016-07-28 | 2018-02-01 | 国立研究開発法人情報通信研究機構 | 音声対話装置、サーバ装置、音声対話方法、音声処理方法およびプログラム |
JP2018151631A (ja) | 2017-03-10 | 2018-09-27 | サウンドハウンド,インコーポレイテッド | ドメイン曖昧性除去を含む音声対応システム |
JP2018160798A (ja) | 2017-03-23 | 2018-10-11 | 沖電気工業株式会社 | 通信装置、通信方法、および、通信プログラム |
WO2019098038A1 (ja) | 2017-11-15 | 2019-05-23 | ソニー株式会社 | 情報処理装置、及び情報処理方法 |
Also Published As
Publication number | Publication date |
---|---|
KR102170088B1 (ko) | 2020-10-26 |
JP2021022928A (ja) | 2021-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7113047B2 (ja) | 人工知能基盤の自動応答方法およびシステム | |
US11823659B2 (en) | Speech recognition through disambiguation feedback | |
EP3639156B1 (en) | Exporting dialog-driven applications to digital communication platforms | |
KR102418511B1 (ko) | 서드 파티 에이전트를 사용하기 위한 호출 요청 생성 및 전송 | |
KR102523982B1 (ko) | 자동화된 어시스턴트를 호출하기 위한 다이내믹 및/또는 컨텍스트-특정 핫 워드 | |
JP6848147B2 (ja) | 音声インタラクション実現方法、装置、コンピュータデバイス及びプログラム | |
US9805718B2 (en) | Clarifying natural language input using targeted questions | |
JP2021533397A (ja) | 話者埋め込みと訓練された生成モデルとを使用する話者ダイアライゼーション | |
TWI425500B (zh) | 以數位語音中表現的單字索引數位語音 | |
US10811005B2 (en) | Adapting voice input processing based on voice input characteristics | |
JP2022547704A (ja) | 訓練を減らした意図認識技術 | |
KR102413616B1 (ko) | 온-디바이스 음성 인식 모델 트레이닝을 위한 텍스트 세그먼트의 온-디바이스 음성 합성 | |
CN112489641A (zh) | 用于高效对话处理的实时反馈 | |
JP7365985B2 (ja) | 音声を認識するための方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム | |
KR20200011198A (ko) | 대화형 메시지 구현 방법, 장치 및 프로그램 | |
Kumar et al. | Enabling the rapid development and adoption of speech-user interfaces | |
US11694682B1 (en) | Triggering voice control disambiguation | |
CN112487137A (zh) | 使用集成共享资源来流线化对话处理 | |
KR20190109651A (ko) | 인공지능 기반의 음성 모방 대화 서비스 제공 방법 및 시스템 | |
Manojkumar et al. | AI-based virtual assistant using python: a systematic review | |
US11842737B2 (en) | Automated assistant interaction prediction using fusion of visual and audio input | |
US20220180865A1 (en) | Runtime topic change analyses in spoken dialog contexts | |
CN114860910A (zh) | 智能对话方法及*** | |
KR102319013B1 (ko) | 대화문 발화 성격 인식 방법 및 시스템 | |
KR20230007502A (ko) | 자동화된 어시스턴트 응답 제시의 핫워드 프리 선점 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200721 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20210414 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20210412 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210817 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220712 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220725 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7113047 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |