CN114117020A - 一种多渠道对话接续方法及*** - Google Patents

一种多渠道对话接续方法及*** Download PDF

Info

Publication number
CN114117020A
CN114117020A CN202210068771.9A CN202210068771A CN114117020A CN 114117020 A CN114117020 A CN 114117020A CN 202210068771 A CN202210068771 A CN 202210068771A CN 114117020 A CN114117020 A CN 114117020A
Authority
CN
China
Prior art keywords
conversation
user
text
progress
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210068771.9A
Other languages
English (en)
Inventor
李一夫
孙赛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Yizhi Intelligent Technology Co ltd
Original Assignee
Hangzhou Yizhi Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Yizhi Intelligent Technology Co ltd filed Critical Hangzhou Yizhi Intelligent Technology Co ltd
Priority to CN202210068771.9A priority Critical patent/CN114117020A/zh
Publication of CN114117020A publication Critical patent/CN114117020A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉及一种多渠道对话接续方法,方法包括:在用户进行语音对话时记录语音对话进度;当检测到语音对话满足切换条件时,生成文本对话界面,将文本对话界面发送至用户;以语音对话进度作为文本对话进度,将文本对话进度应用至文本对话界面,用户能够在文本对话界面中切换至文本对话并接续语音对话进度。本发明的方法通过接续对话的方式,在语音对话识别不准确或无法识别时将用户切换至文本对话方式,保证了识别的准确性;在切换时保持了用户的对话进度,可以从之前中断的位置继续进行,大大提高了用户的使用体验和效率。

Description

一种多渠道对话接续方法及***
技术领域
本发明属于通信技术领域,具体涉及一种多渠道对话接续方法及***。
背景技术
随着人工智能、语义分析等技术的发展,目前具有自动对话功能的语音和文本对话机器人越来越多地应用于客服或数据收集领域。但现有的自动对话功能,无论是语音对话还是文本对话都存在一定缺陷,语音对话存在较严重的识别特殊字符不准确, 或者完全识别不出来的情况,且容易受环境噪音和方言影响识别效果,在和用户交互大量数据信息时也很难以使用;而文本对话与用户的沟通效率较低、需要用户输入大量文字。
因此需要一种方法能够结合语音对话和文本对话的优点并弥补它们各自的缺陷,使得用户的自动对话能够既高效又准确。
发明内容
基于现有技术中存在的上述缺点和不足,本发明的目的之一是至少解决现有技术中存在的上述问题之一或多个,换言之,本发明的目的之一是提供满足前述需求之一或多个的一种多渠道对话接续方法及***。
为了达到上述发明目的,本发明采用以下技术方案:
一种多渠道对话接续方法,方法包括:
在用户进行语音对话时记录语音对话进度;
当检测到语音对话满足切换条件时,生成文本对话界面,将文本对话界面发送至用户;以语音对话进度作为文本对话进度,将文本对话进度应用至文本对话界面,用户能够在文本对话界面中切换至文本对话并接续语音对话进度。
作为优选方案,将文本对话界面发送至用户具体包括:
将文本对话界面生成于网页;
将网页的网址链接发送至用户,用户点击网址链接后打开包含文本对话界面的网页。
作为进一步优选的方案,将网页的网址链接发送至用户具体包括:
将网页的链接转换为短链接;
将短链接以短信形式发送至用户。
作为进一步优选的方案,方法还包括:
为每场对话分配一个对话ID,使用对话ID构建网址链接;
根据用户访问的网址链接中所含对话ID确定所接续的对话。
作为进一步优选的方案,方法还包括:
构建网址链接时在网址链接中添加当前时间戳;
设置过期时间,当用户打开网址链接时根据时间戳和过期时间判断对话是否已经过期,若过期则提醒用户该对话已经过期。
作为优选方案,当检测到语音对话满足切换条件时,向用户征求切换确认,若用户确认则进行切换;若用户拒绝或超时未确认则继续保持语音对话。
作为优选方案,检测到语音对话满足切换条件的一种或多种时开始切换;切换条件包括:
用户语音内容难以识别;
用户进行数据查询或输入;
用户主动要求切换文本对话。
作为优选方案,语音对话进度和文本对话进度包括:
对话开始时间;
对话历史记录信息;
当前对话节点信息;
对话中收集的数据。
作为优选方案,方法还包括:在用户开始文本对话时记录文本对话进度,当检测到文本对话满足切换条件时,将文本对话进度作为语音对话进度,切换至语音对话并接续文本对话进度。
另一方面,本发明还提供一种多渠道对话接续***,应用如上述任一项的方法,***包括:
语音对话服务器,用于与用户进行语音对话;
文本对话服务器,用于生成文本对话界面,并与用户进行文本对话;
用户终端,用户通过用户终端与语音对话服务器和文本对话服务器进行对话;
对话进度数据库,用于储存每场对话的当前语音对话进度和接续文本对话进度;
切换服务器,用于检测切换条件,调取对话进度数据库中的对话进度,控制用户终端的对话在语音对话服务器和文本对话服务器之间切换。
本发明与现有技术相比,有益效果是:
(1)本发明的方法通过接续对话的方式,在语音对话识别不准确或无法识别时将用户切换至文本对话方式,保证了识别的准确性;
(2)在切换时保持了用户的对话进度,可以从之前中断的位置继续进行,大大提高了用户的使用体验和效率;
(3)当用户需要进行复杂数据的对话时,切换至文本对话能够保证用户方便准确地输入大量数据和查看大量数据的结果。
附图说明
图1是本发明实施例的向用户征求切换确认的流程图;
图2是本发明实施例的用户打开网页后接续对话的流程图。
具体实施方式
为了更清楚地说明本发明实施例,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
实施例:本实施例的一种多渠道对话接续方法,在用户与语音对话机器人进行语音对话时记录语音对话进度,并且在对话过程中检测该语音对话是否满足切换条件。如果检测到该语音对话满足切换条件,比如当前语音质量差、用户方言严重无法识别等,则将用户切换至文本对话,并使用之前在语音对话时记录下来的语音对话进度作为文本对话的起始点,以将用户的对话进度接续至文本对话中。
更具体的举例说明如下所述,该方法包括以下步骤:
在用户的语音对话接通时为该对话生成一个对话ID,即sessionID,该sessionID作为session数据存取的凭据指向一个session数据,语音对话的对话进度存储于该session数据中,查询该session数据便可以得到该语音对话的进度。更进一步的,session数据可以使用redis存储***进行存储。
在语音对话过程中,检测并根据用户操作和语音对话进行的状态判断是否需要将对话切换至文本对话并进行接续。
优选的,根据语音对话进行的状态判断可以包括:环境噪音太大导致自动语音对话服务无法识别用户的语音内容、用户方言口音过重导致无法识别语音内容等;根据用户操作判断可以包括:在用户输入大量数组或表格数据时不便于用语音输入、在用户需要展示大量数组或表格数据时不便于用语音听取、用户主动选择切换至文本对话等。
当检测到满足切换条件时,生成文本对话界面,并将该文本对话界面发送至用户,将其语音对话切换至文本对话接续。这样能够在语音对话良好运作的时候以语音对话方式快速对话,并在语音对话听取不清晰、识别不准确的时候切换至文本对话保障对话的准确性,还可以便于大量数据的输入及输出。
进一步的,如图1所示,为了提高用户体验,在由于识别错误等原因判定需要切换至文本对话之后、生成文本对话界面之前,需要先向用户征求切换确认,具体可以是向用户播放切换文本对话的话术录音,并等待用户的同意或拒绝指令。等待用户的同意或拒绝指令可以是等待用户按键信息,例如按1即为同意切换,按2即为拒绝切换。如果用户同意则开始切换至文本对话、生成文本对话界面;如果用户拒绝或等待超时仍未回复,则继续进行语音对话。
优选的,生成文本对话界面是生成于网页上,尤其可以生成于H5网页上,并在包含文本对话界面的网页生成完成后将网址链接发送至用户,用户点击该网址链接后即打开包含文本对话界面的网页,从而能够于文本对话界面中开始接续的文本对话。上述用户接收网址链接及打开网页的终端可以是手机、平板电脑、笔记本电脑、穿戴式设备等众多可通信的终端设备。
为了提高文本对话界面发送至用户并由用户使用的便利性,进一步优选的,生成包含文本对话界面的网页后将该网页的链接进行转换,转换为仅10位字符长度的短链接,然后将该短链接通过短信发送给用户。用户点击该短链接后,短链接服务器将该短链接解析复原成原网页的网址链接,并将用户跳转至该包含文本对话界面的网页。
网址链接与对话的sessionID具有对应关系,访问特定的网址链接能够确定该用户所进行的对话,进而找到该对话的session数据,从中找到对话进度数据。优选的,网址链接由sessionID生成,可以直接由网址链接提取sessionID,然后定位到该sessionID所对应的session数据。
优选的,由于对话一般具有时效性,为了筛选出已经过期的对话,在构建网页的网址链接时还在网址链接中添加当前时间的时间戳,并预设一个过期时间,当用户打开网址链接时根据网址链接中的时间戳结合过期时间判断该网址链接的对话是否已经过期。如果未过期则可以接续对话,如果已经过期则可以生成新的sessionID并从头开始一个新的文本对话。
基于上述两个优选改进,可以在网址链接中同时***对话的sessionID和当前时间的时间戳,并根据sessionID和时间戳生成每个对话唯一的dialog_state_key关键字串,并使用dialog_state_key关键字串生成网址链接。
基于上述优选改进,当用户打开网页后接续对话的流程图如图2所示,访问短信中的短链接,将该短链接转换后,跳转到转换后的网址链接地址。该网址链接地址中包含dialog_state_key关键字串,将dialog_state_key关键字串解析可以得到该网址链接所对应对话的sessionID和过期时间,根据过期时间判断该对话是否还在进行中,若还在进行中则根据sessionID再redis的服务端查询session数据,得到语音对话进度,将语音对话进度作为文本对话进度,导入文本对话界面恢复对话状态,然后在网页的文本对话界面中接续对话。若并将其从而得到之前语音对话的对话进度信息。若该对话已经过期,则生成新的sessionID并从头开始一个新的文本对话。
进一步的,语音对话进度和文本对话进度包括对话开始时间、对话历史记录信息、当前对话节点信息、对话中收集的数据,这些信息能够使对话在语音和文本之间切换的时候保持进度。
优选的,本实施例还包括如下方法:在语音对话转换为文本对话时继续记录文本对话进度,当检测到文本对话满足切换条件时,如用户主动要求切换至语音对话时,如上述方法近似地将文本对话再切换回语音对话。并在切换后接续文本对话的进度,以在合适的时机利用语音对话的高效优势。
本实施例还提供一种多渠道对话接续***,用于实现上述方法,***包括语音对话服务器、文本对话服务器、用户终端、对话进度数据库、切换服务器。其中语音对话服务器和文本对话服务器分别用于与用户终端进行语音和文本对话,文本对话服务器还用于生成文本对话界面及其所在的网页。用户终端是用户与语音对话服务器和文本对话服务器进行对话的承载主体,可以是手机、平板电脑、笔记本电脑、穿戴式设备等众多可通信的终端设备。对话进度数据库可以是上述优选方案中的redis存储***,用于存储每场对话的语音对话进度和文本对话进度。切换服务器用于检测上述的切换条件,并调取对话进度数据库中的对话进度,使用户终端处的对话能够在指向语音对话服务器和文本对话服务器之间切换,并在切换过程中保持对话进度。
应当说明的是,上述实施例仅是对本发明的优选实施例及原理进行了详细说明,对本领域的普通技术人员而言,依据本发明提供的思想,在具体实施方式上会有改变之处,而这些改变也应视为本发明的保护范围。

Claims (10)

1.一种多渠道对话接续方法,其特征在于,所述方法包括:
在用户进行语音对话时记录语音对话进度;
当检测到语音对话满足切换条件时,生成文本对话界面,将所述文本对话界面发送至用户;以所述语音对话进度作为文本对话进度,将所述文本对话进度应用至所述文本对话界面,用户能够在所述文本对话界面中切换至文本对话并接续所述语音对话进度。
2.如权利要求1所述的一种多渠道对话接续方法,其特征在于,所述将所述文本对话界面发送至用户具体包括:
将所述文本对话界面生成于网页;
将所述网页的网址链接发送至用户,用户点击所述网址链接后打开包含所述文本对话界面的网页。
3.如权利要求2所述的一种多渠道对话接续方法,其特征在于,所述将网页的网址链接发送至用户具体包括:
将所述网页的链接转换为短链接;
将所述短链接以短信形式发送至用户。
4.如权利要求2所述的一种多渠道对话接续方法,其特征在于,所述方法还包括:
为每场对话分配一个对话ID,使用所述对话ID构建所述网址链接;
根据用户访问的网址链接中所含对话ID确定所接续的对话。
5.如权利要求2所述的一种多渠道对话接续方法,其特征在于,所述方法还包括:
构建所述网址链接时在所述网址链接中添加当前时间戳;
设置过期时间,当用户打开所述网址链接时根据所述时间戳和所述过期时间判断对话是否已经过期,若过期则提醒用户该对话已经过期。
6.如权利要求1所述的一种多渠道对话接续方法,其特征在于,所述当检测到语音对话满足切换条件时,向用户征求切换确认,若用户确认则进行切换;若用户拒绝或超时未确认则继续保持语音对话。
7.如权利要求1所述的一种多渠道对话接续方法,其特征在于,检测到所述语音对话满足切换条件的一种或多种时开始切换;所述切换条件包括:
用户语音内容难以识别;
用户进行数据查询或输入;
用户主动要求切换文本对话。
8.如权利要求1所述的一种多渠道对话接续方法,其特征在于,所述语音对话进度和所述文本对话进度包括:
对话开始时间;
对话历史记录信息;
当前对话节点信息;
对话中收集的数据。
9.如权利要求1所述的一种多渠道对话接续方法,其特征在于,所述方法还包括:在用户开始文本对话时记录文本对话进度,当检测到文本对话满足切换条件时,将文本对话进度作为语音对话进度,切换至语音对话并接续文本对话进度。
10.一种多渠道对话接续***,应用如权利要求1-9任一项所述的方法,其特征在于,所述***包括:
语音对话服务器,用于与用户进行语音对话;
文本对话服务器,用于生成所述文本对话界面,并与用户进行文本对话;
用户终端,用户通过所述用户终端与所述语音对话服务器和所述文本对话服务器进行对话;
对话进度数据库,用于储存每场对话的所述语音对话进度和所述文本对话进度;
切换服务器,用于检测所述切换条件,调取所述对话进度数据库中的对话进度,控制所述用户终端的对话在所述语音对话服务器和所述文本对话服务器之间切换。
CN202210068771.9A 2022-01-21 2022-01-21 一种多渠道对话接续方法及*** Pending CN114117020A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210068771.9A CN114117020A (zh) 2022-01-21 2022-01-21 一种多渠道对话接续方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210068771.9A CN114117020A (zh) 2022-01-21 2022-01-21 一种多渠道对话接续方法及***

Publications (1)

Publication Number Publication Date
CN114117020A true CN114117020A (zh) 2022-03-01

Family

ID=80360985

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210068771.9A Pending CN114117020A (zh) 2022-01-21 2022-01-21 一种多渠道对话接续方法及***

Country Status (1)

Country Link
CN (1) CN114117020A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080147406A1 (en) * 2006-12-19 2008-06-19 International Business Machines Corporation Switching between modalities in a speech application environment extended for interactive text exchanges
CN101207655A (zh) * 2006-12-19 2008-06-25 国际商业机器公司 通信会话中在话音和文本交换形态之间切换的方法和***
US8593501B1 (en) * 2012-02-16 2013-11-26 Google Inc. Voice-controlled labeling of communication session participants
US20170078490A1 (en) * 2015-09-16 2017-03-16 International Business Machines Corporation Adaptive voice-text transmission
US20210090563A1 (en) * 2019-09-20 2021-03-25 Hyundai Motor Company Dialogue system, dialogue processing method and electronic apparatus

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080147406A1 (en) * 2006-12-19 2008-06-19 International Business Machines Corporation Switching between modalities in a speech application environment extended for interactive text exchanges
CN101207655A (zh) * 2006-12-19 2008-06-25 国际商业机器公司 通信会话中在话音和文本交换形态之间切换的方法和***
US8593501B1 (en) * 2012-02-16 2013-11-26 Google Inc. Voice-controlled labeling of communication session participants
US20170078490A1 (en) * 2015-09-16 2017-03-16 International Business Machines Corporation Adaptive voice-text transmission
US20210090563A1 (en) * 2019-09-20 2021-03-25 Hyundai Motor Company Dialogue system, dialogue processing method and electronic apparatus

Similar Documents

Publication Publication Date Title
CN110769124B (zh) 电力营销客户沟通***
US8457964B2 (en) Detecting and communicating biometrics of recorded voice during transcription process
CN111192060B (zh) 一种基于电力it服务全渠道自助应答实现方法
US9761241B2 (en) System and method for providing network coordinated conversational services
CN201504266U (zh) 一种基于电话银行的用户语音处理***
CN106409283B (zh) 基于音频的人机混合交互***及方法
US10033864B2 (en) Dynamically switching communications to text interactions
DE69937962T2 (de) Vorrichtung und verfahren zur bereitstellung von netzwerk-koordinierten konversationsdiensten
CN110049270A (zh) 多人会议语音转写方法、装置、***、设备及存储介质
CN102984666B (zh) 一种通话过程中的通讯录语音信息处理方法及***
JP2004525551A (ja) 音声メールシステムの音声対応ユーザインタフェース
CN105100360A (zh) 用于语音通话的通话辅助方法和装置
CN105206272A (zh) 语音传输控制方法及***
CN111128241A (zh) 语音通话的智能质检方法及***
CN113840040B (zh) 一种人机协作的外呼方法、装置、设备及存储介质
CN110232553A (zh) 会议支援***以及计算机可读取的记录介质
CN111554280A (zh) 对利用人工智能的翻译内容和口译专家的口译内容进行混合的实时口译服务***
CN111339282A (zh) 智能在线应答方法及智能客服***
CN105206273A (zh) 语音传输控制方法及***
CN113779217A (zh) 一种基于人机交互的智能语音外呼业务方法及***
CN103067579A (zh) 辅助在线语音聊天方法和装置
CN117424960A (zh) 智能语音服务方法、装置、终端设备以及存储介质
CN114117020A (zh) 一种多渠道对话接续方法及***
CN107888745A (zh) 一种通讯录中失效号码的删除方法及装置
CN109147791A (zh) 一种速记***和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220301