CN106201424A - 一种信息交互方法、装置及电子设备 - Google Patents

一种信息交互方法、装置及电子设备 Download PDF

Info

Publication number
CN106201424A
CN106201424A CN201610538666.1A CN201610538666A CN106201424A CN 106201424 A CN106201424 A CN 106201424A CN 201610538666 A CN201610538666 A CN 201610538666A CN 106201424 A CN106201424 A CN 106201424A
Authority
CN
China
Prior art keywords
content
interaction content
information
user
targeted customer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610538666.1A
Other languages
English (en)
Other versions
CN106201424B (zh
Inventor
杨剑
刘伟超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ganwei Lebo Technology Co Ltd
Original Assignee
Beijing Ganwei Lebo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ganwei Lebo Technology Co Ltd filed Critical Beijing Ganwei Lebo Technology Co Ltd
Priority to CN201610538666.1A priority Critical patent/CN106201424B/zh
Publication of CN106201424A publication Critical patent/CN106201424A/zh
Application granted granted Critical
Publication of CN106201424B publication Critical patent/CN106201424B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • G10L15/142Hidden Markov Models [HMMs]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种信息交互方法、装置及电子设备,涉及通信及人工智能领域。一种信息交互方法,该方法包括:获取多个目标用户的整体交互内容;确定与每个目标用户相关的特定交互内容;基于确定的所述特定交互内容判断与所述特定交互内容相关的目标用户是否需要信息提示;若是,则查找与所述特定交互内容匹配的提示信息,并在与所述特定交互内容相匹配的提示情景向与所述特定交互内容相关的目标用户展示所述提示信息。通过本申请提供的方案,能够对多个目标用户的交互内容进行分析,并有针对性的提供提示信息。

Description

一种信息交互方法、装置及电子设备
技术领域
本发明实施例涉及通信及人工智能领域,尤其涉及一种信息交互方法、装置及电子设备。
背景技术
随着语义解析和人工智能技术的发展,人机交互(Human-Computer Interaction,简写HCI)在现实生活中得到了越来越多的应用,人机交互的方式包括人与电子设备(手机、电视、计算机、智能机器人等)之间使用某种对话语言,以一定的交互方式,为完成确定任务的人与电子设备之间的信息交换过程。随着用户需求的不同,人机交互在越来越多的领域都有着广阔的应用。一个比较典型的应用例子便是伴侣机器人,即伴侣机器人能够以多种方式接收用户的输入(这些输入包括但不限于语音输入、文字输入等),伴侣机器人分析用户的输入内容,通过搜索本地或远程的数据库,给出相应的答案。比如用户想知道今天的天气如何,只要对伴侣机器人说“今天北京的天气”,伴侣机器人便会接收用户的语音内容,通过检索关联的天气数据库,以语音或文字的方式向用户展示用户天气信息。
发明人在实现本发明的过程中发现,现有技术中人机交互过程的一般都是单一的用户主动发起,且用户需要向具有人机交互功能的电子设备发起有针对性的提问,智能电子设备才会给出相应的答复,对于具有人机交互功能的电子设备而言,这种交互方式是被动的。而实际使用当中,除了能够直接的回答用户的提问之外,用户更加希望具有人机交互功能的电子设备能够以一种积极的方式来获取用户的需求信息,并根据获取的需求信息主动的进行人机交互。
发明内容
本发明实施例提供一种信息交互方法、装置及电子设备,用以解决现有技术中用户在人机交互的过程中,交互方式单一、不能满足复杂交互环境的交互需求的缺点,实现了人机交互在复杂交互环境下的智能性。
第一方面,本发明实施例提供一种信息交互方法,该方法包括:
获取多个目标用户的整体交互内容;
确定与每个目标用户相关的特定交互内容;
基于确定的所述特定交互内容判断与所述特定交互内容相关的目标用户是否需要信息提示;
若是,则查找与所述特定交互内容匹配的提示信息,并在与所述特定交互内容相匹配的提示情景向与所述特定交互内容相关的目标用户展示所述提示信息。
根据本发明实施例的一种具体实现方式,所述获取多个目标用户的整体交互内容,包括:
获取一个以上用户的语音交互内容,基于所述语音交互内容,确定所述整体交互内容。
根据本发明实施例的一种具体实现方式,所述基于所述语音交互内容,确定所述整体交互内容,包括:
获取与所述语音交互内容对应的情景特征;
获取与所述情景特征相关联的情景特征数据库;
对所述语音交互内容进行语音识别,并将语音识别后的内容与所述情景特征数据库中的情景特征模式进行匹配,得到所述整体交互内容。
根据本发明实施例的一种具体实现方式,所述基于所述语音交互内容,确定所述整体交互内容,还包括:
提取所述语音交互内容中的声纹特征信息;
获取与所述声纹特征信息相关联的用户特征数据库;
对所述语音交互内容进行语音识别,并将语音识别后的内容与所述用户特征数据库中的内容进行匹配,得到所述整体交互内容。
根据本发明实施例的一种具体实现方式,所述确定与每个目标用户相关的特定交互内容,包括:
提取所述语音交互内容中的声纹特征信息;
根据所述声纹特征信息确定与所述语音交互内容相关的每个目标用户;
将所述整体交互内容与所述每个目标用户进行拆分,得到与所述每个目标用户相关的特定交互内容。
根据本发明实施例的一种具体实现方式,所述将所述整体交互内容与所述每个目标用户进行拆分,得到与所述每个目标用户相关的特定交互内容,包括:
基于所述声纹特征信息对所述整体交互内容进行拆分;
获取与所述声纹特征信息相对应的用户特征数据库;
将所述整体交互内容拆分后得到的内容与所述用户特征数据库进行匹配,得到与所述每个目标用户相关的特定交互内容。
根据本发明实施例的一种具体实现方式,所述多个目标用户的整体交互内容,包括:
当前用户与一个以上其他用户进行的:语音通话内容、邮件交互内容、短信交互内容、谈话交互内容、即时通信文字交互内容中的一个以上。
根据本发明实施例的一种具体实现方式,所述在与所述特定交互内容相匹配的提示情景向与所述特定交互内容相关的目标用户展示所述提示信息,包括:
确定与所述交互内容匹配的提示场景;
判断当前场景是否与所述交互内容匹配的提示场景的匹配度;
当所述匹配度大于预设阈值,以预设的信息提示方式向用户展示所述提示信息。
根据本发明实施例的一种具体实现方式,所述在与所述特定交互内容相匹配的提示情景向与所述特定交互内容相关的目标用户展示所述提示信息之后,还包括:
接收与所述特定交互内容相关的目标用户输入的反馈信息;以及
基于所述反馈信息确定是否继续进行信息提示。
第二方面,本发明实施例还提供一种信息交互装置,该装置包括:
获取模块,用于获取多个目标用户的整体交互内容;
确定模块,用于确定与每个目标用户相关的特定交互内容;
判断模块,用于基于确定的所述特定交互内容判断与所述特定交互内容相关的目标用户是否需要信息提示;
提示模块,用于当与所述特定交互内容相关的目标用户需要信息提示时,查找与所述特定交互内容匹配的提示信息,并在与所述特定交互内容相匹配的提示情景向与所述特定交互内容相关的目标用户展示所述提示信息。
根据本发明实施例的一种具体实现方式,所述获取模块还用于:
获取一个以上用户的语音交互内容,基于所述语音交互内容,确定所述整体交互内容。
根据本发明实施例的一种具体实现方式,所述基于所述语音交互内容,确定所述整体交互内容,包括:
获取与所述语音交互内容对应的情景特征;
获取与所述情景特征相关联的情景特征数据库;
对所述语音交互内容进行语音识别,并将语音识别后的内容与所述情景特征数据库中的情景特征模式进行匹配,得到所述整体交互内容。
根据本发明实施例的一种具体实现方式,所述基于所述语音交互内容,确定所述整体交互内容,还包括:
提取所述语音交互内容中的声纹特征信息;
获取与所述声纹特征信息相关联的用户特征数据库;
对所述语音交互内容进行语音识别,并将语音识别后的内容与所述用户特征数据库中的内容进行匹配,得到所述整体交互内容。
根据本发明实施例的一种具体实现方式,所述确定模块还用于:
提取所述语音交互内容中的声纹特征信息;
根据所述声纹特征信息确定与所述语音交互内容相关的每个目标用户;
将所述整体交互内容与所述每个目标用户进行拆分,得到与所述每个目标用户相关的特定交互内容。
根据本发明实施例的一种具体实现方式,所述将所述整体交互内容与所述每个目标用户进行拆分,得到与所述每个目标用户相关的特定交互内容,包括:
基于所述声纹特征信息对所述整体交互内容进行拆分;
获取与所述声纹特征信息相对应的用户特征数据库;
将所述整体交互内容拆分后得到的内容与所述用户特征数据库进行匹配,得到与所述每个目标用户相关的特定交互内容。
根据本发明实施例的一种具体实现方式,所述多个目标用户的整体交互内容,包括:
当前用户与一个以上其他用户进行的:语音通话内容、邮件交互内容、短信交互内容、谈话交互内容、即时通信文字交互内容中的一个以上。
根据本发明实施例的一种具体实现方式,所述提示模块还用于:
确定与所述交互内容匹配的提示场景;
判断当前场景是否与所述交互内容匹配的提示场景的匹配度;
当所述匹配度大于预设阈值,以预设的信息提示方式向用户展示所述提示信息。
根据本发明实施例的一种具体实现方式,所述信息交互装置还包括反馈模块,所述反馈模块用于:
在与所述特定交互内容相匹配的提示情景向与所述特定交互内容相关的目标用户展示所述提示信息之后,接收与所述特定交互内容相关的目标用户输入的反馈信息;以及
基于所述反馈信息确定是否继续进行信息提示。
第三方面,本发明实施例提供一种电子设备,所述电子设备包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为上述电子设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行前述任一所述的信息交互方法
本发明实施例提供的信息交互方法、装置及电子设备,通过将整体交互内容进行针对性的拆分,通过有效的交互场景的确定,能够在特定的场景下有针对性的对特定用户进行信息交互,解决了现有技术中交互方式过于单一、无法适应复杂交互环境的缺点,提高了交互的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种信息交互方法的流程示意图;
图2为本发明实施例提供的基于语音交互方式获得整体交互内容流程示意图;
图3为本发明实施例提供的基于用户的声纹特征进行语音交互内容识别流程示意图;
图4为本发明实施例提供一种基于用户的声纹特征信息确定与目标用户相关的特定交互内容的流程示意图;
图5为本发明实施例提供另一种基于用户的声纹特征信息确定与目标用户相关的特定交互内容的流程示意图;
图6为本发明实施例提供的基于场景向用户展示提示信息的流程示意图;
图7为本发明实施例提供的基于用户反馈内容进行信息提示的流程示意图;
图8为本发明实施例提供的一种信息交互装置的结构示意图;
图9为本发明实施例提供的另一种信息交互装置的结构示意图;
图10为本发明实施例提供的一种电子设备结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有技术中的交互方式通常是固定式的交互方式,且交互的发起方一般都是用户,而交互设备通常是被动的接收用户的输入内容,进而对用户的输入进行回答。作为一个例子,用户可以询问手机助手(比如Iphone中内置的Siri):“给John打电话”,这时候手机助手便会拔打John的电话号码,这种交互方式过于单一,更多的情况下,用户希望交互对象(比如手机助手)能够主动的获取用户的行为信息,进而主动的给用户提供信息提示。
图1为本发明实施例中信息交互方法的流程示意图,该方法包括:
S101:获取多个目标用户的整体交互内容。
在进行获取用户的整体交互内容之前,需要设置整体交互内容获取程序。整体交互内容获取程序可以以多种形式存在,比如安装在用户计算机内的信息(比如接收邮件内容)监控程序、或者是安装在手机内的手机信息(短信、通话记录、手机App的聊天记录等)监控程、或者是单独设计的一个能够监听和记录一个以上用户聊天内容的机器人设备。
可以通过多种方式获取目标用户的整体交互内容,一种方式便是用户主动开启了整体交互内容获取操作开关,此时整体交互内容获取程序便会获取用户在一段时间内(比如一周)的整体交互内容,这些交互内容包含用户的一段时间内容的邮箱内容、用户上网的搜索记录、用户的购物记录、用户的通话记录、用户通过即时通信工具进行的聊天记录、用户打电话的内容等。
除了用户主动开启了整体交互内容获取操作开关的获取方式之外,还可以采用整体交互内容获取程序主动获取的办法,即,在用户开启了整体交互内容获取功能之后,整体交互内容获取程序便时刻监控用户的交互内容。
具体的,整体交互内容获取程序可以采用软件的方式内置在用户的多个设备中,用户的多个设备上的整体交互内容获取程序采用同一个用户ID号进行信息获取及汇总。
整体交互内容包括当前用户与一个或多个用户的整体交互内容,比如当前用户与一个或多个用户通过邮件沟通的内容,或者当前用户在会议室内与其他同事开会讨论的语音内容,或者当前用户在QQ群里与多个QQ好友之间的聊天记录。
S102:确定与每个目标用户相关的特定交互内容。
由于整体交互内容中存在多个交互对象,因此需要将整体交互内容中的信息进行拆分,比如当前用户John在邮件中分别向他的下属Ada和Bob发送了工作内容布置方案,Ada和Bob分别在邮件中对工作安排提出了不同的意见,John基于Ada和Bob的意见对方案进行了修改,此时,需要确定与John相关的具体方案内容是什么,与Ada及Bob相关的具体方案内容分别是什么,这些与每个用户相关的具体方案内容变构成了每个目标用户相关的特定交互内容。
确定与每个目标用户相关的特定交互内容有多种方式,举例而言。对于邮箱交互内容,可以通过发送者和接收者的标签来判断每个用户的交互内容;对于当前用户与一个或多个用户之间的语音聊天记录,可以通过语音识别的方式确定语音聊天记录里面的内容属于哪个语音聊天对象,并将每个语音聊天对象的具体聊天内容作为与该语音聊天对象相关的特定交互内容。
S103:基于确定的所述特定交互内容判断与所述特定交互内容相关的目标用户是否需要信息提示。
通过分析特定交互内容里所包含的信息,可以获得信息提示要素,用户提示要素是与用户提示相关的一条具体内容,例如,用户的日程安排信息。与传统的用户主动安排日程信息不同的是,该方法中能够根据内容数据的信息进行语义分析,进而得到用户是否需要提示信息。比如用户James在特定交互内容中提到“明天天气不错,Steven,咱们要不要一起去爬山”,这时确定用于James有可能在明天要和Steven有约会,确定需要对用户James进行信息提示,更进一步的,也可以给Steven发送信息提示。
S104:若是,则查找与所述特定交互内容匹配的提示信息,并在与所述特定交互内容相匹配的提示情景向与所述特定交互内容相关的目标用户展示所述提示信息。
当确定用户需要进行信息提示后,需要确定用户的提示信息的具体内容,以及在何种情景下对用户进行信息提示。
用户提示信息的具体内容,是指与用户提示要素想匹配的具体信息内容,比如用户James的用户提示要素是“明天去爬山”,那么与“明天去爬山”向匹配的信息包括:询问用户具体的出发时间、向用户推荐比较适宜的爬山地点、向用户建议爬山的注意事项、去往爬山地点可行的交通工具等信息。
除了确定提示信息的具体内容之外,还需要判断提示场景,提示场景是指向目标用户发送提示信息最合适的时间、位置等要素。比如用户David约了Mary今天晚上20:00在Rose酒店见面,从David的出发地到Rose酒店需要30分钟的行程,考虑到提前10分钟到Rose酒店,在17:20的时候,已经构成了提示信息时间提示场景,可以在此场景下向用户David发送并展示提示信息。基于同样的原理,也可以给Mary发送并展示提示信息。
展示提示信息具有多种可选方式,可以通过邮件、短信、日程提醒等方式进行展示,也可以通过专门设定的提醒设备(显示屏、伴侣机器人等)进行提醒。
通过本实施例中的方案,能够主动提取用户的整体交互内容,基于对整体交互内容的分析,确定具体的提示内容,并在合适的提示场景下向用户发送提示信息,解决了用户需要专门针对提醒事项进行单独设置的问题,同时能够获取更加综合的用户交互环境信息,提供更加全面的信息提醒。
作为另外一个实施例,图2展示了基于语音交互方式获得整体交互内容的方案,该方案包括如下步骤:
S201:获取一个以上用户的语音交互内容。
可以采用多种方式获取用户的语音交互内容,比如在用户的手机内内置语音交互内容记录程序,通过语音交互内容记录程序记录当前用户与一个或多个用户的交谈记录,也可以通过软/硬件结合的方式,比如设置具有语音记录功能的智能电子设备来记录用户的语音交互内容。
作为一种可选方式,可以将用户的语音交互内容以特定的语音格式(MP3、WAV等)进行本地存储,也可以将语音交互内容上传到预先设定的服务器。
S202:获取与所述语音交互内容对应的情景特征。
在进行语音记录的过程中,可以获取当前的情景特征,这些情景特征包括但不限于,语音交互的时间信息、位置信息、以及根据用户的行为习惯或当前聊天内容确定的聊天场景。这些聊天场景包括:工作场景、家庭场景、用餐场景、运动场景等。
S203:获取与所述情景特征相关联的情景特征数据库。
情景特征数据库中存储有情景特征,不同的情景特征构成了不同的情景模式,在电子设备的本地或与电子设备通信连接的服务器端存储有情景特征数据库,当步骤S202确定了确定了当前的情景特征后,通过在本地或服务器端搜索与该情景特征匹配的数据库,确定为与所述情景特征相关联的情景特征数据库。
当情景特征数据库在本地存储时,可以直接加载情景特征数据库,当情景特征数据库位于服务器端时,则将情景特征数据库下载到本地,并执行加载操作。
S204:对所述语音交互内容进行语音识别,并将语音识别后的内容与所述情景特征数据库中的情景特征模式进行匹配,得到所述整体交互内容。
在进行语音识别之前,通常需要对声音信号进行预处理,预处理是指在特征提取之前,先对原始语音进行处理,部分消除噪声和不同说话人带来的影响,使处理后的信号更能反映语音的本质特征。例如,可以采用端点检测和语音增强方式进行预处理。端点检测是指在语音信号中将语音和非语音信号时段区分开来,准确地确定出语音信号的起始点。经过端点检测后,后续处理就可以只对语音信号进行,这对提高模型的精确度和识别正确率有重要作用。语音增强的主要是消除环境噪声对语音的影响,比如采用维纳滤波的方式对噪音信号进行过滤。
语音识别是一种模式识别的过程,通过将记录的语音的与预设参考模式逐一进行比较,进而获得语音识别的结果。可以采用多种语音识别算法完成语音识别过程,这些语音识别算法包括:基于动态时间规整(DTW)算法、基于非参数模型的矢量量化(VQ)方法、基于参数模型的隐马尔可夫模型(HMM)的方法、基于人工神经网络(ANN)和支持向量机等语音识别方法等。
在语音识别的过程中,需要采用语言模型来计算一个句子出现概率的概率模型。它主要用于决定哪个词序列的可能性更大,或者在出现了几个词的情况下预测下一个即将出现的词语的内容,对训练文本数据库进行语法、语义分析,经过基于统计模型训练得到语言模型。而采用不同的训练文本数据库,其识别得到的结果也会不同,本发明实施例中的方案则是通过将识别后的语言内容与情景特征数据库中的内容进行二次匹配,最终得到准确度更好的语音识别结果。其中,在进行语音识别的过程中,需要从情景特征数据库中获取特定情景特征,将当前获取的交互内容与情景特征模式进行匹配,从而判断出当前交互情景。
通过将情景特征数据库与识别内容进行匹配的方式进行语音识别,提高了语音识别的准确度。
图3展示了基于用户的声纹特征进行语音交互内容识别的方案,图3所示的方案可以与图2所示的方案合并执行,也可以作为一个独立的方案,单独执行,该方案包括如下步骤:
S301:提取所述语音交互内容中的声纹特征信息。
声纹特征提取的任务是提取并选择对说话人的声纹具有可分性强、稳定性高等特性的声学或语言特征。声纹特征具有多个方面的内容,从利用数学方法可以建模的角度出发,声纹自动识别模型可以使用的特征包括:(1)声学特征(倒频谱);(2)词法特征(说话人相关的词n-gram,音素n-gram);(3)韵律特征(利用n-gram描述的基音和能量“姿势”);(4)语种、方言和口音信息;(5)通道信息(使用何种通道)。
语音交互内容中通常存在多个用户的声纹特征信息,这在进行声纹特征提取的时候,需要提取多个用户的声纹特征信息。
S302:获取与所述声纹特征信息相关联的用户特征数据库。
在电子设备的本地或与电子设备通信连接的服务器端存储有用户特征数据库,当步骤S302确定了确定了当前的一个或多个用户的声纹特征后,通过在本地或服务器端搜索与该声纹特征匹配的数据库,确定为与所述声纹特征相关联的用户特征数据库。
当用户特征数据库在本地存储时,可以直接加载用户特征数据库,当用户特征数据库位于服务器端时,则将用户特征数据库下载到本地,并执行加载操作。
S303:对所述语音交互内容进行语音识别,并将语音识别后的内容与所述用户特征数据库中的内容进行匹配,得到所述整体交互内容。
在进行语音识别之前,通常需要对声音信号进行预处理,预处理是指在特征提取之前,先对原始语音进行处理,部分消除噪声和不同说话人带来的影响,使处理后的信号更能反映语音的本质特征。例如,可以采用端点检测和语音增强方式进行预处理。端点检测是指在语音信号中将语音和非语音信号时段区分开来,准确地确定出语音信号的起始点。经过端点检测后,后续处理就可以只对语音信号进行,这对提高模型的精确度和识别正确率有重要作用。语音增强的主要是消除环境噪声对语音的影响,比如采用维纳滤波的方式对噪音信号进行过滤。
语音识别是一种模式识别的过程,通过将记录的语音的与预设参考模式逐一进行比较,进而获得语音识别的结果。可以采用多种语音识别算法完成语音识别过程,这些语音识别算法包括:基于动态时间规整(DTW)算法、基于非参数模型的矢量量化(VQ)方法、基于参数模型的隐马尔可夫模型(HMM)的方法、基于人工神经网络(ANN)和支持向量机等语音识别方法等。
在语音识别的过程中,需要采用语言模型来计算一个句子出现概率的概率模型。它主要用于决定哪个词序列的可能性更大,或者在出现了几个词的情况下预测下一个即将出现的词语的内容,对训练文本数据库进行语法、语义分析,经过基于统计模型训练得到语言模型。而采用不同的训练文本数据库,其识别得到的结果也会不同,本发明实施例中的方案则是通过将识别后的语言内容与用户特征数据库中的内容进行二次匹配,最终得到准确度更好的语音识别结果。
通过将用户特征数据库与识别内容进行匹配的方式进行语音识别,进一步提高了语音识别的准确度。
图4-5展示了基于用户的声纹特征信息确定与目标用户相关的特定交互内容的过程,其中包括:
S401:提取所述语音交互内容中的声纹特征信息。
声纹特征提取的任务是提取并选择对说话人的声纹具有可分性强、稳定性高等特性的声学或语言特征。声纹特征具有多个方面的内容,从利用数学方法可以建模的角度出发,声纹自动识别模型可以使用的特征包括:(1)声学特征(倒频谱);(2)词法特征(说话人相关的词n-gram,音素n-gram);(3)韵律特征(利用n-gram描述的基音和能量“姿势”);(4)语种、方言和口音信息;(5)通道信息(使用何种通道)。
语音交互内容中通常存在多个用户的声纹特征信息,这在进行声纹特征提取的时候,需要提取多个用户的声纹特征信息。
S402:根据所述声纹特征信息确定与所述语音交互内容相关的每个目标同户。
通过模式识别或聚类的方式,将具有相同声纹特征的信息分成一类,并确定每一类声纹特征所对应的用户。举例而言,可以采用如下识别方式进行识别:
(1)模板匹配方法:利用动态时间弯折(DTW)以对准训练和测试特征序列,主要用于固定词组的应用(通常为文本相关任务);
(2)最近邻方法:训练时保留所有特征矢量,识别时对每个矢量都找到训练矢量中最近的K个,据此进行识别,通常模型存储和相似计算的量都很大;
(3)神经网络方法:有很多种形式,如多层感知、径向基函数(RBF)等,可以显式训练以区分说话人和其背景说话人;
(4)隐式马尔可夫模型(HMM)方法:通常使用单状态的HMM,或高斯混合模型(GMM);
(5)VQ聚类方法(如LBG):该方法效果不错,算法复杂度也不高,和HMM方法配合起来更可以收到更好的效果。
S403:将所述整体交互内容与所述每个目标用户进行拆分,得到与所述每个目标用户相关的特定交互内容。
基于步骤S402中的识别的具体用户及每个具体用户关联的具体内容,得到与所述每个目标用户相关的特定交互内容。
进一步的,步骤S403将所述整体交互内容与所述每个目标用户进行拆分,得到与所述每个目标用户相关的特定交互内容,还包括如下步骤:
S4031:基于所述声纹特征信息对所述整体交互内容进行拆分。
S4032:获取与所述声纹特征信息相对应的用户特征数据库。
用户特征数据库中存储有至少两种类型的数据:一种是用户类型数据,用户根据用户的特征信息(如声纹特征信息)确定具体的用户;另一种类型的数据是具体用户的语言特征数据库,在确定了具体的用户类型之后,加载与该用户对应的语音特征数据库,对特定用户的聊天内容进行修正。
S4033:将所述整体交互内容拆分后得到的内容与所述用户特征数据库进行匹配,得到与所述每个目标用户相关的特定交互内容。
通过该实施例的内容,能够基于用户的声纹特征信息对整体交互内容进行拆分,并确定具体的目标用户及该目标用户关联的特定交互内容。
图6展示了基于场景向用户展示提示信息的方案,该方案包括:
S601:确定与所述交互内容匹配的提示场景。
除了确定提示信息的具体内容之外,还需要判断提示场景,提示场景是指向目标用户发送提示信息最合适的时间、位置等要素。比如用户David约了Mary今天晚上20:00在Rose酒店见面,从David的出发地到Rose酒店需要30分钟的行程,考虑到提前10分钟到Rose酒店,在17:20的时候,已经构成了提示信息时间提示场景,可以在此场景下向用户David发送并展示提示信息。基于同样的原理,也可以给Mary发送并展示提示信息。
S602:判断当前场景是否与所述交互内容匹配的提示场景的匹配度。
并不是所有的场景都适合向用户发送提示信息,此时需要确定当前场景与交互场景的匹配程度,比如用户David打算与Mary今晚20:00在Rose酒店见面,通过确定当前的场景发现David已经到达Rose酒店,此时就没有必要再次提醒David。
具体的场景匹配度可以采用多种算法来实现,比如基于可信性的匹配方法,将可信性划分为可靠性、可用性和时效性,建立起可信性评估的一体化模型,在此不再详细描述。
S603:当所述匹配度大于预设阈值,以预设的信息提示方式向用户展示所述提示信息。
展示提示信息具有多种可选方式,可以通过邮件、短信、日程提醒等方式进行展示,也可以通过专门设定的提醒设备(显示屏、伴侣机器人等)进行提醒。
图7给出了基于用户反馈内容进行信息提示的流程图,该方案除了包含图1所对应的实施例中的内容之外,还包括如下步骤:
S105:接收与所述特定交互内容相关的目标用户输入的反馈信息。
在向用户展示完提示信息之后,还提供用户反馈的接口,比如用户在交谈中提到过“最近打算买一个手机”,当存在手机促销活动时,向用户发送提示信息“最近有X型号的手机,正在降价促销,是否需要购买一部?”,此时用户可以通过语音或手工输入“我不喜欢这部手机”,作为同户的反馈信息。
S106:基于所述反馈信息确定是否继续进行信息提示。
当接收到用户的反馈信息后,对用户的输入信息进行自学习,在理解了用户的输入信息后,可以判断是否需要继续提示信息,比如S105中,用户明确表示了不喜欢推荐的这部手机后,可以继续以提示信息的方式向用户展示其他类型的手机。
通过该实施例的内容,能够基于用户的反馈信息进行再次学习,给用户更多的且更具有针对性的展示信息。
与图1实施例的方法相对应,本发明的实施例还公开了一种信息交互装置,如图8所示,信息交互装置包括:
获取模块801,用于获取多个目标用户的整体交互内容。
在进行获取用户的整体交互内容之前,需要设置整体交互内容获取程序。整体交互内容获取程序可以以多种形式存在,比如安装在用户计算机内的信息(比如接收邮件内容)监控程序、或者是安装在手机内的手机信息(短信、通话记录、手机App的聊天记录等)监控程、或者是单独设计的一个能够监听和记录一个以上用户聊天内容的机器人设备。
可以通过多种方式获取目标用户的整体交互内容,一种方式便是用户主动开启了整体交互内容获取操作开关,此时整体交互内容获取程序便会获取用户在一段时间内(比如一周)的整体交互内容,这些交互内容包含用户的一段时间内容的邮箱内容、用户上网的搜索记录、用户的购物记录、用户的通话记录、用户通过即时通信工具进行的聊天记录、用户打电话的内容等。
除了用户主动开启了整体交互内容获取操作开关的获取方式之外,还可以采用整体交互内容获取程序主动获取的办法,即,在用户开启了整体交互内容获取功能之后,整体交互内容获取程序便时刻监控用户的交互内容。
具体的,整体交互内容获取程序可以采用软件的方式内置在用户的多个设备中,用户的多个设备上的整体交互内容获取程序采用同一个用户ID号进行信息获取及汇总。
整体交互内容包括当前用户与一个或多个用户的整体交互内容,比如当前用户与一个或多个用户通过邮件沟通的内容,或者当前用户在会议室内与其他同事开会讨论的语音内容,或者当前用户在QQ群里与多个QQ好友之间的聊天记录。
确定模块802,用于确定与每个目标用户相关的特定交互内容。
由于整体交互内容中存在多个交互对象,因此需要将整体交互内容中的信息进行拆分,比如当前用户John在邮件中分别向他的下属Ada和Bob发送了工作内容布置方案,Ada和Bob分别在邮件中对工作安排提出了不同的意见,John基于Ada和Bob的意见对方案进行了修改,此时,需要确定与John相关的具体方案内容是什么,与Ada及Bob相关的具体方案内容分别是什么,这些与每个用户相关的具体方案内容变构成了每个目标用户相关的特定交互内容。
确定与每个目标用户相关的特定交互内容有多种方式,举例而言。对于邮箱交互内容,可以通过发送者和接收者的标签来判断每个用户的交互内容;对于当前用户与一个或多个用户之间的语音聊天记录,可以通过语音识别的方式确定语音聊天记录里面的内容属于哪个语音聊天对象,并将每个语音聊天对象的具体聊天内容作为与该语音聊天对象相关的特定交互内容。
判断模块803,用于基于确定的所述特定交互内容判断与所述特定交互内容相关的目标用户是否需要信息提示。
通过分析特定交互内容里所包含的信息,可以获得信息提示要素,用户提示要素是与用户提示相关的一条具体内容,例如,用户的日程安排信息。与传统的用户主动安排日程信息不同的是,该方法中能够根据内容数据的信息进行语义分析,进而得到用户是否需要提示信息。比如用户James在特定交互内容中提到“明天天气不错,Steven,咱们要不要一起去爬山”,这时确定用于James有可能在明天要和Steven有约会,确定需要对用户James进行信息提示,更进一步的,也可以给Steven发送信息提示。
提示模块804,用于当与所述特定交互内容相关的目标用户需要信息提示时,查找与所述特定交互内容匹配的提示信息,并在与所述特定交互内容相匹配的提示情景向与所述特定交互内容相关的目标用户展示所述提示信息。
当确定用户需要进行信息提示后,需要确定用户的提示信息的具体内容,以及在何种情景下对用户进行信息提示。
用户提示信息的具体内容,是指与用户提示要素想匹配的具体信息内容,比如用户James的用户提示要素是“明天去爬山”,那么与“明天去爬山”向匹配的信息包括:询问用户具体的出发时间、向用户推荐比较适宜的爬山地点、向用户建议爬山的注意事项、去往爬山地点可行的交通工具等信息。
除了确定提示信息的具体内容之外,还需要判断提示场景,提示场景是指向目标用户发送提示信息最合适的时间、位置等要素。比如用户David约了Mary今天晚上20:00在Rose酒店见面,从David的出发地到Rose酒店需要30分钟的行程,考虑到提前10分钟到Rose酒店,在17:20的时候,已经构成了提示信息时间提示场景,可以在此场景下向用户David发送并展示提示信息。基于同样的原理,也可以给Mary发送并展示提示信息。
展示提示信息具有多种可选方式,可以通过邮件、短信、日程提醒等方式进行展示,也可以通过专门设定的提醒设备(显示屏、伴侣机器人等)进行提醒。
通过本实施例中的方案,能够主动提取用户的整体交互内容,基于对整体交互内容的分析,确定具体的提示内容,并在合适的提示场景下向用户发送提示信息,解决了用户需要专门针对提醒事项进行单独设置的问题,同时能够获取更加综合的用户交互环境信息,提供更加全面的信息提醒。
作为另外一个实施例,参见图9,信息交互装置还包括反馈模块805,反馈模块805用于:
在与所述特定交互内容相匹配的提示情景向与所述特定交互内容相关的目标用户展示所述提示信息之后,接收与所述特定交互内容相关的目标用户输入的反馈信息;以及
基于所述反馈信息确定是否继续进行信息提示。
通过本实施例中的方案,能够主动提取用户的整体交互内容,基于对整体交互内容的分析,确定具体的提示内容,并在合适的提示场景下向用户发送提示信息,解决了用户需要专门针对提醒事项进行单独设置的问题,同时能够获取更加综合的用户交互环境信息,提供更加全面的信息提醒。
图8-9中实施例中各个模块所执行的内容与图1-7中各方法步骤执行的内容相对应,在此不再赘述。
本发明实施例还提供一种电子设备,所述电子设备包含前述任一实施例所述的装置。
图10为本发明电子设备一个实施例的结构示意图,可以实现本发明图1-7所示实施例的流程,如图10所示,上述电子设备可以包括:壳体1001、处理器1002、存储器1003、电路板1004和电源电路1005,其中,电路板1004安置在壳体1001围成的空间内部,处理器1002和存储器1003设置在电路板1004上;电源电路1005,用于为上述电子设备的各个电路或器件供电;存储器1003用于存储可执行程序代码;处理器1002通过读取存储器1003中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行前述任一实施例所述的信息交互方法。
处理器1002对上述步骤的具体执行过程以及处理器1002通过运行可执行程序代码来进一步执行的步骤,可以参见本发明图1-7所示实施例的描述,在此不再赘述。
该电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、***总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子设备。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程/,是可以通过计算机程序来指令相关的硬件来完成,软件指令数据和指令(软件的)存储在各自的存储设备中,该存储设备表现为一个或多个计算机可读或可用存储介质。存储介质包括不同形式的存储器,包括诸如半导体存储设备,例如动态或静态随即存取存储器(DRAMs或SRAMs),可擦除式和可编程式只读存储器(EEPROMs),电子可擦除式和可编程只读存储器(EEPROMs)和快闪存储器;磁盘包括固定硬盘,软盘和移动硬盘;其他磁性介质包括磁带;且光学介质,如光盘(CDs)或视频光盘(DVDs)。需要指出的是,上述软件的指令能够由一个计算机可读或计算机可用存储介质提供,或可选择地,能够由多个计算机可读或计算机可用存储介质提供,这些存储介质分布在一个具有多节点的大型***中。计算机可读或计算机可用存储介质被视为物件(或产品的物件)的一部分。物件或产品的物件是指任何生产的单个或过个部件。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种信息交互方法,其特征在于,该方法包括:
获取多个目标用户的整体交互内容;
确定与每个目标用户相关的特定交互内容;
基于确定的所述特定交互内容判断与所述特定交互内容相关的目标用户是否需要信息提示;
若是,则查找与所述特定交互内容匹配的提示信息,并在与所述特定交互内容相匹配的提示情景向与所述特定交互内容相关的目标用户展示所述提示信息。
2.根据权利要求1所述的方法,其特征在于,所述获取多个目标用户的整体交互内容,包括:
获取一个以上用户的语音交互内容,基于所述语音交互内容,确定所述整体交互内容。
3.根据权利要求2所述的方法,其特征在于,所述基于所述语音交互内容,确定所述整体交互内容,包括:
获取与所述语音交互内容对应的情景特征;
获取与所述情景特征相关联的情景特征数据库;
对所述语音交互内容进行语音识别,并将语音识别后的内容与所述情景特征数据库中的情景特征模式进行匹配,得到所述整体交互内容。
4.根据权利要求3所述的方法,其特征在于,所述基于所述语音交互内容,确定所述整体交互内容,还包括:
提取所述语音交互内容中的声纹特征信息;
获取与所述声纹特征信息相关联的用户特征数据库;
对所述语音交互内容进行语音识别,并将语音识别后的内容与所述用户特征数据库中的内容进行匹配,得到所述整体交互内容。
5.根据权利要求2所述的方法,其特征在于,所述确定与每个目标用户相关的特定交互内容,包括:
提取所述语音交互内容中的声纹特征信息;
根据所述声纹特征信息确定与所述语音交互内容相关的每个目标用户;
将所述整体交互内容与所述每个目标用户进行拆分,得到与所述每个目标用户相关的特定交互内容。
6.根据权利要求5所述的方法,其特征在于,所述将所述整体交互内容与所述每个目标用户进行拆分,得到与所述每个目标用户相关的特定交互内容,包括:
基于所述声纹特征信息对所述整体交互内容进行拆分;
获取与所述声纹特征信息相对应的用户特征数据库;
将所述整体交互内容拆分后得到的内容与所述用户特征数据库进行匹配,得到与所述每个目标用户相关的特定交互内容。
7.根据权利要求1所述的方法,其特征在于,所述多个目标用户的整体交互内容,包括:
当前用户与一个以上其他用户进行的:语音通话内容、邮件交互内容、短信交互内容、谈话交互内容、即时通信文字交互内容中的一个以上。
8.根据权利要求1所述的方法,其特征在于,所述在与所述特定交互内容相匹配的提示情景向与所述特定交互内容相关的目标用户展示所述提示信息,包括:
确定与所述交互内容匹配的提示场景;
判断当前场景是否与所述交互内容匹配的提示场景的匹配度;
当所述匹配度大于预设阈值,以预设的信息提示方式向用户展示所述提示信息。
9.根据权利要求1所述的方法,其特征在于,所述在与所述特定交互内容相匹配的提示情景向与所述特定交互内容相关的目标用户展示所述提示信息之后,还包括:
接收与所述特定交互内容相关的目标用户输入的反馈信息;以及
基于所述反馈信息确定是否继续进行信息提示。
10.一种信息交互装置,其特征在于,该装置包括:
获取模块,用于获取多个目标用户的整体交互内容;
确定模块,用于确定与每个目标用户相关的特定交互内容;
判断模块,用于基于确定的所述特定交互内容判断与所述特定交互内容相关的目标用户是否需要信息提示;
提示模块,用于当与所述特定交互内容相关的目标用户需要信息提示时,查找与所述特定交互内容匹配的提示信息,并在与所述特定交互内容相匹配的提示情景向与所述特定交互内容相关的目标用户展示所述提示信息。
CN201610538666.1A 2016-07-08 2016-07-08 一种信息交互方法、装置及电子设备 Active CN106201424B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610538666.1A CN106201424B (zh) 2016-07-08 2016-07-08 一种信息交互方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610538666.1A CN106201424B (zh) 2016-07-08 2016-07-08 一种信息交互方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN106201424A true CN106201424A (zh) 2016-12-07
CN106201424B CN106201424B (zh) 2019-10-01

Family

ID=57473997

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610538666.1A Active CN106201424B (zh) 2016-07-08 2016-07-08 一种信息交互方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN106201424B (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107146614A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种语音信号处理方法、装置及电子设备
CN107583291A (zh) * 2017-09-29 2018-01-16 深圳希格玛和芯微电子有限公司 玩具互动方法、装置及玩具
CN107977072A (zh) * 2017-07-28 2018-05-01 北京物灵智能科技有限公司 一种机器人使用的养成方法、养成专家***及电子设备
CN108399700A (zh) * 2018-01-31 2018-08-14 上海乐愚智能科技有限公司 防盗方法和智能设备
CN108537564A (zh) * 2017-03-02 2018-09-14 九阳股份有限公司 一种就餐信息推送方法及家庭服务机器人
CN108831456A (zh) * 2018-05-25 2018-11-16 深圳警翼智能科技股份有限公司 一种通过语音识别对视频标记的方法、装置及***
CN109325097A (zh) * 2018-07-13 2019-02-12 海信集团有限公司 一种语音引导方法及装置、电子设备、存储介质
CN109524001A (zh) * 2018-12-28 2019-03-26 北京金山安全软件有限公司 一种信息处理方法、装置及儿童穿戴设备
CN109754816A (zh) * 2017-11-01 2019-05-14 北京搜狗科技发展有限公司 一种语音数据处理的方法及装置
CN109767338A (zh) * 2018-11-30 2019-05-17 平安科技(深圳)有限公司 肠胃病报销流程的处理方法、装置、设备及可读存储介质
CN110111793A (zh) * 2018-02-01 2019-08-09 腾讯科技(深圳)有限公司 音频信息的处理方法、装置、存储介质及电子装置
CN110265013A (zh) * 2019-06-20 2019-09-20 平安科技(深圳)有限公司 语音的识别方法及装置、计算机设备、存储介质
CN110824940A (zh) * 2019-11-07 2020-02-21 深圳市欧瑞博科技有限公司 控制智能家居设备的方法、装置、电子设备及存储介质
CN110909142A (zh) * 2019-11-20 2020-03-24 腾讯科技(深圳)有限公司 一种问答模型的问题语句处理方法、装置、电子设备及存储介质
CN111124121A (zh) * 2019-12-24 2020-05-08 腾讯科技(深圳)有限公司 语音交互信息处理方法、装置、存储介质和计算机设备
CN111813281A (zh) * 2020-05-28 2020-10-23 维沃移动通信有限公司 信息获取方法、信息输出方法、装置和电子设备
CN111914070A (zh) * 2019-05-09 2020-11-10 上海触乐信息科技有限公司 智能信息提示助手***、信息提示方法及终端设备
CN112929502A (zh) * 2021-02-05 2021-06-08 国家电网有限公司客户服务中心 一种基于电力客服的语音识别方法及***
TWI763207B (zh) * 2020-12-25 2022-05-01 宏碁股份有限公司 聲音訊號處理評估方法及裝置
CN114661899A (zh) * 2022-02-15 2022-06-24 北京结慧科技有限公司 一种任务创建方法、装置、计算机设备和存储介质
CN114924666A (zh) * 2022-05-12 2022-08-19 上海云绅智能科技有限公司 一种应用场景的交互方法、装置、终端设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140248599A1 (en) * 2005-01-28 2014-09-04 Breakthrough Performance Tech, Llc Systems and methods for computerized interactive training
CN104933028A (zh) * 2015-06-23 2015-09-23 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN105389304A (zh) * 2015-10-27 2016-03-09 小米科技有限责任公司 事件提取方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140248599A1 (en) * 2005-01-28 2014-09-04 Breakthrough Performance Tech, Llc Systems and methods for computerized interactive training
CN104933028A (zh) * 2015-06-23 2015-09-23 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN105389304A (zh) * 2015-10-27 2016-03-09 小米科技有限责任公司 事件提取方法及装置

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108537564A (zh) * 2017-03-02 2018-09-14 九阳股份有限公司 一种就餐信息推送方法及家庭服务机器人
CN107146614A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种语音信号处理方法、装置及电子设备
CN107977072A (zh) * 2017-07-28 2018-05-01 北京物灵智能科技有限公司 一种机器人使用的养成方法、养成专家***及电子设备
CN107977072B (zh) * 2017-07-28 2021-06-08 北京物灵智能科技有限公司 一种机器人使用的养成方法、养成专家***及电子设备
CN107583291A (zh) * 2017-09-29 2018-01-16 深圳希格玛和芯微电子有限公司 玩具互动方法、装置及玩具
CN107583291B (zh) * 2017-09-29 2023-05-02 深圳希格玛和芯微电子有限公司 玩具互动方法、装置及玩具
CN109754816B (zh) * 2017-11-01 2021-04-16 北京搜狗科技发展有限公司 一种语音数据处理的方法及装置
CN109754816A (zh) * 2017-11-01 2019-05-14 北京搜狗科技发展有限公司 一种语音数据处理的方法及装置
CN108399700A (zh) * 2018-01-31 2018-08-14 上海乐愚智能科技有限公司 防盗方法和智能设备
CN110111793A (zh) * 2018-02-01 2019-08-09 腾讯科技(深圳)有限公司 音频信息的处理方法、装置、存储介质及电子装置
CN108831456A (zh) * 2018-05-25 2018-11-16 深圳警翼智能科技股份有限公司 一种通过语音识别对视频标记的方法、装置及***
CN109325097B (zh) * 2018-07-13 2022-05-27 海信集团有限公司 一种语音引导方法及装置、电子设备、存储介质
CN109325097A (zh) * 2018-07-13 2019-02-12 海信集团有限公司 一种语音引导方法及装置、电子设备、存储介质
CN109767338A (zh) * 2018-11-30 2019-05-17 平安科技(深圳)有限公司 肠胃病报销流程的处理方法、装置、设备及可读存储介质
CN109524001A (zh) * 2018-12-28 2019-03-26 北京金山安全软件有限公司 一种信息处理方法、装置及儿童穿戴设备
CN111914070A (zh) * 2019-05-09 2020-11-10 上海触乐信息科技有限公司 智能信息提示助手***、信息提示方法及终端设备
CN110265013A (zh) * 2019-06-20 2019-09-20 平安科技(深圳)有限公司 语音的识别方法及装置、计算机设备、存储介质
WO2020253064A1 (zh) * 2019-06-20 2020-12-24 平安科技(深圳)有限公司 语音的识别方法及装置、计算机设备、存储介质
CN110824940A (zh) * 2019-11-07 2020-02-21 深圳市欧瑞博科技有限公司 控制智能家居设备的方法、装置、电子设备及存储介质
CN110909142A (zh) * 2019-11-20 2020-03-24 腾讯科技(深圳)有限公司 一种问答模型的问题语句处理方法、装置、电子设备及存储介质
CN110909142B (zh) * 2019-11-20 2023-03-31 腾讯科技(深圳)有限公司 一种问答模型的问题语句处理方法、装置、电子设备及存储介质
CN111124121A (zh) * 2019-12-24 2020-05-08 腾讯科技(深圳)有限公司 语音交互信息处理方法、装置、存储介质和计算机设备
CN111813281A (zh) * 2020-05-28 2020-10-23 维沃移动通信有限公司 信息获取方法、信息输出方法、装置和电子设备
TWI763207B (zh) * 2020-12-25 2022-05-01 宏碁股份有限公司 聲音訊號處理評估方法及裝置
US11636844B2 (en) 2020-12-25 2023-04-25 Acer Incorporated Method and apparatus for audio signal processing evaluation
CN112929502A (zh) * 2021-02-05 2021-06-08 国家电网有限公司客户服务中心 一种基于电力客服的语音识别方法及***
CN114661899A (zh) * 2022-02-15 2022-06-24 北京结慧科技有限公司 一种任务创建方法、装置、计算机设备和存储介质
CN114924666A (zh) * 2022-05-12 2022-08-19 上海云绅智能科技有限公司 一种应用场景的交互方法、装置、终端设备及存储介质

Also Published As

Publication number Publication date
CN106201424B (zh) 2019-10-01

Similar Documents

Publication Publication Date Title
CN106201424B (zh) 一种信息交互方法、装置及电子设备
JP7101322B2 (ja) デジタルアシスタントのためのボイストリガ
US9905228B2 (en) System and method of performing automatic speech recognition using local private data
US9742912B2 (en) Method and apparatus for predicting intent in IVR using natural language queries
US9875740B1 (en) Using voice information to influence importance of search result categories
US9502032B2 (en) Dynamically biasing language models
US9502031B2 (en) Method for supporting dynamic grammars in WFST-based ASR
US9786281B1 (en) Household agent learning
KR20180070684A (ko) 다이얼로그 시스템들에서의 파라미터 수집 및 자동 다이얼로그 생성
KR20200007011A (ko) 다수의 컴퓨팅 장치를 이용한 인터콤 스타일 통신
CN107004410A (zh) 语音和连接平台
US9502029B1 (en) Context-aware speech processing
CN105320726A (zh) 降低对手动开始/结束点和触发短语的需求
KR101891492B1 (ko) 답변을 변형하여 상황에 맞는 자연어 대화를 제공하는 방법, 컴퓨터 장치 및 컴퓨터 판독가능 기록 매체
CN105009203A (zh) 用于检测语音命令的方法和装置
CN103078995A (zh) 一种在移动终端使用的可定制的个性化应答方法和***
CN103035240A (zh) 用于使用上下文信息的语音识别修复的方法和***
Neustein Advances in speech recognition: mobile environments, call centers and clinics
CN106341539A (zh) 恶意来电者声纹的自动取证方法、装置和移动终端
KR102120751B1 (ko) 대화 이해 ai 시스템에 의하여, 머신러닝을 대화 관리 기술에 적용한 하이브리드 계층적 대화 흐름 모델을 기초로 답변을 제공하는 방법 및 컴퓨터 판독가능 기록 매체
CN112567718A (zh) 响应用户语音执行包括呼叫的任务的电子装置及操作方法
US11381675B2 (en) Command based interactive system and a method thereof
CN112513978A (zh) 热词辨识和被动辅助
US20220161131A1 (en) Systems and devices for controlling network applications
US11798538B1 (en) Answer prediction in a speech processing system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant