CN109151225A - 通话处理方法、装置和通话设备 - Google Patents

通话处理方法、装置和通话设备 Download PDF

Info

Publication number
CN109151225A
CN109151225A CN201811025393.6A CN201811025393A CN109151225A CN 109151225 A CN109151225 A CN 109151225A CN 201811025393 A CN201811025393 A CN 201811025393A CN 109151225 A CN109151225 A CN 109151225A
Authority
CN
China
Prior art keywords
information
user
display
impression window
setting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811025393.6A
Other languages
English (en)
Inventor
陈剑峰
宋晨枫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Xiaodu Technology Co Ltd
Original Assignee
Beijing Fish In Home Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Fish In Home Technology Co Ltd filed Critical Beijing Fish In Home Technology Co Ltd
Priority to CN201811025393.6A priority Critical patent/CN109151225A/zh
Publication of CN109151225A publication Critical patent/CN109151225A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例公开了一种通话处理方法、装置和通话设备。所述方法包括:实时获取通话过程中的用户语音信息,所述用户语音信息包括:本机通话方的语音信息,和/或其他通话方的语音信息;通过语音转文字技术,将用户语音信息转换为用户文本信息;如果确定在用户文本信息中识别出设定关键词,则获取与设定关键词匹配的展示信息;在显示屏幕中弹出信息展示窗口,并将展示信息在信息展示窗口内进行显示。本发明实施例的技术方案解决了现有技术中无法将通话过程中提及的信息及时进行展示的技术缺陷,使得用户可以及时对通话对方提及的信息有更加直观的了解,进而提高了通话的有效性和效率,同时也提高了用户的通话体验。

Description

通话处理方法、装置和通话设备
技术领域
本发明实施例涉及通话技术领域,尤其涉及一种通话处理方法、装置和通话设备。
背景技术
随着网络通讯技术以及移动电话等通话设备的不断发展,人们的通话方式发生了质的变化。
现如今人们可以通过通话设备实现多方同时参与的语音通话,以及两方或多方同时参与的视频通话,丰富了人们的交流方式,同时大大地提高了人们的交流效率。
发明人在实现本发明的过程中,发现现有技术存在如下缺陷:在通话过程中,无法将通话方提及的内容及时进行展示。同时,如果对于通话过程中有一些需要辅助展示的信息,需要用额外的第二设备进行联网搜索和匹配,才能看到相关内容。
发明内容
有鉴于此,本发明实施例提供了一种通话处理方法、装置和通话设备,以优化现有的通话方式。
在第一方面,本发明实施例提供了一种通话处理方法,包括:
实时获取通话过程中的用户语音信息,所述用户语音信息包括:本机通话方的语音信息,和/或其他通话方的语音信息;
通过语音转文字技术,将所述用户语音信息转换为用户文本信息;
如果确定在所述用户文本信息中识别出设定关键词,则获取与所述设定关键词匹配的展示信息;
在显示屏幕中弹出信息展示窗口,并将所述展示信息在所述信息展示窗口内进行显示。
在上述方法中,可选的是,所述通话过程包括:视频通话过程或者语音通话过程;
所述实时获取通话过程中的用户语音信息,包括:
实时获取通话过程中,通过话筒接收的本机通话方的语音信息,和/或,
通过听筒或者扬声器传输的其他通话方的语音信息。
在上述方法中,可选的是,在所述实时获取通话过程中的用户语音信息之后,还包括:
识别与所述用户语音信息匹配的目标用户标识;
根据预先设定的用户标识与识别词库之间的映射关系,获取与所述目标用户标识匹配的目标识别词库;
所述确定在所述用户文本信息中识别出设定关键词,包括:
将所述用户文本信息与所述目标识别词库进行匹配,如果确定所述用户文本信息命中所述目标识别词库中的识别词,则确定所述用户文本信息中识别出设定关键词。
在上述方法中,可选的是,所述获取与所述设定关键词匹配的展示信息,包括:
根据所述设定关键词进行网络搜索或者本地搜索,在搜索结果中获取与所述设定关键词匹配的展示信息;和/或
根据所述设定关键词查询预先建立的关键词与展示信息映射表,获取与所述设定关键词匹配的展示信息。
在上述方法中,可选的是,所述在显示屏幕中弹出信息展示窗口,并将所述展示信息在所述信息展示窗口内进行显示,包括:
如果确定所述显示屏幕中不存在目标尺寸的空白显示位置,则获取所述显示屏幕中当前显示的至少一个显示窗口的显示参数,所述显示参数包括:显示尺寸,和/或显示位置;
根据所述目标尺寸,对所述至少一个显示窗口进行设定缩放比例的缩小处理和/或位置重布局处理,以形成所述空白显示位置;
在所述空白显示位置处,弹出所述信息展示窗口,并将所述展示信息在所述信息展示窗口内进行显示。
在上述方法中,可选的是,所述在显示屏幕中弹出信息展示窗口,并将所述展示信息在所述信息展示窗口内进行显示,包括:
在所述显示屏幕中弹出全屏显示的所述信息展示窗口,并设定倒计时时间;
在所述倒计时时间内,将所述展示信息在所述信息展示窗口内进行显示,并在所述倒计时时间结束时,取消对所述信息展示窗口的显示。
在上述方法中,可选的是,还包括:
在将所述展示信息在所述信息展示窗口内进行显示的过程中,如果接收到分享指令,则将所述本机通话方的屏幕显示内容提供给所述其他通话方。
在第二方面,本发明实施例提供了一种通话处理装置,包括:
用户语音信息获取模块,用于实时获取通话过程中的用户语音信息,所述用户语音信息包括:本机通话方的语音信息,和/或其他通话方的语音信息;
语音文字转换模块,用于通过语音转文字技术,将所述用户语音信息转换为用户文本信息;
展示信息获取模块,用于如果确定在所述用户文本信息中识别出设定关键词,则获取与所述设定关键词匹配的展示信息;
展示信息展示模块,用于在显示屏幕中弹出信息展示窗口,并将所述展示信息在所述信息展示窗口内进行显示。
在上述装置中,可选的是,还包括:
分享模块,用于在将所述展示信息在所述信息展示窗口内进行显示的过程中,如果接收到分享指令,则将所述本机通话方的屏幕显示内容提供给所述其他通话方。
在第三方面,本发明实施例提供了一种通话设备,所述通话设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
屏幕,用于显示图像信息;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例所述的通话处理方法。
本发明实施例提供了一种通话处理方法、装置和通话设备,通过将用户的语音信息转换为文本信息,并将与文本信息匹配的展示信息进行显示,解决了现有技术中无法将通话过程中提及的信息及时进行展示的技术缺陷,使得用户可以及时对通话对方提及的信息有更加直观的了解,进而提高了通话的有效性和效率,同时也提高了用户的通话体验。
附图说明
图1是本发明实施例一提供的一种通话处理方法的流程图;
图2是本发明实施例二提供的一种通话处理方法的流程图;
图3是本发明实施例三提供的一种通话处理装置的结构图;
图4是本发明实施例四提供的一种通话设备的结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1为本发明实施例一提供的一种通话处理方法的流程图,本实施例的方法可以通话处理装置来执行,该装置可通过硬件和/或软件的方式实现,并一般可集成于通话设备中,例如移动电话、平板电脑或者视频通话机器人等。本实施例的方法具体包括:
S110、实时获取通话过程中的用户语音信息,用户语音信息包括:本机通话方的语音信息,和/或其他通话方的语音信息。
可以理解的是,用户在通话过程中,经常会对衣服、生活用品、食物等等与生活息息相关的物品进行讨论,但是仅仅通过语言的描述难以使用户对物品有一个直观、深入的了解,甚至还有可能产生错误的理解。然而,通过本实施例中的通话处理方法可以将通话过程中提及的物品、视频等内容及时展现给通话方,使得通话方可以及时对通话过程中提及的物品、视频等内容有直观、深入的了解。
在本实施例中,通话过程具体可以是双方或多方的语音通话过程,也可以是双方或多方的视频通话过程等。
在本实施例中,用户语音信息具体可以是本机通话方的语音信息,也可以是其他通话方的语音信息(如果其他通话方为多个通话方,那么用户语音信息具体可以是其他通话方中的任意一方通话方,任意多方通话方或所有通话方的语音信息),还可以是本机通话方以及其他通话方的语音信息。
进一步地,考虑到从一个通话方(本机通话方或其他通话方)所获取的语音信息可能是多个用户的语音信息(例如家长在通话时孩子插话的情况),那么可以对所获取的语音进行有效性筛选。具体来说,可以将获取的语音与预先存储的有效语音进行比对,然后仅对与有效语音相匹配的用户语音信息实施步骤120。
S120、通过语音转文字技术,将用户语音信息转换为用户文本信息。
在本实施例中,在获取用户的语音信息之后,会通过语音转文字技术将所有语音信息转换为用户文本信息,其中,语音转文字技术属于现有技术,在此不再进行详细阐述。
进一步地,在本实施例中,对于用户文本信息而言,不同通话方的用户语音信息转换后的用户文本信息既可以依据不同的通话方进行区分(第一种情况),也可以不进行区分。
对于上述第一种情况来说,具体可以是通过对用户文本信息添加标识来区分不同通话方对应的用户文本信息,其中,标识具体可以是通话方的设备编号等内容。
可以理解的是,通话方对于通话过程中自身所提及的内容一般都有一定的了解,因此就无需将通话方自身提及的内容对该通话方进行展示,所以,通过将用户文本信息依据不同的通话方进行区分,可以实现对步骤130中获取的展示信息的展示对象进行有效控制,例如可以不对通话方展示其自身的用户语音信息对应的展示信息,由此可以减少通话处理装置的数据计算量,进而提高数据处理速度。
S130、如果确定在用户文本信息中识别出设定关键词,则获取与设定关键词匹配的展示信息。
在本实施例中,设定关键词具体可以是用户预先设定并存储的词语,还可以是通过网络搜索到的网络热词,还可以是通过网络搜索到的各类别词语中搜索次数大于设定次数的词语等词语。
在本实施例中,与设定关键词匹配的展示信息的获取方式具体可以是通过网络搜索设定关键词获取展示信息等。
示例性地,如果设定关键词是“德国柏曼筒灯”,那么展示信息可以是通过京东商城搜索得到的德国柏曼筒灯的搜索结果列表,或是通过百度搜索得到的德国柏曼筒灯的简介等。
S140、在显示屏幕中弹出信息展示窗口,并将展示信息在信息展示窗口内进行显示。
在本实施例中,信息展示窗口具体可以是设定尺寸的信息展示窗口,也可以是尺寸与当前显示屏幕的尺寸相匹配的信息展示窗口,还可以是根据真展示信息的数量自动调整尺寸的信息展示窗口等。
进一步地,如果与设定关键词匹配的展示信息为多个类别的展示信息,那么可以根据预先设定的信息类别优先级对不同类别的展示信息在信息展示窗口中先后进行展示,也可以仅对优先级别最高的展示信息进行展示,还可以同时将多个类别的展示信息同时在信息展示窗口中进行展示等,本实施例对此不进行限制。
本发明实施例提供了一种通话处理方法,该方法通过将用户的语音信息转换为文本信息,并将与文本信息匹配的展示信息进行显示,解决了现有技术中无法将通话过程中提及的信息及时进行展示的技术缺陷,使得用户可以及时对通话对方提及的信息有更加直观的了解,进而提高了通话的有效性和效率,同时也提高了用户的通话体验。
实施例二
图2是本发明实施例二提供的一种通话处理方法的流程图。本实施例以上述实施例为基础进行优化,在本实施例中,给出了一种具体化通话过程和用户语音信息获取方式,增加目标词库获取过程,具体化设定关键词确定过程,具体化展示信息获取方式,具体化展示信息显示方法的具体实施方式。
相应的,本实施例的方法具体包括:
S210、实时获取视频通话过程或者语音通话过程中,通过话筒接收的本机通话方的语音信息,和/或,通过听筒或者扬声器传输的其他通话方的语音信息。
一般来说,在通话过程中,通话设备都是通过话筒获取当前用户的通话语音,并通过听筒或扬声器播放其他通话方的通话语音。因此,在本实施例中,本机通话方的语音信息具体为通过本机的话筒接收到的语音信息,其他通话方的语音信息具体为通过听筒或扬声器传输的语音信息。
S220、识别与用户语音信息匹配的目标用户标识。
可以理解的是,不同的用户具有不同的语言表述习惯,同时也具有不同的事物关注点。例如,不同的用户可能会通过“电脑”、“计算机”以及“台式机”等不同的词语来表述同样一个事物,如果同时将“电脑”、“计算机”以及“台式机”都设置为设定关键词,那么会大大降低用户文本信息与设定关键词的匹配速度。再者,不同的用户对事物有不同的喜好,因此不同的用户在通话过程中对提及同一类别的词语的概率不尽相同。例如,用户A喜好美食,那么用户A在通话过程中提及食物类别词语的概率就会较高,用户B喜好汽车,那么用户B在通过过程中提及汽车相关词语的概率就会较高。如果将所有类别的词语都设置为设定关键词,那么必然会大大降低用户文本信息与设定关键词的匹配速度。
因此,在本实施例中,对不同的通话方设置了不同的识别词库,并通过将识别词库与用户标识建立映射关系来确定与用户语音信息对应的识别词库。
在本实施例中,具体可以通过辨别用户语音信息的声纹来确定与该用户语音信息匹配的目标用户标识。其中,目标用户标识具体可以是用于表述声纹特征的数据,也可以是数字或字母类编号等。
S230、根据预先设定的用户标识与识别词库之间的映射关系,获取与目标用户标识匹配的目标识别词库。
在本实施例中,不同的用户标识对应不同的识别词库,也就是说,在对不同的通话方的用户语音信息进行识别时,所使用的词库是不同的。识别词库中的词语具体可以是依据用户标识对应的通话方的语言习惯、自身喜好等信息进行个性化设置得到的。
S240、通过语音转文字技术,将用户语音信息转换为用户文本信息。
S250、将用户文本信息与目标识别词库进行匹配,如果确定用户文本信息命中目标识别词库中的识别词,则确定用户文本信息中识别出设定关键词。
S260、根据设定关键词进行网络搜索或者本地搜索,在搜索结果中获取与设定关键词匹配的展示信息。
在本实施例中,展示信息具体是通过对设定关键词进行网络搜索或本地搜索获取的。当然,展示信息的获取方式并不只限于此,还可以是根据预先建立的关键词与展示信息映射表获取语设定关键词匹配的展示信息。
S270、在显示屏幕中弹出全屏显示的信息展示窗口,并设定倒计时时间。
在本实施例中,展示信息在显示屏幕中是进行全屏显示的,并且对显示时间进行了限制,显示时间等于设定倒计时时间。
可以理解的是,在通话过程中,各通话方可能会在短时间内提及不同的事物,因此,为了尽量对通话方所提及的事物均进行展示,在本实施例中对展示信息的显示时间进行了限定。当然,还可以通过词语类别等分类方式对不同的展示信息设定不同的倒计时时间。
S280、在倒计时时间内,将展示信息在信息展示窗口内进行显示,并在倒计时时间结束时,取消对信息展示窗口的显示。
本发明实施例提供了一种通话处理方法,该方法具体化了通话过程和用户语音信息获取方式,增加了目标词库获取过程以及具体化了设定关键词确定过程,缩短了设定关键词的识别时间,提高了设定关键词的识别准确度,具体化了展示信息获取方式,提高了展示信息的信息准确度,具体化了展示信息显示方法,保证了所有展示信息均可有效显示。
在上述各实施例的基础上,将在显示屏幕中弹出信息展示窗口,并将展示信息在信息展示窗口内进行显示,具体化为:如果确定显示屏幕中不存在目标尺寸的空白显示位置,则获取显示屏幕中当前显示的至少一个显示窗口的显示参数,显示参数包括:显示尺寸,和/或显示位置;根据目标尺寸,对至少一个显示窗口进行设定缩放比例的缩小处理和/或位置重布局处理,以形成空白显示位置;在空白显示位置处,弹出信息展示窗口,并将展示信息在信息展示窗口内进行显示。
在本实施方式中,可以首先确定该信息展示窗口需要的显示尺寸,也即目标尺寸,如果当前的显示屏幕中存在目标尺寸的空白显示位置,可以直接在该空白显示位置上对应显示该信息展示窗口;如果当前的显示屏幕中不存在目标尺寸的空白显示位置,则需要将显示屏幕中当前显示的显示窗口进行一定的缩小处理或者移动处理,以形成该空白显示位置,并在该空白显示位置处,弹出信息展示窗口,并将展示信息在信息展示窗口内进行显示。
这样设置的好处是:使得展示信息可以在不影响当前屏幕显示内容的基础上进行有效显示,优化了展示信息的显示效果。
在上述各实施例的基础上,还具体包括:在将展示信息在信息展示窗口内进行显示的过程中,如果接收到分享指令,则将本机通话方的屏幕显示内容提供给其他通话方,以使得其他通话方也能获取上述展示信息。
在本实施例中,可以由用户自行选择是否将展示信息提供给其他通话方进行显示。具体而言,用户可以通过控件输入分享指令,以控制将展示信息提供给其他通话方进行显示。进一步地,还可以针对是否分享展示信息添加设置项,用户可以在通话开始之前,对上述设置项进行设置,以确定是否在通话过程中将展示信息分享给其他通话方进行显示。
这样设置的好处是:进一步提高了通话的有效性和效率,提高多个通话用户的通话体验。
实施例三
图3是本发明实施例三提供的一种通话处理装置的结构图。如图3所示,所述装置包括:用户语音信息获取模块301、语音文字转换模块302、展示信息获取模块303以及展示信息展示模块304,其中:
用户语音信息获取模块301,用于实时获取通话过程中的用户语音信息,用户语音信息包括:本机通话方的语音信息,和/或其他通话方的语音信息;
语音文字转换模块302,用于通过语音转文字技术,将用户语音信息转换为用户文本信息;
展示信息获取模块303,用于如果确定在用户文本信息中识别出设定关键词,则获取与设定关键词匹配的展示信息;
展示信息展示模块304,用于在显示屏幕中弹出信息展示窗口,并将展示信息在信息展示窗口内进行显示。
本发明实施例提供了一种通话处理装置,该装置首先通过用户语音信息获取模块301实时获取通话过程中的用户语音信息,用户语音信息包括:本机通话方的语音信息,和/或其他通话方的语音信息,然后通过语音文字转换模块302通过语音转文字技术,将用户语音信息转换为用户文本信息,再通过展示信息获取模块303如果确定在用户文本信息中识别出设定关键词,则获取与设定关键词匹配的展示信息,最后通过展示信息展示模块304在显示屏幕中弹出信息展示窗口,并将展示信息在信息展示窗口内进行显示。
该装置解决了现有技术中无法将通话过程中提及的信息及时进行展示的技术缺陷,使得用户可以及时对通话对方提及的信息有更加直观的了解,进而提高了通话的有效性和效率,同时也提高了用户的通话体验。
在上述各实施例的基础上,还可以包括:
分享模块,用于在将所述展示信息在所述信息展示窗口内进行显示的过程中,如果接收到分享指令,则将所述本机通话方的屏幕显示内容提供给所述其他通话方。
在上述各实施例的基础上,还可以包括:
用户标识识别模块,用于在实时获取通话过程中的用户语音信息之后,识别与用户语音信息匹配的目标用户标识;
目标识别词库获取模块,用于根据预先设定的用户标识与识别词库之间的映射关系,获取与目标用户标识匹配的目标识别词库;
展示信息获取模块303具体可以用于:
将用户文本信息与目标识别词库进行匹配,如果确定用户文本信息命中目标识别词库中的识别词,则确定用户文本信息中识别出设定关键词。
在上述各实施例的基础上,展示信息获取模块303具体可以用于:
根据设定关键词进行网络搜索或者本地搜索,在搜索结果中获取与设定关键词匹配的展示信息;和/或
根据设定关键词查询预先建立的关键词与展示信息映射表,获取与设定关键词匹配的展示信息。
在上述各实施例的基础上,展示信息展示模块304可以包括:
显示参数获取单元,用于如果确定显示屏幕中不存在目标尺寸的空白显示位置,则获取显示屏幕中当前显示的至少一个显示窗口的显示参数,显示参数包括:显示尺寸,和/或显示位置;
布局单元,用于根据目标尺寸,对至少一个显示窗口进行设定缩放比例的缩小处理和/或位置重布局处理,以形成空白显示位置;
显示单元,用于在空白显示位置处,弹出信息展示窗口,并将展示信息在信息展示窗口内进行显示。
在上述各实施例的基础上,展示信息展示模块304可以包括:
时间设定单元,用于在显示屏幕中弹出全屏显示的信息展示窗口,并设定倒计时时间;
计时单元,用于在倒计时时间内,将展示信息在信息展示窗口内进行显示,并在倒计时时间结束时,取消对信息展示窗口的显示。
在上述各实施例的基础上,还可以包括:
显示内容提供模块,用于在将展示信息在信息展示窗口内进行显示的过程中,将本机通话方的屏幕显示内容提供给其他通话方。
本发明实施例所提供的通话处理装置可用于执行本发明任意实施例提供的通话处理方法,具备相应的功能模块,实现相同的有益效果。
实施例四
图4为本发明实施例四提供的一种通话设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性通话设备12的框图。图4显示的通话设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,通话设备12以通用计算设备的形式表现。通话设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,***存储器28,连接不同***组件(包括***存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及***组件互连(PCI)总线。
通话设备12典型地包括多种计算机***可读介质。这些介质可以是任何能够被通话设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
***存储器28可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。通话设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***34可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
通话设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该通话设备12交互的设备通信,和/或与使得该通话设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,通话设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与通话设备12的其它模块通信。应当明白,尽管图中未示出,可以结合通话设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
处理单元16通过运行存储在***存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的通话处理方法。也即:实时获取通话过程中的用户语音信息,所述用户语音信息包括:本机通话方的语音信息,和/或其他通话方的语音信息;通过语音转文字技术,将所述用户语音信息转换为用户文本信息;如果确定在所述用户文本信息中识别出设定关键词,则获取与所述设定关键词匹配的展示信息;在显示屏幕中弹出信息展示窗口,并将所述展示信息在所述信息展示窗口内进行显示。
实施例五
本发明实施例五还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于实现本发明实施例所述的通话处理方法。也即:实时获取通话过程中的用户语音信息,所述用户语音信息包括:本机通话方的语音信息,和/或其他通话方的语音信息;通过语音转文字技术,将所述用户语音信息转换为用户文本信息;如果确定在所述用户文本信息中识别出设定关键词,则获取与所述设定关键词匹配的展示信息;在显示屏幕中弹出信息展示窗口,并将所述展示信息在所述信息展示窗口内进行显示。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种通话处理方法,其特征在于,包括:
实时获取通话过程中的用户语音信息,所述用户语音信息包括:本机通话方的语音信息,和/或其他通话方的语音信息;
通过语音转文字技术,将所述用户语音信息转换为用户文本信息;
如果确定在所述用户文本信息中识别出设定关键词,则获取与所述设定关键词匹配的展示信息;
在显示屏幕中弹出信息展示窗口,并将所述展示信息在所述信息展示窗口内进行显示。
2.根据权利要求1所述的方法,其特征在于,所述通话过程包括:视频通话过程或者语音通话过程;
所述实时获取通话过程中的用户语音信息,包括:
实时获取通话过程中,通过话筒接收的本机通话方的语音信息,和/或,
通过听筒或者扬声器传输的其他通话方的语音信息。
3.根据权利要求1所述的方法,其特征在于,在所述实时获取通话过程中的用户语音信息之后,还包括:
识别与所述用户语音信息匹配的目标用户标识;
根据预先设定的用户标识与识别词库之间的映射关系,获取与所述目标用户标识匹配的目标识别词库;
所述确定在所述用户文本信息中识别出设定关键词,包括:
将所述用户文本信息与所述目标识别词库进行匹配,如果确定所述用户文本信息命中所述目标识别词库中的识别词,则确定所述用户文本信息中识别出设定关键词。
4.根据权利要求1所述的方法,其特征在于,所述获取与所述设定关键词匹配的展示信息,包括:
根据所述设定关键词进行网络搜索或者本地搜索,在搜索结果中获取与所述设定关键词匹配的展示信息;和/或
根据所述设定关键词查询预先建立的关键词与展示信息映射表,获取与所述设定关键词匹配的展示信息。
5.根据权利要求1所述的方法,其特征在于,所述在显示屏幕中弹出信息展示窗口,并将所述展示信息在所述信息展示窗口内进行显示,包括:
如果确定所述显示屏幕中不存在目标尺寸的空白显示位置,则获取所述显示屏幕中当前显示的至少一个显示窗口的显示参数,所述显示参数包括:显示尺寸,和/或显示位置;
根据所述目标尺寸,对所述至少一个显示窗口进行设定缩放比例的缩小处理和/或位置重布局处理,以形成所述空白显示位置;
在所述空白显示位置处,弹出所述信息展示窗口,并将所述展示信息在所述信息展示窗口内进行显示。
6.根据权利要求1所述的方法,其特征在于,所述在显示屏幕中弹出信息展示窗口,并将所述展示信息在所述信息展示窗口内进行显示,包括:
在所述显示屏幕中弹出全屏显示的所述信息展示窗口,并设定倒计时时间;
在所述倒计时时间内,将所述展示信息在所述信息展示窗口内进行显示,并在所述倒计时时间结束时,取消对所述信息展示窗口的显示。
7.根据权利要求1-6任一项所述的方法,其特征在于,还包括:
在将所述展示信息在所述信息展示窗口内进行显示的过程中,如果接收到分享指令,则将所述本机通话方的屏幕显示内容提供给所述其他通话方。
8.一种通话处理装置,其特征在于,包括:
用户语音信息获取模块,用于实时获取通话过程中的用户语音信息,所述用户语音信息包括:本机通话方的语音信息,和/或其他通话方的语音信息;
语音文字转换模块,用于通过语音转文字技术,将所述用户语音信息转换为用户文本信息;
展示信息获取模块,用于如果确定在所述用户文本信息中识别出设定关键词,则获取与所述设定关键词匹配的展示信息;
展示信息展示模块,用于在显示屏幕中弹出信息展示窗口,并将所述展示信息在所述信息展示窗口内进行显示。
9.根据权利要求8所述的装置,其特征在于,还包括:
分享模块,用于在将所述展示信息在所述信息展示窗口内进行显示的过程中,如果接收到分享指令,则将所述本机通话方的屏幕显示内容提供给所述其他通话方。
10.一种通话设备,其特征在于,所述通话设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
屏幕,用于显示图像信息;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一项所述的通话处理方法。
CN201811025393.6A 2018-09-04 2018-09-04 通话处理方法、装置和通话设备 Pending CN109151225A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811025393.6A CN109151225A (zh) 2018-09-04 2018-09-04 通话处理方法、装置和通话设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811025393.6A CN109151225A (zh) 2018-09-04 2018-09-04 通话处理方法、装置和通话设备

Publications (1)

Publication Number Publication Date
CN109151225A true CN109151225A (zh) 2019-01-04

Family

ID=64826634

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811025393.6A Pending CN109151225A (zh) 2018-09-04 2018-09-04 通话处理方法、装置和通话设备

Country Status (1)

Country Link
CN (1) CN109151225A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109819122A (zh) * 2019-03-12 2019-05-28 安徽赛迪信息技术有限公司 一种客户信息分析***
CN109960805A (zh) * 2019-03-26 2019-07-02 北京博瑞彤芸文化传播股份有限公司 一种基于语义领域划分的智能语义匹配方法
CN111435981A (zh) * 2019-01-11 2020-07-21 华为技术有限公司 通话处理方法及装置
CN111756930A (zh) * 2020-06-28 2020-10-09 维沃移动通信有限公司 通信控制方法、通信控制装置、电子设备和可读存储介质
CN111782172A (zh) * 2020-06-24 2020-10-16 大众问问(北京)信息科技有限公司 一种信息展示方法和装置
CN111833864A (zh) * 2019-04-22 2020-10-27 北京京东尚科信息技术有限公司 信息处理方法、装置、***和可读介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103067569A (zh) * 2012-12-10 2013-04-24 广东欧珀移动通信有限公司 一种智能手机多窗口显示方法和装置
US20130297308A1 (en) * 2012-05-07 2013-11-07 Lg Electronics Inc. Method for displaying text associated with audio file and electronic device
CN103903621A (zh) * 2012-12-26 2014-07-02 联想(北京)有限公司 一种语音识别的方法及电子设备
CN104349109A (zh) * 2013-08-09 2015-02-11 联想(北京)有限公司 一种信息处理方法及电子设备
CN104464735A (zh) * 2014-12-12 2015-03-25 宇龙计算机通信科技(深圳)有限公司 语音信息识别方法、语音信息识别装置与终端
CN104854550A (zh) * 2012-12-06 2015-08-19 三星电子株式会社 显示设备及控制显示设备的方法
CN105279202A (zh) * 2014-07-25 2016-01-27 中兴通讯股份有限公司 一种检索信息的方法及装置
CN105550235A (zh) * 2015-12-07 2016-05-04 小米科技有限责任公司 信息获取方法及装置
CN106385509A (zh) * 2016-09-23 2017-02-08 广东小天才科技有限公司 一种来电提醒方法及装置
CN106502528A (zh) * 2016-09-29 2017-03-15 奇酷互联网络科技(深圳)有限公司 显示窗口的调节方法、装置和终端设备
CN106605224A (zh) * 2016-08-15 2017-04-26 北京小米移动软件有限公司 信息搜索方法、装置、电子设备及服务器
CN107222757A (zh) * 2017-07-05 2017-09-29 深圳创维数字技术有限公司 一种语音搜索方法、机顶盒、存储介质、服务器和***

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130297308A1 (en) * 2012-05-07 2013-11-07 Lg Electronics Inc. Method for displaying text associated with audio file and electronic device
CN104854550A (zh) * 2012-12-06 2015-08-19 三星电子株式会社 显示设备及控制显示设备的方法
CN103067569A (zh) * 2012-12-10 2013-04-24 广东欧珀移动通信有限公司 一种智能手机多窗口显示方法和装置
CN103903621A (zh) * 2012-12-26 2014-07-02 联想(北京)有限公司 一种语音识别的方法及电子设备
CN104349109A (zh) * 2013-08-09 2015-02-11 联想(北京)有限公司 一种信息处理方法及电子设备
CN105279202A (zh) * 2014-07-25 2016-01-27 中兴通讯股份有限公司 一种检索信息的方法及装置
CN104464735A (zh) * 2014-12-12 2015-03-25 宇龙计算机通信科技(深圳)有限公司 语音信息识别方法、语音信息识别装置与终端
CN105550235A (zh) * 2015-12-07 2016-05-04 小米科技有限责任公司 信息获取方法及装置
CN106605224A (zh) * 2016-08-15 2017-04-26 北京小米移动软件有限公司 信息搜索方法、装置、电子设备及服务器
CN106385509A (zh) * 2016-09-23 2017-02-08 广东小天才科技有限公司 一种来电提醒方法及装置
CN106502528A (zh) * 2016-09-29 2017-03-15 奇酷互联网络科技(深圳)有限公司 显示窗口的调节方法、装置和终端设备
CN107222757A (zh) * 2017-07-05 2017-09-29 深圳创维数字技术有限公司 一种语音搜索方法、机顶盒、存储介质、服务器和***

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111435981A (zh) * 2019-01-11 2020-07-21 华为技术有限公司 通话处理方法及装置
CN111435981B (zh) * 2019-01-11 2021-06-08 华为技术有限公司 通话处理方法及装置
CN109819122A (zh) * 2019-03-12 2019-05-28 安徽赛迪信息技术有限公司 一种客户信息分析***
CN109960805A (zh) * 2019-03-26 2019-07-02 北京博瑞彤芸文化传播股份有限公司 一种基于语义领域划分的智能语义匹配方法
CN111833864A (zh) * 2019-04-22 2020-10-27 北京京东尚科信息技术有限公司 信息处理方法、装置、***和可读介质
CN111833864B (zh) * 2019-04-22 2024-04-16 北京京东尚科信息技术有限公司 信息处理方法、装置、***和可读介质
CN111782172A (zh) * 2020-06-24 2020-10-16 大众问问(北京)信息科技有限公司 一种信息展示方法和装置
CN111782172B (zh) * 2020-06-24 2024-03-12 大众问问(北京)信息科技有限公司 一种信息展示方法和装置
CN111756930A (zh) * 2020-06-28 2020-10-09 维沃移动通信有限公司 通信控制方法、通信控制装置、电子设备和可读存储介质

Similar Documents

Publication Publication Date Title
CN109151225A (zh) 通话处理方法、装置和通话设备
US10522146B1 (en) Systems and methods for recognizing and performing voice commands during advertisement
US10079014B2 (en) Name recognition system
US10185711B1 (en) Speech recognition and summarization
KR102300606B1 (ko) 자연어 대화에 관련되는 정보의 시각적 제시
US10558701B2 (en) Method and system to recommend images in a social application
US11682393B2 (en) Method and system for context association and personalization using a wake-word in virtual personal assistants
CN108885873A (zh) 使用自适应阈值的说话者识别
US8495051B2 (en) Search engine inference based virtual assistance
US20200012724A1 (en) Bidirectional speech translation system, bidirectional speech translation method and program
WO2019088384A1 (ko) 답변을 변형하여 풍부한 표현의 자연어 대화를 제공하는 방법, 컴퓨터 장치 및 컴퓨터 판독가능 기록 매체
EP2385520A2 (en) Method and device for generating text from spoken word
WO2019242414A1 (zh) 语音处理方法、装置、存储介质及电子设备
WO2019132135A1 (ko) 사용자간 대화 세션에 대한 능동적 모니터링 및 개입을 제공하는 대화형 ai 에이전트 시스템, 방법 및 컴퓨터 판독가능 기록 매체
CN108055617A (zh) 一种麦克风的唤醒方法、装置、终端设备及存储介质
US20180068659A1 (en) Voice recognition device and voice recognition method
WO2019088383A1 (ko) 적시에 간투사 답변을 제공함으로써 자연어 대화를 제공하는 방법, 컴퓨터 장치 및 컴퓨터 판독가능 기록 매체
WO2015102125A1 (ko) 문자형 대화 시스템 및 방법
WO2019156537A1 (ko) 보안 등과 관련된 서비스를, 사용자간 대화 세션에 대한 모니터링에 기초하고 대화 세션 또는 별도의 세션을 통해, 능동적으로 제공하는 대화형 ai 에이전트 시스템, 방법 및 컴퓨터 판독가능 기록 매체
CN110379406A (zh) 语音评论转换方法、***、介质和电子设备
WO2019168235A1 (ko) 복수 개의 같은 유형의 엔티티 정보의 분석에 기초한 인텐트 결정을 제공하는 방법 및 대화형 ai 에이전트 시스템, 및 컴퓨터 판독가능 기록 매체
CN108268443A (zh) 确定话题点转移以及获取回复文本的方法、装置
WO2019228140A1 (zh) 指令执行方法、装置、存储介质及电子设备
WO2023146030A1 (ko) 감성, 집중도, 대화를 통합한 인공지능 기반 상호작용 장치, 방법 및 프로그램
CN113505596B (zh) 话题切换标记方法、装置及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20210512

Address after: 201210 4 / F, building 1, 701 Naxian Road, Shanghai pilot Free Trade Zone, Pudong New Area, Shanghai, China

Applicant after: Shanghai Xiaodu Technology Co.,Ltd.

Address before: 100012 3rd floor, building 10, No.18 ziyue Road, Chaolai science and Technology Industrial Park, No.1, Laiguangying middle street, Chaoyang District, Beijing

Applicant before: AINEMO Inc.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20190104

RJ01 Rejection of invention patent application after publication