CN107680598A - 基于好友声纹通讯录的信息交互方法、装置及其设备 - Google Patents

基于好友声纹通讯录的信息交互方法、装置及其设备 Download PDF

Info

Publication number
CN107680598A
CN107680598A CN201710786736.XA CN201710786736A CN107680598A CN 107680598 A CN107680598 A CN 107680598A CN 201710786736 A CN201710786736 A CN 201710786736A CN 107680598 A CN107680598 A CN 107680598A
Authority
CN
China
Prior art keywords
user
vocal print
equipment
good friend
address list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710786736.XA
Other languages
English (en)
Other versions
CN107680598B (zh
Inventor
谢波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710786736.XA priority Critical patent/CN107680598B/zh
Publication of CN107680598A publication Critical patent/CN107680598A/zh
Application granted granted Critical
Publication of CN107680598B publication Critical patent/CN107680598B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • H04L51/046Interoperability with other network applications or services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/274Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc
    • H04M1/2745Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提出一种基于好友声纹通讯录的信息交互方法、装置及其设备,其中,方法包括:第一设备接收第一用户发送的语音信息,对语音信息进行声纹分析处理,提取第一用户的第一声纹特征,并解析语音信息获取待进行信息交互的第二用户以及第一用户的意图;第一设备查询预存的与第一声纹特征对应的好友声纹通讯录,获取第二用户预先注册的第二声纹特征,以及与第二声纹特征对应的第二设备的通信地址;第一设备根据第一用户的意图和第二设备的通信地址与第二设备进行通信交互。由此,通过声纹唯一标识用户身份,能够高效快捷的与其他用户进行信息交互,提高了通信效率。

Description

基于好友声纹通讯录的信息交互方法、装置及其设备
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于好友声纹通讯录的信息交互方法、装置及其设备。
背景技术
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用***的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家***等。其中,人工智能最重要的方面就是语音识别技术。
相关技术中,用户与其他用户进行信息交互的过程,主要是通过传统的手机通讯录或者即时通信的好友群找到目标用户,然后与该目标用户进行语音通信或者信息交互。但是当用户需要与其他用户进行信息交互或者分享信息时,上述电话通信方式或者即时通信方式并不能方便快捷的查到目标用户,降低通信交互的效率。
发明内容
本发明的目的旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种基于好友声纹通讯录的信息交互方法,用于解决现有技术中电话通信方式或者即时通信方式并不能方便快捷的查到目标用户,降低通信交互的效率的问题。
本发明的第二个目的在于提出一种基于好友声纹通讯录的信息交互装置。
本发明的第三个目的在于提出一种计算机设备。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
本发明的第五个目的在于提出一种计算机程序产品。
为达上述目的,本发明第一方面实施例提出了一种基于好友声纹通讯录的信息交互方法,所述方法包括以下步骤:第一设备接收第一用户发送的语音信息,对所述语音信息进行声纹分析处理,提取所述第一用户的第一声纹特征,并解析所述语音信息获取待进行信息交互的第二用户以及所述第一用户的意图;所述第一设备查询预存的与所述第一声纹特征对应的好友声纹通讯录,获取所述第二用户预先注册的第二声纹特征,以及与所述第二声纹特征对应的第二设备的通信地址;所述第一设备根据所述第一用户的意图和所述第二设备的通信地址与所述第二设备进行通信交互。
本发明实施例的基于好友声纹通讯录的信息交互方法,通过第一设备接收第一用户发送的语音信息,对语音信息进行声纹分析处理,提取第一用户的第一声纹特征,并解析语音信息获取待进行信息交互的第二用户以及第一用户的意图,接着第一设备查询预存的与第一声纹特征对应的好友声纹通讯录,获取第二用户预先注册的第二声纹特征,以及与第二声纹特征对应的第二设备的通信地址,最后第一设备根据第一用户的意图和第二设备的通信地址与第二设备进行通信交互。由此,通过声纹唯一标识用户身份,能够高效快捷的与其他用户进行信息交互,提高了通信效率。
为达上述目的,本发明第二方面实施例提出了一种基于好友声纹通讯录的信息交互装置,所述装置包括:第一处理模块,用于第一设备接收第一用户发送的语音信息,对所述语音信息进行声纹分析处理,提取所述第一用户的第一声纹特征,并解析所述语音信息获取待进行信息交互的第二用户以及所述第一用户的意图;查询获取模块,用于所述第一设备查询预存的与所述第一声纹特征对应的好友声纹通讯录,获取所述第二用户预先注册的第二声纹特征,以及与所述第二声纹特征对应的第二设备的通信地址;交互模块,用于所述第一设备根据所述第一用户的意图和所述第二设备的通信地址与所述第二设备进行通信交互。
本发明实施例的基于好友声纹通讯录的信息交互装置,通过第一设备接收第一用户发送的语音信息,对语音信息进行声纹分析处理,提取第一用户的第一声纹特征,并解析语音信息获取待进行信息交互的第二用户以及第一用户的意图,接着第一设备查询预存的与第一声纹特征对应的好友声纹通讯录,获取第二用户预先注册的第二声纹特征,以及与第二声纹特征对应的第二设备的通信地址,最后第一设备根据第一用户的意图和第二设备的通信地址与第二设备进行通信交互。由此,通过声纹唯一标识用户身份,能够高效快捷的与其他用户进行信息交互,提高了通信效率。
为达上述目的,本发明第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如一种基于好友声纹通讯录的信息交互方法,所述方法包括:第一设备接收第一用户发送的语音信息,对所述语音信息进行声纹分析处理,提取所述第一用户的第一声纹特征,并解析所述语音信息获取待进行信息交互的第二用户以及所述第一用户的意图;所述第一设备查询预存的与所述第一声纹特征对应的好友声纹通讯录,获取所述第二用户预先注册的第二声纹特征,以及与所述第二声纹特征对应的第二设备的通信地址;所述第一设备根据所述第一用户的意图和所述第二设备的通信地址与所述第二设备进行通信交互。
为了实现上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器被执行时,使得能够执行一种基于好友声纹通讯录的信息交互方法,所述方法包括:第一设备接收第一用户发送的语音信息,对所述语音信息进行声纹分析处理,提取所述第一用户的第一声纹特征,并解析所述语音信息获取待进行信息交互的第二用户以及所述第一用户的意图;所述第一设备查询预存的与所述第一声纹特征对应的好友声纹通讯录,获取所述第二用户预先注册的第二声纹特征,以及与所述第二声纹特征对应的第二设备的通信地址;所述第一设备根据所述第一用户的意图和所述第二设备的通信地址与所述第二设备进行通信交互。
为了实现上述目的,本发明第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种基于好友声纹通讯录的信息交互方法,所述方法包括:第一设备接收第一用户发送的语音信息,对所述语音信息进行声纹分析处理,提取所述第一用户的第一声纹特征,并解析所述语音信息获取待进行信息交互的第二用户以及所述第一用户的意图;所述第一设备查询预存的与所述第一声纹特征对应的好友声纹通讯录,获取所述第二用户预先注册的第二声纹特征,以及与所述第二声纹特征对应的第二设备的通信地址;所述第一设备根据所述第一用户的意图和所述第二设备的通信地址与所述第二设备进行通信交互。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本发明一个实施例的基于好友声纹通讯录的信息交互方法的流程示意图;
图2是根据本发明另一个实施例的基于好友声纹通讯录的信息交互方法的流程示意图;
图3是根据本发明又一个实施例的基于好友声纹通讯录的信息交互方法的流程示意图
图4是根据本发明一个实施例的基于好友声纹通讯录的信息交互装置的结构示意图;
图5是根据本发明另一个实施例的基于好友声纹通讯录的信息交互装置的结构示意图
图6是根据本发明又一个实施例的基于好友声纹通讯录的信息交互装置的结构示意图;
图7是根据本发明一个实施例的计算机设备的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的基于好友声纹通讯录的信息交互方法、装置及其设备。
目前,,随着智能终端种类和信息交互内容的多样化,当用户需要与其他用户进行信息交互或者分享信息时,传统的电话通信方式或者即时通信方式并不能方便快捷的查到到目标用户,降低通信交互的效率。例如:当第一用户需要通过自己的智能音箱向第二用户分享歌曲的情况下,无法通过电话录或者即使通信的好友群定位到目标用户。
针对这一问题,本发明实施例提供了基于好友声纹通讯录的信息交互方法,能够基于好友声纹通讯录的信息交互,通过声纹唯一标识用户身份,能够高效快捷的与其他用户进行信息交互,提高了通信效率。具体如下:
图1是根据本发明一个实施例的基于好友声纹通讯录的信息交互方法的流程示意图。如图1所示,该基于好友声纹通讯录的信息交互方法包括:
需要说明的是,在本发明实施例的基于好友声纹通讯录的信息交互方法中,第一设备、第二设备可以是智能音箱、智能游戏机等智能设备中的一种或者多种。
步骤101,第一设备接收第一用户发送的语音信息,对语音信息进行声纹分析处理,提取第一用户的第一声纹特征,并解析语音信息获取待进行信息交互的第二用户以及第一用户的意图。
具体地,在实际应用当中,第一用户需要通过第一设备与第二用户进行信息交互时,比如第一用户需要通过第一设备比如智能音箱与第二用户分享好听的歌曲,或者,第一用户通过第一设备比如智能音箱拨打第二用户的电话等等。可以根据需要向第一设备发送与第二用户进行信息交互的语音信息。
进一步地,第一设备可以通过声音采集设备等接收上述语音信息,并通过预设算法或者模型等方式对该语音信息进行声纹分析处理,提取第一用户的第一声纹特征。其中,声纹特征能够唯一标识用户身份,即通过第一声纹特征只能且唯一找到第一用户。
进一步地,可以采用很多种方式对语音信息进行语音解析获取待进行信息交互的第二用户以及第一用户的意图,可以根据实际应用需要进行选择设置,举例说明如下:
第一种示例,将语音信息转换为文本信息,接着对文本信息进行切词处理,提取关键字,进行识别获取待进行信息交互的第二用户以及第一用户的意图。
第二种示例,将语音信息输入预设算法中进行处理得到待进行信息交互的第二用户以及第一用户的意图。
步骤102,第一设备查询预存的与第一声纹特征对应的好友声纹通讯录,获取第二用户预先注册的第二声纹特征,以及与第二声纹特征对应的第二设备的通信地址。
具体地,在第一设备中预先存储第一用户的好友声纹通讯录,在提取第一用户的第一声纹特征后,可以通过该第一声纹特征在对应的存储表中或者相关算法计算可以找到其对应的好友声纹通讯录。
进一步地,在好友声纹通讯录中查找待进行信息交互的第二用户,并且获取第二用户预先注册的第二声纹特征,以及与第二声纹特征对应的第二设备的通信地址。
其中,需要说明的是,每个用户的声纹特征是唯一能够标识其身份的,也就是说通过第二声纹特征能够唯一确定第二用户对应的第二设备的通信地址。可以理解的是,第二用户预先将自己的第二声纹特征与对应的第二设备建立连接关系。
步骤103,第一设备根据第一用户的意图和第二设备的通信地址与第二设备进行通信交互。
具体地,在确定第一用户的意图和第二设备的通信地址后,第一设备根据第一用户的意图和第二设备的通信地址与第二设备进行通信交互。其中,不同的意图以及不同的设备,其交互信息方式不同,举例说明如下:
第一种示例,第一用户的意图为第一用户将当前播放歌曲分享给第二用户,第一智能音箱根据第二智能音箱的通信地址,将当前歌曲文件发送给第二智能音箱,以通过第二智能音箱播放给第二用户。
第二种示例,第一用户的意图为第一用户发送给第二用户的通信语音,第一智能音箱将通信语音发送给第二智能音箱,以通过第二智能音箱播放给第二用户。
由此,通过在第一用户的声纹通讯录中查找第二用户预先注册的声纹特征,根据通信需求与第二用户的声纹特征对应的第二设备建立通信交互。
综上所述,本发明实施例的基于好友声纹通讯录的信息交互方法,通过第一设备接收第一用户发送的用于与第二用户进行信息交互的语音信息,对语音信息进行声纹分析处理,提取第一用户的第一声纹特征,接着第一设备查询预存的与第一声纹特征对应的好友声纹通讯录,获取第二用户预先注册的第二声纹特征,以及与第二声纹特征对应的第二设备的通信地址,最后第一设备解析语音信息获取第一用户的意图,根据第一用户的意图和第二设备的通信地址与第二设备进行通信交互。由此,通过声纹唯一标识用户身份,能够高效快捷的与其他用户进行信息交互,提高了通信效率。
基于上述实施例,可以理解的是,需要预先建立第一用户的好友声纹通讯录,具体结合图2描述如下:
图2是根据本发明另一个实施例的基于好友声纹通讯录的信息交互方法的流程示意图。如图2所示,在步骤101之前,还包括:
步骤201,第一设备接收第一用户按照预设引导音发送的用于建立好友声纹通讯录的第一语音注册信息。
步骤202,对第一语音注册信息进行声纹分析处理,提取第一用户的第一声纹特征,建立与第一声纹特征对应的好友声纹通讯录。
具体地,第一用户的好友在多种应用场景中通过多种方式向第一用户的第一设备的语音采集设备发送第一语音注册信息,比如:您好,我是XX的朋友,我叫小度。进而,第一用户的第一设备接收该用户的语音注册信息,进行声纹分析后提取并存储该用户的声纹特征,建立与第一用户对应的声纹通讯录。
综上所述,本发明实施例的基于好友声纹通讯录的信息交互方法,通过第一设备接收第一用户按照预设引导音发送的用于建立好友声纹通讯录的第一语音注册信息,然后对第一语音注册信息进行声纹分析处理,提取第一用户的第一声纹特征,建立与第一声纹特征对应的好友声纹通讯录。由此,能够针对每个用户建立其好友声纹通讯录,从而高效快捷的与其他用户进行信息交互,提高了通信效率。
可以理解的是,需要预先建立第二用户的通信地址,具体结合图3描述如下:
图3是根据本发明又一个实施例的基于好友声纹通讯录的信息交互方法的流程示意图。如图3所示,在步骤102之前,还包括:
步骤301,第一设备接收第二用户按照预设引导音发送的与第一用户加好友的第二语音注册信息。
步骤302,第一设备对第二语音注册信息进行声纹分析处理,提取第二用户的第二声纹特征,并在好友声纹通讯录中存储第二声纹特征与第二用户的对应关系,以及第二用户提供的与第二声纹特征对应的第二设备的通信地址。
具体地,第二用户按照预设引导音(可以根据实际应用需要进行设置选择)向第一设备发送与第一用户加好友的第二语音注册信息,通过该第二语音注册信息可以提取第二用户的第二声纹特征,并在好友声纹通讯录中存储第二声纹特征与第二用户的对应关系,此外第二声纹特征还保存对应第二设备的通信地址以便后续信息交互,从而高效快捷的与其他用户进行信息交互,提高了通信效率。
为了实现上述实施例,本发明还提出一种基于好友声纹通讯录的信息交互装置,图4是根据本发明一个实施例的基于好友声纹通讯录的信息交互装置的结构示意图。如图4所示,该基于好友声纹通讯录的信息交互装置包括:第一处理模块11、查询获取模块12和交互模块13。
需要说明的是,在本发明实施例的基于好友声纹通讯录的信息交互方法中,第一设备、第二设备可以是智能音箱、智能游戏机等智能设备中的一种或者多种。
其中,第一处理模块11,用于第一设备接收第一用户发送的语音信息,对语音信息进行声纹分析处理,提取第一用户的第一声纹特征,并解析语音信息获取待进行信息交互的第二用户以及所述第一用户的意图.
查询获取模块12,用于第一设备查询预存的与第一声纹特征对应的好友声纹通讯录,获取第二用户预先注册的第二声纹特征,以及与第二声纹特征对应的第二设备的通信地址。
交互模块13,用于第一设备根据第一用户的意图和第二设备的通信地址与第二设备进行通信交互。
具体地,在确定第一用户的意图和第二设备的通信地址后,第一设备根据第一用户的意图和第二设备的通信地址与第二设备进行通信交互。其中,不同的意图以及不同的设备,其交互信息方式不同,举例说明如下:
第一种示例,交互模块13具体用于第一用户的意图为第一用户将当前播放歌曲分享给第二用户,第一智能音箱根据第二智能音箱的通信地址,将当前歌曲文件发送给第二智能音箱,以通过第二智能音箱播放给第二用户。
第二种示例,交互模块13具体还用于第一用户的意图为第一用户发送给第二用户的通信语音,第一智能音箱将通信语音发送给第二智能音箱,以通过第二智能音箱播放给第二用户。
需要说明的是,前述对基于好友声纹通讯录的信息交互方法实施例的解释说明也适用于该实施例的基于好友声纹通讯录的信息交互装置,此处不再赘述。
综上所述,本发明实施例的基于好友声纹通讯录的信息交互装置,通过第一设备接收第一用户发送的用于与第二用户进行信息交互的语音信息,对语音信息进行声纹分析处理,提取第一用户的第一声纹特征,接着第一设备查询预存的与第一声纹特征对应的好友声纹通讯录,获取第二用户预先注册的第二声纹特征,以及与第二声纹特征对应的第二设备的通信地址,最后第一设备解析语音信息获取第一用户的意图,根据第一用户的意图和第二设备的通信地址与第二设备进行通信交互。由此,通过声纹唯一标识用户身份,能够高效快捷的与其他用户进行信息交互,提高了通信效率。
图5是根据本发明另一个实施例的基于好友声纹通讯录的信息交互装置的结构示意图。如图5所示,在图4的基础上,还包括:接收模块14和建立模块15。
其中,接收模块14,用于第一设备接收第一用户按照预设引导音发送的用于建立好友声纹通讯录的第一语音注册信息。
建立模块15,用于对第一语音注册信息进行声纹分析处理,提取第一用户的第一声纹特征,建立与第一声纹特征对应的好友声纹通讯录。
具体地,第一用户的好友在多种应用场景中通过多种方式向第一用户的第一设备的语音采集设备发送第一语音注册信息,比如:您好,我是XX的朋友,我叫小度。进而,第一用户的第一设备接收该用户的语音注册信息,进行声纹分析后提取并存储该用户的声纹特征,建立与第一用户对应的声纹通讯录。
综上所述,本发明实施例的基于好友声纹通讯录的信息交互装置,通过第一设备接收第一用户按照预设引导音发送的用于建立好友声纹通讯录的第一语音注册信息,然后对第一语音注册信息进行声纹分析处理,提取第一用户的第一声纹特征,建立与第一声纹特征对应的好友声纹通讯录。由此,能够针对每个用户建立其好友声纹通讯录,从而高效快捷的与其他用户进行信息交互,提高了通信效率。
图6是根据本发明又一个实施例的基于好友声纹通讯录的信息交互装置的结构示意图。如图6所示,在图4的基础上,还包括:发送模块16和第二处理模块17。
其中,发送模块16,用于第一设备接收第二用户按照预设引导音发送的与第一用户加好友的第二语音注册信息。
第二处理模块17,用于第一设备对第二语音注册信息进行声纹分析处理,提取第二用户的第二声纹特征,并在好友声纹通讯录中存储第二声纹特征与第二用户的对应关系,以及第二用户提供的与第二声纹特征对应的第二设备的通信地址。
具体地,第二用户按照预设引导音(可以根据实际应用需要进行设置选择)向第一设备发送与第一用户加好友的第二语音注册信息,通过该第二语音注册信息可以提取第二用户的第二声纹特征,并在好友声纹通讯录中存储第二声纹特征与第二用户的对应关系,此外第二声纹特征还保存对应第二设备的通信地址以便后续信息交互,从而高效快捷的与其他用户进行信息交互,提高了通信效率。
本发明提出一种计算机设备,图7是根据本发明一个实施例的计算机设备的结构示意图。如图7所示,存储器21、处理器22及存储在存储器21上并可在处理器22上运行的计算机程序。
处理器22执行所述程序时实现上述实施例中提供的基于好友声纹通讯录的信息交互方法。
进一步地,计算机设备还包括:
通信接口23,用于存储器21和处理器22之间的通信。
存储器21,用于存放可在处理器22上运行的计算机程序。
存储器21可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
处理器22,用于执行所述程序时实现上述实施例所述的基于好友声纹通讯录的信息交互方法。
如果存储器21、处理器22和通信接口23独立实现,则通信接口21、存储器21和处理器22可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(PeripheralComponent,简称为PCI)总线或扩展工业标准体系结构(Extended Industry StandardArchitecture,简称为EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器21、处理器22及通信接口23,集成在一块芯片上实现,则存储器21、处理器22及通信接口23可以通过内部接口完成相互间的通信。
处理器22可能是一个中央处理器(Central Processing Unit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本发明实施例的一个或多个集成电路。
为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器被执行时,使得能够执行一种基于好友声纹通讯录的信息交互方法,所述方法包括:第一设备接收第一用户发送的语音信息,对语音信息进行声纹分析处理,提取第一用户的第一声纹特征,并解析语音信息获取待进行信息交互的第二用户以及第一用户的意图;第一设备查询预存的与第一声纹特征对应的好友声纹通讯录,获取第二用户预先注册的第二声纹特征,以及与第二声纹特征对应的第二设备的通信地址;第一设备根据第一用户的意图和第二设备的通信地址与第二设备进行通信交互理。
为了实现上述实施例,本发明还提出一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种基于好友声纹通讯录的信息交互方法,所述方法包括:第一设备接收第一用户发送的语音信息,对语音信息进行声纹分析处理,提取第一用户的第一声纹特征,并解析语音信息获取待进行信息交互的第二用户以及第一用户的意图;第一设备查询预存的与第一声纹特征对应的好友声纹通讯录,获取第二用户预先注册的第二声纹特征,以及与第二声纹特征对应的第二设备的通信地址;第一设备根据第一用户的意图和第二设备的通信地址与第二设备进行通信交互。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (13)

1.一种基于好友声纹通讯录的信息交互方法,其特征在于,包括以下步骤:
第一设备接收第一用户发送的语音信息,对所述语音信息进行声纹分析处理,提取所述第一用户的第一声纹特征,并解析所述语音信息获取待进行信息交互的第二用户以及所述第一用户的意图;
所述第一设备查询预存的与所述第一声纹特征对应的好友声纹通讯录,获取所述第二用户预先注册的第二声纹特征,以及与所述第二声纹特征对应的第二设备的通信地址;
所述第一设备根据所述第一用户的意图和所述第二设备的通信地址与所述第二设备进行通信交互。
2.如权利要求1所述的方法,其特征在于,在所述第一设备查询预存的与所述第一声纹特征对应的好友声纹通讯录之前,所述方法还包括:
所述第一设备接收所述第一用户按照预设引导音发送的用于建立好友声纹通讯录的第一语音注册信息;
对所述第一语音注册信息进行声纹分析处理,提取所述第一用户的第一声纹特征,建立与所述第一声纹特征对应的好友声纹通讯录。
3.如权利要求2所述的方法,其特征在于,在所述获取所述第二用户预先注册的第二声纹特征之前,所述方法还包括:
所述第一设备接收所述第二用户按照预设引导音发送的与所述第一用户加好友的第二语音注册信息;
所述第一设备对所述第二语音注册信息进行声纹分析处理,提取所述第二用户的第二声纹特征,并在所述好友声纹通讯录中存储所述第二声纹特征与所述第二用户的对应关系,以及所述第二用户提供的与所述第二声纹特征对应的第二设备的通信地址。
4.如权利要求1所述的方法,其特征在于,所述第一设备和所述第二设备为智能音箱,
所述第一设备根据所述第一用户的意图和所述第二设备的通信地址与所述第二设备进行通信交互,包括:
所述第一用户的意图为所述第一用户将当前播放歌曲分享给第二用户;
所述第一智能音箱根据所述第二智能音箱的通信地址,将当前歌曲文件发送给所述第二智能音箱,以通过所述第二智能音箱播放给所述第二用户。
5.如权利要求4所述的方法,其特征在于,还包括:
所述第一用户的意图为所述第一用户发送给所述第二用户的通信语音;
所述第一智能音箱将所述通信语音发送给所述第二智能音箱,以通过所述第二智能音箱播放给所述第二用户。
6.一种基于好友声纹通讯录的信息交互装置,其特征在于,包括:
第一处理模块,用于第一设备接收第一用户发送的语音信息,对所述语音信息进行声纹分析处理,提取所述第一用户的第一声纹特征,并解析所述语音信息获取待进行信息交互的第二用户以及所述第一用户的意图;
查询获取模块,用于所述第一设备查询预存的与所述第一声纹特征对应的好友声纹通讯录,获取所述第二用户预先注册的第二声纹特征,以及与所述第二声纹特征对应的第二设备的通信地址;
交互模块,用于所述第一设备根据所述第一用户的意图和所述第二设备的通信地址与所述第二设备进行通信交互。
7.如权利要求6所述的装置,其特征在于,还包括:
接收模块,用于所述第一设备接收所述第一用户按照预设引导音发送的用于建立好友声纹通讯录的第一语音注册信息;
建立模块,用于对所述第一语音注册信息进行声纹分析处理,提取所述第一用户的第一声纹特征,建立与所述第一声纹特征对应的好友声纹通讯录。
8.如权利要求7所述的装置,其特征在于,还包括:
发送模块,用于所述第一设备接收所述第二用户按照预设引导音发送的与所述第一用户加好友的第二语音注册信息;
第二处理模块,用于所述第一设备对所述第二语音注册信息进行声纹分析处理,提取所述第二用户的第二声纹特征,并在所述好友声纹通讯录中存储所述第二声纹特征与所述第二用户的对应关系,以及所述第二用户提供的与所述第二声纹特征对应的第二设备的通信地址。
9.如权利要求6所述的装置,其特征在于,所述第一设备和所述第二设备为智能音箱,所述交互模块具体用于:
所述第一用户的意图为所述第一用户将当前播放歌曲分享给第二用户;
所述第一智能音箱根据所述第二智能音箱的通信地址,将当前歌曲文件发送给所述第二智能音箱,以通过所述第二智能音箱播放给所述第二用户。
10.如权利要求9所述的装置,其特征在于,所述交互模块具体还用于:
所述第一用户的意图为所述第一用户发送给所述第二用户的通信语音;
所述第一智能音箱将所述通信语音发送给所述第二智能音箱,以通过所述第二智能音箱播放给所述第二用户。
11.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1-5中任一所述的基于好友声纹通讯录的信息交互方法。
12.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求权利要求1-5中任一所述的基于好友声纹通讯录的信息交互方法。
13.一种计算机程序产品,其特征在于,当所述计算机程序产品中的指令由处理器执行时,执行如权利要求1-5中任一所述的基于好友声纹通讯录的信息交互方法。
CN201710786736.XA 2017-09-04 2017-09-04 基于好友声纹通讯录的信息交互方法、装置及其设备 Active CN107680598B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710786736.XA CN107680598B (zh) 2017-09-04 2017-09-04 基于好友声纹通讯录的信息交互方法、装置及其设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710786736.XA CN107680598B (zh) 2017-09-04 2017-09-04 基于好友声纹通讯录的信息交互方法、装置及其设备

Publications (2)

Publication Number Publication Date
CN107680598A true CN107680598A (zh) 2018-02-09
CN107680598B CN107680598B (zh) 2020-12-11

Family

ID=61136243

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710786736.XA Active CN107680598B (zh) 2017-09-04 2017-09-04 基于好友声纹通讯录的信息交互方法、装置及其设备

Country Status (1)

Country Link
CN (1) CN107680598B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108648754A (zh) * 2018-04-26 2018-10-12 北京小米移动软件有限公司 语音控制方法及装置
CN109640142A (zh) * 2018-12-21 2019-04-16 咪咕数字传媒有限公司 一种内容推荐方法及装置、设备、存储介质
CN111312252A (zh) * 2020-03-11 2020-06-19 严春波 一种通过ai语音邀请通讯录人员的方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103700371A (zh) * 2013-12-13 2014-04-02 江苏大学 一种基于声纹识别的来电身份识别***及其识别方法
CN105141768A (zh) * 2015-08-31 2015-12-09 努比亚技术有限公司 多用户识别方法、装置及移动终端
CN105282294A (zh) * 2015-10-30 2016-01-27 东莞酷派软件技术有限公司 语音拨号方法及装置
CN105635452A (zh) * 2015-12-28 2016-06-01 努比亚技术有限公司 移动终端及其联系人标识方法
FR3032575A1 (fr) * 2015-02-10 2016-08-12 Airbus Operations Sas Procede de communication d'un message vocal comprenant une etape d'affichage d'une transcription du message vocal et d'un identifiant d'un appelant prealablement determine et dispositif pour sa mise en oeuvre
CN106209604A (zh) * 2016-08-26 2016-12-07 北京小米移动软件有限公司 添加好友的方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103700371A (zh) * 2013-12-13 2014-04-02 江苏大学 一种基于声纹识别的来电身份识别***及其识别方法
FR3032575A1 (fr) * 2015-02-10 2016-08-12 Airbus Operations Sas Procede de communication d'un message vocal comprenant une etape d'affichage d'une transcription du message vocal et d'un identifiant d'un appelant prealablement determine et dispositif pour sa mise en oeuvre
CN105141768A (zh) * 2015-08-31 2015-12-09 努比亚技术有限公司 多用户识别方法、装置及移动终端
CN105282294A (zh) * 2015-10-30 2016-01-27 东莞酷派软件技术有限公司 语音拨号方法及装置
CN105635452A (zh) * 2015-12-28 2016-06-01 努比亚技术有限公司 移动终端及其联系人标识方法
CN106209604A (zh) * 2016-08-26 2016-12-07 北京小米移动软件有限公司 添加好友的方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108648754A (zh) * 2018-04-26 2018-10-12 北京小米移动软件有限公司 语音控制方法及装置
CN108648754B (zh) * 2018-04-26 2021-09-21 北京小米移动软件有限公司 语音控制方法及装置
CN109640142A (zh) * 2018-12-21 2019-04-16 咪咕数字传媒有限公司 一种内容推荐方法及装置、设备、存储介质
CN111312252A (zh) * 2020-03-11 2020-06-19 严春波 一种通过ai语音邀请通讯录人员的方法

Also Published As

Publication number Publication date
CN107680598B (zh) 2020-12-11

Similar Documents

Publication Publication Date Title
JP7062851B2 (ja) 声紋の作成・登録の方法及び装置
CN105719649B (zh) 语音识别方法及装置
CN103345467B (zh) 语音翻译***
US20210225380A1 (en) Voiceprint recognition method and apparatus
CN103236259B (zh) 语音识别处理及反馈***、语音回复方法
CN110427472A (zh) 智能客服匹配的方法、装置、终端设备及存储介质
CN108447471A (zh) 语音识别方法及语音识别装置
CN107071542A (zh) 视频片段播放方法及装置
CN107704275A (zh) 智能设备唤醒方法、装置、服务器及智能设备
CN107895578A (zh) 语音交互方法和装置
CN107799119A (zh) 音频制作方法、装置及***
CN105551480B (zh) 方言转换方法及装置
CN111261151B (zh) 一种语音处理方法、装置、电子设备及存储介质
CN110444229A (zh) 基于语音识别的通信服务方法、装置、计算机设备及存储介质
CN106230689A (zh) 一种语音信息交互的方法、装置及服务器
US20190371319A1 (en) Method for human-machine interaction, electronic device, and computer-readable storage medium
CN107680598A (zh) 基于好友声纹通讯录的信息交互方法、装置及其设备
CN109543021B (zh) 一种面向智能机器人的故事数据处理方法及***
CN109979430A (zh) 一种机器人讲故事的方法、装置、机器人及存储介质
CN109885277A (zh) 人机交互设备、方法、***和装置
CN108900612A (zh) 用于推送信息的方法和装置
CN107978317A (zh) 会议纪要合成方法、***及终端设备
CN106919559A (zh) 机器翻译方法以及机器翻译***
CN107025312A (zh) 基于视频内容的信息提供方法和装置
CN107657949A (zh) 游戏数据的获取方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant