CN110100447B - 信息处理方法及装置、多媒体设备及存储介质 - Google Patents

信息处理方法及装置、多媒体设备及存储介质 Download PDF

Info

Publication number
CN110100447B
CN110100447B CN201780055132.6A CN201780055132A CN110100447B CN 110100447 B CN110100447 B CN 110100447B CN 201780055132 A CN201780055132 A CN 201780055132A CN 110100447 B CN110100447 B CN 110100447B
Authority
CN
China
Prior art keywords
account
multimedia
user
service
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780055132.6A
Other languages
English (en)
Other versions
CN110100447A (zh
Inventor
丁科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Publication of CN110100447A publication Critical patent/CN110100447A/zh
Application granted granted Critical
Publication of CN110100447B publication Critical patent/CN110100447B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • H04N21/25891Management of end-user data being end-user preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/441Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明实施例公开了一种信息处理方法、服务提供***及计算机存储介质,所述方法包括:为多媒体设备分配至少一个第一账号;为所述多媒体设备分配与第一帐号相关联的多个第二账号,每一个第二帐号代表一个用户标识;采集语音指令;根据所述语音指令确定当前使用的所述第二账户;查找与当前使用的所述第二账户相关联的用户偏好信息;基于用户偏好信息和基于所述语音指令确定的服务请求信息,向所述当前使用的第二账户代表的用户标识提供第一服务。

Description

信息处理方法及装置、多媒体设备及存储介质
技术领域
本发明涉及信息技术领域,尤其涉及一种信息处理方法及装置、多媒体设备及存储介质。
背景技术
随着电子技术及网络技术的发展,越来越多的智能设备会利用用户账号接收到互联网,而互联网会根据用户账号的历史操作行为等数据,向智能设备推荐用户可能喜欢的音频、视频等各种个***。个***为根据用户的个人行为特征或个人喜好,提供其所需要的服务,例如,歌曲推荐等。但是具体实现时发现,有时候个***并非用户想要的,这种不精确推荐的个***不仅没有提升用户体验,帮助用户获得更加满意的服务,而且个***的推荐可能是一种信息干扰,或直接的选择个***反而限制了用户的选择。此外,互联网这种不精确的个***,导致推荐或服务过程中出现了大量的无效率推荐,占用了大量的网络资源,且效果差及精准度低。
发明内容
有鉴于此,本发明实施例期望提供一种信息处理方法及装置、多媒体设备及存储介质,解决上述问题至少其中之一。
本发明实施例的技术方案是这样实现的:
本发明实施例提供一种信息处理方法,所述方法包括:
为多媒体设备分配至少一个第一账号;
为所述多媒体设备分配与第一帐号相关联的多个第二账号,每一个第二帐号代表一个用户标识;
采集语音指令;
根据所述语音指令确定当前使用的所述第二账户;
查找与当前使用的所述第二账户相关联的用户偏好信息;
基于用户偏好信息和基于所述语音指令确定的服务请求信息,向所述当前使用的第二账户代表的用户标识提供第一服务。
本发明实施例提供另一种信息处理方法,包括:
利用多媒体设备的操作***采集语音指令;其中,所述语音指令,用于触发所述多媒体设备执行预定操作,所述预定操作不同于账号注册操作;
对所述语音指令进行声纹特征识别,获得与所述语音指令对应的第一声纹特征;
将所述第一声纹特征与第二声纹特征进行匹配,其中,所述第二声纹特征已注册账号对应的声纹特征;
若匹配不成功,基于所述第一声纹特征进行账号注册,其中,一个所述账号代表一个用户标识。
本发明实施例提供另一种信息处理方法,包括:利用多媒体设备的操作***采集语音指令;其中,所述语音指令,用于触发所述多媒体设备执行预定操作,所述预定操作不同于账号注册操作;
对所述语音指令进行声纹特征识别,获得与所述语音指令对应的第一声纹特征;
将所述第一声纹特征与第二声纹特征进行匹配,其中,所述第二声纹特征已注册账号对应的声纹特征;
若匹配不成功,基于所述第一声纹特征进行账号注册,其中,一个所述账号代表一个用户标识。
本发明实施例提供一种信息处理装置,包括:
第一配置单元,用于为多媒体设备配置至少一个第一账号;
第二配置单元,用于为所述多媒体设备配置多个第二账号,其中,多个所述第二账号与至少一个所述第一账号关联;
采集单元,用于采集语音指令;
确定单元,用于根据所述语音指令确定当前使用的所述第二账户;
查找单元,用于查找与当前使用的所述第二账户相关联的用户偏好信息;
服务提供单元,用于基于用户偏好信息和基于所述语音指令确定的服务请求信息,向所述当前使用的第二账户代表的用户标识提供第一服务。
本发明实施例提供一种多媒体设备,包括:
采集模块,用于利用多媒体设备的操作***采集语音指令;其中,所述语音指令,用于触发所述多媒体设备执行预定操作,所述预定操作不同于账号注册操作;
识别模块,用于对所述语音指令进行声纹特征识别,获得与所述语音指令对应的第一声纹特征;
匹配模块,用于将所述第一声纹特征与第二声纹特征进行匹配,其中,所述第二声纹特征已注册账号对应的声纹特征;
注册模块,用于,若匹配不成功,基于所述第一声纹特征进行账号注册。
本发明实施例提供一种多媒体设备,其中,包括:媒体输出模组、存储器、处理器及存储在所述存储器上并由所述处理器执行的计算机可执行指令;
所述多媒体输出模组,用于输出多媒体信息;
所述存储器,用于存储信息;
所述处理器,用于分别与所述多媒体信息输出模组及所述存储器连接,用于通过执行前述一个或多个技术方案提供的信息处理方法。
本发明实施例提供一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行前述的信息处理方法。
在本发明实施例提供的信息处理方法及***、存储介质中,一个多媒体设备会设置至少一个第一账号,而一个第一账号下关联设置有多个第二账号;该第一账号可用于与预定***的对接,不同的用户配置不同的第二账号。
一方面,避免为了每一个用户设置一个第一账号导致的账号数目多及管理混乱等问题。
另一方面,一个第一账号对应了多个第二账号,可以基于第二账号对应的不同用户的偏好信息有针对性的提供满足用户个人喜好和需求的个***;从而解决了现有技术中一些被多个用户共用的多媒体设备不区分使用用户导致的无法精准获得偏好信息,从而进行精准的提供个***的问题,从而实现了个***的精准提供,提升了设备的智能性及用户体验满意度。
附图说明
图1为本发明实施例提供的第一种信息处理方法的流程示意图;
图2为本发明实施例提供的一种多媒体设备与外部***的连接示意图;
图3为本发明实施例提供的另一种多媒体设备与外部***的连接示意图;
图4为本发明实施例提供的一种第二账号和第一账号的对应示意图;
图5为本发明实施例提供的另一种第二账号与第一账号的对应示意图;
图6为本发明实施例提供的第一种确定第二账号的流程示意图;
图7为本发明实施例提供的第二种确定第二账号的流程示意图;
图8为本发明实施例提供的又一种信息处理方法的流程示意图;
图9为本发明实施例提供的再一种信息处理方法的流程示意图;
图10为本发明实施例提供的一种多媒体设备的结构示意图;
图11为本发明实施例提供的另一种多媒体设备的结构示意图;
图12为本发明实施例提供的一种多媒体设备或管理设备的结构示意图;
图13为本发明实施例提供的再一种第二账号与第一账号的对应示意图;
图14为本发明实施例提供的基于声纹特征的信息处理方法;
图15为本发明实施例提供的一种基于声纹特征的内部账户注册流程示意图;
图16为本发明实施例提供的两种注册机制的示意图;
图17为本发明实施例提供的另一种信息处理方法的流程示意图;
图18为本发明实施例提供的一种声纹特征提取的流程示意图;
图19为本发明实施例提供的一种声纹特征提取中的音波能量的加权和分布示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行详细说明,应当理解,以下所说明的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
如图1所示,本实施例提供一种信息处理方法,所述方法包括:
步骤S110:为多媒体设备分配至少一个第一账号;
步骤S120:为所述多媒体设备分配与第一帐号相关联的多个第二账号,每一个第二帐号代表一个用户标识;
步骤S130:采集语音指令;
步骤S140:根据所述语音指令确定当前使用的所述第二账户;
步骤S150:查找与当前使用的所述第二账户相关联的用户偏好信息;
步骤S160:基于用户偏好信息和基于所述语音指令确定的服务请求信息,向所述当前使用的第二账户代表的用户标识提供第一服务。
本实施例所述的方法可为应用于多媒体设备的管理设备中,也可以是直接应用于所述多媒体设备中。若本实施例公开的信息处理方法应用于所述管理设备中,则所述管理设备与所述多媒体设备建立有传输链路。例如,所述多媒体设备通过无线局域网(WiFi)或光缆等有线接口接入到互联网,进而与所述管理设备建立连接。
所述多媒体设备可为能够提供多媒体服务的设备,例如,能够提供音频服务的音箱等音频设备,或可以提供视频服务的视频设备。例如,在本实施例中所述多媒体设备为音箱和/或电视等用户设备。在一些实施例中,所述多媒体设备可为能够用于进行信息交互的交互设备。例如,可为进行语音交互的智能音箱,可为与用户进行语音和/或图像交互的智能电脑等设备。在本实施例中,所述多媒体设备可选为智能家居设备。所述智能家居设备可包括:家庭音响、家庭影院设备或智能冰箱等设备。
所述多媒体设备可为被多个用户所共享的共享设备,例如,家庭成员共享的家庭共享设备或同事共享的会议共享设备。
一般情况下这些设备仅设置一个账号,但是不同用户使用时,若都使用同一个用户账号,针对这样的用户账号的历史行为数据和/或属性信息提供个***,显然会导致不精确的问题。而在本实施例中,先在多媒体设备设置了多个与第一账号下关联的多个第二账号,然后记录每一个第二账号对应的用户的偏好信息,利用该偏好信息进行第二服务的提供,从而可以精确的为每一个用户满足其个性需求的服务,提高了设备的至能性及个***的精准性。一个所述第二账号可为一个用户标识,该用户标识可为用户名称、用户编号或者其他可以指向特定用户的具有标识作用的任意信息。
所述预定***可为向多媒体设备提供多媒体服务支撑的***。例如,所述多媒体设备为音频设备,则所述预定***可为音频服务***,可以提供所述音频设备所播放提供各种音频服务,例如,音乐、广播、新闻。所述音频设备通过网络连接到所述预定***,从所述预定***获取多媒体信息的信息内容并输出,这样用户就可以收听到音乐、广播及新闻等,从而享受各种音频服务。典型的音频服务***可为第三方音频服务平台,例如,QQ音频的音乐服务***等。
又例如,所述多媒体设备为视频设备,所述预定***可为视频服务***,可以提供各种视频服务,例如,腾讯视频***,可以提供各种视频供视频设备输出,这样的话,用户就可以看到电影、电视剧、综艺节目或学习视频等。
在本实施例中为所述多媒体设备配置至少一个能够登录到预定***并从预定信息获取多媒体服务的第一账号,同时为该多媒体设备可配置多个第二账号,且多个第二账号可以与同一个第一账号关联。
在本实施例中,所述第一账号和所述第二账号可为不同类型的账号。所述第一账号是被所述预定***识别或授权使用预定***提供多媒体服务的账号,通常在所述预定***中存储有所述第一账号。此外,在预定***中除了存储有第一账号的账号外,还可存储有与第一账号绑定的所述多媒体设备的设备编号,以及可以使用所述第一账号的一个或多个用户的用户信息。
所述第二账号一般不能被所述预定***所识别,是所述多媒体设备自身或所述多媒体设备的管理***分配或设置的账号,仅被所述多媒体信息自身或所述管理***所识别的账号。故从这一层面来说,所述第二账号又可以称仅能被多媒体设备自身或其所在的管理***内被识别的账号。
在一些情况下,所述多媒体***的操作***或所述多媒体设备的管理***又可以称之为设备的内部***,而所述预定***是与多媒体设备的内部***对接的外部***。故从这一层面来说,所述第二账号又可以称之为内部账号;而第一账号是可以被多媒体信息或其所在管理***以外的其他***(例如,第三方平台或第三应用)所识别的账号,故可以称之为外部账号。通常情况下,所述多媒体设备内安装有外部***的应用,所述多媒体设备可以通过该应用对接到外部***。
在一些实施例中,该第一账号可以对应于一个账号标识,该账号标识可为主用户的手机号等通信标识,这里的通信标识除了手机号等移动通信标识,还可以是即时通信的通信标识,例如,微信号或微博号或者QQ号等具有一定身份标识的账号。在有些实施例中,所述第一账号可为所述预定***分配的账号,故是可被所述预定***识别的,而所述第二账号可为所述多媒体设备或所述多媒体设备的管理设备所分配的账号,且未存储在预定***中,故不被预定***所识别。
故在本实施例的步骤S110中为多媒体设备配置至少一个第一账号,利用该第一账号登录预定***,以方便所述多媒体设备基于所述第一账号与预定***进行信息交互,例如,向预定***发送携带有所述第一账号的多媒体服务获取请求等。
如图2所示,多媒体设备所在的***为内部***,在内部***内除了所述多媒体设备以外,还包括与所述多媒体设备连接的管理设备。该管理设备为多媒体设备提供各种数据支持和/或管理。所述多媒体设备可以通过所述管理设备连接到外部***。所述数据支撑可包括:提供多媒体设备自身的***升级或维护等所需的数据等。图3所示的多媒体设备直接连接外部***。
如图4所示,多媒体设备设置了一个可与预定***堆积的第一账号User-wx,多媒体设备会被三个用户使用,故User-wx设置了三个第二账号,分别是User-wx-A,User-wx-B及User-wx-C。图4所示的多媒体设备仅配置了一个第一账号。在一些情况下,一个多媒体设备可能设置有多个第一账号。如图5所示,多媒体设备设置有两个可与外部***中应用的第一账号,分别是User-wx及User-qq。而User-wx对应的第二账号包括:User-wx-1,User-wx-2及User-wx-3。而User-qq对应的第二账号包括:User-qq-1和User-qq-2。
在本实施例中为了简化第二账号和第一账号的对应关系,通常所述第二账号的账号标识包括:第一账号的账号标识加上内部标识信息。这里的第二账号标识信息可为内部序号。例如,第一账号为:User-qq,则第二账号可为User-qq-1一直到User-qq-s,这里的s可为一个第一账号可分配的最大第二账号数目(即第二账号的最大数量)。这样的话,第二账号和第一账号之间的对应关系,可以通过两种账号的账号本身来确定,而不用特意建立第二账号和第一账号的对应关系了。
所述第一服务可为各种类型的服务,例如,音频服务或视频服务、推荐多媒体信息的推荐服务、向社交好友进行信息分享的分享服务等。
在多媒体设备内或者与多媒体设备连接的设备内,对应于第二账号记录有用户偏好信息。
在步骤S130中采集一个语音指令,该语音指令基于用户说话产生的,用于控制多媒体设备提供各种服务的。故所述语音指令还可以用于多媒体设备通过内容识别,确定出服务请求信息。该服务请求信息可为操作参数,所述操作参数可包括:操作类型及操作类型携带的操作值。所述操作类型可包括:点播歌曲、切换歌曲等。所述操作值可指向切换到的歌曲或电视节目等。在本发明实施例中,该语音指令不仅可用于多媒体设备获取服务请求信息,还可以用于识别出当前用户对应的第二账号。从而确定出与用户对应的用户偏好信息,以向用户提供满足其个性需求的第一服务。
用户的所述偏好信息可包括:用户喜好特征和/或用户厌恶特征。所述用户喜好特征和/或用户厌恶特征可是基于用户历史行为数据及用户属性信息的至少其中之一确定的。所述用户喜好特征用于表征用户喜好的服务;所述用户厌恶特征用于表征用户厌恶的服务。
所述用户喜好特征指示用户喜好或用户偏好,可包括:指示用户喜好的用户喜好标签,可如,用户喜好的音乐类型标签、用户喜好的节目标签、用户讨厌的音乐类型表亲,用户讨厌的节目标签。
所述用户厌恶特征为指示了与用户喜好或偏好相反的特征,可包括:用户不喜欢的音乐类型标签,用户不喜欢的节目类型标签等。
所述历史行为数据可为操作所述多媒体设备的行为数据。例如,若多媒体设备随机播放了一首摇滚乐,而用户A正在使用该多媒体设备,若用户不喜欢就会控制多媒体设备进行切换,该切换操作可被记录为所述历史行为数据,然后基于用户挑选播放的音乐类型,从而可以确定出用户不喜欢的音乐类型标签,还可以基于用户听某一类型的音乐,确定出用户喜欢的音乐类型标签。在本实施例中通常的不同的用户对应不同的第二账号,这些偏好信息都是与用户A的第二账号相对应的。
在一些实施例中,所述用户喜好特征和/或用户厌恶特征还可是基于用户属性信息确定的。所述用户属性信息可包括:用户年纪、用户性别、用户职业、用户民族及宗教信仰等用户特性信息。
例如,一个儿童可能会喜欢动漫,但是可能会讨厌各种逻辑分析调理很强的法制节目等。这样的话,可以根据用户年纪得出用户喜好特征或用户厌恶特征。
在本实施例中,可以利用向量机或神经网络等自适应学习模型,对所述用户历史行为数据及用户属性信息的至少其中之一进行处理,得到所述用户喜好特征和/或用户厌恶特征。
在步骤S160中根据所述偏好信息提供所述第一服务可包括以下至少之一:
根据所述用户喜好特征,从所述预定***获取多媒体设备当前使用的第二账号的用户喜好的多媒体信息;
根据所述用户喜好特征,向多媒体设备当前使用的第二账号推荐用户喜好的多媒体信息;
根据所述用户厌恶特征,屏蔽所述预定***提供的所述多媒体设备当前使用的第二账号的用户厌恶的多媒体信息;
根据所述用户喜好特征,屏蔽所述预定***提供的所述多媒体设备当前使用的第二账号用户所厌恶的服务推荐等。
预定***提供的服务都有其服务属性,所述服务属性可为服务提供过程中服务内容的内容标签等信息。例如,音乐服务中的音乐类型标签,音频节目服务中的音频节目的属性标签等。
所述服务属性可用于指示对应服务适配的人群或用户的特征。例如,当前多媒体设备为智能电视,当前的电视节目服务中输出的电视节目为少儿动漫,显然少儿动漫的服务属性可为“少儿”,则该节目作为推荐节目输出,仅能够需要向少儿或儿童推荐,若向成人推荐或老人推荐,显然可能会导致推荐信息干扰,同时降低推荐的点击率及精准度。
在本发明实施例中步骤S160中根据偏好信息从预定***获取第二服务时,可以将预定***可提供服务的服务属性与所述偏好信息进行匹配,根据匹配结果,选择服务属性与用户喜好特征匹配度高的服务作为所述第一服务,和/或屏蔽服务属性与用户厌恶特征高的服务。
通常情况下一个用户分配一个所述第二账号,这样的话,可以根据多媒体设备当前使用的第二账号为用户提供满足其个性需求的个***。所述第一服务可为:从预定***获取满足多媒体设备当前使用的第二账号的用户个性需求的个***。
若采用本实施例中所述的方法,会根据当前使用多媒体设备的用户的第二账号,根据其偏好信息提供第一服务,进而可实现个性推荐,显然一方面可以减少信息干扰,另一方面可以实现更加精准的推荐。
在一些实施例中,所述方法还包括:基于所述第一账号获取所述预定***提供给所述第二账号的第二服务。所述第二服务可为面向所有第二账号的;所述第二服务是不会基于每一个第二账号的用户的偏好信息有选择性的提供的服务。故从这个层面来说,所述第二服务可为面向所有第二账号的通用服务或基础服务。
例如,音频设备启动后,收到随意播放一个音频的操作指令,该音频设备可以利用第一账号随机从预定***获取一个音频并输出该音频,这种音频服务即为所述第二服务。若当前音频设备识别出该用户为某一个第二账号的用户,根据该用户的偏好信息有选择性的从预定***拉取了该用户喜好的音频并输出,这种服务即为满足用户个性需求的有选择性提供的所述第一服务。
又例如,预定***为音乐***可为该多媒体设备提供音乐服务,但是对于每一个第二账号,则基于对应第二账号的偏好信息提供个***,例如,基于偏好信息确定出某一个第二账号的用户喜好摇滚乐,则在该第二账号使用所述多媒体设备时,利用所述第一账号登录到所述预定***之后,在提供所述第二服务的基础上,提供摇滚乐推荐的第一服务。
在本发明实施例中第一服务和第二服务是不同的,例如,第一服务和第二服务面向的对象是不同的,第二服务可为面向所有第二账号的服务,而第一服务是面向特定的第二账号的服务。又例如,第一服务和第二服务的不同体现在服务内容的确定方式不同,例如,第一服务的服务内容是根据用户偏好信息确定的,而第二服务可是服务器主动推动的服务,也可以是用户直接点播的服务,但是与用户偏好信息无关。值得注意的是,用户点播第一服务的行为数据,可以用户产生所述用户偏好信息。
可选地,如图6或图7所示,所述方法还包括:
步骤S101:获取所述多媒体设备的采集信息;
步骤S102:从所述采集信息中提取用户身份特征;
步骤S103:将所述用户身份特征与已注册的第二账号对应的身份特征进行匹配;
步骤S104:根据匹配的结果,确定出当前使用所述多媒体设备的用户的第二账号。
在本实施例中所述采集信息可为音频信息、图像信息或视频信息,还可以是其他传感器采集的辅助信息,所述辅助信息可包括:利用红外传感器通过红外感应到的红外信息,红外信息可以提供当前用户的体温数据,该体温数据可以作为提供当前用户的身份特征的一种数据。
在本实施例中会结合所述采集信息获得用户身份特征。在本实施例中用户身份特征为与第二账号具有一一对应关系的,用于多媒体设备或多媒体设备的管理设备等内部***识别该用户对应的第二账号的信息。
在图6中内部***包括:多媒体设备及管理设备,由多媒体设备进行信息采集,采集之后上报给管理设备,由管理设备完成用户特征的识别及匹配,确定出当前使用目标账户的用户对应的第二账号。
在一些实施中,也可以如图7所示,所述多媒体设备自身完成信息采集,并进行特征匹配确定出对应的第二账号。
所述用户身份特征,可为各种能够指示用户身份的特征,例如,指纹特征及特定行为特征等,以下提供几种获取用户身份特征的可选方式:
可选方式一:
如图8所示,所述方法还包括:
步骤S1:通过所述多媒体设备的操作***采集语音指令,其中,所述语音指令用于触发所述多媒体设备执行预定操作;在前述步骤S130中采集语音指令可以由多媒体设备的语音采集应用来采集,也可以由操作***来采集,在本实施例中,选择由多媒体设备的操作***来采集。
步骤S2:对所述语音指令进行声纹特征识别,获得第一声纹特征;
步骤S3:将所述第一声纹特征与第二声纹特征进行匹配,其中,所述第二声纹特征为已注册的所述第二账号对应的声纹特征;
步骤S4:根据匹配的结果,确定所述多媒体设备当前使用的第二账号。
所述多媒体设备内设置有操作***,在所述操作***的基础上还安装有各种应用程序。在本实施例中利用所述操作***采集语音指令,而不是利用专用的应用程序来采集所述语音指令。这样的话,只要多媒体设备的操作***被启动之后,就可以采集用户的语音指令,而不用等到特定的应用程序被启动之后才可以采集语音指令。如此,本发明实施例提供的方案,可以降低语音指令采集的时延。
若多媒体设备处于休眠状态等,一般情况下为了降低多媒体设备的功耗,很多应用都是被关闭的或者处于未激活态的,若需要由应用来采集所述语音指令,则该应用必须被启动且保持激活态否则无法采集语音指令,但是应用程序保持激活态显然会消耗功耗。而在本实施例中直接由操作***来采集语音指令即可。
在本实施例中所述语音指令可为用户指示所述多媒体设备执行任意一个操作的操作指令。一方面,通过对语音指令的声纹特征的提取,可以获得确定多媒体设备当前使用的第二账号的识别特征,另一方面,所述语音指令还会触发所述多媒体设备响应执行对应的操作。故在一些实施例中,所述方法还包括:响应所述语音指令,执行所述预定操作。例如,所述预定操作为音乐播放操作,则所述音频设备会从不播放音乐的状态,切换到播放音乐的状态。
不同的用户的声音具有不同的特点,例如,不同的用户的频率、音色不同,习惯的说话声音大小不同,则就会导致多媒体设备采集的音频信息的频率、音色及响度的至少其中之一不同,而这些信息均反映在声纹特征中,这样就可以多媒体设备采集的声纹特征来确定出当前使用多媒体设备的用户对应的第二账号。
可选地,所述预定操作为不同于账号注册操作。所述账号注册操作为进行第二账号的操作。
所述S4可包括:当所述第一声纹特征与所述第二声纹特征不匹配时,基于所述第一声纹特征新注册一个第二账号;确定新注册的所述第二账号为所述多媒体设备当前使用的第二账号。
若当前检测的第一声纹特征与所有第二账号的声纹特征都不匹配,表明当前有新的用户使用该多媒体设备,故基于提取的所述第一声纹特征自动发起账号注册流程,从而注册一个专属当前用户的第二账号。在注册一个新的第二账号之后,会将从语音指令中提取的声纹特征与该新注册的第二账号对应存储,方便下次该用户在使用多媒体设备时,可以通过声纹特征的提取和匹配,确定出多媒体设备当前需要使用的第二账号。
可选地,所述方法还包括:
当所述第一声纹特征与所述第二声纹特征不匹配时,输出注册提示语音;
采集注册应答语音;
当所述注册应答语音指示进行新账号注册时,基于所述第一声纹特征新注册一个第二账号。
在一些情况下,家里有客人来访,客人可能是新使用多媒体设备的用户,显然就不需要重新注册一个新的第二账号。为了避免注册过多的使用频率低的第二账号,在本实施例中若检测到第一声纹特征和第二声纹特征不匹配时,会输出注册语音提示,这样用户就可以听到多媒体设备输出的进行账号注册的提示。用户可以根据自己的情况说出自己的注册应答,这样多媒体设备就可以采集到注册应答语音。
若注册应答语音指示进行新账号注册时,才会基于第一声纹特征注册一个新第二账号,否则不新注册一个第二账号;从而减少了使用频次低的第二账号的不必要注册。
可选地,所述方法还包括:当所述注册应答语音指示不进行新账号注册时,确定所述多媒体设备当前使用一个默认的所述第二账号提供多媒体服务。如用户的注册应答语音指示不进行新账号注册时,为了继续提供多媒体服务,则使用一个默认的第二账号为该用户提供多媒体服务,以提高用户的使用体验。
在一些实施例中,所述步骤S4还可包括:
当所述第一声纹特征与所述第二声纹特征匹配时,确定所述多媒体设备当前使用一个与所述第一声纹特征对应的第二账号提供多媒体服务。
若当前检测到第一声纹特征,与某个已注册的第二账号的第二声纹特征匹配,则直接选择该第二账号作为多媒体设备的当前使用的第二账号,可以方便在步骤S160中有针对性的提供所述第一服务。
可选地,所述步骤S1可包括:
通过所述多媒体设备的操作***采集状态切换指令;
所述响应所述语音指令,基于所述预定操作,包括:
所述多媒体设备根据所述状态切换指令从第一状态切换到第二状态,其中,位于所述第一状态下的所述多媒体设备的功耗低于位于所述第二状态下的功耗。
在本实施例中所述多媒体设备的状态可包括:第一状态和第二状态,所述多媒体设备处于第一状态时的功耗是低于多媒体设备的处于第二状态的功耗,即第一状态为低功耗状态,而第二状态为高功耗状态。若所述第一状态可为:休眠状态,则所述第二状态可为:退出休眠状态之后的激活状态,若所述第一状态为关闭状态,则所述第二状态可为启动状态。
故在一些实施例中,所述状态切换指令可为所述多媒体设备的启动指令,多媒体设备在检测到启动指令之后,会从关闭状态进入到启动状态。在关闭状态下,所述多媒体设备可以采集语音指令,但是不可以提供音频服务和/或视频废物等多媒体服务。在所述启动状态下,所述多媒体设备不仅可以采集语音指令,还可以提供所述多媒体服务。
故在另一些实施例中,所述状态切换指令还可为多媒体设备的激活指令;在所述休眠状态下所述多媒体设备虽然未关闭,但是其处理器(例如,中央处理器)进入到休眠状态很多操作都无法响应,也可能是无法提供多媒体服务;但是退出休眠状态进入到激活状态之后,所述多媒体设备的各项功能都被激活,能够提供所述多媒体服务。
在一些实施例中,所述步骤S1可包括:通过所述多媒体设备的操作***采集服务获取指令;在本实施例中所述服务获取指令为获取多媒体服务的指令,例如,指示多媒体设备获取音频并播放音频等。
所述方法还包括:
所述多媒体设备根据所述服务获取指令,从第一状态切换到第二状态,其中,位于所述第一状态下的所述多媒体设备的功耗低于位于所述第二状态下的功耗;
所述响应所述语音指令,基于所述预定操作,包括:
在切换到所述第二状态后,根据所述服务获取指令基于当前使用的第二账号提供多媒体服务。
该服务获取指令不仅可以触发多媒体设备提供多媒体服务,还将触发多媒体设备从第一状态退出并进入到第二状态,然后在第二状态下提供所述多媒体服务。这样用户通过一个服务获取指令就可以触发多媒体设备的状态切换及多媒体服务的提供,显然减少了用户需要提供的指令个数,简化了用户操作。
例如,在家庭影院设备中,父亲和女儿喜欢的视频节目可能完全不同,刚开始父亲在看军事节目,中途离开女儿进入到客厅通过语音控制家庭影院设备切换到与美容护肤相关的综艺节目。显然这其中出现了观看用户的切换。此时,女儿在切换观看节目时,若采用语音控制的,则家庭影院设备会采集到对应的语音指令;而从父亲和女儿的语音指令中提取的声纹特征显然是会有差异的。若女儿说除了“换台”的语音指令,则可以从该语音指令提取出女儿的声纹特征,并根据声纹特征的匹配,将从父亲的第二账号切换到女儿的第二账号,并查询女儿的偏好信息,该偏好信息表明女儿可能喜欢美容护肤的兴趣标签。根据查询到的兴趣标签,视频设备可以自动切换到女儿喜欢看的美容节目。即便女儿未说需要换到那个节目,视频设备就可以根据女儿的偏好信息自动切换到其喜欢的频道。
可选方式二:所述步骤S101可包括:
从图像信息中提取外貌特征。
所述外貌特征一般为用户外表的可视特征,是可以通过图像采集的获得,例如,用户的脸部特征。所述脸部特征又可以分为:脸部轮廓特征、五官的形状特征,五官的分布特征、虹膜特征、发际线的高度、发型和/或头发颜色等等。所述外貌特征可为上述特征的一个或多个。
有些外貌特征是容易改变的,例如,发型及头发颜色,在本实施例中优选面部特征等不容易改变特征作为识别第二账号的特征。
在一些实施例中,所述外貌特征还可包括:用户形体特征等。
可选方式三:
所述步骤S101还可包括:
从所述语音信息中提取用户发音特征,不同的用户具有不同的发音特点,例如,说某些字词的口音,这样的话,还可以根据用户的发声音特征确定出当前使用多媒体设备的用户对应的第二账号。
可选方式四:
所述步骤S101还可包括:
解析多媒体设备采集的语音信息,从所述语音信息提取指向特定第二账号的指示信息,例如,用户A说出了自己的名字,则该名字与对应的第二账号对应,显然根据这样的方式也可以确定出用户的第二账号。
可选方式五:
所述步骤S101还可包括:
利用所述多媒体设备设置有分离或连接的控制设备,不同的用户操作控制终端的方式不同,按压实体键的力度,或者利用结合有指纹采集功能的按键采集用户指纹,利用用户指纹确定出第二账号等。
可选方式六:
所述步骤S101还可包括:
利用红外传感器等采集用户体温,和/或,利用用户随身携带与所述多媒体设备连接的智能设备采集的心跳信息,等能够表明用户身份的各种信息,获得用户身份特征。
在具体实现时,可以用于获取用户身份特征的采集信息有多种,不局限于上述任意一种。在具体实现时,为了实现用户身份特征的精确识别,可以结合上述任意两种或两种以上的采集信息。
则对应的所述步骤S102可包括:利用步骤S101中的一种或多种用户身份特征与第二账号对应的特征进行匹配,这样就会得到对应的匹配度等匹配的结果,再结合匹配的结果,确定出当前使用多媒体设备的用户对对应的第二账号。例如,所述步骤S102可包括以下至少之一:将所述声纹特征与各个所述第二账号对应的声纹特征进行匹配;将所述外貌特征与各个所述第二账号对应的外貌特征进行匹配。
故在本实施例中至少可以结合音频信息获得声纹特征及外貌特征,利用声纹特征及外貌特征中的一个或两个作为用户身份特征,确定出当前使用多媒体设备的用户的第二账号。
在一些实施例中,所述采集信息还可为图像信息,例如,母亲进入客厅可以通过遥控或无线鼠标等控制设备,控制家庭影院设备进行播出节目的切换。通过多媒体设备自身包括的图像采集装置(如摄像头)或者与多媒体设备连接的摄像头通过图像的实时采集或在检测到控制设备发送的控制治指令时对多媒体设备的可视区域的范围采集,获得图像信息。通过图像信息的提取,确定出外貌特征,基于外貌特征可以确定出当前使用多媒体设备的当前用户及其对应的账号。在本实施例中若采集到有多个包括人像的照片时,可以仅控制设备与人像的位置关系,确定提取哪一个人像的外貌特征。例如,仅提取持有多媒体设备的人像的外貌特征,也可以仅提取与控制设备最近的人像的外貌特征。
总之,在本实施例中可以对每一条与控制多媒体设备执行一定操作的语音的音频信息进行声纹特征的提取,也可以在检查到控制设备发送的控制指令时,采集图像信息或其他有助于身份识别的辅助信息,以通过用户身份特征的提取,确定每一条用户输入对应的第二账号,精确获得用户的行为数据,以精确获得偏好信息,从而方便后续个***的精准推送和/或推荐。这里的推送为直接向对应的用户向其提供与其他人不同的服务,推荐则为在该用户的第二账号的界面显示个***的推荐信息,或通过语音输出推荐信息。
可选地,所述方法还包括:
若所述用户身份特征与已有第二账号对应的身份特征均不满足预设匹配条件时,记录所述用户身份特征;
基于所述用户身份特征注册一个第二账号。
在本实施例中若检测出对应的用户身份特征与所有已有第二账号的身份特征都不满足预设匹配条件,例如,与所有的已有第二账号的身份特征的匹配度都低于一个阈值,则可认为当前是一个新的用户在使用多媒体设备的用户,需要建立一个新的第二账号。此时,多媒体设备或与多媒体设备连接的管理设备,重新分配一个第二账号给该用户,将分配的第二账号与该用户的身份特征建立对应关系,用于下一次在该用户使用多媒体设备时,识别出该用户并启动该用户对应的第二账号提供个***。
在一些实施例中,所述第二账号分为两种,一种是临时第二账号,另一种正式第二账号。在本实施例中,首次检测到与任意一个第二账号(包括:正式第二账号和临时第二账号)的身份特征都不匹配的用户身份特征时,建立一个临时第二账号;并记录该第二账号被使用的次数和/或频次等使用状态信息;当所述使用状态信息在预定时间内满足转正条件时,将所述临时第二账号转换为正式第二账号。例如,该临时第二账号的登录次数在预定时间内达到预定次数,或登录频次达到预定频次,就满足所述转正条件,将该临时第二账号确定为正式第二账号。若在预定时间内不满足所述转正条件,删除该临时第二账号。
在一些实施例中,所述多媒体服务可包括:无需收费就提供的免费服务和需要收费才提供的收费服务。例如,在本实施例中对默认的第二账号提供的服务可为所述免费服务。
在还有一些实施例中,所述多媒体服务分为多个级别,例如,限制级和非限制级,有些视频内容或音频内容等服务内容可能涉及到暴力等问题,不适宜儿童观看;这种内容就可以设置为限制级服务的服务内容。在本实施例中,若向默认的第二账号提供的第二服务,即可为所述非限制级通用服务。
故在一些实施例中,所述方法还包括:确定所述第二账号的权限范围;
根据所述权限范围向对应的所述第二账号提供所述第一服务。
在本实施例中还会设置第二账号的权限范围,该权限范围限定了对应的第二账号可获取的多媒体服务的种类和/或属性等范围。
例如,账号A为家里小朋友的第二账号,显然一些涉及暴力等限制级的视频节目和/或音频是不适合其使用的,故在本实施例中会对该第二账号配置禁止使用限制级的多媒体服务的权限。
所述配置所述第二账号的权限范围可包括:
根据第二账号的用户属性确定所述权限范围,例如,根据用户年纪,分别为儿童和成人的第二账号设置不同的权限范围。又例如,根据用户心理状况信息,确定所述第二账号的权限范围;有些用户有心理创伤或心理疾病等,有些视频和/或音频是不适合其观看的,此时多媒体设备或其管理设备可以根据心理状况信息自动配置权限范围,以屏蔽不适合这一类型用户获取的多媒体服务。针对收费服务和免费服务,例如,可以根据用户年纪将未成年人的第二账号的权限范围设置为免费服务,将年人的第二账号的权限范围包括:收费服务和免费服务。
故所述步骤S150可包括:当所述第二账号的权限范围为第一权限范围时,利用所述第一账号从所述预定***中获取所述第一权限范围内的所述第一服务;当所述第二账号的权限范围为第二权限范围时,利用所述第一账号从所述预定***中获取所述第二权限范围内的所述第一服务;其中,所述第一权限范围大于所述第二权限范围。
在一些实施例中,所述方法还包括:接收配置指令,其中,所述配置指令是由权限范围为第一权限范围的所述第二账号提供的;基于所述配置指令配置所述第二权限范围。
这样的话,通过权限范围的设置可以使得第二账号的权限范围实现区分化,权限范围大的第二账号可以对权限范围小的第二账号的权限范围进行配置。例如,所述多媒体设备为家庭共享设备,父母可以利用自身的权限范围大的第二账号,配置子女的第二账号的权限范围。
通过权限范围的配置,可以限制权限范围是否可以使用第一账号购买收费服务等。
当检测到一个与已有的第二账号的身份特征不匹配的用户身份特征时,主动注册一个新的第二账号,这是对多媒体设备的第二账号的一种主动注册模式。在有一些情况下,所述多媒体设备或所述多媒体设备的管理设备等所述多媒体设备所在的管理***,还提供被动注册模式。所述被动注册模式为:多媒体设备检测到用户输入的注册指令,基于注册指令进行第二账号的注册的流程,例如,所述方法还包括:在检测到注册指令时,获取多媒体设备的采集信息;从所述采集信息中提取用户身份特征;基于所述用户身份特征注册一个第二账号。
在本实施例中利用多媒体设备的人机交互接口检测所述注册指令,这里的人机交互接口可包括:多媒体设备的语音采集装置、触摸面板、遥控器或无线鼠标或视觉识别***等可以检测用户输入的装置及结构,所述人机交互接口检测到注册指令时,触发所述多媒体设备自身或与所述多媒体设备连接的管理设备,进行一个新的第二账号的分配,完成第二账号的注册流程。在本实施例中,注册第二账号时,需要采集新的用户的身份特征,故多媒体设备会采集新用户的信息,例如,语音采集新用户的语音,图像采集新的用户的图像,从而方便从采集信息中提取出该用户的身份特征,以与新分配的第二账号建立对应关系。
这样所述第二账号的注册,既可以主动注册也可以被动注册,可以满足不同的注册需求,尽可能的提升用户使用满意度及内部***的智能性。
在一些实施例中,所述方法还包括以下至少之一:
根据所述第二账号记录用户行为数据;
根据所述第二账号对应的偏好信息,配置所述多媒体设备的应用模式、所述多媒体设备的使用权限、使用所述第一账号的应用权限及账号优先级;其中,不同的应用模式的输出参数不同;所述账号优先级,用于当不同所述第二账号对所述多媒体设备的配置冲突时,为所述目标账号提供确定最终配置参数的选择依据;
根据所述第二账号对应记录预定信息,其中,所述预定信息包括:备忘录和/或日程信息。
在本实施例中,在记录用户行为数据时,由于虽然是一个多媒体设备,但是使用的用户不同,可以采用不同的第二账号进行用户行为数据的区分记录,方便基于这些用户行为数据,获得对应第二账号的偏好信息。
在本实施例中配置所述多媒体设备的应用模式。这里的应用模式可包括:输出参数和/或输出风格。例如,当所述多媒体设备为音频输出设备时,不用的用户喜好不同的音色,习惯不同的输出音量,而这些参数都可以作为应用模式中的默认输出参数被设置。一首歌曲的风格可为摇滚、民谣等,而这可以由输出风格进行体现。而输出风格同样是输出模式中的一个参数。若用户A对应的第二账号的应用模式的输出风格配置为摇滚,当一首歌曲有摇滚版和非摇滚版时,优先输出摇滚版的,以向该用户提供个***。
例如,当所述多媒体设备为视频输出设备(如电视机或家庭影院)时,则所述应用模式可包括:显示界面风格,控制界面风格以及视频输出设备的色调或色温参数,以提供不同第二账号对应的不同用户的个***,满足其个性需求。
所述多媒体设备的使用权限,这里的使用权限可包括:升级多媒体设备的***、更换多媒体设备绑定的第一账号、修改该多媒体设备绑定的第一账号对应的第二账号等。不同的第二账号具有不同的多媒体设备的使用权限,这样翻遍分第二账号控制对多媒体设备的使用。例如,一个第一账号包括两个等级的第二账号;所述多媒体设备的使用权限可包括:第一等级使用权限和第二等级使用权限;当所述第二账号为第一等级第二账号时,具有第一等级使用权限;当所述第二账号为第二等级使用权限时,具有第二等级使用权限;所述第二等级使用权限小于所述第一等级使用权限,并包括在所述第一等级使用权限中。
所述第一账号时所述多媒体设备用于与外部***进行对接的账号,在本实施例中不同的第二账号在利用该第一账号与外部***进行对接时,具有不同的应用权限。例如,有些第二账号不能利用该第一账号购买收费服务,或者,仅限于不超过预定金的收费服务。有些第二账号不可以修改第一账号的一些设置参数。例如,在购买收费服务时,是否需要支付密码,或者,修改第一账号绑定的支付账号等。
在本实施例中,所述第二账号具有不同的账号优先级,例如,两个第二账号都具有多媒体设备或第一账号的某些应用权限,这种应用权限可为设置多媒体设备的多媒体服务提供参数的权限,而且一经设置对所有第二账号都有效或对部分第二账号有效。此时,就可能存在两个第二账号的设定出现冲突。在本实施例中,所述多媒体设备或多媒体设备的管理设备会根据所述账号优先级,选择账号优先级的优先程度高的第二账号的设定参数作为最终的设定参数,以控制多媒体设备的运行。
例如,一个家庭影院,有包括父母的第二账号和儿女的第二账号,都可以设定多媒体设备是否自动接收某一个信息,父母的第二账号的账号优先级高于儿女的第二账号的优先级,这样方便账号优先级的差分,方便父母的第二账号控制儿女的第二账号。例如,利用父母的第二账号配置儿女的第二账号可收听的音频节目的类型或观看的视频节目的类型。若此时,父母的第二账号对儿女的第二账号的权限设定,与儿女利用自身的第二账号的设定恰好冲突时,则会以采用父母的第二账号的设定为准。
在一些实施例中,多媒体设备或多媒体设备的管理设备会基于用户输入或用户指示产生所述预定信息,这里的预定信息可为备忘录和日程信息的一种。例如,根据用户使用多媒体设备的习惯,多媒体设备或多媒体设备的管理设备自动生成日程信息。当时若一个多媒体设备被多个用户共享时,若仅生成一个日程信息,显然不能够精确反映是哪一个用户的日程信息,还可能会出现日程冲突的问题。同样的若不分用户记录备忘录,也可能导致冲突问题。在本实施例中由于一个第一账号对应设置了多个第二账号,且这些第二账号对应了不同的用户,故可以基于第二账号分别记录日程信息及备忘录等预定信息,从而简便的解决这种信息冲突,进而可以减少因为信息冲突导致的***异常或设备执行异常等。
可选地,所述步骤S160可包括以下至少之一:
根据所述第二账号对应的偏好信息,为所述第二账号提供推荐信息,其中,所述推荐信息用于供所述多媒体设备输出;
根据所述第二账号对应的偏好信息,为所述第二账号选择对应的应用模式,其中,所述多媒体设备在所述应用模式下为对应的所述第二账号提供服务。
进行服务推荐时,需要有针对性的推荐,否则推荐信息可能时对用户的信息干扰,且推荐精准度低,在本实施例中可以基于第二账号的偏好信息进行精准推荐,从而一方面减少信息干扰,另一方面提升推荐精准度。
在一些实施例中,根据偏好信息设定应用模式,不同的应用模式有不同的输出参数和/或输出风格,这样显然仅会针对特定的第二账号,显然这也是实现了个***。这里的个***可包括:基于偏好信息调整在音频输出选择页面或视频输出选择页面上的各个输出信息的显示位置。再例如,调整与用户的交互模式。这里的交互模式可为应用模式的一种。
例如,儿童和成人需要不同类型的语音反馈机制。成人一般希望语音反馈简单直接,而儿童则有更多的感悟需求,不喜欢生硬的语气,故在本实施例中可以利用不同的第二账号,分别为成人和儿童配置不同的语音交互模式,使得用户时成人时,语音交互简洁明了,而当用户是儿童时,则语音交互有更多的引导,优先采用偏亲近的女音输出语音反馈等。
当然以上仅是举例,具体实现时可以有各种的不同方式,在本实施例中正对共用一个多媒体设备的多个用户,分别设置对应于该多媒体设备的第一账号的多个第二账号,进行分别基于第二账号在内部***内进行服务的个性话提供。然后多个第二账号共用一个第一账号与外部***对接,获取外部***提供的通用服务或者说是基础服务。
如图9所示,本实施例提供一种信息处理方法,包括:
步骤S210:利用多媒体设备的操作***采集语音指令;其中,所述语音指令,用于触发所述多媒体设备执行预定操作,所述预定操作不同于账号注册操作;
步骤S220:对所述语音指令进行声纹特征识别,获得与所述语音指令对应的第一声纹特征;
步骤S230:将所述第一声纹特征与第二声纹特征进行匹配,其中,所述第二声纹特征已注册账号对应的声纹特征;
步骤S240:若匹配不成功,基于所述第一声纹特征进行账号注册。
在本实施例中还提供一种账号注册的信息处理方法。同样的,利用操作***采集语音指令,通过声纹特征的识别,注册一个利用与声纹特征对应的账号,这里的账号可为前述第一账号和/或第二账号。这样的话,后续可以通过声纹特征提取的识别出当前使用多媒体设备的用户,并采用对应的账号提供服务。
可选地,所述步骤S240可包括:若匹配不成功,输出注册提示语音;采集注册应答语音;当所述注册应答语音指示进行账号注册时,基于所述第一声纹特征进行账号注册。
可选地,所述方法还包括:当所述注册应答语音指示不进行账号注册时,确定所述多媒体设备使用默认账号提供多媒体服务。
可选地,所述方法还包括:为已注册账号配置使用所述多媒体设备的权限范围。权限范围的配置可以参见前述实施例的对应部分,在此就不再重复描述了。
可选地,所述权限范围包括:第一权限范围和第二权限范围;所述第一权限范围大于所述第二权限范围;所述方法还包括:采集所述第一权限范围的账号的配置指令;基于所述配置指令,确定所述第二权限范围。
在一些实施例中,所述步骤S210可包括:通过所述多媒体设备的操作***采集状态切换指令;所述响应所述语音指令,基于所述预定操作,包括:根据所述状态切换指令,所述多媒体设备从第一状态切换到第二状态,其中,位于所述第一状态下的所述多媒体设备的功耗低于位于所述第二状态下的功耗。这里的第一状态和第二状态的描述均可以参见前述实施例。
可选地,所述步骤S210还可包括:通过所述多媒体设备的操作***采集服务获取指令;所述方法还包括:根据所述服务获取指令,所述多媒体设备从第一状态切换到第二状态,其中,位于所述第一状态下的所述多媒体设备的功耗低于位于所述第二状态下的功耗;在切换到所述第二状态后,根据所述服务获取指令基于当前使用的第二账号提供多媒体服务。
如图10所示,本发明实施例还提供一种信息处理装置包括:
第一配置单元110,用于为多媒体设备配置至少一个第一账号;
第二配置单元120,用于为所述多媒体设备配置多个第二账号,其中,多个所述第二账号与至少一个所述第一账号关联;
采集单元130,用于采集语音指令;
确定单元140,用于根据所述语音指令确定当前使用的所述第二账户;
查找单元150,用于查找与当前使用的所述第二账户相关联的用户偏好信息;
服务提供单元160,用于基于用户偏好信息和基于所述语音指令确定的服务请求信息,向所述当前使用的第二账户代表的用户标识提供第一服务。
在本实施例中所述第一配置单元110、第二配置单元120,确定单元140、查找单元150及服务提供单元160均可对应于处理器或处理电路。所述处理器可对应于应用处理器AP(AP,Application Processor)、中央处理器(CPU,Central Processing Unit)、数字信号处理器(DSP,Digital Signal Processor)、可编程门阵列(FPGA,Field Programmable GateArray)或者微处理器(Micro Processing Unit,MCU)。所述处理电路可对应于专用集成电路(ASIC,Application Specific Integrated Circuit)。
所述处理器或处理电路可以通过计算机程序等计算机可执行代码的执行实现所述第二账号和第一账号进行配置。
在一些实施例中,所述服务提供单元160,还用于基于所述第一账号获取所述预定***提供给所述第二账号的第二服务。
所述采集单元130,可对应于麦克风等采集音频的组件,可用于通过所述多媒体设备的操作***采集语音指令,其中,所述语音指令用于触发所述多媒体设备执行预定操作。
所述确定单元140,可包括:
识别子单元,用于对所述语音指令进行声纹特征识别,获得第一声纹特征;
匹配子单元,用于将所述第一声纹特征与第二声纹特征进行匹配,其中,所述第二声纹特征为已注册的所述第二账号对应的声纹特征;
确定子单元,用于根据匹配的结果,确定所述多媒体设备当前使用的第二账号;
执行单元,用于响应所述语音指令,执行所述预定操作。
可选地,所述预定操作为不同于账号注册操作;所述多媒体设备还包括:
注册单元,用于当所述第一声纹特征与所述第二声纹特征不匹配时,基于所述第一声纹特征新注册一个第二账号;
确定子单元,用于确定新注册的所述第二账号为所述多媒体设备当前使用的第二账号。
可选地,所述多媒体设备还包括:
输出单元,用于当所述第一声纹特征与所述第二声纹特征不匹配时,输出注册提示语音;
所述采集单元,还用于采集注册应答语音;
所述注册单元,还用于当所述注册应答语音指示进行新账号注册时,基于所述第一声纹特征新注册一个第二账号;
可选地,所述确定子单元,还用于当所述注册应答语音指示不进行新账号注册时,确定所述多媒体设备当前使用一个默认的所述第二账号提供多媒体服务。
可选地,所述确定子单元,还用于当所述第一声纹特征与所述第二声纹特征匹配时,确定所述多媒体设备当前使用一个与所述第一声纹特征对应的第二账号提供多媒体服务。
所述采集单元,用于通过所述多媒体设备的操作***采集状态切换指令;
所述执行单元,用于为所述多媒体设备根据所述状态切换指令从第一状态切换到第二状态,其中,位于所述第一状态下的所述多媒体设备的功耗低于位于所述第二状态下的功耗。
所述采集单元,用于通过所述多媒体设备的操作***采集服务获取指令;所述切换单元,为所述多媒体设备根据所述服务获取指令,从第一状态切换到第二状态,其中,位于所述第一状态下的所述多媒体设备的功耗低于位于所述第二状态下的功耗;所述执行单元,在切换到所述第二状态后,根据所述服务获取指令基于当前使用的第二账号提供多媒体服务。
可选地,所述信息处理装置还包括:
第三配置单元,用于配置所述第二账号的权限范围;
所述服务提供单元160,还用于根据所述权限范围向对应的所述第二账号提供所述第一服务。
所述服务提供单元160,还用于当所述第二账号的权限范围为第一权限范围时,利用所述第一账号从所述预定***中获取所述第一权限范围内的所述第一服务;当所述第二账号的权限范围为第二权限范围时,利用所述第一账号从所述预定***中获取所述第二权限范围内的所述第一服务;其中,所述第一权限范围大于所述第二权限范围。
可选地,所述第三配置单元,还用于接收配置指令,其中,所述配置指令是由权限范围为第一权限范围的所述第二账号提供的;基于所述配置指令配置所述第二权限范围。
如图11所示,本实施例提供一种信息处理装置,包括:
采集模块210,用于利用多媒体设备的操作***采集语音指令;其中,所述语音指令,用于触发所述多媒体设备执行预定操作,所述预定操作不同于账号注册操作;
识别模块220,用于对所述语音指令进行声纹特征识别,获得与所述语音指令对应的第一声纹特征;
匹配模块230,用于将所述第一声纹特征与第二声纹特征进行匹配,其中,所述第二声纹特征已注册账号对应的声纹特征;
注册模块240,用于若匹配不成功,基于所述第一声纹特征进行账号注册。
所述采集模块,可对应于麦克风等采集组件,可以采集音频信息,可用于采集语音指令。
所述识别模块、匹配模块及注册模块可对应于处理器,可通过计算机i程序等执行实现声纹特征识别及账号注册等操作。
所述多媒体设备还包括:
输出模块,用于若匹配不成功,输出注册提示语音;
所述采集模块,还用于采集注册应答语音;
所述注册模块,还用于当所述注册应答语音指示进行账号注册时,基于所述第一声纹特征进行账号注册。
所述多媒体设备还包括:
确定模块,用于当所述注册应答语音指示不进行账号注册时,确定所述多媒体设备使用默认账号提供多媒体服务。
所述多媒体设备还包括:
第三配置模块,用于为已注册账号配置使用所述多媒体设备的权限范围。
可选地,所述权限范围包括:第一权限范围和第二权限范围;所述第一权限范围大于所述第二权限范围;
所述采集模块,还用于采集所述第一权限范围的账号的配置指令;
所述第三配置模块,还用于基于所述配置指令,确定所述第二权限范围。
所述采集模块,还用于通过所述多媒体设备的操作***采集状态切换指令。
所述多媒体设备还包括:
执行模块,用于根据所述状态切换指令,所述多媒体设备从第一状态切换到第二状态,其中,位于所述第一状态下的所述多媒体设备的功耗低于位于所述第二状态下的功耗;
所述采集模块,还用于通过所述多媒体设备的操作***采集服务获取指令。
所述多媒体设备还包括:
切换模块,用于根据所述服务获取指令,所述多媒体设备从第一状态切换到第二状态,其中,位于所述第一状态下的所述多媒体设备的功耗低于位于所述第二状态下的功耗;
所述执行模块,还用于在切换到所述第二状态后,根据所述服务获取指令基于当前使用的第二账号提供多媒体服务。
如图12所示,本实施例提供一种多媒体设备包括:
多媒体输出模组300,用于输出多媒体信息;
存储器310,用于存储数据;
处理器320,用于与所述存储器310及所述多媒体输出模组300连接,通过执行所述存储器310存储的计算机程序实现前述一个或多个技术方案提供的信息处理方法,例如,可如图1、图6、图7、图8及图9所示的信息处理方法中的一个或多个。
所述多媒体输出模组300可包括:喇叭或扬声器等可以输出音频的结构,还可包括:显示屏等可以输出图像的器件。总之,本实施例中的所媒体输出模组300可为各种能够输出多媒体信息的模块或组件。
在本实施例中所述存储器310可为各种计算机存储介质,该计算机存储介质可用于存储各种数据,例如,所述计算机程序,在一些实施例中还存储有第二账号及第一账号、偏好信息及用户身份特征各种数据。
在本实施例中,所述处理器320可通过集成电路总线等总线接口与所述存储器310,可通过所述计算机程序的执行实现上述一个或多个技术方案提供的信息处理方法。
这种服务提供***,能够仅基于一个第一账号提供共用一个多媒体设备的多个用户精准个***,提升***的智能性及用户使用满意度。
可选地,本发明实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行前述任意一个或多个技术方案提供的服务方法。
所述计算机存储介质可包括:移动存储设备、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,可选为非瞬间存储介质。
以下结合上述任意一个实施例提供几个具体示例:
示例1:
本示例提供一种应用于多媒体设备的个性信息处理方法。为提供个性化的服务(即第一服务),智能音箱一般会绑定一个第一账号(如亚马逊账号)。对于外部***而言,所有通过与音箱的交互都被视为同一个用户的行为。音箱以家庭应用场景为主,而家庭成员中的父母、孩子等有着较大的偏好差异(例如,成年人和儿童对音乐的喜好)以及非常不同的需求(儿童有更多好闲聊需要)。由于现有方案不能区分家庭成员,因此,无法对每个成员进行精细化的个***,造成整体用户体验的不佳。
本示例提出一种基于声纹识别的个***提供方案,具体的,对每个音箱,通过注册多个家庭成员都注册形成第二账号,由多个第二账号形成一个第二账号体系。在用户使用音箱时,通过声纹识别技术,自动识别不同的家庭成员,采用给家庭成员对应的第二账号为其提供个***,达到更细致化的更精准的个***提供。
所述第一账号:同音箱绑定,以标识音箱身份的专用或第三方账号(例如,可利用微信号、QQ号、京东账号作为第一账号与外部***进行对接)。
第二账号:在音箱绑定第一账号后,为家庭或团队成员单独生产的应用于智能音箱所在的多媒体服务***内的第二账号,用以区分音箱的不同使用者。其中,多个第二账号可以同时对应一个第一账号,也可以对应不同的第一账号(即音箱同时绑定多个第一账号)。
声纹识别(Voiceprint Recognition,VPR),也称为说话人识别(SpeakerRecognition),是一项利用话说人语音自动识别话说人身份的技术。
注册(enrollment):声纹识别中,需要用户提供若干时长的语音数据,作为后续识别任务的参考依据,这一过程称为注册。在完成注册后就会该用户分配一个第二账号,该第二账号与该用户的声纹特征对应。
所述个***可包括以下一种或多种:
1)推荐服务——以音乐为例,不同用户会收听不同类型的音乐,如果仅利用一个第一账号全部收听记录为依据,会造成推荐的混乱,如为父母推荐儿童歌曲;在本示例中引入第二账号,分别记录每一个用户的收听记录,方便后续有针对性的推荐。
2)反馈服务——儿童和成人需要不同类型的反馈机制。成人一般希望反馈简单直接,而儿童则有更多的感悟需求,不喜欢生硬的语气;在本示例中会利用成人和儿童对应的不同第二账号,提供不同的语音反馈服务。对于智能电视等还可以基于不同的第二账号,提供不同的视觉反馈服务。
3)信息管理服务——若所有用户使用一个第一账号记录备忘录、日程等不能区分,管理上会出现混乱和矛盾(如日程冲突)。在本示例中会利用不同的第二账号,分别记录不同用户的备忘录和/或日程信息。
4)隐私和安全服务——第一账号涉及付费服务及社交,有一定的隐私性需要。特别的,应避免儿童进行一些不适当的操作,如拨打同事的电话、进行网上购物等。在本示例中可以设置不同第二账号的第一账号的应用权限或设备的应用权限。
本示例提出的方案中,通过声纹识别或脸部识别等识别技术,自动用户身份特征,在不增加用户负担的前提下,可以为用户提供更加精细的个***。
本示例中多个用户共享一个第一账号。所述第二账号还可设置一个主账号和多个从账号,当设备识别到小朋友(从账号)的语音时,拒绝付费服务授权等;当识别到其他成年从用户且进行付费服务授权时,唤起主用户的应用,触发信息提示是否同意付费或者授权,如主账号表示同意,前述从用户才可能执行付费及授权流程。将第二账号分为主账号和从账号,显然主账号的优先级高于从账号的优先级。
示例2:
如图13所示,本示例提供方案允许同一台音箱同时绑定一个以上的第一账号。不同用户可以使用同一个第一账号,而一个第一账号可以同时对应多个第一账号。使用时,用户身份通过声纹识别技术自动确定当前用户对应的第二账号。
若当前检测到使用音箱的用户对应的账号为User-wx-2,则基于该第二账号提供个***。如图9所示,所述个***可包括:歌曲收藏、收听历史记录、备忘录及个性推荐等。
如图14所示,本示例提出个性信息处理方法:
1)接收用户输入的语音请求,在接收到语音请求后,音箱或音箱的管理设备利用声纹提取技术,判断当前采集的声音的声纹特征是否与已知的第二账号的声纹特征的匹配。
2)如果匹配,则调用匹配的第二账号提供个***,例如,调用匹配的第二账号的用户偏好信息进行个性化语音交互,并进行个***提供。
3)如果没有匹配上,可能存在如下两种情况:a.新用户;b.为已知用户,但没有识别成功。因此,在具体的产品设计上,可以有如下不同的考虑:
4)为了不影响用户的使用,对未识别的声音,先调用默认账号对应的默认用户数据提供个***。
5)希望为新用户建立对应的第二账号,或对于未识别的用户,将新的语料加入更新的声纹模型。这时,触发新的流程进行声音的注册(或补充注册)。由于这种交互会打断用户正常的交流,因此,何时、何种情况下触发流程需要产品设计时具体考虑。
如图15所示,以下提供一种基于主动注册机制的第二账号注册方法,包括:
1)注册机制被触发,开始基于语音的注册流程,具体的触发方式可包括应用(APP)自动触发或用户语音触发。
2)提示用户输入用户名,然后识别并保存用户名,例如,设备输出“您叫什么名字?”。
3)采集用户输入的用户名;例如,用户输入“Mike”。
4)提示用户朗读并录入语音,可以重复输入若干次。例如设备输出“Mike,请在滴声之后输出……”。
5)用户朗读,采集用户朗读音,例如,采集用户说出的……。
通过这种方式也可以用来补充新的训练语料。
6)判断是否继续收集,若否则返回提示用户朗读,若是则结束注册流程。
声纹提取的注册流程的触发有被动触发和主动触发两种触发机制。
被动触发需要用户发起注册流程,这可以通过音箱绑定的APP进行触发或通过特定的语音指令(例如,用户输入“开始注册新用户”)。
音箱也可以主动触发注册流程。具体的当音箱通过在图3的交互流程中,检测到未知用户时,音箱主动发起注册流程,提示用户是否进行声纹注册(“是否注册新用户?”),得到用户的肯定回答(e.g.“是的”)后,注册流程被触发。
其中,基于语音指令的被动触发和基于声纹识别结果的主动触发,可以仅依赖语音交互完成注册,不需要借助额外的工具(如手机APP)。图16所示的为两种注册机制,被动注册机制和主动注册机制。在被动注册机制中,注册流程是被动触发,通常为多媒体设备的APP启动后采集到用户输入的指示注册的语音指令。主动注册机制是主动触发,具体如,基于声纹识别结果的自动触发。
本示例可以采用任意一种性能满足要求的技术方案,如基于ivector的算法或基本深度学习的算法。与具体声纹算法无关的,声纹识别在语音交互中的集成方案如图17。
如图17所示,个性信息处理方法可分为注册阶段和应用阶段。
注册阶段:
1)通过上述的注册流程(图15),收集到若干用户的语音数据;
2)经过算法相关的特征提取和模型训练过程,为每个用户生成特定的声纹特征,并保存到声纹库中。补充语料以更新声纹特征,也可以采用相同的流程,唯一的不同点在于,训练时使用新语料在加上全部或部分旧语料作为提取声纹的基础数据。
应用阶段:
1)新语音到来,通过与注册阶段相同的特征提取等手段,生成对应的声纹特征;
2)进行用户识别,具体可如将采集的声纹特征和已注册的声纹特征进行相似度(算法相关)比对,得出比较结果——匹配某个用户或为未知用户,从而确定出第二账号。
3)根据匹配结果进行后续交互流程。
示例3:
如图18所示,本示例提供一种声纹提取方法,包括:音频选取、预加重处理、分帧处理、傅里叶变换、频带过滤及离散余弦变换。
1)音频选取:音箱一般采用多麦克的拾音方案,因此,需要从多路语音信号中选取其中一路进行特征提取。本示例将采用采集到信号能量最大的一路语音信号进行特征提取。能量定义如下:
Figure BDA0001988599070000351
其中,N表示语音段的采样点数,xi表示第i个采样点的幅值。
2)预加重处理:经过滤波加强高频部分,滤波器传递函数如下:
Figure BDA0001988599070000352
其中,
Figure BDA0001988599070000353
的典型值在0.93至0.97之间。这里的高频可为频率高于特定频率的频带部分;
3)分帧:预处理后的信号进行分帧处理,每10ms为一帧,帧长为25ms。对于采样率为16kHz的1s的语音,分帧得到100帧的数据,每帧数据包含400个数据点。分帧可采用汉宁(Hanning)窗、汉名(Hamming,又译海明)窗或矩形窗等窗函数。
4)离散傅里叶变换:对于每一帧音频数据,利用快速傅里叶算法进行离散傅里叶变换,变换后取每一个系数的幅值。
5)带宽滤波:对上步得到的傅里叶系数在Mel尺度上进行均匀划分。其中Mel尺度定义如下:
Figure BDA0001988599070000354
图19为Mel尺度的能量加权和分布示意图。横坐标为频率,纵坐标是对应频率音波的权重;此处的权值为0到1的取值。图16中的m1为第1个区间各频率音波的能量加权和;ms为第s个区间各频率的能量音波的加权和;第mp为第p个区间的各频率音波的能量加权和。p大于s,且p和s都为正整数。
所述Mel尺度,可用于体现人耳对声音的感知特性,通常人耳对声音的感知是非线性的,而Mel尺度即为对这种非线性的声音感知的一种度量。
本方案选择在Mel尺度上等分为预定个数个区间,(例如25个区间),每个区间的系数相加后取得到带宽滤波的系数向量,该系数向量为一个对应于25个区间的25个系数组成(25维)。
6)离散余弦变换:对带宽滤波取对数后进行离散余弦变换,取前13个系数,得到梅尔频率倒谱系数MFCC(Mel-frequency cepstral coefficients,MFCC)系数。相邻帧的MFCC系数取一阶和二阶差分,做为最后的特征向量,这里的特征向量可为一个包括39个特征值39维向量。所述MFCC系数为梅尔频率倒谱系数,是语音信号处理中的特征提取方法。
在获得MFCC系数的获取过程中是根据人耳听觉机理的研究发现,人耳对不同频率的声波有不同的听觉敏感度。从200Hz到5000Hz的语音信号对语音的清晰度影响对大。两个响度不等的声音作用于人耳时,则响度较高的频率成分的存在会影响到对响度较低的频率成分的感受,使其变得不易察觉,这种现象称为掩蔽效应。由于频率较低的声音在内耳蜗基底膜上行波传递的距离大于频率较高的声音。低音容易掩蔽高音,而高音掩蔽低音较困难。在低频处的声音掩蔽的临界带宽较高频要小。所以,人从低频到高频这一段频带内按临界带宽的大小由密到疏安排一组带通滤波器,对输入信号进行滤波。将每个带通滤波器输出的信号能量作为信号的基本特征,对此特征经过进一步处理后就可以作为语音的输入特征,进而得到MFCC系数。这种MFCC系数获得方式,具有鲁邦性,更符合人耳的听觉特性,而且当信噪比降低时仍然具有好的识别性能。
经过特征提取,每1s的语音数据(采样率16k)得到100个39维的特征。
以下提供一种声纹特征识别模型训练:
本示例采用基于高斯混合模型-通用背景模型(GMM)进行声纹识别。
步骤1:利用外部数据训练通用的背景GMM-UBM模型。本方案将采用100个高斯的混合模型,每个高斯各维不相关(39维),具体高斯数据可以依据实际数据进行调整。其中,外部数据通过收集大量人群(不同性别、年龄、口音)的语音得到。
高斯混合模型定义如下:
Figure BDA0001988599070000361
其中,G为多元高斯分布,uj、σj为其均值极协方差矩阵,并且σj为对角矩阵。M为高斯数量。
模型用期望最大化(EM)算法进行训练。
步骤2:计算超向量(Super Vector,SV)。对于用户语音特征,根据最大似然准则,调整GMM-UBM各个高斯的均值。公式如下:
Figure BDA0001988599070000371
其中,GMM为步骤1训练的通胀的GMM模型,D为语音特征,v为待调整的各个高斯的均值。
经过调整的所有高斯的均值共同构成超向量。在训练阶段,超向量做为用户的声纹特征,进行保存。
超向量匹配。在应用阶段,针对待判定语音,通过上述特征提取和超向量计算,得到特定的超向量。将这个超向量同声纹库的超向量分别计算余弦距离dist(sv1,sv2):
Figure BDA0001988599070000372
在所有距离中,选出最小的一个(假设距离为L=mindist(sv1,sv2))。如果L大于预设的阈值Lref,则认为匹配,判定未知语音为匹配超向量的用户,否则,未知语音来自未注册用户。
声纹特征的识别可包括:
根据对语音内部相求的不同,声纹识别可以分为文本相关和文本无关声纹识别两类技术。其中,文本相关相求用于提取声纹的语音是朗读的是特定的文本(如必须说“你好,腾讯”),而文本无关则没的上述限制。
例如,文本相关声纹识别只利用唤醒词的语音来识别用户身份。这种方案的优点是用户注册负担小(只需要读简短的唤醒词),而且计算量小;缺点是语音较短,算法鲁棒性较低。
再例如,文本无关声纹识别利用唤醒+交互指令的语音来识别用户身份。这种方案的优点是算法鲁棒性好(语音较长),然而计算量大也会相应增大,而且用户注册负担大。
总之,本发明实施例提出的方案是现有方案的增量改进。在不改变原有交互方式、不增加用户交互负担的前提下,通过用户少量的一次性设置,使用智能音箱能够提供更加个性化的推荐、反馈、日常管理、以及更好的安全和隐私保护。利用本方案,智能音箱能够在多人使用的家庭环境下,显著改善用户体验。
1)在一些情况下,可通过特定的语音口令(如“芝麻开门”、“小兔乖乖”)来区分不同的用户,以按成当前对应的第二账号。
2)通过为不同用户分配不同的唤醒词来区分用户,例如,不同用户的唤醒词不同,相当于不同用户利用不同的唤醒指令唤醒设备。
3)通过人脸识别来进行身份识别。
4)不识别具体的用户,而是识别大致的人群分布(青年男性、老年女性、男孩等),对每个人群进行个性化的交互;——不需要用户注册,但需要预训练声纹模型,且个性化粒度较大。
5)除采用MFCC特征外,语音特征可以使用傅里叶系数、滤波器组(filterbank)、对数滤波器组(log filterbank)等。
6)声纹识别模型可以采用其他声纹识别技术。
总之声纹识别不限于上述任意一种。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个***,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理模块中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、管理设备、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡按照本发明原理所作的修改,都应当理解为落入本发明的保护范围。

Claims (23)

1.一种信息处理方法,所述方法,包括:
为多媒体设备分配至少一个第一账号,所述第一账号是被预定***识别或授权使用预定***提供多媒体服务的账号;
为所述多媒体设备分配与第一帐号相关联的多个第二账号,每一个第二帐号代表一个用户标识,所述第二账号是被所述多媒体设备或多媒体设备所在的管理***所识别的账号;
采集用于控制所述多媒体设备提供服务的语音指令;
根据所述语音指令确定当前使用的所述第二账号;
查找当前使用的所述第二账号代表的用户标识的用户历史行为数据及用户属性信息;
根据所述用户历史行为数据及所述用户属性信息,确定用户偏好信息;
基于用户偏好信息和基于所述语音指令确定的服务请求信息,向所述当前使用的第二账号代表的用户标识提供第一服务。
2.根据权利要求1所述的方法,其中,所述方法还包括:
基于所述第一账号获取所述预定***提供给所述第二账号的第二服务,该第二服务不同于所述第一服务。
3.根据权利要求1或2所述的方法,其中,所述采集用于控制所述多媒体设备提供服务的语音指令,包括:
通过所述多媒体设备的操作***采集用于控制所述多媒体设备提供服务的语音指令,其中,所述语音指令用于触发所述多媒体设备执行预定操作;
所述根据所述语音指令确定当前使用的所述第二账号,包括:
对所述语音指令进行声纹特征识别,获得第一声纹特征;
将所述第一声纹特征与第二声纹特征进行匹配,其中,所述第二声纹特征为已注册的所述第二账号对应的声纹特征;
根据匹配的结果,确定所述多媒体设备当前使用的所述第二账号;
响应所述语音指令,执行所述预定操作。
4.根据权利要求3所述的方法,其中,所述预定操作为状态切换或提供多媒体服务;
所述根据匹配的结果,确定所述多媒体设备当前使用的第二账号,包括:
当所述第一声纹特征与所述第二声纹特征不匹配时,基于所述第一声纹特征新注册一个第二账号;
确定新注册的所述第二账号为所述多媒体设备当前使用的第二账号。
5.根据权利要求3所述的方法,其中,所述方法还包括:
当所述第一声纹特征与所述第二声纹特征不匹配时,输出注册提示语音;
采集注册应答语音;
当所述注册应答语音指示进行新账号注册时,基于所述第一声纹特征新注册一个第二账号。
6.根据权利要求5所述的方法,其中,所述方法还包括:
当所述注册应答语音指示不进行新账号注册时,确定所述多媒体设备当前使用一个默认的所述第二账号提供多媒体服务。
7.根据权利要求3所述的方法,其中,所述根据匹配的结果,确定所述多媒体设备当前使用的第二账号,包括:
当所述第一声纹特征与所述第二声纹特征匹配时,确定所述多媒体设备当前使用一个与所述第一声纹特征对应的第二账号提供多媒体服务。
8.根据权利要求3所述的方法,其中,所述通过所述多媒体设备的操作***采集用于控制所述多媒体设备提供服务的语音指令,包括:
通过所述多媒体设备的操作***采集状态切换指令;
所述响应所述语音指令,执行所述预定操作,包括:
所述多媒体设备根据所述状态切换指令从第一状态切换到第二状态,其中,位于所述第一状态下的所述多媒体设备的功耗低于位于所述第二状态下的功耗。
9.根据权利要求3所述的方法,其中,所述通过所述多媒体设备的操作***采集用于控制所述多媒体设备提供服务的语音指令,包括:通过所述多媒体设备的操作***采集服务获取指令;
所述方法还包括:
所述多媒体设备根据所述服务获取指令,从第一状态切换到第二状态,其中,位于所述第一状态下的所述多媒体设备的功耗低于位于所述第二状态下的功耗;
所述响应所述语音指令,执行所述预定操作,包括:
在切换到所述第二状态后,根据所述服务获取指令基于当前使用的第二账号提供多媒体服务。
10.根据权利要求1或2所述的方法,其中,所述方法还包括:
配置所述第二账号的权限范围;
根据所述权限范围向对应的所述第二账号提供所述第一服务。
11.根据权利要求10所述的方法,其中,所述根据所述权限范围向对应的所述第二账号提供所述第一服务,包括:
当所述第二账号的权限范围为第一权限范围时,利用所述第一账号从所述预定***中获取所述第一权限范围内的所述第一服务;
当所述第二账号的权限范围为第二权限范围时,利用所述第一账号从所述预定***中获取所述第二权限范围内的所述第一服务;
其中,所述第一权限范围大于所述第二权限范围。
12.根据权利要求11所述的方法,其中,所述方法还包括:
接收配置指令,其中,所述配置指令是由权限范围为第一权限范围的所述第二账号提供的;
基于所述配置指令配置所述第二权限范围。
13.一种信息处理方法,包括:
为多媒体设备分配至少一个第一账号,所述第一账号是被预定***识别或授权使用预定***提供多媒体服务的账号;
为所述多媒体设备分配与第一帐号相关联的多个第二账号,每一个第二帐号代表一个用户标识,所述第二账号是被所述多媒体设备或多媒体设备所在的管理***所识别的账号;
利用多媒体设备的操作***采集语音指令;其中,所述语音指令,用于触发所述多媒体设备执行预定操作,所述预定操作为状态切换或提供多媒体服务;
对所述语音指令进行声纹特征识别,获得与所述语音指令对应的第一声纹特征;
将所述第一声纹特征与第二声纹特征进行匹配,其中,所述第二声纹特征已注册的第二账号对应的声纹特征;
若匹配不成功,基于所述第一声纹特征,为所述多媒体设备新分配一个与第一账号相关联的第二账号,并将所述第一声纹特征与新分配的第二账号对应存储;
获取与所述新分配的第二账号相关联的用户偏好信息;
基于所述新分配的第二账号相关联的用户偏好信息和基于所述语音指令确定的服务请求信息,向所述新分配的第二账号代表的用户标识提供第一服务。
14.根据权利要求13所述的方法,其中,所述若匹配不成功,基于所述第一声纹特征,为所述多媒体设备新分配一个第二账号,包括:
若匹配不成功,输出注册提示语音;
采集注册应答语音;
当所述注册应答语音指示进行账号注册时,基于所述第一声纹特征,为所述多媒体设备新分配一个第二账号。
15.根据权利要求14所述的方法,其中,所述方法还包括:
当所述注册应答语音指示不进行账号注册时,确定所述多媒体设备使用默认账号提供多媒体服务。
16.根据权利要求14或15所述的方法,其中,所述方法还包括:
为已注册账号配置使用所述多媒体设备的权限范围。
17.根据权利要求16所述的方法,其中,所述权限范围包括:第一权限范围和第二权限范围;所述第一权限范围大于所述第二权限范围;
所述方法还包括:
采集所述第一权限范围的账号的配置指令;
基于所述配置指令,确定所述第二权限范围。
18.根据权利要求13所述的方法,其中,所述多媒体设备的操作***采集语音指令,包括:
通过所述多媒体设备的操作***采集状态切换指令;
所述方法还包括:
根据所述状态切换指令,所述多媒体设备从第一状态切换到第二状态,其中,位于所述第一状态下的所述多媒体设备的功耗低于位于所述第二状态下的功耗。
19.根据权利要求13所述的方法,其中,所述多媒体设备的操作***采集语音指令,包括:
通过所述多媒体设备的操作***采集服务获取指令;
所述方法还包括:
根据所述服务获取指令,所述多媒体设备从第一状态切换到第二状态,其中,位于所述第一状态下的所述多媒体设备的功耗低于位于所述第二状态下的功耗;
在切换到所述第二状态后,根据所述服务获取指令基于当前使用的第二账号提供多媒体服务。
20.一种信息处理装置,包括:
第一配置单元,用于为多媒体设备配置至少一个第一账号,所述第一账号是被预定***识别或授权使用预定***提供多媒体服务的账号;
第二配置单元,用于为所述多媒体设备配置多个第二账号,其中,多个所述第二账号与至少一个所述第一账号关联,所述第二账号是被所述多媒体设备或多媒体设备所在的管理***所识别的账号;
采集单元,用于为采集用于控制所述多媒体设备提供服务的语音指令;
确定单元,用于为根据所述语音指令确定当前使用的所述第二账号;
查找单元,用于为查找与当前使用的所述第二账号代表的用户标识的用户历史行为数据及用户属性信息;根据所述用户历史行为数据及所述用户属性信息,确定用户偏好信息;
服务提供单元,用于为基于用户偏好信息和基于所述语音指令确定的服务请求信息,向所述当前使用的第二账号代表的用户标识提供第一服务。
21.一种信息处理装置,包括:
注册模块,用于为多媒体设备分配至少一个第一账号,所述第一账号是被预定***识别或授权使用预定***提供多媒体服务的账号;
为所述多媒体设备分配与第一帐号相关联的多个第二账号,每一个第二帐号代表一个用户标识,所述第二账号是被所述多媒体设备或多媒体设备所在的管理***所识别的账号;
采集模块,用于为利用多媒体设备的操作***采集语音指令;其中,所述语音指令,用于触发所述多媒体设备执行预定操作,所述预定操作为状态切换或提供多媒体服务;
识别模块,用于为对所述语音指令进行声纹特征识别,获得与所述语音指令对应的第一声纹特征;
匹配模块,用于为将所述第一声纹特征与第二声纹特征进行匹配,其中,所述第二声纹特征已注册账号对应的声纹特征;
注册模块,还用于为若匹配不成功,为所述多媒体设备新分配一个与第一账号相关联的第二账号,并将所述第一声纹特征与新分配的第二账号对应存储;获取与所述新分配的第二账号相关联的用户偏好信息;基于所述新分配的第二账号相关联的用户偏好信息和基于所述语音指令确定的服务请求信息,向所述新分配的第二账号代表的用户标识提供第一服务。
22.一种多媒体设备,包括:媒体输出模组、存储器、处理器及存储在所述存储器上并由所述处理器执行的计算机可执行指令;
所述多媒体输出模组,用于为输出多媒体信息;
所述存储器,用于存储信息;
所述处理器,用于分别与所述多媒体信息输出模组及所述存储器连接,通过执行权利要求1至12或权利要求13至19任一项提供的信息处理方法。
23.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令;所述计算机可读执行指令被执行后,能够实现权利要求1至12或权利要求13至19任一项提供的信息处理方法。
CN201780055132.6A 2017-11-30 2017-11-30 信息处理方法及装置、多媒体设备及存储介质 Active CN110100447B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2017/114146 WO2019104698A1 (zh) 2017-11-30 2017-11-30 信息处理方法及装置、多媒体设备及存储介质

Publications (2)

Publication Number Publication Date
CN110100447A CN110100447A (zh) 2019-08-06
CN110100447B true CN110100447B (zh) 2021-06-11

Family

ID=66665352

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780055132.6A Active CN110100447B (zh) 2017-11-30 2017-11-30 信息处理方法及装置、多媒体设备及存储介质

Country Status (3)

Country Link
US (1) US11386905B2 (zh)
CN (1) CN110100447B (zh)
WO (1) WO2019104698A1 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110855740B (zh) * 2019-09-27 2021-03-19 深圳市火乐科技发展有限公司 信息推送方法及相关设备
US11226801B2 (en) * 2019-10-30 2022-01-18 Mastercard International Incorporated System and methods for voice controlled automated computer code deployment
CN110992948B (zh) * 2019-11-18 2023-07-25 博泰车联网科技(上海)股份有限公司 基于多轮语音交互的餐厅预订方法及终端
CN111163049B (zh) * 2019-11-26 2022-02-25 全球创新网络香港有限公司 一种平台入驻与认证方法和***
CN113127887A (zh) * 2019-12-30 2021-07-16 中移信息技术有限公司 数据权限隔离性判断方法、装置、设备及存储介质
CN111341326B (zh) * 2020-02-18 2023-04-18 RealMe重庆移动通信有限公司 语音处理方法及相关产品
US20220027812A1 (en) * 2020-07-24 2022-01-27 Sib BAHJAT System and method for storing and retrieving a historical entry to generate a renter risk report
CN112218124A (zh) * 2020-10-14 2021-01-12 广州欢网科技有限责任公司 Tv模式匹配方法、装置、设备和***
CN114449297A (zh) * 2020-11-04 2022-05-06 阿里巴巴集团控股有限公司 一种多媒体信息的处理方法、计算设备及存储介质
CN112397066A (zh) * 2020-11-06 2021-02-23 上海仙塔智能科技有限公司 语音识别方法、装置、车辆及计算机存储介质
CN112784238B (zh) * 2021-01-21 2024-04-05 百度在线网络技术(北京)有限公司 一种数据处理方法、装置、电子设备和介质
KR20220141137A (ko) * 2021-04-12 2022-10-19 삼성전자주식회사 사용자 발화를 처리하는 전자 장치, 및 그 전자 장치의 제어 방법
CN113362086A (zh) * 2021-06-09 2021-09-07 广州智会云科技发展有限公司 一种客户关系绑定方法及***
CN113421563B (zh) * 2021-06-21 2024-05-28 安徽听见科技有限公司 说话人标注方法、装置、电子设备和存储介质
US20230006880A1 (en) * 2021-06-30 2023-01-05 Microsoft Technology Licensing, Llc Local edge authority platform
US11404062B1 (en) 2021-07-26 2022-08-02 LifePod Solutions, Inc. Systems and methods for managing voice environments and voice routines
US11410655B1 (en) * 2021-07-26 2022-08-09 LifePod Solutions, Inc. Systems and methods for managing voice environments and voice routines
CN113643049A (zh) * 2021-08-30 2021-11-12 北京读我科技有限公司 一种网销客户管理方法及***
CN115129923B (zh) * 2022-05-17 2023-10-20 荣耀终端有限公司 语音搜索方法、设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013085176A1 (ko) * 2011-12-09 2013-06-13 (주)네오위즈게임즈 지역 및 친밀도 기반의 게임 운영 방법 및 그 시스템
CN103442290A (zh) * 2013-08-15 2013-12-11 安徽科大讯飞信息科技股份有限公司 基于电视终端用户及语音的信息提供方法及***
JP2015099461A (ja) * 2013-11-19 2015-05-28 日本電気株式会社 データ保護装置、方法、および、プログラム
CN104899485A (zh) * 2015-07-02 2015-09-09 三星电子(中国)研发中心 用户管理方法及装置
CN105263052A (zh) * 2015-10-13 2016-01-20 微鲸科技有限公司 基于人脸识别技术的音视频推送方法及***
CN105681835A (zh) * 2016-02-26 2016-06-15 腾讯科技(深圳)有限公司 一种信息推送的方法以及服务器
CN105744368A (zh) * 2016-02-19 2016-07-06 四川长虹电器股份有限公司 电视上使用声纹识别技术分账户管理用户的方法
CN105915491A (zh) * 2015-11-18 2016-08-31 乐视网信息技术(北京)股份有限公司 账号登录方法及装置
CN106489269A (zh) * 2014-05-14 2017-03-08 三星电子株式会社 显示装置、服务器、***及其信息提供方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060277043A1 (en) * 2005-06-06 2006-12-07 Edward Tomes Voice authentication system and methods therefor
US20070055517A1 (en) * 2005-08-30 2007-03-08 Brian Spector Multi-factor biometric authentication
KR20130055748A (ko) * 2011-11-21 2013-05-29 한국전자통신연구원 콘텐츠 추천 시스템 및 방법
US11055721B2 (en) * 2013-10-30 2021-07-06 Tencent Technology (Shenzhen) Company Limited Method, device and system for information verification
CN104331407A (zh) * 2013-12-26 2015-02-04 乐视网信息技术(北京)股份有限公司 一种多媒体文件信息推荐方法及装置
EP3158427B1 (en) * 2014-06-19 2022-12-28 Robert Bosch GmbH System and method for speech-enabled personalized operation of devices and services in multiple operating environments
CN104967622B (zh) * 2015-06-30 2017-04-05 百度在线网络技术(北京)有限公司 基于声纹的通讯方法、装置和***
CN105979376A (zh) * 2015-12-02 2016-09-28 乐视致新电子科技(天津)有限公司 一种推荐方法和装置
US10091190B2 (en) * 2015-12-11 2018-10-02 International Business Machines Corporation Server-assisted authentication
CN107104875B (zh) * 2016-02-22 2020-08-25 腾讯科技(深圳)有限公司 信息推送的方法和装置
CN105847884B (zh) * 2016-05-13 2020-09-04 Tcl商用信息科技(惠州)股份有限公司 一种控制电视用户使用电视的方法和装置
US10607148B1 (en) * 2016-12-21 2020-03-31 Facebook, Inc. User identification with voiceprints on online social networks
CN107863108B (zh) * 2017-11-16 2021-03-23 百度在线网络技术(北京)有限公司 信息输出方法和装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013085176A1 (ko) * 2011-12-09 2013-06-13 (주)네오위즈게임즈 지역 및 친밀도 기반의 게임 운영 방법 및 그 시스템
CN103442290A (zh) * 2013-08-15 2013-12-11 安徽科大讯飞信息科技股份有限公司 基于电视终端用户及语音的信息提供方法及***
JP2015099461A (ja) * 2013-11-19 2015-05-28 日本電気株式会社 データ保護装置、方法、および、プログラム
CN106489269A (zh) * 2014-05-14 2017-03-08 三星电子株式会社 显示装置、服务器、***及其信息提供方法
CN104899485A (zh) * 2015-07-02 2015-09-09 三星电子(中国)研发中心 用户管理方法及装置
CN105263052A (zh) * 2015-10-13 2016-01-20 微鲸科技有限公司 基于人脸识别技术的音视频推送方法及***
CN105915491A (zh) * 2015-11-18 2016-08-31 乐视网信息技术(北京)股份有限公司 账号登录方法及装置
CN105744368A (zh) * 2016-02-19 2016-07-06 四川长虹电器股份有限公司 电视上使用声纹识别技术分账户管理用户的方法
CN105681835A (zh) * 2016-02-26 2016-06-15 腾讯科技(深圳)有限公司 一种信息推送的方法以及服务器

Also Published As

Publication number Publication date
WO2019104698A1 (zh) 2019-06-06
US11386905B2 (en) 2022-07-12
CN110100447A (zh) 2019-08-06
US20200043502A1 (en) 2020-02-06

Similar Documents

Publication Publication Date Title
CN110100447B (zh) 信息处理方法及装置、多媒体设备及存储介质
CN112074900B (zh) 用于自然语言处理的音频分析
EP2674941B1 (en) Terminal apparatus and control method thereof
CN112313741A (zh) 选择性注册到自动助理
US11704940B2 (en) Enrollment with an automated assistant
TW201905675A (zh) 資料更新方法、客戶端及電子設備
JP2019212288A (ja) 情報を出力するための方法、及び装置
CN111727474A (zh) 语音处理***中的用户输入处理限制
US20210136441A1 (en) Method and device for adjusting video parameter based on voiceprint recognition and readable storage medium
US10916249B2 (en) Method of processing a speech signal for speaker recognition and electronic apparatus implementing same
CN111199032A (zh) 身份认证的方法以及装置
JP6904361B2 (ja) 情報処理装置、及び情報処理方法
WO2021159369A1 (zh) 一种用于降噪的助听方法、装置、芯片、耳机及存储介质
CN111292734B (zh) 一种语音交互方法和装置
CN111640434A (zh) 用于控制语音设备的方法和装置
CN111429917B (zh) 一种设备唤醒方法及终端设备
CN113033245A (zh) 一种功能调节方法、装置、存储介质及电子设备
WO2020202862A1 (ja) 応答生成装置及び応答生成方法
US20230362026A1 (en) Output device selection
EP4276818A1 (en) Speech operation method for device, apparatus, and electronic device
JP2016206646A (ja) 音声再生方法、音声対話装置及び音声対話プログラム
CN109922397A (zh) 音频智能处理方法、存储介质、智能终端及智能蓝牙耳机
CN111512364B (zh) 智能音箱、多语音助手控制方法以及智能家居***
WO2020208972A1 (ja) 応答生成装置及び応答生成方法
CN110060662B (zh) 语音识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant