CN111310059B - 基于聚合资源的用户意图定位方法和装置 - Google Patents

基于聚合资源的用户意图定位方法和装置 Download PDF

Info

Publication number
CN111310059B
CN111310059B CN202010252828.1A CN202010252828A CN111310059B CN 111310059 B CN111310059 B CN 111310059B CN 202010252828 A CN202010252828 A CN 202010252828A CN 111310059 B CN111310059 B CN 111310059B
Authority
CN
China
Prior art keywords
user
intention
operation instruction
historical
content resources
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010252828.1A
Other languages
English (en)
Other versions
CN111310059A (zh
Inventor
吴昊阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neusoft Reach Automotive Technology Shenyang Co Ltd
Original Assignee
Neusoft Reach Automotive Technology Shenyang Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neusoft Reach Automotive Technology Shenyang Co Ltd filed Critical Neusoft Reach Automotive Technology Shenyang Co Ltd
Priority to CN202010252828.1A priority Critical patent/CN111310059B/zh
Publication of CN111310059A publication Critical patent/CN111310059A/zh
Application granted granted Critical
Publication of CN111310059B publication Critical patent/CN111310059B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Fuzzy Systems (AREA)
  • Acoustics & Sound (AREA)
  • Library & Information Science (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明提供了一种基于聚合资源的用户意图定位方法和装置,涉及车辆通信技术领域,包括:获取针对聚合资源的当前用户的操作指令,聚合资源包括多个内容资源;根据历史数据确定操作指令对应的多种备选用户意图以及多种备选用户意图的权重值,其中,历史数据包括当前用户的历史操作指令针对多个内容资源的意图统计数据和/或历史用户的操作指令针对多个内容资源的意图统计数据;在备选用户意图中选择权重值最高的作为目标用户意图;将目标用户意图发送车载控制端,以使车载控制端对目标用户意图对应的内容资源执行相应操作;根据聚合资源的历史数据准确识别出用户意图,提高用户驾驶体验。

Description

基于聚合资源的用户意图定位方法和装置
技术领域
本发明涉及车辆通信技术领域,尤其是涉及一种基于聚合资源的用户意图定位方法和装置。
背景技术
随着现今科技的发展,为了增强车辆驾驶体验,一般车辆具有聚合资源平台,用户可在驾驶过程中通过聚合资源平台调用多种内容资源,来进行播放音乐、广播、文学作品等,以舒缓调节用户的心情。
由于驾驶操作需要占用用户较多的注意力,当前用户一般通过按钮或语音来实现驾驶过程中播放功能。其中,按钮只能简单控制的开始或终止命令,具体播放内容的控制命令通过语音方式进行下发,但内容资源有多种且语音语义也可能包括多种意图,云端服务器并不能准确识别出用户意图播放何种内容资源的哪钟类型的音频作品,经常会造成车载终端播放与用户意图无关的内容,导致用户体验较差。
发明内容
有鉴于此,本发明的目的在于提供一种基于聚合资源的用户意图定位方法和装置,根据聚合资源的历史数据准确识别出用户意图,提高用户驾驶体验。
第一方面,实施例提供一种基于聚合资源的用户意图定位方法,应用于云端服务器,包括:
获取针对聚合资源的当前用户的操作指令,所述聚合资源包括多个内容资源;
根据历史数据确定所述操作指令对应的多种备选用户意图以及所述多种备选用户意图的权重值,其中,所述历史数据包括所述当前用户的历史操作指令针对所述多个内容资源的意图统计数据和/或历史用户的操作指令针对所述多个内容资源的意图统计数据;
在所述备选用户意图中选择所述权重值最高的作为目标用户意图;
将所述目标用户意图发送车载控制端,以使所述车载控制端对所述目标用户意图对应的内容资源执行相应操作。
在可选的实施方式中,获取当前用户的操作指令的步骤,包括:
获取当前用户的操作指令,所述操作指令针对的对象为聚合资源,所述操作指令包括音频数据和控制信号,所述操作指令的语义包括动词与名词的组合。
在可选的实施方式中,所述名词包括音频名称,所述音频包括多种播放源、多种演绎者和多种音频格式。
在可选的实施方式中,根据历史数据确定所述操作指令对应的多种备选用户意图以及多种备选用户意图的权重值的步骤,包括:
获取所述当前用户的操作指令中的名词语义;
根据所述历史用户的操作指令针对所述多个内容资源的意图统计数据确定所述名词语义对应的各种备选用户意图播放音频以及各种备选用户意图播放音频的权重值。
在可选的实施方式中,根据历史数据确定所述操作指令对应的多种备选用户意图以及多种备选用户意图的权重值的步骤,包括:
获取所述当前用户的操作指令中的名词语义;
根据所述当前用户的历史操作指令针对所述多个内容资源的意图统计数据确定所述名词语义对应的各种备选用户意图播放音频以及各种备选用户意图播放音频的权重值。
在可选的实施方式中,根据历史数据确定所述操作指令对应的多种备选用户意图以及多种备选用户意图的权重值的步骤,包括:
获取所述当前用户的操作指令中的名词语义;
根据所述当前用户的历史操作指令针对所述多个内容资源的意图统计数据和历史用户的操作指令针对所述多个内容资源的意图统计数据的结合,确定所述名词语义对应的各种备选用户意图播放音频以及备选用户意图播放音频的权重值。
在可选的实施方式中,所述权重值根据多个播放源、多个演绎者和多个音频格式中所述音频的播放次数进行确定。
第二方面,实施例提供一种基于聚合资源的用户意图定位装置,应用于云端服务器,包括:
获取模块,用于获取针对聚合资源的当前用户的操作指令,所述聚合资源包括多个内容资源;
第一确定模块,用于根据历史数据确定所述操作指令对应的多种备选用户意图以及所述多种备选用户意图的权重值,其中,所述历史数据包括所述当前用户的历史操作指令针对所述多个内容资源的意图统计数据和/或历史用户的操作指令针对所述多个内容资源的意图统计数据;
第二确定模块,用于在所述备选用户意图中选择所述权重值最高的作为目标用户意图;
执行模块,用于将所述目标用户意图发送车载控制端,以使所述车载控制端对所述目标用户意图对应的内容资源执行相应操作。
第三方面,实施例提供一种服务器,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述前述实施方式任一项所述的方法的步骤。
第四方面,实施例提供一种机器可读存储介质,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被处理器调用和执行时,机器可执行指令促使处理器实现前述实施方式任一项所述的方法的步骤。
本发明实施例提供的一种基于聚合资源的用户意图定位方法和装置,通过当前用户的历史操作指令针对多个内容资源的意图统计数据、历史用户的操作指令针对多个内容资源的意图统计数据或两者结合的历史数据确定当前用户的操作指令存在的各种备选的用户意图,以及每个备选用户意图对应的权重值,根据权重值确定当前用户的操作指令实际对应的用户意图,将权重值最高的备选用户意图作为实际的目标用户意图,并根据目标用户意图控制车辆执行相应用户操作,上述方式基于聚合资源的历史数据得到操作指令对应的各种可能的用户意图,并将可能性最高的作为目标用户意图,并执行目标用户意图对应的操作,提高用户意图识别定位的准确性,进而保证用户驾驶体验。
本公开的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本公开的上述技术即可得知。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于聚合资源的用户意图定位方法流程图;
图2为本发明实施例提供的一种基于聚合资源的用户意图定位装置的功能模块图;
图3为本发明实施例提供的一种服务器的硬件架构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
由于聚合资源平台包括多种内容资源且相同词组、语义可能对应不同的播放内容,进而在驾驶过程中,用户语音控制播放功能时,车辆无法准确了解用户的语音命令对应的意图播放哪种内容资源何种类型的音频数据,致使车辆执行与用户意图无关的操作,如用户语音命令为“狮子座”,而对于“狮子座”来说,可能存在一首歌、一本书、一篇故事或运势说明等等内容,云端服务器无法根据用户的语音命令准确得知用户想要播放哪种内容的意图,且对于在多种内容资源中都存在作品“狮子座”,车载控制端可能会出现播放内容资源错误、作品类型出错的情况,进而影响客户体验。
基于此,本发明实施例提供的一种基于聚合资源的用户意图定位方法和装置,根据聚合资源的历史数据准确识别出用户意图,提高用户驾驶体验。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种基于聚合资源的用户意图定位方法进行详细介绍。
图1为本发明实施例提供的一种基于聚合资源的用户意图定位方法流程图。
参照图1,实施例提供一种基于聚合资源的用户意图定位方法,可应用于云端服务器,包括以下步骤:
S102,获取针对聚合资源的当前用户的操作指令,聚合资源包括多个内容资源;
S104,根据历史数据确定操作指令对应的多种备选用户意图以及多种备选用户意图的权重值,其中,历史数据包括当前用户的历史操作指令针对多个内容资源的意图统计数据和/或历史用户的操作指令针对多个内容资源的意图统计数据;
S106,在备选用户意图中选择权重值最高的作为目标用户意图;
S108,将目标用户意图发送车载控制端,以使车载控制端对目标用户意图对应的内容资源执行相应操作。
在实际应用的优选实施例中,通过当前用户的历史操作指令针对多个内容资源的意图统计数据、历史用户的操作指令针对多个内容资源的意图统计数据或两者结合的历史数据确定当前用户的操作指令存在的各种备选的用户意图,以及每个备选用户意图对应的权重值,根据权重值确定当前用户的操作指令实际对应的用户意图,将权重值最高的备选用户意图作为实际的目标用户意图,并根据目标用户意图控制车辆执行相应用户操作,上述方式基于聚合资源的历史数据得到操作指令对应的各种可能的用户意图,并将可能性最高的作为目标用户意图,并执行目标用户意图对应的操作,提高用户意图识别定位的准确性,进而保证用户驾驶体验。
作为一种可选的实施例,当前用户的操作指令的语义可能包括播放音频作品和/或控制车辆设备动作。云端服务器可根据当前用户的操作指令控制车载控制端播放音频作品,如当前用户的操作指令为播放音乐、播放A相声等,这里A可为相声表演者或相声作品名称,或者云端服务器可根据当前用户的操作指令控制车载控制端进行相应动作,如当前用户的操作指令为控制车门打开或关闭、控制空调升温或降温等。
在可选的实施方式中,步骤S102,可包括以下步骤:
步骤1.1),获取当前用户的操作指令,操作指令针对的对象为聚合资源,操作指令包括音频数据和控制信号,操作指令的语义包括动词与名词的组合。
这里,在实际应用过程中,为了进一步不增加用户驾驶负担,用户一般可通过语音控制方式下发当前用户的操作指令,即当前用户的操作指令的类型为音频数据,这里仅为一种示例,并不局限于此,还包括不会增加用户驾驶负担的其他下发操作指令的方式。对于音频数据来说可通过收音器、传感器等采集设备采集获取当前用户的操作指令。
其中,为了车辆能够准确识别出用户意图,可在云端服务器预先设置当前用户的操作指令的语义格式,作为一种优选的实施例,用户下发语义格式为动词加名词组合的语音命令信息,云端服务器根据此种语义格式对操作指令进行识别,并按照操作指令的语义和历史数据进而得到明确的用户意图,使车载控制器根据用户意图执行操作,如,播放或停止播放L歌曲,打开或关闭V设备等。作为另一种可选的实施例,还可通过第三方服务器对操作指令进行语音识别及第一次语义解析,将用户的语音命令信息转化为文字,再将文字转化为关键字,在此基础上,本发明实施例中的云端服务器根据历史数据确定与该关键字相匹配的多个内容资源中权重值最高的,作为当前用户的目标用户意图对应的内容资源。
在前述实施例的基础上,当前用户的操作指令语义中的名词包括音频名称和车辆设备名称,音频包括多种播放源、多种演绎者和多种音频格式。可以理解的是,这里的多种播放源分别对应聚合资源平台中的多种内容资源,如歌曲O的播放源T可能对应于聚合资源平台中的内容资源T,即通过聚合资源平台调用内容资源T来实现歌曲O的播放,其他播放源的实现过程与前述过程相似,在此不再赘述。
需要说明的是,车辆设备名称可能包括车门、空调、音箱等等车内设备;音频名称为可通过音箱设备进行播放的音频数据名称,如歌曲、小说、故事、相声、新闻等等。而对于同一名称(当前用户的操作指令语义中的名词相同)的音频数据来说,可能包括多种播放源、多种演绎者和多种音频格式。如“狮子座”可能是歌曲名、故事名、相声名、星座名等;当“狮子座”为歌曲名时,此歌曲可能存在多种播放源平台,如xx音乐、xx电台、xx广播等播放源,且此歌曲还可能同时被B、C、D三位歌手演唱过,同时每位歌手的演唱版本都包括多种格式,如现场版本、高清版本、超清版本、无损音质等等。因此,可知晓当前用户的操作指令可能包括多种用户意图,对于云端服务器来说,不易于准确定位。
在一些可选的实施例中,为了云端服务器能够更加准确地定位用户意图,当前用户的操作指令语义中的名词还可包括音频的目的播放源、目的演绎者和目的音频格式,如,用户的当前用户的操作指令可为,“播放-xx广播-无损音质-B-狮子座”,以便车载控制端能够准确执行用户意图操作,这里,xx广播为目的播放源、B为目的演绎者、无损音质为目的音频格式。
在可选的实施方式中,用户在驾驶过程中,注意力主要集中于驾驶操作和道路情况,可能不会对每次下发的当前用户的操作指令的语义都考虑的那么全面,即可能会遗漏当前用户的操作指令语义中的一项或几项,如完整的当前用户的操作指令语义可能为“播放-xx广播-无损音质-B-狮子座”,但实际用户下发的操作指令语义可能为“播放-B-狮子座”、“播放-xx广播-狮子座”、“播放-狮子座”、“播放-xx广播-B-狮子座”、“播放-无损音质-B-狮子座”等等,根据前述实施例的说明,此种指令情况可能会对应多种音频播放内容,云端服务器存在对用户意图定位错误的风险,为了降低此种风险,保证用户意图定位的准确性,本发明实施例中步骤S104,还可用以下方式实现,包括:
步骤2.1),获取当前用户的操作指令中的名词语义;
步骤2.2),根据历史用户的操作指令针对多个内容资源的意图统计数据确定名词语义对应的各种备选用户意图播放音频以及各种备选用户意图播放音频的权重值。
这里,获取当前用户的操作指令的音频数据中的名词语义,以便云端服务器理解,获取历史用户的操作指令针对多个内容资源的意图统计数据,来确定该名词语义对应的各种意图以及多个意图的权重值权重。可以理解的是,权重值是由历史用户的操作指令中该名词语义对应的多个内容资源的意图进行统计得到的。例如,用户操作指令信息为“播放-B-狮子座”,对于历史用户的操作指令针对多个内容资源的意图统计数据来说,可能包括“播放-xx音乐-现场版-B-狮子座”对应权重值45%、“播放-xx音乐-演唱会版-B-狮子座”对应权重值30%、“播放-xx广播-无损音质-B-狮子座”对应权重值19%等等备选音频播放内容,上述播放内容对应的权重值为历史用户下发此用户操作指令信息时,对应的最终用户意图播放内容概率统计。
需要说明的是,对于权重值45%为“播放-xx音乐-现场版-B-狮子座”和权重值30%为“播放-xx音乐-演唱会版-B-狮子座”来说,两者可能对应同一内容资源平台或不同内容资源平台,如,可能权重值45%为“播放-xx音乐-现场版-B-狮子座”对应内容资源T,权重值30%为“播放-xx音乐-演唱会版-B-狮子座”也对应内容资源T,或者,可能权重值45%为“播放-xx音乐-现场版-B-狮子座”对应内容资源Y,权重值30%为“播放-xx音乐-演唱会版-B-狮子座”也对应内容资源T。即历史数据是历史用户的不同操作指令语义在不同的内容资源平台的权重的统计数据,本发明实施例根据权重值进行选择最可能的用户意图播放音频,进而确定此用户意图播放音频对应的内容资源。
在可选的实施方式中,权重值根据多个播放源、多个演绎者和多个音频格式中音频的播放次数进行确定。
在可选的实施方式中,步骤S104,还包括:
步骤3.1),获取当前用户的操作指令中的名词语义;
步骤3.2),根据当前用户的历史操作指令针对多个内容资源的意图统计数据确定名词语义对应的各种备选用户意图播放音频以及各种备选用户意图播放音频的权重值。
这里,在前述实施例的基础上,获取当前用户的历史操作指令针对多个内容资源的意图统计数据,即个人习惯,对于该名词语义对应的各种意图以及多个意图的权重值。例如,操作指令语义为“播放-B-狮子座”,对于用户个人习惯来说,可能包括“播放-xx音乐-现场版-B-狮子座”对应权重值80%、“播放-xx音乐-演唱会版-B-狮子座”对应权重值10%、“播放-xx广播-无损音质-B-狮子座”对应权重值5%等等备选音频播放内容。上述播放内容对应的权重值为此用户下发此用户操作指令信息时,对应的目标用户意图播放内容的历史概率统计。
在可选的实施方式中,步骤S104,还包括:
步骤4.1),获取当前用户的操作指令中的名词语义;
步骤4.2),根据当前用户的历史操作指令针对多个内容资源的意图统计数据和历史用户的操作指令针对多个内容资源的意图统计数据的结合,确定名词语义对应的各种备选用户意图播放音频以及备选用户意图播放音频的权重值。
这里,在前述实施例的基础上,获取当前用户的历史操作指令针对多个内容资源的意图统计数据和历史用户的操作指令针对多个内容资源的意图统计数据结合后的数据中对于该名词语义对应的各种意图以及多个意图的权重值。作为一种可选的实施例,可预先设置当前用户的历史操作指令针对多个内容资源的意图统计数据和历史用户的操作指令针对多个内容资源的意图统计数据的各自占比,如历史用户的操作指令针对多个内容资源的意图统计数据占比40%、当前用户的历史操作指令针对多个内容资源的意图统计数据占比55%。需要说明的是,历史数据中可能还包括其他种类的意图统计数据,这里仅以当前用户的历史操作指令针对多个内容资源的意图统计数据和历史用户的操作指令针对多个内容资源的意图统计数据两种进行示例,并不局限于以上两种。
例如,用户操作指令信息为“播放-B-狮子座”,对于当前用户的历史操作指令针对多个内容资源的意图统计数据来说,可能包括“播放-xx音乐-现场版-B-狮子座”对应权重值80%、“播放-xx音乐-演唱会版-B-狮子座”对应权重值10%、“播放-xx广播-无损音质-B-狮子座”对应权重值5%等等备选音频播放内容;对于历史用户的操作指令针对多个内容资源的意图统计数据来说,可能包括“播放-xx音乐-现场版-B-狮子座”对应权重值45%、“播放-xx音乐-演唱会版-B-狮子座”对应权重值30%、“播放-xx广播-无损音质-B-狮子座”对应权重值19%等等备选音频播放内容;若当前用户的历史操作指令针对多个内容资源的意图统计数据和历史用户的操作指令针对多个内容资源的意图统计数据按照上述占比进行结合后,则得到多个音频播放内容对应的权重值,如,“播放-xx音乐-现场版-B-狮子座”对应权重值为80%*55%+45%*40%,若当前用户的历史操作指令针对多个内容资源的意图统计数据以及历史用户的操作指令针对多个内容资源的意图统计数据结合,则余下音频内容概率计算方法类似,均为:音频播放内容A在历史用户的操作指令针对多个内容资源的意图统计数据的权重值*历史用户的操作指令针对多个内容资源的意图统计数据的占比+音频播放内容A在当前用户的历史操作指令针对多个内容资源的意图统计数据的权重值*当前用户的历史操作指令针对多个内容资源的意图统计数据的占比,在此不再赘述。
需要说明的是,当前用户的历史操作指令针对多个内容资源的意图统计数据以及历史用户的操作指令针对多个内容资源的意图统计数据的占比可根据用户个人喜好进行设定,或通过预设的控制模式根据每次用户意图正确率调整占比,如,云端服务器可能对当前用户的历史操作指令针对多个内容资源的意图统计数据和历史用户的操作指令针对多个内容资源的意图统计数据的占比分别包括历史用户的操作指令针对多个内容资源的意图统计数据40%、当前用户的历史操作指令针对多个内容资源的意图统计数据60%,历史用户的操作指令针对多个内容资源的意图统计数据50%、当前用户的历史操作指令针对多个内容资源的意图统计数据50%,历史用户的操作指令针对多个内容资源的意图统计数据60%、当前用户的历史操作指令针对多个内容资源的意图统计数据40%;云端服务器按照预设时间步长进行调整,并观察用户意图正确率,进而确定最终选择何种占比,具体为,若云端服务器以一周时间为预设时间步长,第一周历史用户的操作指令针对多个内容资源的意图统计数据占比40%时,正确率为80%,第二周历史用户的操作指令针对多个内容资源的意图统计数据占比50%时,正确率为78%,第三周历史用户的操作指令针对多个内容资源的意图统计数据占比40%时,正确率为77%,则云端服务器选取第一周的占比为最终的占比结果。
作为一种可选的实施例,用户意图的正确率根据用户的重复操作或重复命令次数进行统计,如,用户下发当前用户的操作指令后,云端服务器控制车载控制端执行相应操作后,在预设时间间隔内,用户没有再次下发当前用户的操作指令,则此次操作记为正确操作,参与正确率计算,反之。
可以理解的是,这里可对预设时间间隔进行设置,如30秒、1分钟等等;还可对当前用户的操作指令进行设置,如预设时间间隔内的前后两次当前用户的操作指令需要符合预设的语义相似度,即当用户在预设时间间隔内,没有下发两次以上达到预设语义相似度的当前用户的操作指令。例如,用户下发用户的操作指令语义“播放-B-狮子座”,车载控制端播放相应内容后的一分钟内,用户又下发操作指令语义“播放-xx音乐-B-狮子座”,前后两次下发的操作指令的语义相似度达到了预设语义相似度阈值,则记为一次错误操作,不参与正确率的计算。
这里,历史用户为在不同的内容资源平台上的历史使用者,其中可能也包括当前用户,但历史使用者的数量可能较为庞大,如几千人或几百人,历史用户的操作指令针对多个内容资源的意图统计数据是根据大量的历史使用者的意图统计得到的,进而可知当前用户的历史操作指令针对多个内容资源的意图统计数据并不会对历史用户的操作指令针对多个内容资源的意图统计数据造成显著影响;作为另一种可选的实施例,历史用户也可能为排除当前用户以外的,在不同的内容资源平台上的历史使用者,进而本发明实施例通过当前用户和/或非当前用户的历史用户针对多个内容资源的意图统计数据来确定用户意图。
在一些实施例中,根据备选用户意图对应的播放内容的权重值确定当前用户的用户意图,将权重值最高的播放内容认定为用户意图。
如图2所示,实施例提供一种基于聚合资源的用户意图定位装置200,应用于云端服务器,包括:
获取模块201,用于获取针对聚合资源的当前用户的操作指令,所述聚合资源包括多个内容资源;
第一确定模块202,用于根据历史数据确定所述操作指令对应的多种备选用户意图以及多种备选用户意图的权重值,其中,所述历史数据包括所述当前用户的历史操作指令针对所述多个内容资源的意图统计数据和/或历史用户的操作指令针对所述多个内容资源的意图统计数据;
第二确定模块203,用于在所述备选用户意图中选择所述权重值最高的作为目标用户意图;
执行模块204,用于将所述目标用户意图发送车载控制端,以使所述车载控制端对所述目标用户意图对应的内容资源执行相应操作。
在可选的实施方式中,获取模块,还用于获取当前用户的操作指令,所述操作指令针对的对象为聚合资源,所述操作指令包括音频数据和控制信号,所述操作指令的语义包括动词与名词的组合。
在可选的实施方式中,所述名词包括音频名称,所述音频包括多种播放源、多种演绎者和多种音频格式。
在可选的实施方式中,第一确定模块,还用于获取所述当前用户的操作指令中的名词语义;根据所述历史用户的操作指令针对所述多个内容资源的意图统计数据确定所述名词语义对应的各种备选用户意图播放音频以及各种备选用户意图播放音频的权重值。
在可选的实施方式中,第一确定模块,还用于获取所述当前用户的操作指令中的名词语义;根据所述当前用户的历史操作指令针对所述多个内容资源的意图统计数据确定所述名词语义对应的各种备选用户意图播放音频以及各种备选用户意图播放音频的权重值。
在可选的实施方式中,第一确定模块,还用于获取所述当前用户的操作指令中的名词语义;根据所述当前用户的历史操作指令针对所述多个内容资源的意图统计数据和历史用户的操作指令针对所述多个内容资源的意图统计数据的结合,确定所述名词语义对应的各种备选用户意图播放音频以及备选用户意图播放音频的权重值。
在可选的实施方式中,所述权重值根据多个播放源、多个演绎者和多个音频格式中所述音频的播放次数进行确定。
进一步地,如图3所示,是本发明实施例提供的用于实现所述基于聚合资源的用户意图定位方法的服务器400的示意图。本实施例中,所述服务器400可以是,但不限于具备分析及处理能力的计算机设备。
图3为本发明实施例提供的服务器400的硬件架构示意图。参见图3所示,该计算机设备包括:机器可读存储介质401和处理器402,还可以包括非易失性存储介质403、通信接口404和总线405;其中,机器可读存储介质401、处理器402、非易失性存储介质403和通信接口404通过总线405完成相互间的通信。处理器402通过读取并执行机器可读存储介质401中基于聚合资源的用户意图定位的机器可执行指令,可执行上文实施例描述基于聚合资源的用户意图定位方法。
本文中提到的机器可读存储介质可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,机器可读存储介质可以是:RAM(Radom Access Memory,随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、任何类型的存储盘(如光盘、dvd等),或者类似的存储介质,或者它们的组合。
非易失性介质可以是非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、任何类型的存储盘(如光盘、dvd等),或者类似的非易失性存储介质,或者它们的组合。
可以理解的是,本实施例中的各功能模块的具体操作方法可参照上述方法实施例中相应步骤的详细描述,在此不再重复赘述。
本发明实施例所提供计算机可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序代码被执行时可实现上述任一实施例所述的基于聚合资源的用户意图定位方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。

Claims (6)

1.一种基于聚合资源的用户意图定位方法,其特征在于,应用于云端服务器,包括:
获取针对聚合资源的当前用户的操作指令,所述聚合资源包括多个内容资源;
根据历史数据确定所述操作指令对应的多种备选用户意图以及所述多种备选用户意图的权重值,其中,所述历史数据包括所述当前用户的历史操作指令针对所述多个内容资源的意图统计数据和/或历史用户的操作指令针对所述多个内容资源的意图统计数据;
在所述备选用户意图中选择所述权重值最高的作为目标用户意图;
将所述目标用户意图发送车载控制端,以使所述车载控制端对所述目标用户意图对应的内容资源执行相应操作;
获取当前用户的操作指令的步骤,包括:
获取当前用户的操作指令,所述操作指令针对的对象为聚合资源,所述操作指令包括音频数据和控制信号,所述操作指令的语义包括动词与名词的组合;
所述名词包括音频名称,所述音频包括多种播放源、多种演绎者和多种音频格式;
根据历史数据确定所述操作指令对应的多种备选用户意图以及多种备选用户意图的权重值的步骤,包括:
获取所述当前用户的操作指令中的名词语义;
根据所述当前用户的历史操作指令针对所述多个内容资源的意图统计数据和历史用户的操作指令针对所述多个内容资源的意图统计数据的结合,确定所述名词语义对应的各种备选用户意图播放音频以及备选用户意图播放音频的权重值;
根据历史数据确定所述操作指令对应的多种备选用户意图以及多种备选用户意图的权重值的步骤,包括:
获取所述当前用户的操作指令中的名词语义;
根据所述历史用户的操作指令针对所述多个内容资源的意图统计数据确定所述名词语义对应的各种备选用户意图播放音频以及各种备选用户意图播放音频的权重值;所述权重值是由所述历史用户的操作指令中所述名词语义对应的多个内容资源的意图进行统计得到的。
2.根据权利要求1所述的方法,其特征在于,根据历史数据确定所述操作指令对应的多种备选用户意图以及多种备选用户意图的权重值的步骤,包括:
获取所述当前用户的操作指令中的名词语义;
根据所述当前用户的历史操作指令针对所述多个内容资源的意图统计数据确定所述名词语义对应的各种备选用户意图播放音频以及各种备选用户意图播放音频的权重值。
3.根据权利要求1所述的方法,其特征在于,所述权重值根据多个播放源、多个演绎者和多个音频格式中所述音频的播放次数进行确定。
4.一种基于聚合资源的用户意图定位装置,其特征在于,应用于云端服务器,包括:
获取模块,用于获取针对聚合资源的当前用户的操作指令,所述聚合资源包括多个内容资源;
第一确定模块,用于根据历史数据确定所述操作指令对应的多种备选用户意图以及所述多种备选用户意图的权重值,其中,所述历史数据包括所述当前用户的历史操作指令针对所述多个内容资源的意图统计数据和/或历史用户的操作指令针对所述多个内容资源的意图统计数据;
第二确定模块,用于在所述备选用户意图中选择所述权重值最高的作为目标用户意图;
执行模块,用于将所述目标用户意图发送车载控制端,以使所述车载控制端对所述目标用户意图对应的内容资源执行相应操作;
获取模块,还用于获取当前用户的操作指令,所述操作指令针对的对象为聚合资源,所述操作指令包括音频数据和控制信号,所述操作指令的语义包括动词与名词的组合;
所述名词包括音频名称,所述音频包括多种播放源、多种演绎者和多种音频格式;
第一确定模块,还用于获取所述当前用户的操作指令中的名词语义;根据所述当前用户的历史操作指令针对所述多个内容资源的意图统计数据和历史用户的操作指令针对所述多个内容资源的意图统计数据的结合,确定所述名词语义对应的各种备选用户意图播放音频以及备选用户意图播放音频的权重值;
第一确定模块,还用于获取所述当前用户的操作指令中的名词语义;根据所述历史用户的操作指令针对所述多个内容资源的意图统计数据确定所述名词语义对应的各种备选用户意图播放音频以及各种备选用户意图播放音频的权重值;所述权重值是由所述历史用户的操作指令中所述名词语义对应的多个内容资源的意图进行统计得到的。
5.一种服务器,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至3任一项所述的方法的步骤。
6.一种机器可读存储介质,其特征在于,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被处理器调用和执行时,机器可执行指令促使处理器实现权利要求1至3任一项所述的方法的步骤。
CN202010252828.1A 2020-04-01 2020-04-01 基于聚合资源的用户意图定位方法和装置 Active CN111310059B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010252828.1A CN111310059B (zh) 2020-04-01 2020-04-01 基于聚合资源的用户意图定位方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010252828.1A CN111310059B (zh) 2020-04-01 2020-04-01 基于聚合资源的用户意图定位方法和装置

Publications (2)

Publication Number Publication Date
CN111310059A CN111310059A (zh) 2020-06-19
CN111310059B true CN111310059B (zh) 2023-11-21

Family

ID=71160986

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010252828.1A Active CN111310059B (zh) 2020-04-01 2020-04-01 基于聚合资源的用户意图定位方法和装置

Country Status (1)

Country Link
CN (1) CN111310059B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113409785A (zh) * 2021-06-30 2021-09-17 中国第一汽车股份有限公司 基于车辆的语音交互方法、装置、车辆和存储介质
CN113870842B (zh) * 2021-12-02 2022-03-15 深圳市北科瑞声科技股份有限公司 基于权重调节的语音控制方法、装置、设备及介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010028739A (ko) * 1999-09-22 2001-04-06 구자홍 사용자 피드백 변화를 반영한 멀티미디어 데이타 구조 및 멀티미디어 데이타의 특징소 가중치 결정방법
CN102782733A (zh) * 2009-12-31 2012-11-14 数字标记公司 采用配备有传感器的智能电话的方法和配置方案
CN106897369A (zh) * 2017-01-17 2017-06-27 成都视达科信息技术有限公司 一种内容数据推荐方法及***
CN109036425A (zh) * 2018-09-10 2018-12-18 百度在线网络技术(北京)有限公司 用于操作智能终端的方法和装置
CN109698858A (zh) * 2018-11-01 2019-04-30 百度在线网络技术(北京)有限公司 用于智能设备的资源推送方法、设备和存储介质
CN110309252A (zh) * 2018-02-28 2019-10-08 阿里巴巴集团控股有限公司 一种自然语言处理方法及装置
CN110333840A (zh) * 2019-06-28 2019-10-15 百度在线网络技术(北京)有限公司 推荐方法、装置、电子设备和存储介质
CN110622253A (zh) * 2017-06-02 2019-12-27 苹果公司 定制通知的确定和呈现
CN110825977A (zh) * 2019-10-10 2020-02-21 平安科技(深圳)有限公司 一种数据推荐方法及相关设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9836545B2 (en) * 2012-04-27 2017-12-05 Yahoo Holdings, Inc. Systems and methods for personalized generalized content recommendations

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010028739A (ko) * 1999-09-22 2001-04-06 구자홍 사용자 피드백 변화를 반영한 멀티미디어 데이타 구조 및 멀티미디어 데이타의 특징소 가중치 결정방법
CN102782733A (zh) * 2009-12-31 2012-11-14 数字标记公司 采用配备有传感器的智能电话的方法和配置方案
CN106897369A (zh) * 2017-01-17 2017-06-27 成都视达科信息技术有限公司 一种内容数据推荐方法及***
CN110622253A (zh) * 2017-06-02 2019-12-27 苹果公司 定制通知的确定和呈现
CN110309252A (zh) * 2018-02-28 2019-10-08 阿里巴巴集团控股有限公司 一种自然语言处理方法及装置
CN109036425A (zh) * 2018-09-10 2018-12-18 百度在线网络技术(北京)有限公司 用于操作智能终端的方法和装置
CN109698858A (zh) * 2018-11-01 2019-04-30 百度在线网络技术(北京)有限公司 用于智能设备的资源推送方法、设备和存储介质
CN110333840A (zh) * 2019-06-28 2019-10-15 百度在线网络技术(北京)有限公司 推荐方法、装置、电子设备和存储介质
CN110825977A (zh) * 2019-10-10 2020-02-21 平安科技(深圳)有限公司 一种数据推荐方法及相关设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Origins and history of the International System of Units, SI;Terry Quinn et al.;《 2012 Conference on Precision electromagnetic Measurements》;全文 *
基于用户偏好和动态兴趣的多样性推荐方法;邓明通等;《小型微型计算机***》;第39卷(第9期);全文 *
基于经验感知的自适应用户界面模型;樊银亭等;《计算机学报》;第34卷(第11期);全文 *

Also Published As

Publication number Publication date
CN111310059A (zh) 2020-06-19

Similar Documents

Publication Publication Date Title
US11676575B2 (en) On-device learning in a hybrid speech processing system
US10991374B2 (en) Request-response procedure based voice control method, voice control device and computer readable storage medium
CN105074822B (zh) 用于音频分类和处理的装置和方法
JP2019091417A (ja) 音声サービス提供方法および装置
KR20190024762A (ko) 음악추천방법, 장치, 디바이스 및 저장매체
CN111310059B (zh) 基于聚合资源的用户意图定位方法和装置
US20060224260A1 (en) Scan shuffle for building playlists
US20050021341A1 (en) In-vehicle controller and program for instructing computer to excute operation instruction method
US20220130395A1 (en) Voice-Controlled Management of User Profiles
CN105702253A (zh) 一种语音唤醒方法及装置
WO2018047421A1 (ja) 音声処理装置、情報処理装置、音声処理方法および情報処理方法
JP7308335B2 (ja) 車載音声機器のテスト方法、装置、電子機器及び記憶媒体
CN109671427B (zh) 一种语音控制方法、装置、存储介质及空调
JP7347217B2 (ja) 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム
CN111785238A (zh) 音频校准方法、装置及存储介质
US11756544B2 (en) Selectively providing enhanced clarification prompts in automated assistant interactions
US7505909B2 (en) Device control device and device control method
JP2021101252A (ja) 情報処理方法、情報処理装置およびプログラム
CN114822532A (zh) 语音交互方法、电子设备和存储介质
US20240029708A1 (en) Visual responses to user inputs
US11670326B1 (en) Noise detection and suppression
WO2022217621A1 (zh) 语音交互的方法和装置
US11114079B2 (en) Interactive music audition method, apparatus and terminal
US10990614B1 (en) Endpoint device relationships in processing user inputs
JP2006227954A (ja) 情報処理装置及び情報処理方法等

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant