CN111782965B - 意图推荐方法、装置、设备及存储介质 - Google Patents
意图推荐方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111782965B CN111782965B CN202010604365.0A CN202010604365A CN111782965B CN 111782965 B CN111782965 B CN 111782965B CN 202010604365 A CN202010604365 A CN 202010604365A CN 111782965 B CN111782965 B CN 111782965B
- Authority
- CN
- China
- Prior art keywords
- intention
- recommendation list
- information
- user
- intent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 104
- 238000003860 storage Methods 0.000 title claims abstract description 24
- 238000012545 processing Methods 0.000 claims abstract description 63
- 230000006399 behavior Effects 0.000 claims description 90
- 239000011159 matrix material Substances 0.000 claims description 71
- 238000004422 calculation algorithm Methods 0.000 claims description 36
- 238000001914 filtration Methods 0.000 claims description 35
- 230000008569 process Effects 0.000 claims description 21
- 230000015654 memory Effects 0.000 claims description 18
- 230000000694 effects Effects 0.000 claims description 14
- 238000004458 analytical method Methods 0.000 claims description 10
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000013135 deep learning Methods 0.000 abstract description 3
- 238000004590 computer program Methods 0.000 description 12
- 238000013461 design Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000011160 research Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000013480 data collection Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000013075 data extraction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003203 everyday effect Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 230000004308 accommodation Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012821 model calculation Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000000060 site-specific infrared dichroism spectroscopy Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2246—Trees, e.g. B+trees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
- G06F16/24534—Query rewriting; Transformation
- G06F16/24542—Plan optimisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0282—Rating or review of business operators or products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Computing Systems (AREA)
- Operations Research (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种意图推荐方法、装置、设备及存储介质,涉及计算机技术领域中的大数据、人工智能、智能搜索、信息流、深度学习技术领域。具体实现方案为:接收携带意图关键字和用户标识的意图查询请求,根据该意图关键字和预先配置的意图库可以确定第一推荐列表,意图库包括至少一个树状意图集合,每个树状意图集合包括至少一个层级意图,利用用户标识对应的意图策略信息对第一推荐列表中的意图进行处理,得到目标推荐列表并输出。该技术方案中,基于预先配置的意图库,能够确定出与意图查询请求相关性较高的意图,基于用户标识的意图策略信息能够提高个性化推荐结果,从而提高了意图推荐的准确度和个性化精度。
Description
技术领域
本申请实施例涉及计算机技术领域中的大数据、人工智能、智能搜索、信息流、深度学习技术领域,尤其涉及一种意图推荐方法、装置、设备及存储介质。
背景技术
随着互联网技术的迅速发展,基于用户行为数据和采集数据对目标对象进行信息研判和关系研判,能够获取到针对目标对象的意图信息,从而执行意图的推荐。
现有技术中,意图推荐方法主要基于规则或基于策略或者基于用户行为等,确定出合适的意图,并进行推荐。然而,该方案中,由于规则、策略或用户行为推荐的处理过程均需要考虑适用的场景,应用范围受限,存在推荐准确性低的问题。
发明内容
本申请提供了一种意图推荐方法、装置、设备及存储介质。
根据本申请的第一方面,提供了一种意图推荐方法,包括:
接收意图查询请求,所述意图查询请求携带意图关键字和用户标识;
根据所述意图关键字和预先配置的意图库,确定第一推荐列表,所述意图库包括至少一个树状意图集合,每个树状意图集合包括至少一个层级意图;
利用所述用户标识对应的意图策略信息对所述第一推荐列表中的意图进行处理,得到目标推荐列表;
输出所述目标推荐列表。
根据本申请的第二方面,提供了一种意图推荐装置,包括:接收模块、第一处理模块、第二处理模块和输出模块;
所述接收模块,用于接收意图查询请求,所述意图查询请求携带意图关键字和用户标识;
所述第一处理模块,用于根据所述意图关键字和预先配置的意图库,确定第一推荐列表,所述意图库包括至少一个树状意图集合,每个树状意图集合包括至少一个层级意图;
所述第二处理模块,用于利用所述用户标识对应的意图策略信息对所述第一推荐列表中的意图进行处理,得到目标推荐列表;
所述输出模块,用于输出所述目标推荐列表。
根据本申请的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面以及第一方面各可能设计所述的方法。
根据本申请的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行第一方面以及第一方面各可能设计所述的方法。
根据本申请的第五方面,提供了一种意图推荐方法,包括:
根据接收到的意图查询请求和意图类别规则,确定第一推荐列表;
利用预设的意图干预策略对所述第一推荐列表中的意图进行处理,得到目标推荐列表。
根据本申请的第六方面,提供一种计算机程序产品,包括:计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面所述的方法。
本申请实施例提供的意图推荐方法、装置、设备及存储介质,通过接收携带意图关键字和用户标识的意图查询请求,根据该意图关键字和预先配置的意图库可以确定第一推荐列表,该意图库包括至少一个树状意图集合,每个树状意图集合包括至少一个层级意图,利用用户标识对应的意图策略信息对第一推荐列表中的意图进行处理,得到目标推荐列表,最后输出该目标推荐列表。该技术方案中,基于预先配置的意图库,能够确定出与意图查询请求相关性较高的意图,基于用户标识的意图策略信息能够提高个性化推荐结果,从而提高了意图推荐的准确度和个性化精度。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1为本申请实施例提供的意图推荐方法的***架构示意图;
图2是根据本申请第一实施例提供的意图推荐方法的流程示意图;
图3是根据本申请第二实施例提供的意图推荐方法的流程示意图;
图4是根据本申请第三实施例提供的意图推荐方法的流程示意图;
图5是根据本申请第四实施例提供的意图推荐方法的流程示意图;
图6是根据本申请第五实施例提供的意图推荐方法的流程示意图;
图7是图6所示实施例中用户行为相似度矩阵和/或意图相似度矩阵的训练过程示意图;
图8是根据本申请第六实施例提供的意图推荐方法的流程示意图;
图9为本申请实施例提供的意图推荐装置的结构示意图;
图10是用来实现本申请实施例的意图推荐方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
在介绍本申请的技术方案之前,首先对本申请实施例中涉及到的术语进行解释:
意图:指的是用户所输入的简短且含糊的查询请求所对应的真实希望的意思的表示。
战法:指的是针对各种情况创造出来应用策略和技能。
可读性/可解释性:指的是意图的表述更加符合应用环境下的表述习惯,而不仅仅是多个词或短语的简单堆砌。
基于用户行为的协同过滤算法:用于给用户推荐和他行为相似的其他用户的意图。
基于意图的协同过滤算法:用于给用户推荐和他之前有过的意图相似的意图。
下面在介绍本申请的技术方案和***架构之前,首先介绍一下本申请技术方案的应用背景。
随着互联网大环境和各类监控、卡口等采集设备的迅速普及,每天都会产生或获取到大量的用户数据。
可选的,用户数据可以包括用户行为数据和用户身份数据。其中,用户行为数据可以包括:住店行为数据(各类酒店、租房、钟点房、长租房等),交通出行行为数据(乘坐火车、高铁、飞机、轮渡等),通话行为数据(手机短信息、固话通话信息、移动电话通话信息等),快递行为数据,犯罪羁押行为(各个监狱服刑记录信息)。用户身份数据可以包括:人脸数据(例如,通过交通探头、酒店探头、用户自装探头等采集到的人脸信息),互联网上各类身份标识号(identity document,ID)(包括设备ID,如国际移动设备识别码(internationalmobile equipment identity,IMEI)、广告标识符(identifier for advertising,IDFA)等;网络ID,如互联网协议(internet protocol,IP)地址、接入点(access point,AP)、服务集标识(service set identifier,SSID)等)。
在实际应用中的警务场景下,基于用户行为数据和用户身份数据,警方可以进行目标对象的信息和关系研判(研究和判断)。可选的,研判的过程本身是一个战法的查询和推荐过程,研判的意图包括:关联关系意图(同行、同住、通话、快递、狱友);一人一档信息意图(出行记录、住宿记录、通话记录、快递记录、羁押记录);报文要素意图(文本信息,情报,短信);重大时政热点意图(某个国际机场、某地骚乱);标签意图(人口标签)等。
然而,随着采集或获取到的用户数据不断累积,重点对象/嫌疑对象的行为轨迹急剧膨胀,为了进行精准的战法意图推荐,由此需要解决如下有挑战性的问题:
计算和存储资源:解决PB级别的数据处理问题,其中,PB指petabyte,它是较高级的存储单位,1PB=1024TB。即,由于每天都会产生大量的查询和点击日志数据,需要进行海量日志预处理和数据计算。
警务使用场景:多警种、多场景的战犯意图推荐不会完全相同,同时也要互相补充。
战法意图拓展:随着维稳、反恐等形势愈发加剧,新的有效的战法也不断更新加入,需要适应和拓展新的战法,同时弃用和淘汰成效较低的战法。
由背景技术的介绍可知,现有技术中意图推荐方法主要基于规则或基于策略或者基于用户行为等,确定出合适的意图,并进行推荐。
具体的,从推荐个性化和相似度区分,意图推荐方法主要分为基于用户行为的推荐、基于查询结果的推荐和基于热点推荐。其中,基于用户行为的推荐是指:根据不同用户的搜索、点击行为,学习用户相似度模型,推荐相似的用户的查询结果。基于查询结果的推荐是指:根据结果集的各类特征,学习结果集相似度模型,推荐和查询的结果相似的其他内容。基于热点推荐是指:推荐近期出现的重大热点内容,其和查询用户的行为和查询的内容关系不大。
从推荐模型的算法进行区分,意图推荐方法主要分为基于规则的算法、有监督算法和无监督算法。其中,基于规则的算法主要指:提前制定推荐具体规则,例如,某类用户查询某类特定意图,则命中某条规则,进而推荐预制的内容。有监督算法主要包括支持向量机算法、神经网络算法、逻辑回归算法等。预测用户行为或者查询内容的标签类别,然后推荐相同类别下的内容。无监督算法主要包括聚类算法、最近邻算法、相似度矩阵等。通过计算相似程度或者分类,把相似度用户或者结果进行推荐。
从战法和意图的推荐方式区分,意图推荐方法主要指基于战法的推荐,即:不同的查询意图构成不同战法。推荐的意图本身可以构成某种潜在战法,从而解决某类问题。
然而,上述不同的推荐方式均存在一定的问题,下面分别从基于规则、基于策略、基于用户行为等方面进行说明。
可选的,在基于规则的方案中,虽然规则的编写能够快速的产生推荐结果,但是较为单一;规则的定义需要考虑适用的场景和不适用的场景,随着用户增长、行为数据增长、战法扩充,规则的编写和维护将变得非常困难。规则的泛化能力有限,并且很难穷举全部;复杂的场景难以抽象规则,成本高。
在基于策略的方案中,虽然采用机器学习或者其他模型算法,能够提升模型泛化能力,降低规则的编写量,但是难以干预推荐的结果是相似度高的意图,还是个性化的意图;不同的推荐类别,数据采集后的分布不均匀,可能导致推荐有偏;策略模型迁移成本高,一般需要重新训练。
在基于用户行为的推荐方案中,通过挖掘相似用户,推荐其点击和查询的结果,有助于发现新鲜的战法和意图,但是其依赖大量用户行为数据,推荐***冷启动时用户数量少,效果会折损,当用户数量特别多,结果集较少的场景,计算用户相似度会占用较大资源。
综上分析可知,由于规则、策略或用户行为推荐的处理过程均需要考虑适用的场景,应用范围受限,存在推荐准确性低的问题。
针对上述问题,本申请实施例提供了一种意图推荐方法,例如,对于警务场景下的意图查询请求,其可以基于自然语言实现,具体的,通过提取意图查询请求(查询语句)中的存在的意图关键词和用户标识,首先根据该意图关键字和预先配置的意图库可以确定第一推荐列表,该意图库包括至少一个树状意图集合,每个树状意图集合包括至少一个层级意图;其次利用用户标识对应的意图策略信息对第一推荐列表中的意图进行处理,得到目标推荐列表,最后输出该目标推荐列表。基于预先配置的意图库,首先能够确定出与意图查询请求相关性较高的意图,基于用户标识的意图策略信息能够提高个性化推荐结果,从而提高了意图推荐的准确度和个性化精度。
进一步的,本申请实施例的方案,还可以利用协同过滤的技术进行战法意图的推荐。具体的,用户的每一次意图查询请求,均可以作为某种战法的组成元素,通过内置战法分析和学习其他用户行为的战法,进而推荐相关的意图,帮助用户只需要少量输入和点击操作,就可以“猜中”和“预测”用户想要查询的全部意图。
可选的,在实际应用中,在接收到意图查询请求后,首先通过分析该意图查询请求对应的实体(人、物、时间、地点等)类别、实体之间的排列组合顺序以及用户的身份ID生成用户的查询特征向量,然后通过协同过滤相关算法与离线训练的推荐模型进行相似度检索,并通过个性化战法意图规则干预加强,得到推荐结果集。
下面在介绍本申请的技术方案之前,首先介绍一下本申请技术方案的***架构。图1为本申请实施例提供的意图推荐方法的***架构示意图。参照图1所示,该***架构包括:数据源部分11、数据处理部分12、数据存储部分13和推荐分级部分14。
其中,数据源部分11主要指用户数据集的产生阶段和数据源。在本申请的实施例中,用户数据集可以包括互联网的虚拟数据和真实数据。可选的,虚拟数据可以包括搜索流量数据、地图定位数据、购物数据、广告数据等,真实数据可以包括酒店住宿数据、出行数据(高铁、飞机、轮渡等)、通话数据和短信数据、社会数据等。
可选的,用户数据集的存储***主要包括关系型数据库***(relationaldatabase management system,RMDB)、非关系型数据库(NoSQL)、文件***(file)和分布式文件***(hadoop distributed file system,HDFS)等。因为,为了能够从不同的存储***获取用户数据,需要获取预设的配置信息,根据预设的配置信息从不同的存储***中获取用户数据。
可选的,数据源部分11主要用于生成用户行为的原始数据。数据处理部分12主要用于基于接收到的意图查询请求,从数据源部分11获取用户数据集,并对用户数据集进行处理,得到用户ID、接口路径、接口返参、接口入参和时间戳等信息,并基于得到的用户ID,接口路径、接口返参、接口入参和时间戳等信息进行数据清洗等处理,从而得到目标数据集,并存储至数据存储部分13中。
可选的,推荐分级部分14主要用于从数据处理部分12获取意图查询请求和从数据存储部分13中获取预先处理好的目标数据集,并基于该意图查询请求和目标数据集,按照协同过滤、内容推荐和个性化干预等规则,确定出目标推荐列表,在存储至数据存储部分13的同时,输出该目标推荐列表。
可以理解的是,上述图1所述的***架构图仅是一种示例性说明。在实际应用中,可以根据实际需求进行调整,本申请实施例并不对其进行限定。
可选的,本申请实施例的执行主体可以是电子设备,例如,计算机、平板电脑等终端设备,也可以是服务器,例如,后台的处理平台等。因而,本实施例以终端设备和服务器统称为电子设备进行解释说明,关于该电子设备具体为终端设备,还是服务器,其可以实际情况确定。
可选的,本申请实施例提供了一种意图推荐方法,应用于计算机技术领域中的大数据、人工智能、智能搜索、信息流、深度学习技术领域,主要涉及到数据采集、数据模型计算、推荐分级策略等多个部分,支持私有化部署,方便多警种多场景的使用,以提高意图推荐的准确性和个性化精度。
下面,通过具体实施例对本申请的技术方案进行详细说明。需要说明的是,下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
图2是根据本申请第一实施例提供的意图推荐方法的流程示意图。如图2所示,该方法可以包括如下步骤:
S201、接收意图查询请求,该意图查询请求携带意图关键字和用户标识。
在本申请的实施例中,当用户有查询需求时,其可以发出意图查询请求,以请求电子设备对意图查询请求进行处理,输出该用户真实希望得到的信息,也即,意图。
可选的,电子设备可以接收用户通过多种方式发出的意图查询请求,例如,文字方式,语音方式等。本实施例并不对用户发出意图查询请求的方式进行限定,其可以根据实际场景确定,此处不再赘述。
可选的,为了使得电子设备有目标性的进行意图查询,该意图查询请求中可以携带意图关键字,而为了确定出用户个性化的意图,该意图查询请求中会携带该用户标识。可以理解的是,该用户标识可以通过用户发出意图查询请求的设备标识、网络标识等进行表征,本申请实施例并不对用户标识的具体表现形式进行限定,其可以根据实际场景确定。
例如,用户通过一个终端设备发出意图查询请求,可选的,该意图查询请求是一个查询语句,例如,“XX地方的天气是什么”,则该意图查询请求对应的意图关键字是“XX”和“天气”,其携带的用户标识可以利用该终端设备的标识进行表征。
S202、根据该意图关键字和预先配置的意图库,确定第一推荐列表。
其中,该意图库包括至少一个树状意图集合,每个树状意图集合包括至少一个层级意图。
在实际应用中,电子设备中可以预先配置有意图库,该意图库中的意图可以是***内置的,也可以是用户自定义的。本申请实施例并不对意图的具体形成方式进行限定,其可以根据实际场景确定。
可选的,为了表征意图的精细程度,在本申请的实施例中,意图库中的意图可以采用树状结构进行存储,因而,意图库中包括至少一个树状意图集合,每个树状意图集合包括至少一个等级意图。例如,每个树状意图集合包括主意图、二级意图、三级意图等等,每个树状意图中的每个分支均具有一个唯一的意图编码。
可选的,由于树是一种数据结构,其是由至少一个有限节点组成一个具有层次关系的集合。在本申请的实施例中,树状意图集合具有以下的特点:每个层级的意图具有零个或多个子意图,没有父意图的意图称为主意图,每个非主意图有且只有一个父意图,除了主意图外,每个子意图可以分为多个不相交的子树状意图结合。
在本申请的实施例中,电子设备接收到意图查询请求后,通过对该意图查询请求进行分析,可以确定该意图查询请求对应的意图关键字,进而根据该意图关键字,在预先配置的意图库中进行查询,确定出该意图关键字所属的层级意图和该层级意图所属的树状意图集合,随后基于预设的排序规则,对该意图关键字所属的树状意图集合所包括的所有意图进行排序,从而生成该第一推荐列表。
S203、利用该用户标识对应的意图策略信息对第一推荐列表中的意图进行处理,得到目标推荐列表。
在实际应用中,随着时间的推移,电子设备中预先配置的意图库会不断的更新,例如,基于用户需要产生新的意图并加入该意图库,弃用过时的意图等。因而,为了提高意图推荐的准确度,电子设备中预先设置有个性化意图干预策略信息,即不同的用户可能对应不同的意图策略信息。
在本申请的实施例中,电子设备在接收到意图查询请求并确定出该意图查询请求对应的用户标识,可以根据该用户标识,查询电子设备中预先配置的个性化意图干预策略信息,确定出该用户标识对应的意图策略信息。
相应的,电子设备可以利用该用户对应的意图策略信息对上述确定的第一推荐列表中的意图进行干预,例如,弃用某些意图,对意图的顺序进行重排等,进而得到处理后的推荐列表,即目标推荐列表。
S204、输出上述目标推荐列表。
在本申请的实施例中,电子设备基于意图查询请求确定出目标推荐列表后,可以将其输出,例如,将其推送至用户标识对应用户的终端设备,以便用户查看。
本申请实施例提供的意图推荐方法,通过接收携带意图关键字和用户标识的意图查询请求,根据该意图关键字和预先配置的意图库可以确定第一推荐列表,该意图库包括至少一个树状意图集合,每个树状意图集合包括至少一个层级意图,利用用户标识对应的意图策略信息对第一推荐列表中的意图进行处理,得到目标推荐列表,最后输出该目标推荐列表。该技术方案中,基于预先配置的意图库,能够确定出与意图查询请求相关性较高的意图,基于用户标识的意图策略信息能够提高个性化推荐结果,从而提高了意图推荐的准确度和个性化精度。
示例性的,在上述实施例的基础上,图3是根据本申请第二实施例提供的意图推荐方法的流程示意图。如图3所示,在本实施例中,上述S202可以通过如下步骤实现:
S301、对该意图关键字进行语义分析,确定该用户标识对应用户的目标意图。
在本申请的实施例中,用户发出的意图查询请求通常是自然语言,偏口语化,通过对该自然语言进行分析获取实质内容,即确定出该用户标识对应用户的目标意图。
示例性的,由于用户可以通过多种方式发出意图查询请求,对于不同的方式可以采用不同的分析方式。示例性的,若用户通过语音方式发出该意图查询请求,则电子设备在获取到语音形式的意图查询请求时,首先将其转换为文字信息,确定出该文字信息中的意图关键字,进而对该意图关键字进行语音分析,确定出该意图关键字对应的时间、地点、人物、事件等要素,从而获取到该用户标识对应用户的目标意图。
S302、根据该目标意图,查询预先配置的意图库,确定该目标意图所在的层级信息和树信息。
可选的,在本申请的实施例中,意图库中存储有至少一个树状意图集合,每个树状意图集合包括至少一个层级,每个树状意图中的每个分支均具有一个唯一的意图编码,该意图编码本身反映了意图的分类层级。可以理解的是,意图的层级越高,意图的分类越精细。
示例性的,表1示出了一个具有三级意图的树状意图集合。如表1所示,该树状意图集合包括三级意图,即主意图—A、二级意图—B、三级意图—C,相应的,由于二级意图包括关联关系意图—B1和一人一档意图—B2,三级意图包括同行—C1和出行—C2,因而,该树状意图集合包括两个分支,分别是利用意图编码A1B1C1-tongxing和意图编码A1B2C1-chuixing表示。
表1 一个具有三级意图的树状意图集合
在本申请的实施例中,电子设备确定出用户标识对应的目标意图后,在预先配置的意图库进行查询,定位到目标意图所在的层级和树,从而得到该目标意图所在的层级信息和树信息。
示例性的,假设用户的目标意图为出行—C2,则可以首先定位到该目标意图的层级为三级意图,且其对应的二级意图为一人一档意图—B2、主意图为人员研判意图—A1。
S303、根据该目标意图所在的层级信息和树信息、树信息对应的树状意图集合,得到该第一推荐列表。
在本申请的实施例中,电子设备确定出目标意图所在的层级信息和树信息,也相应的确定了该树信息对应的树状意图集合,即该目标意图所属的树状意图集合,随后根据该树状意图集合中各层级的意图信息,可以生成第一推荐列表。
示例性的,在本申请的实施例中,该S303可以通过如下步骤实现:
A1、生成该目标意图对应的初始推荐列表。
可选的,为了向用户推荐用户希望的意图,电子设备在确定出目标意图后,首先可以基于该目标意图,生成初始推荐列表。可选的,该目标意图位于该初始推荐列表的表头。
示例性的,假设电子设备基于接收到的意图查询请求,确定出的目标意图为xx-code,则可以生成包括该xx-code的初始推荐列表。
A2、根据该目标意图所在的层级信息和树信息,确定该目标意图的至少一个关联意图。
A3、按照同层级、附属层级、树层级的先后顺序,依次将该目标意图的至少一个关联意图,添加至初始推荐列表中,得到第一推荐列表。
在本申请的实施例中,树状意图集合可以包括多个不同的层级,每个层级具有至少一个意图。因而,本申请的实施例中,根据该目标意图所在的层级信息,依次确定出与该目标意图处于同层级、各附属层级、树层级的至少一个关联意图,然后,先同层级、后附属层级、最后树层级的先后顺序,依次把目标意图的至少一个关联意图添加至初始推荐列表中,得到该第一推荐列。
示例性的,假设xx-code意图为三级意图,则首先把xx-code意图同组的三级意图项,加入上述初始推荐列表,然后把xx-code意图从属的二级意图下属的全部三级意图,加入初始推荐列表,最后把xx-code意图从属的主意图下属的全部三级意图,加入初始推荐列表,最后得到的推荐列表为第一推荐列表。
示例性的,对于表1所示的树状意图集合,目标意图为出行—C2,与该出行—C2同组的意图、出行—C2从属的二级意图(一人一档意图—B2)下属的全部三级意图均为无,出行—C2从属的主意图(人员研判意图—A1)下属的全部三级意图(同行—C1)添加至推荐列表,因而,得到的第一推荐列表包括出行—C2、同行—C1。
在本实施例中,在生成第一推荐列表时,基于先同层级、后附属层级、最后树层级的先后顺序,依次把目标意图的至少一个关联意图添加至初始推荐列表中,这样能够把与目标意图关联性最大的意图排在推荐列表的前面,可以在一定程度上提高意图推荐的准确度。
本申请实施例提供的意图推荐方法,通过对该意图关键字进行语义分析,确定该用户标识对应用户的目标意图,然后根据该目标意图,查询预先配置的意图库,确定该目标意图所在的层级信息和树信息,最后根据该目标意图所在的层级信息和树信息、树信息对应的树状意图集合,得到该第一推荐列表。该技术方案,能够提升意图库中新增意图的相关性推荐顺序,解决了由于新增意图的搜索和点击量很小,导致新增意图排名靠后的问题。
可选的,在上述实施例的基础上,图4是根据本申请第三实施例提供的意图推荐方法的流程示意图。如图3所示,在本实施例中,上述S203可以通过如下步骤实现:
S401、确定该用户标识对应的意图策略信息,该意图策略信息用于指示意图的生效范围信息和生效顺序信息。
在实际应用中,例如,警务场景下,为了应对复杂多变的战法需求,意图库中会不断有新的意图加入,同时也有过时的意图需要弃用。因而,本申请实施例中,电子设备中针对不同的用户设置了不同的意图策略信息,即个性化的干预策略。
示例性的,该个性化的干预策略从全局生效和特定用户生效的干预策略、黑白名单生效的干预策略进行设定,因而,个性化的干预策略对应的配置项可以包括:全局生效的白名单意图、全局生效的黑名单意图、仅对特定用户生效的白名单意图、仅对特定用户生效的黑名单意图等。
示例性的,配置项的表示方式如下:
Whitelist表示全局生效的白名单意图;blacklist表示全局生效的黑名单意图;personal表示个性化干预配置;personal.userToken表示用户id;personal.whitelist表示仅对特定用户生效的白名单意图,personal.blacklist表示仅对特定用户生效的黑名单意图。
可选的,在本申请的实施例中,为了针对不同的用户确定出意图的生效范围信息和生效顺序信息,电子设备中还可以设置不同配置项的优先级和执行生效顺序。例如,干预策略的优先级大小划分:黑名单>白名单,个性化配置>全局配置,相应的,干预策略的执行生效顺序:全局白名单-全局黑名单-个性化白名单-个性化黑名单。
在本申请的实施例中,电子设备首先根据用户标识与意图策略信息的对应关系,确定该用户标识对应的意图策略信息,进而确定出该意图策略信息指示的意图的生效范围信息和生效顺序信息。
S402、根据该意图策略信息指示的意图的生效范围信息,确定第一推荐列表中生效的意图集合。
在本申请的实施例中,电子设备根据该用户标识对应的意图策略信息,首先确定出其指示的意图的生效范围信息,例如,是黑名单生效,还是白名单生效,还是该用户对应的个性化白名单生效,或者该用户对应的个性化黑名单生效等。
相应的,在本实施例中,电子设备可以根据用户标识对应意图的生效范围信息,确定出第一推荐列表中生效的意图集合。例如,若意图策略信息指示白名单生效,则电子设备从上述第一推荐列表中筛选出全局白名单和用户白名单对应的意图集合。
S403、根据该意图策略信息指示的意图的生效顺序信息,对上述意图集合中的所有意图进行排序,得到目标推荐列表。
示例性的,电子设备还可以根据该用户标识对应的意图策略信息,确定出其指示的意图的生效顺序信息,例如,在干预策略中,个性化配置的优先级大于全局配置的优先级,且干预策略的执行生效顺序为先全局白名单,后个性化白名单。
因而,在本实施例中,电子设备可以根据确定的意图的生效顺序信息,对从第一推荐列表中筛选出的全局白名单和用户白名单对应的意图集合中的意图进行排序,从而生成该目标推荐列表。
本申请实施例提供的意图推荐方法,通过确定出用户标识对应的意图策略信息,该意图策略信息用于指示意图的生效范围信息和生效顺序信息,再根据该意图策略信息指示的意图的生效范围信息,确定第一推荐列表中生效的意图集合,最后根据该意图策略信息指示的意图的生效顺序信息,对上述意图集合中的所有意图进行排序,得到目标推荐列表。该技术方案中,根据个性化的意图干预策略,既可以筛选出个性化的意图集合,也可以对意图集合中的意图进行排序,提高了意图推荐的准确度和目的性。
进一步的,在上述实施例的基础上,图5是根据本申请第四实施例提供的意图推荐方法的流程示意图。如图5所示,在本实施例中,该方法还可以包括如下步骤:
S501、基于协同过滤算法对上述意图查询请求和预先确定的相似度矩阵进行处理,得到第二推荐列表。
其中,第二推荐列表是利用基于用户行为的协同过滤算法对意图查询请求和预先确定的用户行为相似度矩阵进行处理得到的,和/或,利用基于意图的协同过滤算法对意图查询请求和预先确定的意图相似度矩阵进行处理得到的。
可选的,该步骤可以在上述S202之前或S202之后执行,本申请实施例并不限定该步骤S501的具体执行顺序。本实施例中,以该步骤在S202之后执行进行说明。
在实际应用中,随着互联网技术的发展,能够获取到越来越多的用户数据,通过对网络上的用户数据进行分析,可以发现隐性战法和相关意图。因而,在本申请的实施例中,可以利用协同过滤算法对获取到的意图查询请求和基于大量用户数据生成的相似度矩阵进行处理,以确定出多个相关意图。
在本申请实施例的一种可能设计中,该步骤S501可以通过如下步骤实现:
利用基于用户行为的协同过滤算法对上述意图查询请求、预先生成的用户行为相似度矩阵进行处理,得到第二推荐列表。
具体的,首先根据该用户标识和预先生成的用户行为相似度矩阵,确定第一用户集合,该第一用户集合包括:与目标用户(用户标识对应用户)之间的行为相似度最高的K个用户,K为正整数,其次根据该用户标识对应用户的行为特征信息,确定目标用户对应的第一意图集合,再次,针对该第一意图集合中的任意一个意图,确定该意图对应的第二用户集合,并根据该目标用户与第一用户集合中每个用户之间的相似度值、每个用户对所述意图的喜好信息,确定目标用户对该意图的喜好得分,最后根据该目标用户对第一意图集合中每个意图的喜好得分,确定第二推荐列表。
示例性的,对于第一意图集合中的任意一个意图x,用户a对意图x的感兴趣程度得分(喜好得分)通过下式表示:
score(a,x)=∑b∈S(a,K)∩N(x)wa,brb,x
其中,S(a,K)表示与用户a行为相似度最高的前K个用户,称为第一用户集合,其是根据用户标识和预先确定的用户行为相似度矩阵确定的;N(x)表示同时具有意图x对应行为的用户集合,称为第二用户集合。wa,b表示用户a和用户b之间的相似度值。rb,x表示用户b对意图x的喜好得分。
通过上述方法可以确定出该用户对第一意图集合中每个意图的喜好得分,最后在用户维度对第一意图集合中每个意图的得分进行降序排列,从而可以得到第二推荐列表。
在本申请实施例的另一种可能设计中,该步骤S501可以通过如下步骤实现:
利用基于意图的协同过滤算法对上述意图查询请求、预先生成的意图相似度矩阵进行处理,得到第二推荐列表。
具体的:首先根据用户标识和预先生成的意图相似度矩阵,确定第二意图集合,该第二意图集合包括:与意图查询请求对应意图之间的意图相似度最高的K个意图;其次根据目标用户(用户标识对应用户)的行为特征信息,确定目标用户的第三意图集合,再次对于该第三意图集合中的任意一个意图,根据该意图与第二意图集合中每个意图之间的相似度值、目标用户对意图的喜好信息,确定目标用户对该意图的喜好得分,最后根据该目标用户对第三意图集合中每个意图的喜好得分,确定第二推荐列表。
示例性的,对于第三意图集合中的任意一个意图x,用户a对意图x的感兴趣程度得分(喜好得分)通过下式表示:
score(a,x)=∑b∈S(y,K)∩N(a)wx,yra,y
其中,S(y,K)表示和意图y最相似的k个意图,称为第二意图集合,其中,意图y为基于意图查询请求确定的意图;N(a)是用户a喜欢的意图的集合,称为第三意图集合。wx,y表示意图x和意图y的相似度值,ra,y表示用户a对意图y的喜好得分。
通过上述方法可以确定出该目标用户对第三意图集合中每个意图的喜好得分,最后在用户维度对第三意图集合中每个意图的得分进行降序排列,从而可以得到第二推荐列表。
在本申请实施例的再一种可能设计中,该步骤S501可以通过如下步骤实现:
利用基于用户行为的协同过滤算法对意图查询请求、预先生成的用户行为相似度矩阵进行处理以及利用基于意图的协同过滤算法对上述意图查询请求、预先生成的意图相似度矩阵进行处理,得到第二推荐列表。
具体的,在本申请的实施例中,可以将基于用户行为的协同过滤算法确定的用户行为推荐列表和基于用户行为的协同过滤算法确定的意图推荐列表进行整合,得到该第二推荐列表。关于用户行为推荐列表和意图推荐列表的生成方法可以参见上述可能设计中的记载,此处不再赘述。
相应的,如图5所示,上述203可以替换为如下步骤:
S502、利用该用户标识对应的意图策略信息对第一推荐列表中的意图、第二推荐列表中的意图进行处理,得到该目标推荐列表。
在本申请的实施例中,基于上述图2所示实施例中S203的记载,电子设备可以首先确定该用户标识对应的意图策略信息。其次,利用该用户对应的意图策略信息对上述确定的第一推荐列表和第二推荐列表中的意图进行干预,例如,弃用某些意图,对意图的顺序进行重排等,进而得到处理后的推荐列表,即目标推荐列表。
可选的,电子设备对第一推荐列表和第二推荐列表的处理顺序可以根据用户设置确定,例如,根据某个指标,例如,关注量大小、生成时间等指标,对第一推荐列表和第二推荐列表包括的所有意图进行整合后,再利用用户标识对应的意图策略信息对其进行处理,从而得到目标推荐列表。
本申请实施例提供的意图推荐方法,通过基于协同过滤算法对上述意图查询请求和预先确定的相似度矩阵进行处理,得到第二推荐列表,利用该用户标识对应的意图策略信息对第一推荐列表中的意图、第二推荐列表中的意图进行处理,得到该目标推荐列表。该技术方案中,利用大量的用户行为数据和协同过滤推荐,能够发现隐性战法和相关意图,结合基于意图内容类别的推荐可以让新增的意图快速生效,通过个性化的意图策略信息能够提高推荐的准确性和目的性。
可选的,在上述各实施例的基础上,图6是根据本申请第五实施例提供的意图推荐方法的流程示意图。如图6所示,在本实施例中,该方法还可以包括如下步骤:
S601、获取用户数据集。
在本申请的实施例中,在互联网大场景下,网络中产生的用户行为数据很大,可选的,用户数据集可以包括用户ID,用户搜索内容,搜索接口,意图信息,查询结果,时间戳等信息。其中,数据来源包括关联关系接口、一人一档接口等多份日志,通过正则匹配和过滤,抽取出原始的用户行为数据。示例性的,下述列出各种数据的格式:
用户id:{"userToken":"192.0.25.64"}
搜索接口:{"apiUrl":"/api/to/path"}
搜索内容:{"apiParmas":{"query":"blabla.."}}
意图信息:{"intentionCode":"A1B1C1-tongxing"}
时间戳:{"timeStamp":1521402351}
搜索结果:{"apiResponse":{...}}
可选的,原始的日志包含上述信息的结构化信息,通过按行的正则匹配,得到每项的具体内容,然后写入到csv格式的文本文件当中,schema信息如下:userToken\t apiUrl\t apiParams\t intentionCode\t timestamp\t apiResponse。
可选的,电子设备可以基于预设的数据配置获取用户数据集。示例性的,预设的配置信息可以包括数据源类型(HDFS、HIVE、MYSQL、NoSQL…)、数据源路径(主机:端口(host:port)、hdfspath…)、提取方式、提取周期。其中,数据源类型用于表征存储用户身份数据的***类型,数据源路径用于表征提取用户身份数据时经过的路线,提取方式用于表征采用什么样的方式进行数据提取(增量或全量),提取周期用于表征多长时间自动执行一次数据提取。该提取周期也可以认为是调度频次(执行周期),用于指示按照天级别、小时级别或是单次执行用户数据提取任务。
可选的,由于***的日志产生方式一般是滚动日志,每天产生一个新的日志文件,所以,数据采集周期建议设置为每隔预设时间(例如,一天)执行一次,按照增量的方式。
具体的,电子设备可以基于配置的内容,根据不同的数据源路径读取不同的数据源。如果利用增量的数据采集方式,那么增量匹配的结果需要和历史全量数据进行融合。如果利用全量的数据采集方式,那么全量匹配的结果需要直接覆盖历史全量数据。
进一步的,在本申请的实施例中,由于从网络中获取到的原始用户数据,其可能存在数据不准确,数据不及时,数据缺失等情况,使得采集到的原始用户数据的质量无法得到保证。可选的,针对这类低质量数据,电子设备可以采用严格的过滤条件,只保留完全符合要求的数据,尽可能降低数据噪音对后期使用的影响。对于数据缺失和不及时,还可以提供手动执行模式,以定期回溯遗漏的数据,提高数据的全面性。
由上述分析可知,本申请实施例提供了一种自动化的数据采集方案,引入用户行为采集的抽取-转换-加载(Extract-Transform-Load,etl)工程方案,描述了将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程,其实现了配置化和自动化,支持增量、全量的数据采集,支持人工回溯数据,降低了数据采集成本。
S602、根据该用户数据集,生成用户行为相似度矩阵和/或意图相似度矩阵。
其中,该用户行为相似度矩阵用于表征用户数据集所涉及的用户之间的行为相似度,该意图相似度矩阵用于表征用户数据集所涉及的意图之间的相似度。
在本申请的实施例中,由于协同过滤的目的是通过分析多用户多场景下的搜索意图,使推荐列表过滤掉不感兴趣的意图,得到出现感兴趣和新鲜的意图。因而,当需要对用户进行个性化推荐时,首先需要找到和他行为相似的其他用户,然后把那些用户的喜欢和搜索的意图加入到推荐列表。
具体的,电子设备首先根据用户的原始行为数据,计算每个用户的行为特征向量。可选的,该用户的行为特征向量可以包括查询的apiUrl(即,查询接口)和意图代码两类特征。示例性的,用户的用户特征向量可以利用直方图特征(bag of feature)表示:[apiUrl(1),apiUrl(2),…,apiUrl(m),intention(1),intention(2),…,intention(n)]。其中,apiUrl(m)表示用户访问的第m个api的url路径的次数,intention(n)表示用户搜索的第n个意图的次数,两者均表示用户的特征分量。
在本实施例中,用户数据集中任意两个用户之间的行为相似度值可以通过如下余弦相似度公式得到:
其中,Wa,b表示用户a和用户b的行为相似度值,n表示特征向量的维数,xi是用户a的特征分量,yi是用户b的特征分量。
对于用户数据集中任意两个用户均采用上述方式计算行为相似度值,因而,可以计算得到用户数据集对应的用户行为相似度矩阵。
同理,通过分析多用户对意图的搜索点击行为,可以得到每个意图的用户喜好向量。因而,可以基于每个意图的用户喜好向量计算意图之间的相似度矩阵。示例性的,每个意图的用户喜好的直方图特征可以用下式表示:[user(1),user(2),…,user(n)]。其中,user(n)表示第n个用户对当前意图的搜索点击次数。
在本实施例中,用户数据集中任意两个意图之间的意图相似度值可以根据余弦相似度公式得到:
其中,Wp,q表示意图p和意图q的相似度值,n表示用户的数量,xi是意图p的特征分量,yi是意图q的特征分量。
对于用户数据集中的任意两个意图均采用上述方式计算意图相似度值,因而,可以计算得到用户数据集对应的意图相似度矩阵。
S603、存储该用户行为相似度矩阵和/或意图相似度矩阵。
在本申请的实施例中,在确定出用户数据集对应的用户行为相似度矩阵和/或意图相似度矩阵后,通过对其进行存储,以便在后续进行意图推荐时直接使用,从而提高了推荐效率。
示例性的,图7是图6所示实施例中用户行为相似度矩阵和/或意图相似度矩阵的训练过程示意图。如图7所示,在本申请的实施例中,离线训练的数据源可以包括搜索API数据,关联关系数据、一人一档数据和标签数据,相应的,数据采集方式可以采用增量的方式,即获取到用户行为增量数据后,通过累计的方式得到用户行为全量数据,随后分别训练得到用户行为相似度矩阵和意图相似度矩阵,最后将得到的用户行为相似度矩阵和意图相似度矩阵存储至数据库中,以便后续使用。
本申请实施例提供的意图推荐方法,通过获取用户数据集,根据该用户数据集,生成用户行为相似度矩阵和/或意图相似度矩阵,该用户行为相似度矩阵用于表征用户数据集所涉及的用户之间的行为相似度,意图相似度矩阵用于表征用户数据集所涉及的意图之间的相似度,并存储用户行为相似度矩阵和/或意图相似度矩阵。该技术方案中,根据采集到的用户数据集计算用户行为相似度矩阵和/或意图相似度矩阵,方便了为后续的使用,而且提高了意图推荐的效率和精度。
综上可知,本申请实施例为了向用户推荐精准意图,采用了分级的推荐策略,可以首先采用协同过滤方法得到用户到意图的相关性结果集,然后基于用意图类别规则(即预设的意图库)进一步召回相关意图,并加入到推荐列表中,最后通过生效个性化干预策略,通过添加和删除特定意图、对全局或者指定用户生效的方式,得到精度较高的目标推荐列表。
示例性的,图8是根据本申请第六实施例提供的意图推荐方法的流程示意图。如图8所示,在本申请的实施例中,在线检索过程可以通过信息输入阶段、推荐模型计算阶段、排序合并阶段、个性化干预阶段后,输出推荐结果。
示例性的,电子设备可以在信息输入阶段获取用户输入的用户信息,得到目标意图,然后在推荐模型计算阶段,对该标意图进行基于用户行为的协同过滤、基于意图的协同过滤、意图分类推荐等处理,将输出的推荐列表输入到排序合并阶段,并在排序合并阶段经过意图去重、交叉推荐等方式的处理,将处理结果输入到个性化干预阶段,通过添加全局白名单、添加全局黑名单、个性化白名单、个性化黑名单等处理后,最后输出推荐结果。
由上述分析可知,本申请实施例提出了协同过滤的意图推荐方案,通过学习多用户的搜索点击意图行为,得到每个用户的意图推荐结果集,在大量用户共同使用的场景下,会得到很好的准确率和召回率,提出了基于意图内容的推荐方案,通过对意图分类,直接推荐意图相似的其他意图,当新的意图加入分类体系中,该方案可以迅速的把新意图进行相关的推荐,从而和协同过滤的结果互补。即,通过提出分级的推荐策略,通过协同过滤推荐,意图内容推荐和个性化干预策略,在***冷启动时,推荐结果集也有数据,当新意图加入可以快速出现,而且随着该方法的使用推荐的结果越丰富也更准确。
上述介绍了本申请实施例提到的意图推荐方法的具体实现,下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图9为本申请实施例提供的意图推荐装置的结构示意图。该装置可以集成在电子设备中或通过电子设备实现,该电子设备可以为终端设备,也可以是服务器。如图9所示,在本实施例中,该意图推荐装置90可以包括:
接收模块901,用于接收意图查询请求,所述意图查询请求携带意图关键字和用户标识;
第一处理模块902,用于根据所述意图关键字和预先配置的意图库,确定第一推荐列表,所述意图库包括至少一个树状意图集合,每个树状意图集合包括至少一个层级意图;
第二处理模块903,用于利用所述用户标识对应的意图策略信息对所述第一推荐列表中的意图进行处理,得到目标推荐列表;
输出模块904,用于输出所述目标推荐列表。
在本申请实施例的一种可能设计中,第一处理模块902,具体用于:
对所述意图关键字进行语义分析,确定所述用户标识对应用户的目标意图;
根据所述目标意图,查询预先配置的所述意图库,确定所述目标意图所在的层级信息和树信息;
根据所述目标意图所在的层级信息和树信息、所述树信息对应的树状意图集合,得到所述第一推荐列表。
其中,第一处理模块902,用于根据所述目标意图所在的层级信息和树信息、所述树信息对应的树状意图集合,得到所述第一推荐列表,具体为:
第一处理模块902,具体用于:
生成所述目标意图对应的初始推荐列表;
根据所述目标意图所在的层级信息和树信息,确定所述目标意图的至少一个关联意图;
按照同层级、附属层级、树层级的先后顺序,依次将所述目标意图的至少一个关联意图,添加至所述初始推荐列表中,得到所述第一推荐列表。
在本申请实施例的另一种可能设计中,第二处理模块903,具体用于:
确定所述用户标识对应的意图策略信息,所述意图策略信息用于指示意图的生效范围信息和生效顺序信息;
根据所述意图策略信息指示的意图的生效范围信息,确定所述第一推荐列表中生效的意图集合;
根据所述意图策略信息指示的意图的生效顺序信息,对所述意图集合中的所有意图进行排序,得到所述目标推荐列表。
在本申请实施例的再一种可能设计中,第一处理模块902,还用于基于协同过滤算法对所述意图查询请求和预先确定的相似度矩阵进行处理,得到第二推荐列表;
第二处理模块903,具体用于利用所述用户标识对应的意图策略信息对所述第一推荐列表中的意图、所述第二推荐列表中的意图进行处理,得到所述目标推荐列表。
其中,所述第二推荐列表是利用基于用户行为的协同过滤算法对所述意图查询请求和预先确定的用户行为相似度矩阵进行处理得到的,和/或,利用基于意图的协同过滤算法对所述意图查询请求和预先确定的意图相似度矩阵进行处理得到的。
在本申请实施例的又一种可能设计中,第一处理模块902,还用于:
获取用户数据集;
根据所述用户数据集,生成用户行为相似度矩阵和/或意图相似度矩阵,所述用户行为相似度矩阵用于表征所述用户数据集所涉及的用户之间的行为相似度,所述意图相似度矩阵用于表征所述用户数据集所涉及的意图之间的相似度;
存储所述用户行为相似度矩阵和/或所述意图相似度矩阵。
本申请实施例提供的装置,可用于执行图2至图8所示实施例中的方法,其实现原理和技术效果类似,在此不再赘述。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
进一步的,根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
图10是用来实现本申请实施例的意图推荐方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图10所示,该电子设备包括:一个或多个处理器1001、存储器1002,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器***)。图10中以一个处理器1001为例。
存储器1002即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的意图推荐方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的意图推荐方法。
存储器1002作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的意图推荐方法对应的程序指令/模块。处理器1001通过运行存储在存储器1002中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的意图推荐方法。
存储器1002可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储根据意图推荐电子设备的使用所创建的数据等。此外,存储器1002可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器1002可选包括相对于处理器1001远程设置的存储器,这些远程存储器可以通过网络连接至意图推荐电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
用于实现意图推荐方法的电子设备还可以包括:输入装置1003和输出装置1004。处理器1001、存储器1002、输入装置1003和输出装置1004可以通过总线或者其他方式连接,图10中以通过总线连接为例。
输入装置1003可接收输入的数字或字符信息,以及产生与意图推荐电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置1004可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
这些计算机程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算机程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
本申请实施例还提供一种意图推荐方法,包括:
根据接收到的意图查询请求和意图类别规则,确定第一推荐列表;
利用预设的意图干预策略对所述第一推荐列表中的意图进行处理,得到目标推荐列表。
根据本申请实施例的技术方案,根据接收到的意图查询请求和意图类别规则,确定第一推荐列表,利用预设的意图干预策略对所述第一推荐列表中的意图进行处理,得到目标推荐列表,其能够确定出与意图查询请求相关性较高的意图,基于用户标识的意图策略信息能够提高个性化推荐结果,从而提高了意图推荐的准确度和个性化精度。
根据本申请的实施例,本申请还提供了一种计算机程序产品,包括:计算机程序,计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得电子设备执行前述任一方法实施例中电子设备的方案。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (15)
1.一种意图推荐方法,包括:
接收意图查询请求,所述意图查询请求携带意图关键字和用户标识;
根据所述意图关键字和预先配置的意图库,确定第一推荐列表,所述意图库包括至少一个树状意图集合,每个树状意图集合包括至少一个层级意图;
利用所述用户标识对应的意图策略信息对所述第一推荐列表中的意图进行处理,得到目标推荐列表;其中,不同的用户标识对应不同的意图策略信息,所述意图策略信息为个性化的干预策略,所述个性化的干预策略从全局生效和特定用户生效的干预策略、黑白名单生效的干预策略进行设定;
输出所述目标推荐列表;
其中,所述利用所述用户标识对应的意图策略信息对所述第一推荐列表中的意图进行处理,得到目标推荐列表,包括:
确定所述用户标识对应的意图策略信息,所述意图策略信息用于指示意图的生效范围信息和生效顺序信息;
根据所述意图策略信息指示的意图的生效范围信息,确定所述第一推荐列表中生效的意图集合;
根据所述意图策略信息指示的意图的生效顺序信息,对所述意图集合中的所有意图进行排序,得到所述目标推荐列表。
2.根据权利要求1所述的方法,其中,所述根据所述意图关键字和预先配置的意图库,确定第一推荐列表,包括:
对所述意图关键字进行语义分析,确定所述用户标识对应用户的目标意图;
根据所述目标意图,查询预先配置的所述意图库,确定所述目标意图所在的层级信息和树信息;
根据所述目标意图所在的层级信息和树信息、所述树信息对应的树状意图集合,得到所述第一推荐列表。
3.根据权利要求2所述的方法,其中,所述根据所述目标意图所在的层级信息和树信息、所述树信息对应的树状意图集合,得到所述第一推荐列表,包括:
生成所述目标意图对应的初始推荐列表;
根据所述目标意图所在的层级信息和树信息,确定所述目标意图的至少一个关联意图;
按照同层级、附属层级、树层级的先后顺序,依次将所述目标意图的至少一个关联意图,添加至所述初始推荐列表中,得到所述第一推荐列表。
4.根据权利要求1-3任一项所述的方法,所述方法还包括:
基于协同过滤算法对所述意图查询请求和预先确定的相似度矩阵进行处理,得到第二推荐列表;
所述利用所述用户标识对应的意图策略信息对所述第一推荐列表中的意图进行处理,得到目标推荐列表,包括:
利用所述用户标识对应的意图策略信息对所述第一推荐列表中的意图、所述第二推荐列表中的意图进行处理,得到所述目标推荐列表。
5.根据权利要求4所述的方法,其中,所述第二推荐列表是利用基于用户行为的协同过滤算法对所述意图查询请求和预先确定的用户行为相似度矩阵进行处理得到的,和/或,利用基于意图的协同过滤算法对所述意图查询请求和预先确定的意图相似度矩阵进行处理得到的。
6.根据权利要求4所述的方法,所述方法还包括:
获取用户数据集;
根据所述用户数据集,生成用户行为相似度矩阵和/或意图相似度矩阵,所述用户行为相似度矩阵用于表征所述用户数据集所涉及的用户之间的行为相似度,所述意图相似度矩阵用于表征所述用户数据集所涉及的意图之间的相似度;
存储所述用户行为相似度矩阵和/或所述意图相似度矩阵。
7.一种意图推荐装置,包括:接收模块、第一处理模块、第二处理模块和输出模块;
所述接收模块,用于接收意图查询请求,所述意图查询请求携带意图关键字和用户标识;
所述第一处理模块,用于根据所述意图关键字和预先配置的意图库,确定第一推荐列表,所述意图库包括至少一个树状意图集合,每个树状意图集合包括至少一个层级意图;
所述第二处理模块,用于利用所述用户标识对应的意图策略信息对所述第一推荐列表中的意图进行处理,得到目标推荐列表;其中,不同的用户标识对应不同的意图策略信息,所述意图策略信息为个性化的干预策略,所述个性化的干预策略从全局生效和特定用户生效的干预策略、黑白名单生效的干预策略进行设定;
所述输出模块,用于输出所述目标推荐列表;
其中,所述第二处理模块,具体用于:
确定所述用户标识对应的意图策略信息,所述意图策略信息用于指示意图的生效范围信息和生效顺序信息;
根据所述意图策略信息指示的意图的生效范围信息,确定所述第一推荐列表中生效的意图集合;
根据所述意图策略信息指示的意图的生效顺序信息,对所述意图集合中的所有意图进行排序,得到所述目标推荐列表。
8.根据权利要求7所述的装置,其中,所述第一处理模块,具体用于:
对所述意图关键字进行语义分析,确定所述用户标识对应用户的目标意图;
根据所述目标意图,查询预先配置的所述意图库,确定所述目标意图所在的层级信息和树信息;
根据所述目标意图所在的层级信息和树信息、所述树信息对应的树状意图集合,得到所述第一推荐列表。
9.根据权利要求8所述的装置,其中,所述第一处理模块,用于根据所述目标意图所在的层级信息和树信息、所述树信息对应的树状意图集合,得到所述第一推荐列表,具体为:
所述第一处理模块,具体用于:
生成所述目标意图对应的初始推荐列表;
根据所述目标意图所在的层级信息和树信息,确定所述目标意图的至少一个关联意图;
按照同层级、附属层级、树层级的先后顺序,依次将所述目标意图的至少一个关联意图,添加至所述初始推荐列表中,得到所述第一推荐列表。
10.根据权利要求7-9任一项所述的装置,所述第一处理模块,还用于基于协同过滤算法对所述意图查询请求和预先确定的相似度矩阵进行处理,得到第二推荐列表;
所述第二处理模块,具体用于利用所述用户标识对应的意图策略信息对所述第一推荐列表中的意图、所述第二推荐列表中的意图进行处理,得到所述目标推荐列表。
11.根据权利要求10所述的装置,其中,所述第二推荐列表是利用基于用户行为的协同过滤算法对所述意图查询请求和预先确定的用户行为相似度矩阵进行处理得到的,和/或,利用基于意图的协同过滤算法对所述意图查询请求和预先确定的意图相似度矩阵进行处理得到的。
12.根据权利要求10所述的装置,所述第一处理模块,还用于:
获取用户数据集;
根据所述用户数据集,生成用户行为相似度矩阵和/或意图相似度矩阵,所述用户行为相似度矩阵用于表征所述用户数据集所涉及的用户之间的行为相似度,所述意图相似度矩阵用于表征所述用户数据集所涉及的意图之间的相似度;
存储所述用户行为相似度矩阵和/或所述意图相似度矩阵。
13. 一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。
14.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-6中任一项所述的方法。
15.一种意图推荐方法,包括:
根据接收到的意图查询请求和意图类别规则,确定第一推荐列表;
利用预设的意图干预策略对所述第一推荐列表中的意图进行处理,得到目标推荐列表;其中,所述意图干预策略从全局生效和特定用户生效的干预策略、黑白名单生效的干预策略进行设定;
所述利用预设的意图干预策略对所述第一推荐列表中的意图进行处理,得到目标推荐列表,包括:
确定预设的意图干预策略对应的意图策略信息,所述意图策略信息用于指示意图的生效范围信息和生效顺序信息;
根据所述意图策略信息指示的意图的生效范围信息,确定所述第一推荐列表中生效的意图集合;
根据所述意图策略信息指示的意图的生效顺序信息,对所述意图集合中的所有意图进行排序,得到所述目标推荐列表。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010604365.0A CN111782965B (zh) | 2020-06-29 | 2020-06-29 | 意图推荐方法、装置、设备及存储介质 |
KR1020210036066A KR102591421B1 (ko) | 2020-06-29 | 2021-03-19 | 의도 추천 방법, 장치, 기기 및 저장매체 |
US17/207,503 US11580104B2 (en) | 2020-06-29 | 2021-03-19 | Method, apparatus, device, and storage medium for intention recommendation |
EP21163982.8A EP3819792A3 (en) | 2020-06-29 | 2021-03-22 | Method, apparatus, device, and storage medium for intention recommendation |
JP2021065388A JP7201730B2 (ja) | 2020-06-29 | 2021-04-07 | 意図推薦方法、装置、機器及び記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010604365.0A CN111782965B (zh) | 2020-06-29 | 2020-06-29 | 意图推荐方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111782965A CN111782965A (zh) | 2020-10-16 |
CN111782965B true CN111782965B (zh) | 2023-08-11 |
Family
ID=72760186
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010604365.0A Active CN111782965B (zh) | 2020-06-29 | 2020-06-29 | 意图推荐方法、装置、设备及存储介质 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11580104B2 (zh) |
EP (1) | EP3819792A3 (zh) |
JP (1) | JP7201730B2 (zh) |
KR (1) | KR102591421B1 (zh) |
CN (1) | CN111782965B (zh) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112231577B (zh) * | 2020-11-06 | 2022-06-03 | 重庆理工大学 | 一种融合文本语义向量和神经协同过滤的推荐方法 |
CN112685546B (zh) * | 2020-12-29 | 2023-10-31 | 王福山 | 人机多轮对话方法、装置及计算机可读存储介质 |
US11816137B2 (en) | 2021-01-12 | 2023-11-14 | Samsung Electronics Co., Ltd | Method for providing search word and electronic device for supporting the same |
WO2022154403A1 (ko) * | 2021-01-12 | 2022-07-21 | 삼성전자 주식회사 | 검색어를 제공하는 방법 및 이를 지원하는 전자 장치 |
US11592973B2 (en) | 2021-01-27 | 2023-02-28 | Paypal, Inc. | Goal-based dynamic modifications to user interface content |
CN112764128B (zh) * | 2021-03-16 | 2023-07-28 | 北京墨迹风云科技股份有限公司 | 显示天气数据的方法、服务器、计算机设备及可读介质 |
CN113126765A (zh) * | 2021-04-22 | 2021-07-16 | 北京云迹科技有限公司 | 一种多模态输入交互方法、装置、机器人和存储介质 |
CN113434643A (zh) * | 2021-05-20 | 2021-09-24 | 华为技术有限公司 | 一种信息推荐方法以及相关设备 |
CN113157892A (zh) * | 2021-05-24 | 2021-07-23 | 中国平安人寿保险股份有限公司 | 用户意图处理方法、装置、计算机设备及存储介质 |
CN113360218B (zh) * | 2021-06-16 | 2024-06-07 | 抖音视界有限公司 | 一种业务方案选择方法、装置、设备以及存储介质 |
CN113434633B (zh) * | 2021-06-28 | 2022-09-16 | 平安科技(深圳)有限公司 | 基于头像的社交话题推荐方法、装置、设备及存储介质 |
CN113408920B (zh) * | 2021-06-29 | 2024-01-12 | 北京百度网讯科技有限公司 | 迁徙方式确定方法、装置、设备以及存储介质 |
CN113722322A (zh) * | 2021-08-30 | 2021-11-30 | 咪咕数字传媒有限公司 | 信息流数据生成方法、装置及电子设备 |
CN113947290A (zh) * | 2021-09-26 | 2022-01-18 | 海南电网有限责任公司 | 基于人工智能的配网可研评审辅助方法及*** |
CN116419293A (zh) * | 2021-12-29 | 2023-07-11 | 华为技术有限公司 | 意图冲突处理的方法及其装置 |
CN114647756A (zh) * | 2022-03-11 | 2022-06-21 | 北京百度网讯科技有限公司 | 基于图像的搜索方法、装置、电子设备及存储介质 |
CN114493377B (zh) * | 2022-04-06 | 2022-07-12 | 广州平云小匠科技有限公司 | 一种工单派单方法及*** |
CN114791915B (zh) * | 2022-06-22 | 2022-09-27 | 深圳高灯计算机科技有限公司 | 数据归集方法、装置、计算机设备和存储介质 |
CN115167161A (zh) * | 2022-06-27 | 2022-10-11 | 青岛海尔科技有限公司 | 灯具关联关系的确定方法和装置、存储介质及电子装置 |
US12010075B2 (en) * | 2022-06-29 | 2024-06-11 | Chime Financial, Inc. | Utilizing machine learning models to generate interactive digital text threads with personalized digital text reply options |
CN115203598B (zh) * | 2022-07-20 | 2023-09-19 | 贝壳找房(北京)科技有限公司 | 房产领域的信息排序方法、电子设备及存储介质 |
CN115457979A (zh) * | 2022-09-22 | 2022-12-09 | 赵显阳 | 一种视频语音分析识别处理方法及*** |
CN117972184A (zh) * | 2022-10-24 | 2024-05-03 | 中兴通讯股份有限公司 | 用户偏好分析方法及装置 |
US11936814B1 (en) | 2022-11-22 | 2024-03-19 | Chime Financial, Inc. | Utilizing machine learning models to generate interactive digital text threads with personalized agent escalation digital text reply options |
CN116244413B (zh) * | 2022-12-27 | 2023-11-21 | 北京百度网讯科技有限公司 | 新意图确定方法、设备和存储介质 |
CN116595249B (zh) * | 2023-04-28 | 2024-03-22 | 广东津虹数字科技有限公司 | 个性推荐方法、***、电子设备以及计算机程序产品 |
CN116823410B (zh) * | 2023-08-29 | 2024-01-12 | 阿里巴巴(成都)软件技术有限公司 | 数据处理方法、对象处理方法、推荐方法及计算设备 |
CN117573896A (zh) * | 2023-12-05 | 2024-02-20 | 苏州中格软件有限公司 | 基于意图识别的事项筛查方法、平台、设备及存储介质 |
CN117455631A (zh) * | 2023-12-20 | 2024-01-26 | 浙江口碑网络技术有限公司 | 信息展示方法及*** |
CN117892000A (zh) * | 2024-01-17 | 2024-04-16 | 湖北旭志信息技术有限公司 | 基于用户特征的云数据统筹管理***及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103942204A (zh) * | 2013-01-18 | 2014-07-23 | 佳能株式会社 | 用于挖掘意图的方法和设备 |
CN108536852A (zh) * | 2018-04-16 | 2018-09-14 | 上海智臻智能网络科技股份有限公司 | 问答交互方法和装置、计算机设备及计算机可读存储介质 |
CN109716334A (zh) * | 2016-08-16 | 2019-05-03 | 电子湾有限公司 | 选择下一用户提示类型 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5533880B2 (ja) | 2009-10-26 | 2014-06-25 | 日本電気株式会社 | コンテンツ推薦システム、推薦方法及び推薦プログラム |
US9460237B2 (en) | 2012-05-08 | 2016-10-04 | 24/7 Customer, Inc. | Predictive 411 |
US20140019285A1 (en) * | 2012-07-13 | 2014-01-16 | Venkateswaran Subramanian Karthik | Dynamic Listing Recommendation |
US11023947B1 (en) * | 2013-03-15 | 2021-06-01 | Overstock.Com, Inc. | Generating product recommendations using a blend of collaborative and content-based data |
US9367880B2 (en) * | 2013-05-03 | 2016-06-14 | Facebook, Inc. | Search intent for queries on online social networks |
CN105159977B (zh) | 2015-08-27 | 2019-01-25 | 百度在线网络技术(北京)有限公司 | 信息交互处理方法及装置 |
US20170250930A1 (en) * | 2016-02-29 | 2017-08-31 | Outbrain Inc. | Interactive content recommendation personalization assistant |
US10891673B1 (en) * | 2016-12-22 | 2021-01-12 | A9.Com, Inc. | Semantic modeling for search |
US11048764B2 (en) * | 2016-12-30 | 2021-06-29 | Verizon Media Inc. | Managing under—and over-represented content topics in content pools |
JP6209691B2 (ja) * | 2017-01-30 | 2017-10-04 | 株式会社エヌ・ティ・ティ・データ | マーケティング装置、マーケティング方法およびプログラム |
CN110020140B (zh) * | 2017-11-15 | 2023-02-21 | 腾讯科技(深圳)有限公司 | 推荐内容显示方法、装置及*** |
US10853396B2 (en) * | 2017-12-22 | 2020-12-01 | Sap Se | Intelligent natural language query processor |
KR102607666B1 (ko) * | 2018-08-08 | 2023-11-29 | 삼성전자 주식회사 | 전자 장치에서 사용자 의도 확인을 위한 피드백 제공 방법 및 장치 |
WO2020197975A1 (en) * | 2019-03-25 | 2020-10-01 | Fintel Labs, Inc. | Artificial intelligence-powered cloud for the financial services industry |
CN110162776A (zh) * | 2019-03-26 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 交互消息处理方法、装置、计算机设备和存储介质 |
US10996944B2 (en) * | 2019-05-06 | 2021-05-04 | Red Hat, Inc. | Automated software selection using matrix factorization |
US11526801B2 (en) * | 2019-05-30 | 2022-12-13 | International Business Machines Corporation | Conversational search in content management systems |
CN110377716B (zh) * | 2019-07-23 | 2022-07-12 | 百度在线网络技术(北京)有限公司 | 对话的交互方法、装置及计算机可读存储介质 |
-
2020
- 2020-06-29 CN CN202010604365.0A patent/CN111782965B/zh active Active
-
2021
- 2021-03-19 KR KR1020210036066A patent/KR102591421B1/ko active IP Right Grant
- 2021-03-19 US US17/207,503 patent/US11580104B2/en active Active
- 2021-03-22 EP EP21163982.8A patent/EP3819792A3/en not_active Ceased
- 2021-04-07 JP JP2021065388A patent/JP7201730B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103942204A (zh) * | 2013-01-18 | 2014-07-23 | 佳能株式会社 | 用于挖掘意图的方法和设备 |
CN109716334A (zh) * | 2016-08-16 | 2019-05-03 | 电子湾有限公司 | 选择下一用户提示类型 |
CN108536852A (zh) * | 2018-04-16 | 2018-09-14 | 上海智臻智能网络科技股份有限公司 | 问答交互方法和装置、计算机设备及计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
李树青 ; 徐侠 ; 曹杰 ; 庄光光 ; .基于关键词链接网络分析方法的医学文献推荐服务研究.情报学报.2017,(第01期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
EP3819792A3 (en) | 2021-10-06 |
JP2021108183A (ja) | 2021-07-29 |
KR102591421B1 (ko) | 2023-10-18 |
EP3819792A2 (en) | 2021-05-12 |
US20210209109A1 (en) | 2021-07-08 |
JP7201730B2 (ja) | 2023-01-10 |
US11580104B2 (en) | 2023-02-14 |
CN111782965A (zh) | 2020-10-16 |
KR20210038860A (ko) | 2021-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111782965B (zh) | 意图推荐方法、装置、设备及存储介质 | |
CN111984689B (zh) | 信息检索的方法、装置、设备以及存储介质 | |
US10546006B2 (en) | Method and system for hybrid information query | |
US11663254B2 (en) | System and engine for seeded clustering of news events | |
US9535902B1 (en) | Systems and methods for entity resolution using attributes from structured and unstructured data | |
Oussalah et al. | A software architecture for Twitter collection, search and geolocation services | |
CN112148889A (zh) | 一种推荐列表的生成方法及设备 | |
Reinanda et al. | Mining, ranking and recommending entity aspects | |
US20150019544A1 (en) | Information service for facts extracted from differing sources on a wide area network | |
JP2021166098A (ja) | 検索語の推薦方法と装置、目的モデルの訓練方法と装置、電子デバイス、記憶媒体、及びプログラム | |
CN113297457B (zh) | 一种高精准性的信息资源智能推送***及推送方法 | |
CN111339406B (zh) | 个性化推荐方法、装置、设备及存储介质 | |
CN112818230B (zh) | 内容推荐方法、装置、电子设备和存储介质 | |
CN108509545B (zh) | 一种文章的评论处理方法及*** | |
CN110674290B (zh) | 一种用于重叠社区发现的关系预测方法、装置和存储介质 | |
Kim et al. | TwitterTrends: a spatio-temporal trend detection and related keywords recommendation scheme | |
CN112818195A (zh) | 数据获取方法、装置、***及计算机存储介质 | |
CN114637903A (zh) | 一种针对定向目标数据拓展的舆情数据采集*** | |
CN114996562A (zh) | 利用数据驱动分析确定数字角色 | |
CN116823410B (zh) | 数据处理方法、对象处理方法、推荐方法及计算设备 | |
US20140244741A1 (en) | Computer-Implemented System And Method For Context-Based APP Searching And APP Use Insights | |
CN116962516A (zh) | 一种数据查询方法、装置、设备及存储介质 | |
Kumar et al. | Classification of Mobile Applications with rich information | |
KR20140135100A (ko) | 시맨틱 매쉬업 기술을 이용한 프로그램 제공 방법 | |
CN111753199B (zh) | 用户画像构建方法及设备、电子设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |