CN111680165B - 信息匹配方法、装置、可读存储介质和电子设备 - Google Patents
信息匹配方法、装置、可读存储介质和电子设备 Download PDFInfo
- Publication number
- CN111680165B CN111680165B CN202010350954.0A CN202010350954A CN111680165B CN 111680165 B CN111680165 B CN 111680165B CN 202010350954 A CN202010350954 A CN 202010350954A CN 111680165 B CN111680165 B CN 111680165B
- Authority
- CN
- China
- Prior art keywords
- information
- matched
- matching
- data
- piece
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000007405 data analysis Methods 0.000 claims description 51
- 239000013598 vector Substances 0.000 claims description 36
- 238000012216 screening Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 11
- 230000006399 behavior Effects 0.000 claims description 9
- 238000001914 filtration Methods 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 abstract description 12
- 238000010586 diagram Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 5
- 230000007774 longterm Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 235000014510 cooky Nutrition 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003238 somatosensory effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种信息匹配方法、装置、可读存储介质和电子设备,本发明实施例在确定了目标用户信息和对应的待匹配信息集合后,通过评分模型得到所述待匹配信息集合中各所述待匹配信息和目标用户信息的匹配度以及属性特征,根据所述匹配度筛选得到匹配信息,根据对属性特征进行数据分析生成各匹配信息的推荐文本,以向所述目标用户推荐包括匹配信息和用于表述推荐理由的推荐文本的匹配结果。本发明实施例在进行信息匹配的过程中充分考虑目标用户的偏好,以及各所述待匹配信息的属性特征,以在实现精准匹配的同时还能够给出对应的匹配理由,提高了信息匹配过程的效率。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种信息匹配方法、装置、可读存储介质和电子设备。
背景技术
随着互联网通信技术的快速发展,无论在日常生活中还是工作场景下,人们在获取需要的信息时通常都会利用互联网来实现信息的搜索与推荐。例如在债券交易领域,交易员和金融债券以及对手方的关系错综复杂,如何实现为海量的交易员推荐和其匹配的金融债券或对手方是目前需要解决的一个很大的问题。基于上述问题,现有技术通常会选择协同过滤法或基于内容推荐的方法进行信息匹配,但前者仅考虑用户的长期喜好,忽略了短期偏好;后者仅考虑用户的短期喜好,忽略了长期偏好,因此两者的匹配结果都不够精确。同时,上述两种方法均无法针对用户匹配的结果给出对应的推荐理由。
发明内容
有鉴于此,本发明实施例公开了一种信息匹配方法、装置、可读存储介质和电子设备,以实现提高匹配结果的准确性,同时给出各匹配结果对应的推荐理由。
第一方面,本发明实施例公开了一种信息匹配方法,所述方法包括:
确定目标用户信息和与所述目标用户信息对应的待匹配信息集合,所述待匹配信息集合中包括至少一个待匹配信息;
将所述目标用户信息和待匹配信息集合输入预先训练得到的评分模型中,输出各所述待匹配信息的匹配概率以及属性特征,所述属性特征中包括文本信息和数据信息;
基于各所述待匹配信息的数据信息进行横向数据分析和/或纵向数据分析,以确定各所述待匹配信息的数据特征;
根据对应的匹配概率对各所述待匹配信息进行筛选得到匹配信息,以确定匹配信息集合;
基于对应的匹配概率对各所述匹配信息进行排序;
输出匹配结果,所述匹配结果包括排序后的匹配信息和各所述匹配信息对应的推荐文本,所述推荐文本基于所述文本信息和所述数据特征生成。
进一步地,所述确定目标用户信息和与所述目标用户信息对应的待匹配信息集合包括:
确定目标用户信息;
根据所述目标用户信息获取所述目标用户的历史行为信息;
根据所述历史行为信息确定至少一个待匹配信息,以获得待匹配信息集合。
进一步地,所述评分模型中包括第一注意力层、第二注意力层、知识图谱以及评分子模型;
所述将所述目标用户信息和待匹配信息集合输入预先训练得到的评分模型中,输出各所述待匹配信息的匹配概率以及属性特征包括:
将所述目标用户信息和所述知识图谱输入所述第一注意力层,输出用户偏好向量;
将所述待匹配信息集合和所述知识图谱输入所述第二注意力层,输出待匹配向量集合,所述待匹配向量集合中包括至少一个与所述待匹配信息对应的待匹配向量;
将所述用户偏好向量和所述待匹配向量输入所述评分子模型,输出各所述待匹配信息的匹配概率以及属性特征。
进一步地,所述基于各所述待匹配信息的数据信息进行横向数据分析和/或纵向数据分析,以确定各所述待匹配信息的数据特征包括:
根据各所述待匹配信息的数据信息确定目标特征值;
基于各所述待匹配信息的目标特征值进行横向数据分析,以确定各所述待匹配信息的数据特征。
进一步地,所述基于各所述待匹配信息的数据信息进行横向数据分析和/或纵向数据分析,以确定各所述待匹配信息的数据特征包括:
确定各所述数据信息中的当前特征数据;
获取各所述待匹配信息的历史特征数据集合,所述历史特征数据集合中包括至少一个历史特征数据;
对于各所述待匹配信息,基于所述当前特征数据和历史特征数据集合进行纵向数据分析,以确定对应的数据特征。
进一步地,所述根据对应的匹配概率对各所述待匹配信息进行筛选得到匹配信息,以确定匹配信息集合具体为:
确定匹配概率大于概率阈值的待匹配信息为匹配信息,以确定匹配信息集合。
进一步地,所述根据对应的匹配概率对各所述待匹配信息进行筛选得到匹配信息,以确定匹配信息集合具体为:
确定匹配概率最大的N个待匹配信息为匹配信息,以确定匹配信息集合,其中,所述N为预设的正整数。
第二方面,本发明实施例公开了一种信息匹配装置,所述装置包括:
信息确定模块,用于确定目标用户信息和与所述目标用户信息对应的待匹配信息集合,所述待匹配信息集合中包括至少一个待匹配信息;
匹配模块,用于将所述目标用户信息和待匹配信息集合输入预先训练得到的评分模型中,输出各所述待匹配信息的匹配概率以及属性特征,所述属性特征中包括文本信息和数据信息;
数据特征确定模块,用于基于各所述待匹配信息的数据信息进行横向数据分析和/或纵向数据分析,以确定各所述待匹配信息的数据特征;
筛选模块,用于根据对应的匹配概率对各所述待匹配信息进行筛选得到匹配信息,以确定匹配信息集合;
排序模块,用于基于对应的匹配概率对各所述匹配信息进行排序;
信息输出模块,用于输出匹配结果,所述匹配结果包括排序后的匹配信息和各所述匹配信息对应的推荐文本,所述推荐文本基于所述文本信息和所述数据特征生成。
第三方面,本发明实施例公开了一种计算机可读存储介质,用于存储计算机程序指令,所述计算机程序指令在被处理器执行时实现如第一方面中任一项所述的方法。
第四方面,本发明实施例公开了一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如第一方面中任一项所述的方法。
本发明实施例在进行信息匹配的过程中充分考虑目标用户的偏好,以及各所述待匹配信息的属性特征,以在实现精准匹配的同时还能够给出对应的匹配理由,提高了信息匹配过程的效率。
附图说明
通过以下参照附图对本发明实施例的描述,本发明的上述以及其它目的、特征和优点将更为清楚,在附图中:
图1为应用本发明实施例的信息匹配方法的信息匹配***的示意图;
图2为本发明实施例的信息匹配方法的流程图;
图3为本发明实施例的信息匹配方法的数据流程示意图;
图4为本发明实施例的评分模型的结构示意图;
图5为本发明实施例的推荐结果的示意图;
图6为本发明实施例的信息匹配装置的示意图;
图7为本发明实施例的电子设备的示意图。
具体实施方式
以下基于实施例对本发明进行描述,但是本发明并不仅仅限于这些实施例。在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。为了避免混淆本发明的实质,公知的方法、过程、流程、元件和电路并没有详细叙述。
此外,本领域普通技术人员应当理解,在此提供的附图都是为了说明的目的,并且附图不一定是按比例绘制的。
除非上下文明确要求,否则在说明书的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。
在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
图1为应用本发明实施例的信息匹配方法的信息匹配***的示意图,如图1所示,所述信息匹配***中包括通过网络连接的服务器10和终端设备11。在本实施例中,所述服务器10可以是单个服务器、也可以是以分布式方式配置的服务器集群。所述终端设备11可以是能够运行计算机程序的、具有通信功能通用数据处理终端,例如,智能手机、电脑或平板电脑等。所述信息匹配***在进行信息匹配时,由所述服务器10接收至少一个终端设备11发送的信息匹配请求,根据对应的信息匹配请求进行信息匹配,并将信息匹配结果返回终端设备11。
其中,所述终端设备11发送的信息匹配请求中可以包括用户信息多个待匹配信息,所述服务器10对用户信息和多个待匹配信息进行信息匹配,得到与所述用户信息匹配的匹配信息,并通过数据分析确定各匹配信息的匹配理由,生成匹配结果和对应的匹配理由并返回终端设备11。在本发明实施例的另一个可选的实现方式中,所述终端设备11发送信息匹配请求中还可以仅包括用户信息,由所述服务器10根据用户信息获取对应的待匹配信息集合进行信息匹配,得到与所述用户信息匹配的匹配信息,并通过数据分析确定各匹配信息的匹配理由,生成匹配结果并返回终端设备11。本发明实施例可以应用于任何通过服务器进行信息匹配的***中,以基于终端设备的信息匹配请求进行信息匹配。例如通过网络引擎进行信息搜索、通过电商软件获取感兴趣的商品、通过金融软件查找与自身匹配的债券等应用场景。
以所述信息匹配***用于金融领域信息匹配的应用场景为例进行说明,所述终端设备11可以为交易员登录的终端,用于向所述服务器10发送信息匹配请求,用于搜索感兴趣的债券信息或交易对手方信息。所述服务器10可以根据所述终端设备11发送的信息匹配请求中的交易员信息获取所述交易员可能感兴趣的债券信息集合或交易对手方信息集合,并通过所述债券信息集合或交易对手方信息集合进行信息匹配,在其中确定交易员感兴趣的债券信息或交易对手方信息,同时通过获取各所述债券信息或交易对手方信息的特征进行数据分析生成匹配理由,最后将包括匹配的债券信息或交易对手方信息以及对应匹配理由的匹配结果返回所述终端设备11。
图2为本发明实施例的信息匹配方法的流程图,如图2所示,所述信息匹配方法包括:
步骤S100、确定目标用户信息和与所述目标用户信息对应的待匹配信息集合。
具体地,所述目标用户信息可以通过终端设备发送至服务器,可以包括用于表征需要进行信息匹配用户的用户标识以及所述用户的属性特征,其中所述用户标识例如可以包括用户名称、用户账号、用户ID、cookie等信息,所述属性特征例如可以包括用户标注的兴趣、偏好等信息。所述待匹配信息集合中包括至少一个待匹配信息,以通过所述服务器基于所述目标用户信息和所述待匹配信息集合进行信息匹配。以所述信息匹配方法用于交易员在金融软件中筛选感兴趣债券的应用场景为例进行说明,所述目标用户信息可以包括交易员的身份信息,所述待匹配信息集合中包括多个待推荐的债券信息,所述服务器用于根据所述交易员的身份信息和各所述待推荐的债券信息进行信息匹配。
在本发明实施例的一个可选的实现方式中,所述待匹配信息集合也通过终端设备发送,通过服务器接收。例如,所述终端设备可以向所述服务器发送包括待匹配信息集合和目标用户信息的信息匹配指令,所述服务器根据所述信息匹配指令进行信息匹配。以所述信息匹配方法用于交易员在金融软件中筛选感兴趣债券的应用场景为例进行说明,交易员可以通过终端设备登陆债券交易平台,并在所述债券交易平台输入自己感兴趣的多个债券名称,生成包括各所述债券名称和所述交易员身份信息的信息匹配指令,发送至所述债券交易平台的服务器。
在本发明实施例的另一个可选的实现方式中,所述待匹配信息集合由服务器根据目标用户信息确定。即所述服务器在确定目标用户信息后,根据所述目标用户信息获取所述目标用户的历史行为信息,再根据所述历史行为信息确定至少一个待匹配信息,以获得待匹配信息集合。其中,所述历史行为信息例如可以包括所述目标用户历史选择次数最多的多个信息、最近一段时间内选择次数最多的多个信息,以及根据用户的属性特征在信息库中搜索得到的多个信息。再根据所述服务器预设的规则在所述历史行为信息中筛选得到多个待匹配信息。以所述信息匹配方法用于交易员在金融软件中筛选感兴趣债券的应用场景为例进行说明,交易员可以通过终端设备登陆债券交易平台,生成包括所述交易员身份信息的信息匹配指令,发送至所述债券交易平台的服务器。所述服务器在接收到所述信息匹配指令后获取所述交易员历史购买次数最多的多个信息、所述交易员在一个月内购买次数最多的多个信息、以及根据交易员兴趣“企业债”、“长期受益”在服务器预设的债券库中搜索获取的多个信息,以得到历史行为信息。再根据预设的规则,例如获取历史购买次数最多的10个信息、一个月内购买次数最多的10个信息,以及随机选择债券特征为“企业债”、“长期受益”的10个信息组成待匹配信息集合。
步骤S200、将所述目标用户信息和待匹配信息集合输入预先训练得到的评分模型中,输出各所述待匹配信息的匹配概率以及属性特征。
具体地,所述服务器将获取到目标用户信息和待匹配信息集合后,将所述目标用户信息和所述待匹配信息集合输入评分模型中,以输出各所述待匹配信息和所述目标用户信息的匹配概率,以及各所述待匹配信息的属性特征。所述评分模型可以通过标注过的训练集预先训练得到。在本发明实施例中,所述评分模型中还包括第一注意力层、第二注意力层、预存的知识图谱以及评分子模型。可选的,所述预存的知识图谱包括父字典和子字典,所述子字典中包括作为根节点的信息和所述信息对应的多个值;所述父字典中包括作为根节点的值和所述值对应的多个信息。例如在债券交易平台中,所述子字典的根节点为债券信息,所述对应的多个值为所述债券信息的多个债券属性值;所述父字典的根节点为债券属性值,所述对应的多个信息为包括所述债券属性值的多个债券信息。
由此,所述确定各所述待匹配信息的匹配概率以及属性特征的过程包括先将所述目标用户信息和所述知识图谱输入所述第一注意力层,输出对应的用户偏好向量,同时将所述待匹配信息集合中的各所述待匹配信息和所述知识图谱输入所述第二注意力层,输出对应的待匹配向量,以确定待匹配向量集合。最后将所述用户偏好向量和所述待匹配向量输入所述评分子模型,输出各所述待匹配信息的匹配概率以及通过所述知识图谱确定的属性特征。上述确定匹配概率以及属性特征的方法可以通过各种现有的方式实现,例如通过《Explainable Recommendation Through Attentive Multi-View Learning》中记载的方法实现。
进一步地,所述属性特征中包括文本信息和数据信息,其中所述文本信息中包括各所述待匹配信息的文本属性,所述数据信息包括各所述待匹配信息对应的数据属性。以所述信息匹配方法用于交易员在金融软件中筛选感兴趣债券的应用场景为例进行说明,所述服务器将交易员信息和各所述待匹配的债券信息输入评分模型中,输入各所述债券信息和所述交易员的匹配概率,以及各所述债券信息的属性特征,所述属性特征中包括各所述债券信息对应的文本信息和数据信息,所述文本信息例如可以包括债券的种类、发行机构、发行人性质、行业类型、债券评级和担保判断等,所述数据信息例如可以包括预计收益率、最大收益率和发行价格等。
S300、基于各所述待匹配信息的数据信息进行横向数据分析和/或纵向数据分析,以确定各所述待匹配信息的数据特征。
具体地,所述服务器通过步骤S200确定各所述待匹配信息的数据信息和文本信息后,基于所述数据信息进行数据分析,得到对应的数据特征。
在本发明实施例的一个可选的实现方式中,所述服务器对各所述待匹配信息的数据信息进行横向数据分析。所述过程可以先在各所述待匹配信息的数据信息确定目标特征值,即在所述数据信息中包括的多个数据中选择一个数据作为标准进行数据分析,将所述数据确定为目标特征值。再基于各所述待匹配信息的目标特征值进行横向数据分析,以确定各所述待匹配信息的数据特征。以所述信息匹配方法用于交易员在金融软件中筛选感兴趣债券的应用场景为例进行说明,所述数据信息可以包括各所述债券信息对应的预计收益率、最大收益率和发行价格等。所述服务器可以在所述数据信息中确定预计收益率为目标特征值,即获取各所述债券信息中的预计收益率进行横向数据分析,例如对各所述预计收益率进行排序,确定各所述预计收益率的排序位置为对应待匹配信息的数据特征。例如,当存在债券信息1、债券信息2和债券信息3,各所述债券信息对应的预计收益率分别为5%、2.7%和4.3%时,从高到低排序后预计收益率依次为5%、4.3%和2.7%,因此所述债券信息1的数据特征为预计收益率第一,所述债券信息2的数据特征为预计收益率第三,所述债券信息3的数据特征为预计收益率第二。可选的,所述服务器可以在所述数据属性中确定多个目标特征值分别进行横向数据分析,根据各所述数据分析的结果确定最终的数据特征。
在本发明实施例的一个可选的实现方式中,所述服务器对各所述待匹配信息的数据信息进行纵向数据分析。在所述纵向数据分析过程中,所述服务器先确定各所述数据信息中的当前特征数据,再获取各所述待匹配信息的历史特征数据集合。最后对于各所述待匹配信息,基于所述当前特征数据和历史特征数据集合进行纵向数据分析,以确定对应的数据特征。其中,所述当前特征数据为所述数据信息中的一个数据,用于服务器基于所述数据的历史特征数据集合进行纵向数据分析,所述历史特征数据集合中包括至少一个历史特征数据。以所述信息匹配方法用于交易员在金融软件中筛选感兴趣债券的应用场景为例进行说明,所述数据信息可以包括各所述债券信息对应的预计收益率、最大收益率和发行价格等。所述服务器可以在所述数据信息中确定预计收益率为当前特征数据,即对于各所述债券信息,获取历史一段时间内的预计收益率作为历史特征数据集合,以进行纵向数据分析,例如通过计算各历史预计收益率的差异确定变化趋势,以得到对应待匹配信息的数据特征。例如,当存在债券信息对应的预计收益率为5%,获取历史五个交易日的预计收益率分别为1.2%、1.3%、2.0%、2.7%和3.4%,因此所述债券信息的数据特征为近期持续上涨。进一步地的,所述纵向数据分析还可以直接根据所述历史预计收益率和所述当前收益率绘制收益率变化趋势图,作为数据特征。可选的,所述服务器可以在所述数据属性中确定多个当前特征数据分别进行纵向数据分析,根据各所述数据分析的结果确定最终的数据特征。
进一步地,所述数据分析还可以同时包括横向数据分析和纵向数据分析,即获取所述数据信息中的至少一个数据进行横向数据分析,同时获取至少一个数据进行纵向数据分析,再将所述横向数据分析和纵向数据分析的结果整合,以得到所述待匹配信息的数据特征。
步骤S400、根据对应的匹配概率对各所述待匹配信息进行筛选得到匹配信息,以确定匹配信息集合。
具体地,所述服务器可以根据各所述待匹配信息与所述目标用户信息的匹配概率对所述待匹配信息集合进行筛选,将满足预设筛选条件的待匹配信息确定为匹配信息,最终得到匹配信息集合。其中,所述筛选条件可以根据实际情况的需要预先设定。
在本发明实施例的一个可选的实现方式中,所述筛选条件可以为设定一个概率阈值,确定匹配概率大于所述概率阈值的待匹配信息为匹配信息。以所述信息匹配方法用于交易员在金融软件中筛选感兴趣债券的应用场景为例进行说明,当所述服务器预设的概率阈值为80%,所述待匹配信息集合中包括债券信息1、债券信息2、债券信息3、债券信息4和债券信息5,且各所述债券信息与所述目标用户信息的匹配概率分别为77%、92%、83%、69%和81%时,所述服务器根据概率阈值筛选得到的匹配信息为债券信息2、债券信息3和债券信息5。
在本发明实施例的另一个可选的实现方式中,所述筛选条件可以为设定一个正整数N,在所述待匹配信息集合中获取匹配概率最高的N个待匹配信息作为匹配信息。以所述信息匹配方法用于交易员在金融软件中筛选感兴趣债券的应用场景为例进行说明,当所述服务器预设的整数值N为3,所述待匹配信息集合中包括债券信息1、债券信息2、债券信息3、债券信息4和债券信息5,且各所述债券信息与所述目标用户信息的匹配概率分别为77%、92%、83%、69%和81%时,所述服务器筛选得到的3个匹配信息分别为债券信息2、债券信息3和债券信息5。
步骤S500、基于对应的匹配概率对各所述匹配信息进行排序。
具体地,所述服务器在确定匹配信息后,根据对应的匹配概率对各所述匹配信息进行排序,以按顺序输出各所述匹配信息。其中,所述排序规则可以根据所述服务器的需要确定由高到低排序或由低到高排序。以所述信息匹配方法用于交易员在金融软件中筛选感兴趣债券的应用场景为例进行说明,当所述服务器确定的匹配信息分别为债券信息1、债券信息2、债券信息3、债券信息4和债券信息5,且各所述债券信息与所述目标用户信息的匹配概率分别为77%、92%、83%、69%和81%时,根据对应的匹配概率由高到低排序后的结果为债券信息2、债券信息3、债券信息5、债券信息1和债券信息4。
步骤S600、输出匹配结果。
具体地,所述匹配结果包括排序后的匹配信息和各所述匹配信息对应的推荐文本。其中,所述推荐文本基于所述文本信息和所述数据特征生成,用于表征对应匹配信息的推荐理由,可以通过将所述文本信息和所述数据特征输入预先设定的推荐文本生成模板确定。
图3为本发明实施例的信息匹配方法的数据流程示意图,如图3所示,所述信息匹配方法的流程为将目标用户信息和待匹配信息集合输入评分模型30中,以输出各所述待匹配信息和所述目标用户信息的匹配概率,以及各所述待匹配信息的属性特征,再将各所述待匹配信息对应的匹配概率输入匹配信息筛选模块31筛选得到匹配信息,将各所述待匹配信息对应的属性特征输入数据分析模块32对所述属性特征中的数据信息数据分析得到数据特征,再根据所述数据特征和文本信息确定推荐文本。最后根据各所述匹配信息和对应的推荐文本确定匹配结果。
图4为本发明实施例的评分模型的结构示意图,如图4所示,在本发明实施例中,所述评分模型30包括第一注意力层40、第二注意力层41和评分子模型42,所述目标用户信息和待匹配信息集合输入所述评分模型后,所述目标用户信息和预设的知识图谱经过第一注意力层40后得到用户偏好向量,所述待匹配信息集合中各所述待匹配信息和预设的知识图谱经过第二注意力层41后得到待匹配向量,所述用户偏好向量和待匹配向量输入所述评分子模型42后输出所述待匹配向量与所述用户偏好向量的匹配概率,以及所述待匹配向量对应的属性特征。
图5为本发明实施例的推荐结果的示意图,如图5所示,所述服务器在确定各所述匹配向量后,根据各所述匹配向量与所述目标用户信息的匹配概率排序,按照排序后的结果输出各所述匹配向量和对应的推荐文本。其中,所述推荐文本包括所述匹配向量对应的数据特征和文本信息,用于表征所述匹配向量的推荐理由。
本发明实施例所述的信息匹配方法在进行信息匹配的过程中充分考虑目标用户的偏好,以及各所述待匹配信息的属性特征,以在实现精准匹配的同时还能够给出对应的匹配理由,提高了信息匹配过程的效率。
图6为本发明实施例的信息匹配装置的示意图,如图6所示,所述信息匹配装置包括信息确定模块60、匹配模块61、数据特征确定模块62、筛选模块63、排序模块64和信息输出模块65。
具体地,所述信息确定模块60用于确定目标用户信息和与所述目标用户信息对应的待匹配信息集合,所述待匹配信息集合中包括至少一个待匹配信息。所述匹配模块61用于将所述目标用户信息和待匹配信息集合输入预先训练得到的评分模型中,输出各所述待匹配信息的匹配概率以及属性特征,所述属性特征中包括文本信息和数据信息。所述数据特征确定模块62用于基于各所述待匹配信息的数据信息进行横向数据分析和/或纵向数据分析,以确定各所述待匹配信息的数据特征。所述筛选模块63用于根据对应的匹配概率对各所述待匹配信息进行筛选得到匹配信息,以确定匹配信息集合。所述排序模块64用于基于对应的匹配概率对各所述匹配信息进行排序。所述信息输出模块65用于输出匹配结果,所述匹配结果包括排序后的匹配信息和各所述匹配信息对应的推荐文本,所述推荐文本基于所述文本信息和所述数据特征生成。
本发明实施例所述的信息匹配装置在确定了目标用户信息和对应的待匹配信息集合后,通过评分模型得到所述待匹配信息集合中各所述待匹配信息和目标用户信息的匹配度以及属性特征,根据所述匹配度筛选得到匹配信息,根据对属性特征进行数据分析生成各匹配信息的推荐文本,以向所述目标用户推荐包括匹配信息和用于表述推荐理由的推荐文本的匹配结果。因此,在进行信息匹配的过程中能够充分考虑目标用户的偏好,以及各所述待匹配信息的属性特征,实现了精准匹配的同时还能够给出对应的匹配理由,提高了信息匹配过程的效率。
图7是本发明实施例的电子设备的示意图。图7所示的电子设备为通用数据处理装置,其包括通用的计算机硬件结构,其至少包括处理器71和存储器72。处理器71和存储器72通过总线73连接。存储器72适于存储处理器71可执行的指令或程序。处理器71可以是独立的微处理器,也可以是一个或者多个微处理器集合。由此,处理器71通过执行存储器72所存储的命令,从而执行如上所述的本发明实施例的方法流程实现对于数据的处理和对于其他装置的控制。总线73将上述多个组件连接在一起,同时将上述组件连接到显示控制器74和显示装置以及输入/输出(I/O)装置75。输入/输出(I/O)装置75可以是鼠标、键盘、调制解调器、网络接口、触控输入装置、体感输入装置、打印机以及本领域公知的其他装置。典型地,输入/输出(I/O)装置75通过输入/输出(I/O)控制器75与***相连。
其中,存储器72可以存储软件组件,例如操作***、通信模块、交互模块以及应用程序。以上所述的每个模块和应用程序都对应于完成一个或多个功能和在发明实施例中描述的方法的一组可执行程序指令。
上述根据本发明实施例的方法、设备(***)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应理解,流程图和/或框图的每个块以及流程图图例和/或框图中的块的组合可以由计算机程序指令来实现。这些计算机程序指令可以被提供至通用计算机、专用计算机或其它可编程数据处理设备的处理器,以产生机器,使得(经由计算机或其它可编程数据处理设备的处理器执行的)指令创建用于实现流程图和/或框图块或块中指定的功能/动作的装置。
同时,如本领域技术人员将意识到的,本发明实施例的各个方面可以被实现为***、方法或计算机程序产品。因此,本发明实施例的各个方面可以采取如下形式:完全硬件实施方式、完全软件实施方式(包括固件、常驻软件、微代码等)或者在本文中通常可以都称为“电路”、“模块”或“***”的将软件方面与硬件方面相结合的实施方式。此外,本发明的方面可以采取如下形式:在一个或多个计算机可读介质中实现的计算机程序产品,计算机可读介质具有在其上实现的计算机可读程序代码。
可以利用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质可以是如(但不限于)电子的、磁的、光学的、电磁的、红外的或半导体***、设备或装置,或者前述的任意适当的组合。计算机可读存储介质的更具体的示例(非穷尽列举)将包括以下各项:具有一根或多根电线的电气连接、便携式计算机软盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪速存储器)、光纤、便携式光盘只读存储器(CD-ROM)、光存储装置、磁存储装置或前述的任意适当的组合。在本发明实施例的上下文中,计算机可读存储介质可以为能够包含或存储由指令执行***、设备或装置使用的程序或结合指令执行***、设备或装置使用的程序的任意有形介质。
计算机可读信号介质可以包括传播的数据信号,所述传播的数据信号具有在其中如在基带中或作为载波的一部分实现的计算机可读程序代码。这样的传播的信号可以采用多种形式中的任何形式,包括但不限于:电磁的、光学的或其任何适当的组合。计算机可读信号介质可以是以下任意计算机可读介质:不是计算机可读存储介质,并且可以对由指令执行***、设备或装置使用的或结合指令执行***、设备或装置使用的程序进行通信、传播或传输。
用于执行针对本发明各方面的操作的计算机程序代码可以以一种或多种编程语言的任意组合来编写,所述编程语言包括:面向对象的编程语言如Java、Smalltalk、C++、PHP、Python等;以及常规过程编程语言如“C”编程语言或类似的编程语言。程序代码可以作为独立软件包完全地在用户计算机上、部分地在用户计算机上执行;部分地在用户计算机上且部分地在远程计算机上执行;或者完全地在远程计算机或服务器上执行。在后一种情况下,可以将远程计算机通过包括局域网(LAN)或广域网(WAN)的任意类型的网络连接至用户计算机,或者可以与外部计算机进行连接(例如通过使用因特网服务供应商的因特网)。
本发明还涉及一种计算机可读存储介质,用于存储计算机可读程序,所述计算机可读程序用于供计算机执行上述部分或全部的方法实施例。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种信息匹配方法,其特征在于,所述方法包括:
确定目标用户信息和与所述目标用户信息对应的待匹配信息集合,所述待匹配信息集合中包括至少一个待匹配信息;
将所述目标用户信息和待匹配信息集合输入预先训练得到的评分模型中,输出各所述待匹配信息的匹配概率以及属性特征,所述属性特征中包括文本信息和数据信息;
基于各所述待匹配信息的数据信息进行横向数据分析和/或纵向数据分析,以确定各所述待匹配信息的数据特征;
根据对应的匹配概率对各所述待匹配信息进行筛选得到匹配信息,以确定匹配信息集合;
基于对应的匹配概率对各所述匹配信息进行排序;
输出匹配结果,所述匹配结果包括排序后的匹配信息和各所述匹配信息对应的推荐文本,所述推荐文本基于所述文本信息和所述数据特征生成;
所述评分模型中包括第一注意力层、第二注意力层、知识图谱以及评分子模型;
所述将所述目标用户信息和待匹配信息集合输入预先训练得到的评分模型中,输出各所述待匹配信息的匹配概率以及属性特征包括:
将所述目标用户信息和所述知识图谱输入所述第一注意力层,输出用户偏好向量;
将所述待匹配信息集合和所述知识图谱输入所述第二注意力层,输出待匹配向量集合,所述待匹配向量集合中包括至少一个与所述待匹配信息对应的待匹配向量;
将所述用户偏好向量和所述待匹配向量输入所述评分子模型,输出各所述待匹配信息的匹配概率以及属性特征。
2.根据权利要求1所述的方法,其特征在于,所述确定目标用户信息和与所述目标用户信息对应的待匹配信息集合包括:
确定目标用户信息;
根据所述目标用户信息获取所述目标用户的历史行为信息;
根据所述历史行为信息确定至少一个待匹配信息,以获得待匹配信息集合。
3.根据权利要求1所述的方法,其特征在于,所述基于各所述待匹配信息的数据信息进行横向数据分析和/或纵向数据分析,以确定各所述待匹配信息的数据特征包括:
根据各所述待匹配信息的数据信息确定目标特征值;
基于各所述待匹配信息的目标特征值进行横向数据分析,以确定各所述待匹配信息的数据特征。
4.根据权利要求1所述的方法,其特征在于,所述基于各所述待匹配信息的数据信息进行横向数据分析和/或纵向数据分析,以确定各所述待匹配信息的数据特征包括:
确定各所述数据信息中的当前特征数据;
获取各所述待匹配信息的历史特征数据集合,所述历史特征数据集合中包括至少一个历史特征数据;
对于各所述待匹配信息,基于所述当前特征数据和历史特征数据集合进行纵向数据分析,以确定对应的数据特征。
5.根据权利要求1所述的方法,其特征在于,所述根据对应的匹配概率对各所述待匹配信息进行筛选得到匹配信息,以确定匹配信息集合具体为:
确定匹配概率大于概率阈值的待匹配信息为匹配信息,以确定匹配信息集合。
6.根据权利要求1所述的方法,其特征在于,所述根据对应的匹配概率对各所述待匹配信息进行筛选得到匹配信息,以确定匹配信息集合具体为:
确定匹配概率最大的N个待匹配信息为匹配信息,以确定匹配信息集合,其中,所述N为预设的正整数。
7.一种信息匹配装置,其特征在于,所述装置包括:
信息确定模块,用于确定目标用户信息和与所述目标用户信息对应的待匹配信息集合,所述待匹配信息集合中包括至少一个待匹配信息;
匹配模块,用于将所述目标用户信息和待匹配信息集合输入预先训练得到的评分模型中,输出各所述待匹配信息的匹配概率以及属性特征,所述属性特征中包括文本信息和数据信息;
数据特征确定模块,用于基于各所述待匹配信息的数据信息进行横向数据分析和/或纵向数据分析,以确定各所述待匹配信息的数据特征;
筛选模块,用于根据对应的匹配概率对各所述待匹配信息进行筛选得到匹配信息,以确定匹配信息集合;
排序模块,用于基于对应的匹配概率对各所述匹配信息进行排序;
信息输出模块,用于输出匹配结果,所述匹配结果包括排序后的匹配信息和各所述匹配信息对应的推荐文本,所述推荐文本基于所述文本信息和所述数据特征生成;
所述评分模型中包括第一注意力层、第二注意力层、知识图谱以及评分子模型;
所述将所述目标用户信息和待匹配信息集合输入预先训练得到的评分模型中,输出各所述待匹配信息的匹配概率以及属性特征包括:
将所述目标用户信息和所述知识图谱输入所述第一注意力层,输出用户偏好向量;
将所述待匹配信息集合和所述知识图谱输入所述第二注意力层,输出待匹配向量集合,所述待匹配向量集合中包括至少一个与所述待匹配信息对应的待匹配向量;
将所述用户偏好向量和所述待匹配向量输入所述评分子模型,输出各所述待匹配信息的匹配概率以及属性特征。
8.一种计算机可读存储介质,用于存储计算机程序指令,其特征在于,所述计算机程序指令在被处理器执行时实现如权利要求1-6中任一项所述的方法。
9.一种电子设备,包括存储器和处理器,其特征在于,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如权利要求1-6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010350954.0A CN111680165B (zh) | 2020-04-28 | 2020-04-28 | 信息匹配方法、装置、可读存储介质和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010350954.0A CN111680165B (zh) | 2020-04-28 | 2020-04-28 | 信息匹配方法、装置、可读存储介质和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111680165A CN111680165A (zh) | 2020-09-18 |
CN111680165B true CN111680165B (zh) | 2024-03-01 |
Family
ID=72452335
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010350954.0A Active CN111680165B (zh) | 2020-04-28 | 2020-04-28 | 信息匹配方法、装置、可读存储介质和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111680165B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112989022B (zh) * | 2021-03-16 | 2022-11-25 | 中国平安人寿保险股份有限公司 | 虚拟文本智能选取方法、装置以及计算机设备 |
CN113223657A (zh) * | 2021-06-01 | 2021-08-06 | 联仁健康医疗大数据科技股份有限公司 | 药品信息的处理方法、装置、电子设备及存储介质 |
CN113780018B (zh) * | 2021-09-06 | 2024-06-07 | 珠海格力电器股份有限公司 | 数据写入方法、电子装置、装置及可读存储介质 |
CN116645211B (zh) * | 2023-05-15 | 2024-05-10 | 中信建投证券股份有限公司 | 推荐用户信息生成方法、装置、设备和计算机可读介质 |
CN117056739B (zh) * | 2023-07-28 | 2024-06-07 | 广东津虹数字科技有限公司 | 匹配方法、装置、电子设备及计算机程序产品 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109726747A (zh) * | 2018-12-20 | 2019-05-07 | 西安电子科技大学 | 基于社交网络推荐平台的数据融合排序方法 |
CN110084671A (zh) * | 2019-04-17 | 2019-08-02 | 上海拉扎斯信息科技有限公司 | 信息处理方法、信息处理装置、存储介质和电子设备 |
WO2019192135A1 (zh) * | 2018-04-03 | 2019-10-10 | 平安科技(深圳)有限公司 | 电子装置、债券收益率分析方法、***及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160125501A1 (en) * | 2014-11-04 | 2016-05-05 | Philippe Nemery | Preference-elicitation framework for real-time personalized recommendation |
-
2020
- 2020-04-28 CN CN202010350954.0A patent/CN111680165B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019192135A1 (zh) * | 2018-04-03 | 2019-10-10 | 平安科技(深圳)有限公司 | 电子装置、债券收益率分析方法、***及存储介质 |
CN109726747A (zh) * | 2018-12-20 | 2019-05-07 | 西安电子科技大学 | 基于社交网络推荐平台的数据融合排序方法 |
CN110084671A (zh) * | 2019-04-17 | 2019-08-02 | 上海拉扎斯信息科技有限公司 | 信息处理方法、信息处理装置、存储介质和电子设备 |
Non-Patent Citations (1)
Title |
---|
侯银秀 ; 李伟卿 ; 王伟军 ; 张婷婷 ; .基于用户偏好与商品属性情感匹配的图书个性化推荐研究.数据分析与知识发现.2017,(08),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN111680165A (zh) | 2020-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111680165B (zh) | 信息匹配方法、装置、可读存储介质和电子设备 | |
WO2018040944A1 (zh) | 恶意地址/恶意订单的识别***、方法及装置 | |
CN112084383A (zh) | 基于知识图谱的信息推荐方法、装置、设备及存储介质 | |
US9384278B2 (en) | Methods and systems for assessing excessive accessory listings in search results | |
US20220374956A1 (en) | Natural language analysis of user sentiment based on data obtained during user workflow | |
CN113051380A (zh) | 信息生成方法、装置、电子设备和存储介质 | |
CN114090601B (zh) | 一种数据筛选方法、装置、设备以及存储介质 | |
CN117216393A (zh) | 信息推荐方法、信息推荐模型的训练方法及装置、设备 | |
CN116703515A (zh) | 基于人工智能的推荐方法、装置、计算机设备及存储介质 | |
EP4116884A2 (en) | Method and apparatus for training tag recommendation model, and method and apparatus for obtaining tag | |
CN114880498B (zh) | 事件信息展示方法及装置、设备和介质 | |
CN114141236B (zh) | 语言模型更新方法、装置、电子设备及存储介质 | |
CN114925275A (zh) | 产品推荐方法、装置、计算机设备及存储介质 | |
CN113486145B (zh) | 基于网络节点的用户咨询回复方法、装置、设备及介质 | |
US11907508B1 (en) | Content analytics as part of content creation | |
CN116127948B (zh) | 待标注文本数据的推荐方法、装置及电子设备 | |
CN114723544B (zh) | 财报数据处理方法、装置、设备、介质及程序产品 | |
CN113656393B (zh) | 数据处理方法、装置、电子设备以及存储介质 | |
CN108628861B (zh) | 用于推送信息的方法和装置 | |
CN115080845A (zh) | 推荐理由的生成方法、装置、电子设备及可读存储介质 | |
CN116542779A (zh) | 基于人工智能的产品推荐方法、装置、设备及存储介质 | |
CN117453973A (zh) | 信息推荐方法、装置、设备及介质 | |
CN117974271A (zh) | 事件概要生成、语义识别事件概要模型训练方法和装置 | |
CN114547416A (zh) | 一种媒体资源排序方法及电子设备 | |
CN114547417A (zh) | 一种媒体资源排序方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230712 Address after: No. 15 Zhongshan East 1st Road, Huangpu District, Shanghai, 200002 Applicant after: China Foreign Exchange Trading Center (National Interbank Interbank lending market Center) Address before: 201203 Building 3, No. 491 Yindong Road, Pudong New Area, Shanghai Applicant before: CFETS INFORMATION TECHNOLOGY (SHANGHAI) CO.,LTD. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |