CN112395506A - 一种资讯推荐方法、装置、电子设备和存储介质 - Google Patents
一种资讯推荐方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN112395506A CN112395506A CN202011408670.9A CN202011408670A CN112395506A CN 112395506 A CN112395506 A CN 112395506A CN 202011408670 A CN202011408670 A CN 202011408670A CN 112395506 A CN112395506 A CN 112395506A
- Authority
- CN
- China
- Prior art keywords
- information
- user behavior
- vector
- recommendation
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Business, Economics & Management (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Software Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Animal Behavior & Ethology (AREA)
- Biophysics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种资讯推荐方法、装置、电子设备和存储介质,其中,该方法包括:根据预设金融数据集的实体构建金融知识图谱;基于所述金融知识图谱和用户信息浏览记录确定用户行为特征;根据所述用户行为特征选择目标资讯进行推荐。本发明实施例通过金融知识图谱识别资讯的上下文知识,丰富资讯的语义表示,提高用户个性化资讯推荐的准确性,可增强资讯推荐的质量。
Description
技术领域
本发明实施例涉及计算机应用技术领域,尤其涉及一种资讯推荐方法、装置、电子设备和存储介质。
背景技术
随着互联网的发展以及移动终端的普及,我们正在经历着一个信息***的时代。如何从这些海量的信息中找到我们所感兴趣的内容,这不仅是每一位用户的期望,也是互联网产品之间的利益竞争点。在这个流量居上的互联网时代,各互联网产品只有准确定位用户的偏好,为用户定制个性化的浏览内容,提升用户的使用体验,才能占据更多的用户市场,拥有更多的流量。所以如何进行精准的用户画像,为用户推荐其想要的信息就成为了该领域急需解决的问题。
现有技术中简单的通过用户的历史阅读内容以及用户的信息对用户进行推荐很容易造成推荐内容的单元,只会为用户推荐与历史阅读内容相关的信息,例如,用户在过去浏览过科大讯飞的资讯信息,该用户可以拿也会对同为科技创新版块的四维图新感兴趣,但是现有的方法无法为用户推荐四维图新的相关信息。
发明内容
本发明提供一种资讯推荐方法、装置、电子设备和存储介质,通过知识图谱增加外部知识,提高信息推荐的丰富性,增强信息推荐质量,可提高用户的使用体验程度。
第一方面,本发明实施例提供了一种资讯推荐方法,该方法包括:
根据预设金融数据集的实体构建金融知识图谱;
基于所述金融知识图谱和用户信息浏览记录确定用户行为特征;
根据所述用户行为特征选择目标资讯进行推荐。
第二方面,本发明实施例还提供了一种资讯推荐装置,该装置包括:
图谱构建模型,用于根据预设金融数据集的实体构建金融知识图谱;
用户特征模块,用于基于所述金融知识图谱和用户信息浏览记录确定用户行为特征;
资讯推荐模块,用于根据所述用户行为特征选择目标资讯进行推荐。
第三方面,本发明实施例还提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的资讯推荐方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如本发明实施例中任一所述的方法。
本发明实施例,通过预设金融数据集的实体建立金融知识图谱,通过金融知识图谱和用户信息浏览记录确定用户行为特征,基于用户行为特征选择目标资讯进行推荐,提高了资讯推荐的个性化,丰富了资讯推荐范围,可增强信息推荐质量。
附图说明
图1是本发明实施例一中的资讯推荐方法的流程图;
图2是本发明实施例二中的资讯推荐方法的流程图;
图3是本发明实施例二中提供的一种金融知识图谱的示例图;
图4是本发明实施例二中提供的一种特征提取模型的结构示意图;
图5是本发明实施例三中提供的一种资讯推荐装置的结构示意图;
图6是本发明实施例四中提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构,此外,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例一
图1是本发明实施例一中的资讯推荐方法的流程图,本实施例可适用于资讯信息个性化推荐的情况,该方法可以由资讯推荐装置来执行,该装置可以采用硬件和/或软件的方式来实现,参见图1,本发明实施例提供的方法通常可以包括如下步骤:
步骤110、根据预设金融数据集的实体构建金融知识图谱。
其中,预设金融数据集可以是预先收集的数据集,预设金融数据集中可以包括公司信息和行业信息等,预设金融数据集具体可以是从万得(wind)上获取了申万对于沪市和深市所有上市公司得行业分类信息。金融知识图谱可以是挖掘金融领域知识并进行展示的信息,金融知识图谱中的每一条边通过以实体-关系的三元组(h,r,t)形式存在,其中,h,r,t分别表示金融实体、关系以及尾实体等。
在本发明实施例中,可以对预设金融数据集进行文本识别,可以获取到预设金融数据集中的实体,如公司名称和行业名称等。可以根据各实体和各实体之间的关联关系构建知识图谱。示例性的,可以将各实体分别作为知识图谱中的顶点,可以将对应的实体之间的关联关系转换为各顶点之间的连线。
步骤120、基于所述金融知识图谱和用户信息浏览记录确定用户行为特征。
其中,用户信息浏览记录可以是用户在过去浏览信息产生的记录,用户信息浏览记录可以包括用户浏览的标题、内容以及浏览时间。用户行为特征可以是反映用户浏览金融信息的习惯特征,用户行为特征具体可以为一个向量,该向量中可以包括用于喜欢浏览或者不喜欢浏览的金融信息。
具体的,可以基于金融知识图谱对用户信息浏览记录进行特征提取,可以将提取到的特征作为用户行为特征,例如,在用户信息浏览记录中提取浏览次数最多或者浏览时间最长的记录,可以根据该记录在金融知识图谱中查找对应的实体,可以由该实体对应的金融信息作为用户行为特征。还可以将金融知识图谱和用户浏览记录一同输入到神经网络模型中进行特征提取,可以将提取结果作为用户行为特征,其中,神经网络模型可以预先经过金融知识图谱和海量用户的信息浏览记录训练生成。
步骤130、根据所述用户行为特征选择目标资讯进行推荐。
其中,目标资讯可以是与用户行为特征对应的信息资讯,目标资讯可以从待推荐的资讯集中选择生成,选择的原则可以为用户行为特征。
具体的,可以基于用户行为特征包括的资讯内容在待推荐的资讯集中选择一个或多个资讯作为目标资讯进行推荐。还可以根据用户行为特征预测出待推荐的资讯集中资讯信息各自对应的推荐概率,可以按照推荐概率从大到小的顺序选择一个或者多个资讯信息作为目标资讯进行推荐。
本发明实施例,通过提取预设金融数据集的实体以建立金融知识图谱,基于金融知识图谱对用户信息浏览记录进行分析获取到用户行为特征,基于用户行为特征选择目标资讯进行推荐,提高了资讯推荐的个性化,丰富了资讯推荐范围,可增强信息推荐质量。
实施例二
图2是本发明实施例二中的资讯推荐方法的流程图,本发明实施例是在上述发明实施例基础上的具体化,参见图2,本发明实施例提供的方法具体包括如下步骤:
步骤210、识别预设金融数据集中的名词文本作为实体,名词文本至少包括地点、人名、机构名、公司名、行业名中至少一种。
其中,名词文本可以是具有实际含义的词汇,可以包括地名、人名、机构名、公司名和行业名等,实体可以是金融知识图谱的组成单元,实体和名词文本可以存在对应关系,一个或多个名词文本可以对应到一个实体,例如,科大讯飞和四维图新可以对应到同一个实体,该实体在金融知识图谱中可以表示科技创新板块。
在本发明实施例中,可以对预设金融数据集中的文本进行分词操作获取到不同的分词,由于分词可以包含不具有实际含义的文本词汇,可以直接利用词库对获取到的分词进行识别获取到具有实际含义的名词文本作为实体。进一步的,从预设金融数据集中识别出的名词文本由于自然语义表达的多样性以及歧义性,对于同一个实体可能会有多个不同表达的名词文本,可以通过语义模糊机器学习模型计算各名词文本的相似性,可以将具有相同语义的名词文本映射为同一个实体。
步骤220、根据预设图表示学习处理操作降低实体的维度以获取金融知识图谱。
其中,预设图表示学习操作可以将视图嵌入低维且稠密的向量空间的操作,经过处理后的实体可以保存原因的内在结构信息。
在本发明实施例中,可以根据预设的图表示学习处理操作降低实体的维度以嵌入到低维向量空间,可以将嵌入有实体的低维向量空间作为金融知识图谱,使得降维后形成连续空间向量,减少后续资讯推荐过程的数据处理量,金融知识图谱中每一条边可以通过实体-关系的三元组(h,r,t)表示。其中,预设的图表示学习处理操作可以包括基于Trans和基于路径的两类处理操作。进一步的,金融知识图可以包括公司和行业两类实体,以及公司属于行业的一类关系,基于Trans的方法比较适合关系种类比较多的图谱表示,而基于路径的方法比较适合对距离比较近的实体具有相似属性的图谱表示,本发明实施例中可以采用基于路径的图表示处理操作。示例性的,实体向量的维度设置为50,得到的实体向量进行降维后形成的金融知识图谱可以如图3所示,每个不同行业的实体用不同形状的图标表示,可以看出同一个行业的实体都聚集在了同一个簇,不同行业的实体也可以很明显的被区分开。例如聚集在图左下角的一簇是机械设备行业的公司,聚集在正中间的一簇是医药生物行业的公司。
步骤230、获取金融知识图谱对应的图谱向量以及用户信息浏览记录对应的用户行为向量。
具体的,可以将金融知识图谱以向量的形式进行表示,例如,可以将金融知识图谱中的实体分布作为向量的元素。可以提取用户信息浏览记录中的资讯标题或者资讯标签,可以将获取到标题或者标签作为用户行为向量中的组成元素。
步骤240、将图谱向量和用户行为向量输入到特征提取模型获取用户行为特征,其中,特征提取模型通过历史浏览数据集训练生成。
其中,特征提取模型可以是提取用户阅读习惯特征的模型,具体可以为卷积神经网络模型,特征提取模型可以包括一个或者多个输入通道。用户行为特征具体可以是用户阅读资讯信息的特征,例如最喜欢浏览的资讯类型或者最不喜欢浏览的资讯类型,历史浏览数据集可以是包含一个或者多个用户的资讯浏览记录的数据集,历史浏览数据集的数据规模可以满足阈值条件,历史浏览数据集的数据规模越大,经过历史浏览数据训练生成的特征提取模型提取用户行为特征的准确性可以越高。在本发明实施例中,可以将历史浏览数据集作为训练集的正样本,随机生成一个数据集作为负样本,可以通过正样本和负样本对特征提取模型进行训练,直到提走提取模型输出的结果符合要求。
在本发明实施例中,可以将获取到的图谱向量和用户行为向量输入到特征提取模型中,可以将图谱向量和用户行为向量融合作为一个输入向量输入到特征提取模型中,也可以将图谱向量和用户行为向量分别作为一个向量输入到特征提取模型中,可以通过特征提取模型处理图谱向量和用户行为向量获取到用户特征。
步骤250、基于用户行为特征确定待推荐资讯对应的推荐概率。
其中,待推荐资讯可以是预先设定的资讯数据集,待推荐资讯中可以包括一个或者多个信息资讯。
具体的,可以将用户行为特征确定出待推荐资讯中各推荐资讯的推荐概率,推荐概率越大,则对应的推荐资讯越可能被用户阅读,示例性的,可以通过大量用户的资讯阅读历史和待推荐资讯对一个长短期记忆网络模型进行训练,该长短期记忆网络模型用于确定待推荐资讯对应的推荐概率,可以将用户行为特征和待推荐资讯输入到该长短期记忆网络模型以获取对应的推荐概率,可以理解的是,待推荐资讯可以包括多个,用户行为特征和待推荐资讯可以向量的形式输入到长短期记忆网络模型获取各待推荐资讯各自对应的推荐概率。
步骤260、根据推荐概率选择对应的待推荐资讯作为目标资讯进行推荐。
在本发明实施例中,可以按照推荐概率选择对应的待推荐资讯作为目标资讯推荐给用户,推荐概率的数值越大的待推荐资讯可以先被选则为目标资讯。在另一个实施方式中,可以选择一个或者多个推荐概率大于阈值数值的待推荐资讯作为目标资讯一起推荐给用户。
本发明实施例,通过识别预设金融数据集中的名词文本作为实体,按照预设图表示学习操作降低实体的维度并构建金融知识图谱,获取金融知识图谱对应的图谱向量以及用户信息浏览记录对应的用户行为向量输入到特征提取模型以获取用户行为特征,基于用户行为特征确定待推荐资讯的推荐概率,按照该推荐概率获取目标资讯进行推荐,提高了用户资讯推荐的个性化程度,可丰富资讯推荐范围,增强用户阅读资讯的体验程度。
进一步的,在上述发明实施例的基础上,所述预设图表示学习处理至少包括以下一种:基于TransE的图表示学习、基于TransD的图表示学习、基于TransR的图表示学习、DeepWalk图表示学习、Node2vec图表示学习。
在本发明实施例中,基于TransE的图表示学习可以针对金融知识图谱的一条边对应实体-关系的三元组(h,r,t),其中,h、r、t分别表示头实体、关系以及尾实体,假设(h,r,t)满足h+r≈t,其中,,r,t分别代表头实体,关系,尾实体的向量表示,即满足(h,r,t)关系的三元组对应下式的得分函数越小,否则就越大。
而基于TransD的图表示学***面,每个实体首先会通过下式被映射到相应关系的超平面上:
其中,wr是r关系超平面的法向量。映射之后的三元组满足TransE的得分函数,即:
基于TransR的图表示学习假设每个不同类型的实体关系都存在一个关系空间,实体通过映射矩阵Mr被映射到相应的空间:
hr=hMr,tr=tMr
映射后的向量同样满足TransE的得分函数,即:
进一步的,DeepWalk图表示学习可以利用最简单的随机游走方式生成节点的序列,即选取下一个节点的方式是均匀随机分布的,可以将序列中的节点看作文本中的词,利用Skip-Gram模型来训练节点的向量。
Node2vec图表示学习可以是基于改变DeepWalk随机游走序列生成的方式,通过引入两个参数p和q,将宽度优先搜索和深度优先搜索引入随机游走序列的生成过程。
进一步的,在上述发明实施例的基础上,所述识别所述预设金融数据集中的名词文本作为实体,包括:通过预设文本相似模型确定各所述名词文本的相似度;根据所述相似度将具有相同语义的名词文本映射到相同的实体。
在本发明实施例中,预设文本相似模型可以是确定名词文本之间相似度的深度学习模型,该模型可以通过海量的文本词汇训练生成。可以将预设金融数据集中识别出的名词文本输入到预设文本相似模型中,获取到输出结果,该输出结果可以是一个结果向量,每一个元素可以对应一个名词文本,可以将结果向量中数值相同或者差值小于固定阈值的名词文本作为同一类文本映射到相同的实体。
进一步的,在上述发明实施例的基础上,所述将所述图谱向量和所述用户行为向量输入到特征提取模型获取用户行为特征,包括:
将所述图谱向量和所述用户行为向量分别输入到特征提取模型,其中,所述图谱向量和所述用户行为向量分别对应所述特征提取模型的一个输入通道;在所述特征提取模型对所述图谱向量和所述用户行为向量进行卷积和池化操作获取到资讯向量作为用户行为特征。
在本发明实施例中,特征提取模型可以具有多输入通道,图谱向量和用户行为向量可以分别作为一个输入通道的输入,特征提取模型内可以通过卷积核池化等操作处理输入的图谱向量和用户向量,可以将特征提取模型输出的资讯向量作为用户行为特征。示例性的,图4是本发明实施例二中提供的一种特征提取模型的结构示意图,参见图4,本发明实施例中的特征提取模型具体可以为多通道卷积神经网络模型,可以将图谱向量和用户行为向量分别看作两个输入通道的输入信息,对应的卷积核可以为一个维度为2的三维矩阵,对应的卷积操作可以通用是对三维矩阵的每个位置进行乘积后求和,步长为1,可以横向移动4步,纵向移动4步,最终获取到4*4的卷积核的特征地图。当特征提取模型输入的图谱向量和用户相位向量的大小为8*50*2时,卷积核的大小分别为1*50*2和2*50*2,每个大小的卷积核有128个,不同卷积核池化操作后的向量相连可以作为资讯向量作为用户行为特征,其中,资讯向量的向量表示维度可以为256。
在一个示例性的实施方式中,资讯推荐方法具体可以包括数据提取、数据分析和训练集生成、模型构建和信息推荐五个步骤,每个步骤涉及的具体工作可以包括如下:
数据提取:本发明实施例中获取到的数据可以分为资讯数据和埋点数据,资讯数据包括待推荐资讯的标题和内容等信息,埋点数据可以包括用户信息浏览记录等,由于获取到的数据可以为非结构化数据,可以通过正则表达式对数据中的相关字段进行提取。
数据分析:对埋点数据的相关字段进行统计分析确定资讯推荐过程中资讯的时效性和稀疏性特点。
训练集生成:对资讯数据使用应用软件jieba进行分词,并通过加入外部预留和停用词来提高分词的效果,然后采用负采样方法生成信息推荐需要的模型训练集以及测试集。
模型构建:模型构建主要包括资讯特征提取和用户特征提取两部分,资讯特征提取可以使用向量直连法和卷积神经网络实现,其中,卷积神经网络可以通过金融知识图谱来提高用户行为特征确定的准确性,而用户行为特征的提取可以通过长短期记忆人工神经网络模型实现,进一步的,可以对长短期记忆人工模型添加Attention机制以提高用户行为特征提取的多样性。
进一步的,其中,向量直连法可以是对资讯的分词使用word2vec方法以及对实体使用Node2vec方法分别转换为向量,然后将所有向量首位相连作为资讯最终的表示向量,可保留资讯向量的原始语音信息,有助于提高信息推荐的准确性。
信息推荐:可以使用确定出的用户行为特征在待推荐资讯中选择目标资讯进行推荐。
实施例三
图5是本发明实施例三中提供的一种资讯推荐装置的结构示意图,可执行本发明实施例中任意实施例提供的资讯推荐方法,具备执行方法相应的功能模块和有益效果。该装置可以由软件和/或硬件实现,具体包括:图谱构建模型301、用户特征模块302和资讯推荐模块303。
图谱构建模型301,用于根据预设金融数据集的实体构建金融知识图谱。
用户特征模块302,用于基于所述金融知识图谱和用户信息浏览记录确定用户行为特征。
资讯推荐模块303,用于根据所述用户行为特征选择目标资讯进行推荐。
本发明实施例,通过图谱构建模型预设金融数据集的实体建立金融知识图谱,用户特征模块根据金融知识图谱和用户信息浏览记录确定用户行为特征,资讯推荐模块基于用户行为特征选择目标资讯进行推荐,提高了资讯推荐的个性化,丰富了资讯推荐范围,可增强信息推荐质量。
进一步的,在上述发明实施例的基础上,所述图谱构建模型301包括:
实体识别单元,用于识别所述预设金融数据集中的名词文本作为实体,名词文本至少包括地点、人名、机构名、公司名、行业名中至少一种。
图谱建立单元,用于根据预设图表示学习处理操作降低所述实体的维度以获取金融知识图谱。
进一步的,在上述发明实施例的基础上,所述图谱建立单元中预设图表示学习处理至少包括以下一种:基于TransE的图表示学习、基于TransD的图表示学习、基于TransR的图表示学习、DeepWalk图表示学习、Node2vec图表示学习。
进一步的,在上述发明实施例的基础上,所述实体识别单元包括:
相似度子单元,用于通过预设文本相似模型确定各所述名词文本的相似度。
实体映射子单元,用于根据所述相似度将具有相同语义的名词文本映射到相同的实体。
进一步的,在上述发明实施例的基础上,所述用户特征模块302包括:
向量获取单元,用于获取所述金融知识图谱对应的图谱向量以及用户信息浏览记录对应的用户行为向量。
特征提取单元,用于将所述图谱向量和所述用户行为向量输入到特征提取模型获取用户行为特征,其中,所述特征提取模型通过历史浏览数据集训练生成。
进一步的,在上述发明实施例的基础上,所述特征提取单元包括:
输入子单元,用于将所述图谱向量和所述用户行为向量分别输入到特征提取模型,其中,所述图谱向量和所述用户行为向量分别对应所述特征提取模型的一个输入通道。
处理子单元,用于在所述特征提取模型对所述图谱向量和所述用户行为向量进行卷积和池化操作获取到资讯向量作为用户行为特征。
进一步的,在上述发明实施例的基础上,所述资讯推荐模块303包括:
概率单元,用于基于所述用户行为特征确定待推荐资讯对应的推荐概率。
推荐单元,用于根据所述推荐概率选择对应的待推荐资讯作为目标资讯进行推荐。
实施例四
图6是本发明实施例四中提供的一种电子设备的结构示意图,如图6所示,该电子设备包括处理器40、存储器41、输入装置42和输出装置43;电子设备中处理器40的数量可以是一个或多个,图6中以一个处理器40为例;电子设备中的处理器40、存储器41、输入装置42和输出装置43可以通过总线或其他方式连接,图6中以通过总线连接为例。
存储器41作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的资讯推荐方法对应的程序指令/模块(例如,资讯推荐装置中的图谱构建模型301、用户特征模块302和资讯推荐模块303)。处理器40通过运行存储在存储器41中的软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述的资讯推荐方法。
存储器41可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器41可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器41可进一步包括相对于处理器40远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置42可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。输出装置73可包括显示屏等显示设备。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种资讯推荐方法,该方法包括:
根据预设金融数据集的实体构建金融知识图谱;
基于所述金融知识图谱和用户信息浏览记录确定用户行为特征;
根据所述用户行为特征选择目标资讯进行推荐。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的资讯推荐方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述资讯推荐装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种资讯推荐方法,其特征在于,所述方法包括:
根据预设金融数据集的实体构建金融知识图谱;
基于所述金融知识图谱和用户信息浏览记录确定用户行为特征;
根据所述用户行为特征选择目标资讯进行推荐。
2.根据权利要求1所述的方法,其特征在于,所述根据预设金融数据集的实体构建金融知识图谱,包括:
识别所述预设金融数据集中的名词文本作为实体,名词文本至少包括地点、人名、机构名、公司名、行业名中至少一种;
根据预设图表示学习处理操作降低所述实体的维度以获取金融知识图谱。
3.根据权利要求2所述的方法,其特征在于,所述预设图表示学习处理至少包括以下一种:基于TransE的图表示学习、基于TransD的图表示学习、基于TransR的图表示学习、DeepWalk图表示学习、Node2vec图表示学习。
4.根据权利要求2所述的方法,其特征在于,所述识别所述预设金融数据集中的名词文本作为实体,包括:
通过预设文本相似模型确定各所述名词文本的相似度;
根据所述相似度将具有相同语义的名词文本映射到相同的实体。
5.根据权利要求1所述的方法,其特征在于,所述基于所述金融知识图谱和用户信息浏览记录确定用户行为特征,包括:
获取所述金融知识图谱对应的图谱向量以及用户信息浏览记录对应的用户行为向量;
将所述图谱向量和所述用户行为向量输入到特征提取模型获取用户行为特征,其中,所述特征提取模型通过历史浏览数据集训练生成。
6.根据权利要求5所述的方法,其特征在于,所述将所述图谱向量和所述用户行为向量输入到特征提取模型获取用户行为特征,包括:
将所述图谱向量和所述用户行为向量分别输入到特征提取模型,其中,所述图谱向量和所述用户行为向量分别对应所述特征提取模型的一个输入通道;
在所述特征提取模型对所述图谱向量和所述用户行为向量进行卷积和池化操作获取到资讯向量作为用户行为特征。
7.根据权利要求1-6中任一所述的方法,其特征在于,所述根据所述用户行为特征选择目标资讯进行推荐,包括:
基于所述用户行为特征确定待推荐资讯对应的推荐概率;
根据所述推荐概率选择对应的待推荐资讯作为目标资讯进行推荐。
8.一种资讯推荐装置,其特征在于,所述装置包括:
图谱构建模型,用于根据预设金融数据集的实体构建金融知识图谱;
用户特征模块,用于基于所述金融知识图谱和用户信息浏览记录确定用户行为特征;
资讯推荐模块,用于根据所述用户行为特征选择目标资讯进行推荐。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的资讯推荐方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序在执行时实现如权利要求1-7中任一所述的资讯推荐方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011408670.9A CN112395506A (zh) | 2020-12-04 | 2020-12-04 | 一种资讯推荐方法、装置、电子设备和存储介质 |
PCT/CN2021/104680 WO2022116537A1 (zh) | 2020-12-04 | 2021-07-06 | 一种资讯推荐方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011408670.9A CN112395506A (zh) | 2020-12-04 | 2020-12-04 | 一种资讯推荐方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112395506A true CN112395506A (zh) | 2021-02-23 |
Family
ID=74604337
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011408670.9A Pending CN112395506A (zh) | 2020-12-04 | 2020-12-04 | 一种资讯推荐方法、装置、电子设备和存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112395506A (zh) |
WO (1) | WO2022116537A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113407729A (zh) * | 2021-05-11 | 2021-09-17 | 银江股份有限公司 | 一种面向司法的个性化案例推荐方法及*** |
WO2022116537A1 (zh) * | 2020-12-04 | 2022-06-09 | 上海帜讯信息技术股份有限公司 | 一种资讯推荐方法、装置、电子设备和存储介质 |
CN116028617A (zh) * | 2022-12-06 | 2023-04-28 | 腾讯科技(深圳)有限公司 | 资讯推荐方法、装置、设备、可读存储介质及程序产品 |
CN116629984A (zh) * | 2023-07-24 | 2023-08-22 | 中信证券股份有限公司 | 基于嵌入模型的产品信息推荐方法、装置、设备和介质 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114969557B (zh) * | 2022-07-29 | 2022-11-08 | 之江实验室 | 一种基于多来源信息融合的宣教推送方法和*** |
CN115239442B (zh) * | 2022-09-22 | 2023-01-06 | 湖南快乐通宝小额贷款有限公司 | 一种互联网金融产品推广的方法及***和存储介质 |
CN115618108B (zh) * | 2022-10-24 | 2023-05-26 | 云南中烟工业有限责任公司 | 新零售模式下基于知识图谱的品牌推荐方法 |
CN116089624B (zh) * | 2022-11-17 | 2024-02-27 | 昆仑数智科技有限责任公司 | 基于知识图谱的数据推荐方法、装置和*** |
CN115757984B (zh) * | 2022-11-18 | 2023-06-20 | 青海师范大学 | 基于深度游走和物品协同过滤的融合推荐方法 |
CN115577095B (zh) * | 2022-12-12 | 2023-05-02 | 南方电网科学研究院有限责任公司 | 一种基于图论的电力标准信息推荐方法 |
CN115794898B (zh) * | 2023-01-05 | 2023-04-25 | 中信建投证券股份有限公司 | 一种金融资讯推荐方法、装置、电子设备及存储介质 |
CN116304303B (zh) * | 2023-02-01 | 2023-09-08 | 北京三维天地科技股份有限公司 | 一种基于知识图谱的资产推荐方法及*** |
CN116108162B (zh) * | 2023-03-02 | 2024-03-08 | 广东工业大学 | 一种基于语义增强的复杂文本推荐方法及*** |
CN116932488B (zh) * | 2023-09-15 | 2024-01-09 | 之江实验室 | 基于知识图谱的课件生成方法、装置、***和存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110222198A (zh) * | 2019-06-18 | 2019-09-10 | 卓尔智联(武汉)研究院有限公司 | 有色金属行业知识图谱构建方法、电子装置及存储介质 |
CN110321482A (zh) * | 2019-06-11 | 2019-10-11 | 阿里巴巴集团控股有限公司 | 一种信息的推荐方法、装置及设备 |
CN111159431A (zh) * | 2019-12-30 | 2020-05-15 | 深圳Tcl新技术有限公司 | 基于知识图谱的信息可视化方法、装置、设备及存储介质 |
CN111401055A (zh) * | 2020-04-07 | 2020-07-10 | 宁波深擎信息科技有限公司 | 从金融资讯提取脉络信息的方法和装置 |
CN111444410A (zh) * | 2020-03-27 | 2020-07-24 | 民生科技有限责任公司 | 一种基于知识图谱的关联交易挖掘识别方法及装置 |
CN111582509A (zh) * | 2020-05-07 | 2020-08-25 | 南京邮电大学 | 一种基于知识图谱表示学习和神经网络的协同推荐方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109064318A (zh) * | 2018-08-24 | 2018-12-21 | 苏宁消费金融有限公司 | 一种基于知识图谱的互联网金融风险监测*** |
CN110458641B (zh) * | 2019-06-28 | 2022-02-25 | 苏宁云计算有限公司 | 一种电商推荐方法及*** |
CN110795571B (zh) * | 2019-10-24 | 2023-05-05 | 南宁师范大学 | 基于深度学习和知识图谱的文化旅游资源推荐方法 |
CN112395506A (zh) * | 2020-12-04 | 2021-02-23 | 上海帜讯信息技术股份有限公司 | 一种资讯推荐方法、装置、电子设备和存储介质 |
-
2020
- 2020-12-04 CN CN202011408670.9A patent/CN112395506A/zh active Pending
-
2021
- 2021-07-06 WO PCT/CN2021/104680 patent/WO2022116537A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110321482A (zh) * | 2019-06-11 | 2019-10-11 | 阿里巴巴集团控股有限公司 | 一种信息的推荐方法、装置及设备 |
CN110222198A (zh) * | 2019-06-18 | 2019-09-10 | 卓尔智联(武汉)研究院有限公司 | 有色金属行业知识图谱构建方法、电子装置及存储介质 |
CN111159431A (zh) * | 2019-12-30 | 2020-05-15 | 深圳Tcl新技术有限公司 | 基于知识图谱的信息可视化方法、装置、设备及存储介质 |
CN111444410A (zh) * | 2020-03-27 | 2020-07-24 | 民生科技有限责任公司 | 一种基于知识图谱的关联交易挖掘识别方法及装置 |
CN111401055A (zh) * | 2020-04-07 | 2020-07-10 | 宁波深擎信息科技有限公司 | 从金融资讯提取脉络信息的方法和装置 |
CN111582509A (zh) * | 2020-05-07 | 2020-08-25 | 南京邮电大学 | 一种基于知识图谱表示学习和神经网络的协同推荐方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022116537A1 (zh) * | 2020-12-04 | 2022-06-09 | 上海帜讯信息技术股份有限公司 | 一种资讯推荐方法、装置、电子设备和存储介质 |
CN113407729A (zh) * | 2021-05-11 | 2021-09-17 | 银江股份有限公司 | 一种面向司法的个性化案例推荐方法及*** |
CN113407729B (zh) * | 2021-05-11 | 2022-06-24 | 银江技术股份有限公司 | 一种面向司法的个性化案例推荐方法及*** |
CN116028617A (zh) * | 2022-12-06 | 2023-04-28 | 腾讯科技(深圳)有限公司 | 资讯推荐方法、装置、设备、可读存储介质及程序产品 |
CN116028617B (zh) * | 2022-12-06 | 2024-02-27 | 腾讯科技(深圳)有限公司 | 资讯推荐方法、装置、设备、可读存储介质及程序产品 |
CN116629984A (zh) * | 2023-07-24 | 2023-08-22 | 中信证券股份有限公司 | 基于嵌入模型的产品信息推荐方法、装置、设备和介质 |
CN116629984B (zh) * | 2023-07-24 | 2024-02-06 | 中信证券股份有限公司 | 基于嵌入模型的产品信息推荐方法、装置、设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2022116537A1 (zh) | 2022-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112395506A (zh) | 一种资讯推荐方法、装置、电子设备和存储介质 | |
CN111753060B (zh) | 信息检索方法、装置、设备及计算机可读存储介质 | |
CN111444428B (zh) | 基于人工智能的信息推荐方法、装置、电子设备及存储介质 | |
CN110069709B (zh) | 意图识别方法、装置、计算机可读介质及电子设备 | |
CN112131350B (zh) | 文本标签确定方法、装置、终端及可读存储介质 | |
CN109471944B (zh) | 文本分类模型的训练方法、装置及可读存储介质 | |
CN111324771B (zh) | 视频标签的确定方法、装置、电子设备及存储介质 | |
CN110619051B (zh) | 问题语句分类方法、装置、电子设备及存储介质 | |
WO2005022413A1 (en) | Method and apparatus for automatic file clustering into a data-driven, user-specific taxonomy | |
CN111539197A (zh) | 文本匹配方法和装置以及计算机***和可读存储介质 | |
WO2023108993A1 (zh) | 基于深度聚类算法的产品推荐方法、装置、设备及介质 | |
CN113254711B (zh) | 一种互动图像的显示方法、装置、计算机设备和存储介质 | |
CN111783903B (zh) | 文本处理方法、文本模型的处理方法及装置、计算机设备 | |
CN111666766A (zh) | 数据处理方法、装置和设备 | |
CN113806588A (zh) | 搜索视频的方法和装置 | |
CN114416998A (zh) | 文本标签的识别方法、装置、电子设备及存储介质 | |
CN115795030A (zh) | 文本分类方法、装置、计算机设备和存储介质 | |
CN113282754A (zh) | 针对新闻事件的舆情检测方法、装置、设备和存储介质 | |
CN114090793A (zh) | 信息抽取方法、装置、电子设备及计算机可读介质及产品 | |
CN116882414B (zh) | 基于大规模语言模型的评语自动生成方法及相关装置 | |
CN114328800A (zh) | 文本处理方法、装置、电子设备和计算机可读存储介质 | |
CN114547257B (zh) | 类案匹配方法、装置、计算机设备及存储介质 | |
CN117216617A (zh) | 文本分类模型训练方法、装置、计算机设备和存储介质 | |
CN115129890A (zh) | 回馈数据图谱生成方法、生成设备、问答设备及冰箱 | |
CN114676237A (zh) | 语句相似度确定方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |