CN104915399A - 基于新闻标题的推荐数据处理方法及*** - Google Patents

基于新闻标题的推荐数据处理方法及*** Download PDF

Info

Publication number
CN104915399A
CN104915399A CN201510290279.6A CN201510290279A CN104915399A CN 104915399 A CN104915399 A CN 104915399A CN 201510290279 A CN201510290279 A CN 201510290279A CN 104915399 A CN104915399 A CN 104915399A
Authority
CN
China
Prior art keywords
text fragments
eigenvalue
entity
rationale
headline
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510290279.6A
Other languages
English (en)
Inventor
罗剑波
张俊彬
蔡勋梁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510290279.6A priority Critical patent/CN104915399A/zh
Publication of CN104915399A publication Critical patent/CN104915399A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于新闻标题的推荐数据处理方法,所述方法包括:从网页中识别与实体对相关的新闻标题;计算所述实体对的关键词集合;从所述新闻标题中截取文本片段,得到带时间信息的文本片段集合,提取所述文本片段集合中各文本片段的第一特征值;计算所述文本片段集合中各个文本片段的语义向量,根据所述语义向量提取得到所述各个文本片段的第二特征值;根据用户的点击数据,将所述第一特征值和所述第二特征值拟合得到推荐理由排序。通过采用本发明,可解决现有技术中网页智能推荐理由缺乏趣味性的问题,同时使推荐理由兼顾准确性和吸引力。

Description

基于新闻标题的推荐数据处理方法及***
技术领域
本发明涉及计算机网络领域,更为具体而言,涉及一种基于新闻标题的推荐数据处理方法和***。
背景技术
当今网络信息发展迅速,人们已普遍采用网络查阅各类新闻和信息。在网络新闻的发展过程中,作为成熟商业推荐***不可或缺的重要组成部分,推荐理由客观准确地阐述推荐逻辑。
让用户感知推荐***的智能,对提升用户体验具有重要意义。目前推荐理由主要依靠预定义模板方式生成,受限于模板的丰富度,推荐理由在语言表达上缺乏多样性。在娱乐明星推荐这一类娱乐推荐场景中,目前也仅限于“相关人物”、“猜你喜欢”、“其他人也在搜”这些千篇一律的推荐理由与娱乐至上的精神格格不入,难以博取用户青睐。
为解决现有技术中网页智能推荐***的推荐理由缺乏趣味性这一问题,同时使推荐理由兼顾准确性和吸引力,亟需一种全新的推荐数据处理方法及***。
发明内容
为了解决现有技术中网页智能推荐***的推荐理由缺乏趣味性这一问题,本发明的实施方式提供了一种基于新闻标题的推荐数据处理方法和***。
一方面,本发明实施方式提供了一种基于新闻标题的推荐数据处理方法,所述方法包括:
从网页中识别与实体对相关的新闻标题;
计算所述实体对的关键词集合;
从所述新闻标题中截取文本片段,得到带时间信息的文本片段集合,提取所述文本片段集合中各文本片段的第一特征值;
计算所述文本片段集合中各个文本片段的语义向量,根据所述语义向量提取得到所述各个文本片段的第二特征值;
根据用户的点击数据,将所述第一特征值和所述第二特征值拟合得到推荐理由排序。
相应的,本发明实施方式还提供了一种基于新闻标题的推荐数据处理***,所述***包括:
标题识别模块,用于从网页中识别与实体对相关的新闻标题;
关键词计算模块,用于计算所述实体对的关键词集合;
文本片段截取模块,用于从所述新闻标题中截取文本片段,得到带时间信息的文本片段集合,提取所述文本片段集合中各文本片段的第一特征值;
特征值计算模块,用于计算所述文本片段集合中各个文本片段的语义向量,根据所述语义向量提取得到所述各个文本片段的第二特征值;
筛选模块,用于根据用户的点击数据,将所述第一特征值和所述第二特征值拟合得到推荐理由排序。
实施本发明的各种实施方式具有以下有益效果:可准确又智能地向用户推荐更具趣味性和吸引力的网络信息。
附图说明
图1是根据本发明实施方式的基于新闻标题的推荐数据处理方法的流程图;
图2示出了图1所示方法的步骤S5的具体流程图;
图3是根据本发明实施方式的基于新闻标题的推荐数据处理***的架构图;
图4示出了图3所示的筛选模块500的框图。
具体实施方式
以下结合附图和具体实施方式对本发明的各个方面进行详细阐述。其中,众所周知的模块、单元及其相互之间的连接、链接、通信或操作没有示出或未作详细说明。并且,所描述的特征、架构或功能可在一个或一个以上实施方式中以任何方式组合。本领域技术人员应当理解,下述的各种实施方式只用于举例说明,而非用于限制本发明的保护范围。还可以容易理解,本文所述和附图所示的各实施方式中的模块或单元或处理方式可以按各种不同配置进行组合和设计。
图1是根据本发明实施方式的基于新闻标题的推荐数据处理方法的流程图。参见图1,所述方法包括如下步骤:
S1,从网页中识别与实体对相关的新闻标题;
S2,计算所述实体对的关键词集合;
S3,从所述新闻标题中截取文本片段,得到带时间信息的文本片段集合,提取所述文本片段集合中各文本片段的第一特征值;
S4,计算所述文本片段集合中各个文本片段的语义向量,根据所述语义向量提取得到所述各个文本片段的第二特征值;S5,根据用户的点击数据,将所述第一特征值和所述第二特征值拟合得到推荐理由排序。
在本发明的实施方式中,基于新闻标题的推荐数据处理方法可包括:执行步骤S1,从网页中识别与实体对相关的新闻标题。在步骤S1和步骤S2之间,还可包括如下步骤:检测所述实体对新闻爆发的时间区间。可利用高斯异常点在先检测模型检测实体对新闻爆发的时间区间。例如:可检测到某明星在A时间段内的新闻总量,以及在B时间段内该明星新闻量异常增多,即该明星的新闻爆发时间为B时间段。通过上述检测实体对新闻爆发的时间区间的步骤,可查询到与实体对相关新闻的集中时间,从而减少推荐理由数据的查询范围和提高查询效率。
接下来,执行步骤S2,计算所述实体对的关键词集合,具体而言,可包括根据tf-idf算法计算所述实体对在某一时间区间的关键词集合。其中,tf-idf(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。可根据tf-idf模型提取得到关键词列表,例如:在某时间段,按照tf-idf值由高至低的顺序截取前N名的关键词集合。
接下来,执行步骤S3,从所述新闻标题中截取文本片段,得到带时间信息的文本片段集合,提取所述文本片段集合中各文本片段的第一特征值。例如,可利用正则表达式从新闻标题中截取文本片段,得到带有时间信息的实体对文本片段集合。
然后,执行步骤S4,计算所述文本片段集合中各个文本片段的语义向量,根据所述语义向量提取得到所述各个文本片段的第二特征值。例如,可通过卷积神经网络深度学习模型,每个语义片段会得到200维的语义特征向量,例如:“浪漫求婚成功”会得到V1,“求婚成功上头条”得到V2,由于这两个文本片段语义相近,V1和V2的余弦相似度会接近1,而语义不相同的文本片段得到的余弦相似度会趋于0甚至小于0;
其中,所述第一特征值包括:语法结构特征和时效性特征;所述第二特征值包括:相关性特征、关注度特征、吸引力特征。具体而言,可利用依存分析工具计算文本片段的语法结构特征,将不符合中文语法结构的文本片段删除;可根据带有时间信息的文本片段,查询到该实体对的时效性特征,例如爆发新闻的时间区间;可根据是否具有吸引力人工标注一批文本片段作为标准数据集,训练SVM(Support Vector Machine,支持向量机)分类模型,并利用该SVM模型预测文本片段的吸引力,得到吸引力特征;从搜索引擎搜索日志挖掘实体对的热搜词,计算热搜词与实体对文本片段的语义相似度,得到用户关注度特征;从知识库获取实体对的关系,计算实体对关系与文本片段的语义相似度,得到相关性特征,例如:通过卷积神经网络,可以得到“夫妻”、“女朋友”、“男朋友”这些实体关系词汇的语义特征向量,它们与文本片段的语义相似度用于表示该关系与文本片段的相关性特征。比如“浪漫求婚成功”这个文本片段与“男朋友”的相似度要高于“无人机想上头条”的相似度,因此可将实体对的关系与文本片段的语义特征向量的余弦相似度来表示相关性特征。
通过采用本发明的所述方法,可解决现有技术中网页智能推荐***的推荐理由缺乏趣味性的问题,同时使推荐理由兼顾准确性和吸引力。
图2示出了图1所示方法的步骤S5的具体流程图。参见图2,所述步骤S5包括:
S51,将所述点击数据转化为对所述第一特征值和所述第二特征值的投票数据;
S52,根据所述投票数据得到所述推荐理由排序,并根据所述推荐理由排序由高至低的顺序提取推荐理由。
在本发明的实施方式中,根据人工标注结果及线上点击数据,综合考虑吸引力、结构特征、用户关注度、相关性、时效性等特征训练文本片段的排序模型,每个实体对中,排名最高的文本片段就作为该实体对的推荐理由用户每一次点击可以理解为对文本片段的一次正向投票,文本片段点击次数越多表明它越受欢迎,也越适合作为推荐理由,这样便将用户的点击行为转化为排序模型的训练数据,利用该训练数据,我们可以在文本片段的5个基础特征之上训练逻辑回归(Logistic Regression)模型,从而选择优质的文本片段作为推荐理由,也可提取排名第一或前N名的文本片段作为推荐理由。
图3是根据本发明实施方式的基于新闻标题的推荐数据处理***1的架构图。参见图3,所述***1包括:
标题识别模块100,用于从网页中识别与实体对相关的新闻标题;
关键词计算模块200,用于计算所述实体对的关键词集合;
文本片段截取模块300,用于从所述新闻标题中截取文本片段,得到带时间信息的文本片段集合,提取所述文本片段集合中各文本片段的第一特征值;
特征值计算模块400,用于计算所述文本片段集合中各个文本片段的语义向量,根据所述语义向量提取得到所述各个文本片段的第二特征值;
筛选模块500,用于根据用户的点击数据,将所述第一特征值和所述第二特征值拟合得到推荐理由排序。
在本发明的实施方式中,基于新闻标题的推荐数据处理***可包括:标题识别模块100,从网页中识别与实体对相关的新闻标题。***还可包括检测模块,用于在所述从网页中识别与实体对相关的新闻标题之后,计算所述实体对的关键词集合之前,检测所述实体对新闻爆发的时间区间。例如:可检测到某明星在A时间段内的新闻总量,以及在B时间段内该明星新闻量异常增多,即该明星的新闻爆发时间为B时间段。通过上述检测实体对新闻爆发的时间区间的步骤,可查询到与实体对相关新闻的集中时间,从而减少推荐理由数据的查询范围和提高查询效率。
关键词计算模块200,计算所述实体对的关键词集合,具体而言,可包括根据tf-idf算法计算所述实体对在某一时间区间的关键词集合。其中,tf-idf是一种用于资讯检索与资讯探勘的常用加权技术。可根据tf-idf模型提取得到关键词列表,例如:在某时间段,按照tf-idf值由高至低的顺序截取前N名的关键词集合。
文本片段截取模块300,从所述新闻标题中截取文本片段,得到带时间信息的文本片段集合,提取所述文本片段集合中各文本片段的第一特征值。例如,可利用正则表达式从新闻标题中截取文本片段,得到带有时间信息的实体对文本片段集合。
特征值计算模块400,计算所述文本片段集合中各个文本片段的语义向量,根据所述语义向量提取得到所述各个文本片段的第二特征值。例如,可通过卷积神经网络深度学习模型,每个语义片段会得到200维的语义特征向量,例如:“浪漫求婚成功”会得到V1,“求婚成功上头条”得到V2,由于这两个文本片段语义相近,V1和V2的余弦相似度会接近1,而语义不相同的文本片段得到的余弦相似度会趋于0甚至小于0;
其中,所述第一特征值包括:语法结构特征和时效性特征;所述第二特征值包括:相关性特征、关注度特征、吸引力特征。具体而言,可利用依存分析工具计算文本片段的语法结构特征,将不符合中文语法结构的文本片段删除;可根据带有时间信息的文本片段,查询到该实体对的时效性特征,例如爆发新闻的时间区间;可根据是否具有吸引力人工标注一批文本片段作为标准数据集,训练SVM分类模型,并利用该SVM模型预测文本片段的吸引力,得到吸引力特征;从搜索引擎搜索日志挖掘实体对的热搜词,计算热搜词与实体对文本片段的语义相似度,得到用户关注度特征;从知识库获取实体对的关系,计算实体对关系与文本片段的语义相似度,得到相关性特征,例如:通过卷积神经网络,可以得到“夫妻”、“女朋友”、“男朋友”这些实体关系词汇的语义特征向量,它们与文本片段的语义相似度用于表示该关系与文本片段的相关性特征。比如“浪漫求婚成功”这个文本片段与“男朋友”的相似度要高于“无人机想上头条”的相似度,因此可将实体对的关系与文本片段的语义特征向量的余弦相似度来表示相关性特征。
通过采用本发明的所述***,可解决现有技术中网页智能推荐***的推荐理由缺乏趣味性的问题,同时使推荐理由兼顾准确性和吸引力。
图4示出了图3所示的筛选模块500的框图;参见图4,所述筛选模块500包括:
排序单元510,用于将所述点击数据转化为对所述第一特征值和所述第二特征值的投票数据;
提取单元520,用于根据所述投票数据得到所述推荐理由排序,并根据所述推荐理由排序由高至低的顺序提取推荐理由。
在本发明的实施方式中,根据人工标注结果及线上点击数据,综合考虑吸引力、结构特征、用户关注度、相关性、时效性等特征训练文本片段的排序模型,每个实体对中,排名最高的文本片段就作为该实体对的推荐理由用户每一次点击可以理解为对文本片段的一次正向投票,文本片段点击次数越多表明它越受欢迎,也越适合作为推荐理由,这样便将用户的点击行为转化为排序模型的训练数据,利用该训练数据,我们可以在文本片段的5个基础特征之上训练逻辑回归模型,从而选择优质的文本片段作为推荐理由,也可提取排名第一或前N名的文本片段作为推荐理由。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件结合硬件平台的方式来实现,当然也可以全部通过硬件来实施。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,智能手机或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本发明说明书中使用的术语和措辞仅仅为了举例说明,并不意味构成限定。本领域技术人员应当理解,在不脱离所公开的实施方式的基本原理的前提下,对上述实施方式中的各细节可进行各种变化。因此,本发明的范围只由权利要求确定,在权利要求中,除非另有说明,所有的术语应按最宽泛合理的意思进行理解。

Claims (10)

1.一种基于新闻标题的推荐数据处理方法,其特征在于,所述方法包括:
从网页中识别与实体对相关的新闻标题;
计算所述实体对的关键词集合;
从所述新闻标题中截取文本片段,得到带时间信息的文本片段集合,提取所述文本片段集合中各文本片段的第一特征值;
计算所述文本片段集合中各个文本片段的语义向量,根据所述语义向量提取得到所述各个文本片段的第二特征值;
根据用户的点击数据,将所述第一特征值和所述第二特征值拟合得到推荐理由排序。
2.如权利要求1所述的方法,其特征在于,在所述从网页中识别与实体对相关的新闻标题之后,计算所述实体对的关键词集合之前包括:
检测所述实体对新闻爆发的时间区间。
3.如权利要求2所述的方法,其特征在于,所述计算所述实体对的关键词集合包括:
根据tf-idf算法计算所述实体对在所述时间区间的关键词集合。
4.如权利要求1所述的方法,其特征在于,所述第一特征值包括:语法结构特征和时效性特征;所述第二特征值包括:相关性特征、关注度特征、吸引力特征。
5.如权利要求1所述的方法,其特征在于,根据用户的点击数据,将所述第一特征值和所述第二特征值拟合得到推荐理由排序包括:
将所述点击数据转化为对所述第一特征值和所述第二特征值的投票数据,根据所述投票数据得到所述推荐理由排序,并根据所述推荐理由排序由高至低的顺序提取推荐理由。
6.一种基于新闻标题的推荐数据处理***,其特征在于,所述***包括:
标题识别模块,用于从网页中识别与实体对相关的新闻标题;
关键词计算模块,用于计算所述实体对的关键词集合;
文本片段截取模块,用于从所述新闻标题中截取文本片段,得到带时间信息的文本片段集合,提取所述文本片段集合中各文本片段的第一特征值;
特征值计算模块,用于计算所述文本片段集合中各个文本片段的语义向量,根据所述语义向量提取得到所述各个文本片段的第二特征值;
筛选模块,用于根据用户的点击数据,将所述第一特征值和所述第二特征值拟合得到推荐理由排序。
7.如权利要求6所述的***,其特征在于,所述***包括:
检测模块,用于在所述从网页中识别与实体对相关的新闻标题之后,计算所述实体对的关键词集合之前,检测所述实体对新闻爆发的时间区间。
8.如权利要求7所述的***,其特征在于,所述关键词计算模块中计算所述实体对的关键词集合包括:
根据tf-idf算法计算所述实体对在所述时间区间的关键词集合。
9.如权利要求6所述的***,其特征在于,所述第一特征值包括:语法结构特征和时效性特征;所述第二特征值包括:相关性特征、关注度特征、吸引力特征。
10.如权利要求6所述的***,其特征在于,所述筛选模块包括:
排序单元,用于将所述点击数据转化为对所述第一特征值和所述第二特征值的投票数据;
提取单元,用于根据所述投票数据得到所述推荐理由排序,并根据所述推荐理由排序由高至低的顺序提取推荐理由。
CN201510290279.6A 2015-05-29 2015-05-29 基于新闻标题的推荐数据处理方法及*** Pending CN104915399A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510290279.6A CN104915399A (zh) 2015-05-29 2015-05-29 基于新闻标题的推荐数据处理方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510290279.6A CN104915399A (zh) 2015-05-29 2015-05-29 基于新闻标题的推荐数据处理方法及***

Publications (1)

Publication Number Publication Date
CN104915399A true CN104915399A (zh) 2015-09-16

Family

ID=54084462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510290279.6A Pending CN104915399A (zh) 2015-05-29 2015-05-29 基于新闻标题的推荐数据处理方法及***

Country Status (1)

Country Link
CN (1) CN104915399A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105869016A (zh) * 2016-03-28 2016-08-17 天津中科智能识别产业技术研究院有限公司 一种基于卷积神经网络的点击通过率预估方法
CN107491436A (zh) * 2017-08-21 2017-12-19 北京百度网讯科技有限公司 一种标题党识别方法和装置、服务器、存储介质
CN107609094A (zh) * 2017-09-08 2018-01-19 北京百度网讯科技有限公司 数据消歧方法、装置及计算机设备
CN108509410A (zh) * 2017-02-27 2018-09-07 广东神马搜索科技有限公司 文本语义相似度计算方法、装置及用户终端
CN108804409A (zh) * 2017-04-28 2018-11-13 西安科技大市场创新云服务股份有限公司 一种语义检索方法和装置
CN108875065A (zh) * 2018-07-02 2018-11-23 电子科技大学 一种基于内容的印尼新闻网页推荐方法
CN109064294A (zh) * 2018-08-21 2018-12-21 重庆大学 一种融合时间因素、文本特征和相关性的药品推荐方法
CN111984867A (zh) * 2020-08-20 2020-11-24 北京奇艺世纪科技有限公司 一种网络资源确定方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2378415A1 (en) * 2010-02-19 2011-10-19 Sap Ag Service integration modeling and execution framework
CN102831234A (zh) * 2012-08-31 2012-12-19 北京邮电大学 基于新闻内容和主题特征的个性化新闻推荐装置和方法
CN103324665A (zh) * 2013-05-14 2013-09-25 亿赞普(北京)科技有限公司 一种基于微博的热点信息提取的方法和装置
CN103383702A (zh) * 2013-07-17 2013-11-06 中国科学院深圳先进技术研究院 一种基于用户投票排名的个性化新闻推荐的方法及***
CN104036038A (zh) * 2014-06-30 2014-09-10 北京奇虎科技有限公司 新闻推荐方法和***
CN104166668A (zh) * 2014-06-09 2014-11-26 南京邮电大学 基于folfm模型的新闻推荐***及方法
CN104239587A (zh) * 2014-10-17 2014-12-24 北京字节跳动网络技术有限公司 新闻列表刷新的方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2378415A1 (en) * 2010-02-19 2011-10-19 Sap Ag Service integration modeling and execution framework
CN102831234A (zh) * 2012-08-31 2012-12-19 北京邮电大学 基于新闻内容和主题特征的个性化新闻推荐装置和方法
CN103324665A (zh) * 2013-05-14 2013-09-25 亿赞普(北京)科技有限公司 一种基于微博的热点信息提取的方法和装置
CN103383702A (zh) * 2013-07-17 2013-11-06 中国科学院深圳先进技术研究院 一种基于用户投票排名的个性化新闻推荐的方法及***
CN104166668A (zh) * 2014-06-09 2014-11-26 南京邮电大学 基于folfm模型的新闻推荐***及方法
CN104036038A (zh) * 2014-06-30 2014-09-10 北京奇虎科技有限公司 新闻推荐方法和***
CN104239587A (zh) * 2014-10-17 2014-12-24 北京字节跳动网络技术有限公司 新闻列表刷新的方法及装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105869016A (zh) * 2016-03-28 2016-08-17 天津中科智能识别产业技术研究院有限公司 一种基于卷积神经网络的点击通过率预估方法
CN108509410A (zh) * 2017-02-27 2018-09-07 广东神马搜索科技有限公司 文本语义相似度计算方法、装置及用户终端
CN108509410B (zh) * 2017-02-27 2022-08-05 阿里巴巴(中国)有限公司 文本语义相似度计算方法、装置及用户终端
CN108804409A (zh) * 2017-04-28 2018-11-13 西安科技大市场创新云服务股份有限公司 一种语义检索方法和装置
CN107491436A (zh) * 2017-08-21 2017-12-19 北京百度网讯科技有限公司 一种标题党识别方法和装置、服务器、存储介质
CN107609094B (zh) * 2017-09-08 2020-12-04 北京百度网讯科技有限公司 数据消歧方法、装置及计算机设备
CN107609094A (zh) * 2017-09-08 2018-01-19 北京百度网讯科技有限公司 数据消歧方法、装置及计算机设备
CN108875065B (zh) * 2018-07-02 2021-07-06 电子科技大学 一种基于内容的印尼新闻网页推荐方法
CN108875065A (zh) * 2018-07-02 2018-11-23 电子科技大学 一种基于内容的印尼新闻网页推荐方法
CN109064294A (zh) * 2018-08-21 2018-12-21 重庆大学 一种融合时间因素、文本特征和相关性的药品推荐方法
CN109064294B (zh) * 2018-08-21 2021-11-12 重庆大学 一种融合时间因素、文本特征和相关性的药品推荐方法
CN111984867A (zh) * 2020-08-20 2020-11-24 北京奇艺世纪科技有限公司 一种网络资源确定方法及装置
CN111984867B (zh) * 2020-08-20 2023-06-06 北京奇艺世纪科技有限公司 一种网络资源确定方法及装置

Similar Documents

Publication Publication Date Title
US11347782B2 (en) Internet text mining-based method and apparatus for judging validity of point of interest
CN104915399A (zh) 基于新闻标题的推荐数据处理方法及***
WO2018050022A1 (zh) 应用程序的推荐方法及服务器
CN107491547A (zh) 基于人工智能的搜索方法和装置
EP3825862A2 (en) Method and apparatus of recommending information based on fused relationship network, and device and medium
CN106202294B (zh) 基于关键词和主题模型融合的相关新闻计算方法及装置
US20160125028A1 (en) Systems and methods for query rewriting
CN111460221B (zh) 评论信息处理方法、装置及电子设备
CN110597962B (zh) 搜索结果展示方法、装置、介质及电子设备
CN104881458B (zh) 一种网页主题的标注方法和装置
CN105095187A (zh) 一种搜索意图识别方法及装置
CN105531701A (zh) 个性化趋势图像搜索建议
CN110717038B (zh) 对象分类方法及装置
CN112084307B (zh) 一种数据处理方法、装置、服务器及计算机可读存储介质
CN112347339A (zh) 一种搜索结果处理方法及装置
CN113282754A (zh) 针对新闻事件的舆情检测方法、装置、设备和存储介质
CN115757991A (zh) 一种网页识别方法、装置、电子设备和存储介质
CN113569118B (zh) 自媒体推送方法、装置、计算机设备及存储介质
CN110162769B (zh) 文本主题输出方法和装置、存储介质及电子装置
CN114490923A (zh) 相似文本匹配模型的训练方法、装置、设备及存储介质
KR101955920B1 (ko) 속성 언어를 이용한 검색 방법 및 장치
CN105426382A (zh) 一种基于Personal Rank的情绪上下文感知的音乐推荐方法
CN112330387A (zh) 一种应用于看房软件的虚拟经纪人
CN116431912A (zh) 用户画像推送方法及装置
CN105608183A (zh) 一种提供聚合类型回答的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150916