CN105512333A - 基于情感倾向的产品评论主题搜索方法 - Google Patents

基于情感倾向的产品评论主题搜索方法 Download PDF

Info

Publication number
CN105512333A
CN105512333A CN201511003818.XA CN201511003818A CN105512333A CN 105512333 A CN105512333 A CN 105512333A CN 201511003818 A CN201511003818 A CN 201511003818A CN 105512333 A CN105512333 A CN 105512333A
Authority
CN
China
Prior art keywords
product
webpage
theme
sentiment orientation
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201511003818.XA
Other languages
English (en)
Inventor
闫俊英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Dianji University
Original Assignee
Shanghai Dianji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Dianji University filed Critical Shanghai Dianji University
Priority to CN201511003818.XA priority Critical patent/CN105512333A/zh
Publication of CN105512333A publication Critical patent/CN105512333A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于情感倾向的产品评论主题搜索方法,本发明在保证查全率的前提下,根据产品的主题模型,抽取产品评价对象,并根据情感词词典分析产品评价的情感倾向性,排序后输出,从而得到更高的查准率。本发明对产品评价的主题采用产品对象、产品评价短语和情感倾向值的三元组表示,能够更清楚地表达不同产品评价的情感倾向。另外,对采集的页面从两个方面进行评分,与主题的相关度和产品评价的情感倾向值,更好地满足用户不仅对产品评价,还对评价的情感倾向感兴趣的需要,因此提高了搜索的准确性。

Description

基于情感倾向的产品评论主题搜索方法
技术领域
本发明涉及一种基于情感倾向的产品评论主题搜索方法。
背景技术
目前的很多搜索服务中,有一些针对不同用户的个性化的信息搜索服务,如基于用户行为分析的个性化搜索服务,对于不同用户的相同查询请求返回的查询结果也有所相同,即***能够在一定程度上识别不同用户个性信息需求上的差别。另外目前的主题搜索中很少有对产品评价进行情感倾向性,仅仅只是搜索出相应产品的对应评价,但是搜索结果却无法对用户如何做选择进行较好地帮助。因此如何在搜索中,不仅搜索出相应产品的评价,还能对产品评价的情感倾向性进行分析即文本的情感分类,并对搜索结果进行排序成为产品评价主题搜索领域中许多学者的研究热点。近十年来对文本主题分类的研究已经比较深入,但是对文本情感分类的研究还处在一个较少。在文本情感倾向分类的研究中,文本中情感倾向词语的选择和抽取是整个分类过程的关键,而词语的情感倾向判别是篇章级情感倾向研究的基础。
在很多主题元搜索方法中,对搜索结果一般采用提取特征向量的方法,然后采用夹角余弦算法,计算搜索结果与主题的相符合程度。但是特征向量是离散的,可能无法正确表达搜索结果文档,因此以此计算与主题的相似度就会不够准确,搜索结果的准确性就大大受到影响。
发明内容
本发明的目的在于提供一种基于情感倾向的产品评论主题搜索方法,能够在保证查全率的前提下,根据产品的主题模型,抽取产品评价对象,并根据情感词词典分析产品评价的情感倾向性,排序后输出,从而得到更高的查准率。
为解决上述问题,本发明提供一种基于情感倾向的产品评论主题搜索方法,包括:
建立各种产品的主题模型,其中,每个主题模型包括多个产品主题;
对每个产品主题根据设定的种子网址进行爬行,对爬行采集到的网页进行处理,提取产品对象及产品评价短语,根据产品主题模型,计算网页与主题的相关度,高于预设的阈值的网页保留,然后再计算页面的产品评价的情感倾向值;
用户在进行搜索时,选择要进行搜索的产品主题,然后根据关键词进行搜索,搜索结果按照情感倾向性的降序排序。
进一步的,在上述方法中,建立各种产品的主题模型,包括:
主题模型采取三元组Topic(C,W,V)来表示,形成主题树结构,其中:C表示产品对象;W表示产品评价短语;V表示产品评价的情感倾向值,C采用向量空间模型(VSM)来表示,使用二元组Ci(Keyi,Weighti),其中,Keyi表示关键词,Weighti表示关键词的权重,产品评价的情感倾向值V介于-1和1之间,正数表示对产品的正面评价,且值越大,情感倾向越高;负数表示对产品的负面评价,且值越小,负面情感倾向就越高。
进一步的,在上述方法中,对每个产品主题根据设定的种子网址进行爬行,包括:
对每个产品主题设置几个爬行的种子网址,从网络上采集相关网页。
进一步的,在上述方法中,对爬行采集到的网页进行处理,提取产品对象及产品评价短语,根据产品主题模型,计算网页与主题的相关度,高于预设的阈值的网页保留,然后再计算页面的产品评价的情感倾向值,包括:
提取网页的正文,并提取网页的正文的特征向量;
根据特征向量的夹角的余弦值来计算提取网页的相似度,去除重复的网页;
从剩余的网页中抽取评价对象,根据所述评价对象计算与所述产品主题的相关度;
抽取未丢弃网页中的产品评价短语;
据不同类型的产品评价短语分别计算其情感倾向值;
计算每个未丢弃网页的情感倾向值。
进一步的,在上述方法中,从剩余的网页中抽取评价对象,根据所述评价对象计算与所述产品主题的相关度,包括:
对剩余的网页中的文本进行分词,根据分词的词性标注的出现规则抽取候选评价对象;
从召回率的角度出发,尽可能多的收集剩余的网页中评价对象的词性规则;
网页采用产品对象及关系的特征向量来表示,产品主题的各个子类的概念也是特征向量,根据向量空间模型,两特征向量夹角的余弦值表示它们的相关度,由此计算出一个网页与主题的相关度,并记录下来;
根据设定的相关度阈值,将低于相关度阈值的网页丢弃。
进一步的,在上述方法中,抽取未丢弃网页中的产品评价短语,包括:
根据情感词词典,以情感词为中心,通过所述评价对象、程度词和否定词的修饰成分来识别评价短语。
进一步的,在上述方法中,根据情感词词典,以情感词为中心,通过所述评价对象、程度词和否定词的修饰成分来识别评价短语的步骤中,根据情感词、否定词、程度词及其他成分,将产品评价短语划分为5类。
进一步的,在上述方法中,计算每个未丢弃网页的情感倾向值,包括:
通过每个未丢弃网页的各评价短语的权值之和,来判断每个未丢弃网页的情感倾向性。
进一步的,在上述方法中,通过每个未丢弃网页的各评价短语的权值之和中,
通过公式计算每个未丢弃网页的各评价短语的权值之和,其中,WS(CT)表示一个未丢弃网页中评价短语的情感倾向值,Document表示一个未丢弃网页的情感倾向值,若Document大于0,该文本为正面评价;若Document小于0,则该文本为负面评价。
进一步的,在上述方法中,用户在进行搜索时,选择要进行搜索的产品主题,然后根据关键词进行搜索,搜索结果按照情感倾向性的降序排序,包括:
用户输入关键字后,在选定的产品主题中进行搜索;
根据用户选择的主题及关键字与采集到的网页进行匹配,然后根据与产品主题的相关性的高低及网页的情感倾向值,按照情感倾向性的降序排序显示出相应的网页。
与现有技术相比,本发明在保证查全率的前提下,根据产品的主题模型,抽取产品评价对象,并根据情感词词典分析产品评价的情感倾向性,排序后输出,从而得到更高的查准率。本发明对产品评价的主题采用产品对象、产品评价短语和情感倾向值的三元组表示,能够更清楚地表达不同产品评价的情感倾向。另外,对采集的页面从两个方面进行评分,与主题的相关度和产品评价的情感倾向值,更好地满足用户不仅对产品评价,还对评价的情感倾向感兴趣的需要,因此提高了搜索的准确性。
附图说明
图1是本发明一实施例的基于情感倾向的产品评论主题搜索方法的流程图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明提供一种基于情感倾向的产品评论主题搜索方法,包括:
步骤S1,建立各种产品的主题模型,其中,每个主题模型包括多个产品主题;
步骤S2,对每个产品主题根据设定的种子网址进行爬行,对爬行采集到的网页进行处理,提取产品对象及产品评价短语,根据产品主题模型,计算网页与主题的相关度,高于预设的阈值的网页保留,然后再计算页面的产品评价的情感倾向值;
步骤S3,用户在进行搜索时,选择要进行搜索的产品主题,然后根据关键词进行搜索,搜索结果按照情感倾向性的降序排序。
优选的,步骤S1,建立各种产品的主题模型,包括:
主题模型采取三元组Topic(C,W,V)来表示,形成主题树结构,其中:C表示产品对象;W表示产品评价短语;V表示产品评价的情感倾向值,C采用向量空间模型(VSM)来表示,使用二元组Ci(Keyi,Weighti),其中,Keyi表示关键词,Weighti表示关键词的权重,产品评价的情感倾向值V介于-1和1之间,正数表示对产品的正面评价,且值越大,情感倾向越高;负数表示对产品的负面评价,且值越小,负面情感倾向就越高。
优选的,对每个产品主题根据设定的种子网址进行爬行,包括:
对每个产品主题设置几个爬行的种子网址,从网络上采集相关网页。
优选的,对爬行采集到的网页进行处理,提取产品对象及产品评价短语,根据产品主题模型,计算网页与主题的相关度,高于预设的阈值的网页保留,然后再计算页面的产品评价的情感倾向值,包括:
(1)提取网页的正文,并提取网页的正文的特征向量;
(2)网页去重:根据特征向量的夹角的余弦值来计算提取网页的相似度,去除重复的网页;
(3)从剩余的网页中抽取评价对象,根据所述评价对象计算与所述产品主题的相关度;较佳的,本步骤包括:对剩余的网页中的文本进行分词,根据分词的词性标注的出现规则抽取候选评价对象;从召回率的角度出发,尽可能多的收集剩余的网页中评价对象的词性规则;网页采用产品对象及关系的特征向量来表示,产品主题的各个子类的概念也是特征向量,根据向量空间模型,两特征向量夹角的余弦值表示它们的相关度,由此可以计算出一个网页与主题的相关度Simj,并记录下来;同时根据设定的相关度阈值,将低于相关度阈值的网页丢弃;
(4)抽取未丢弃网页中的产品评价短语:根据情感词词典,以情感词为中心,通过所述评价对象、程度词和否定词的修饰成分来识别评价短语;较佳的,根据情感词、否定词、程度词及其他成分,将产品评价短语划分为5类;
(5)计算所述评价短语的情感倾向值:根据不同类型的产品评价短语分别计算其情感倾向值;
(6)计算每个未丢弃网页的情感倾向值:通过每个未丢弃网页的各评价短语的权值之和,来判断每个未丢弃网页的情感倾向性;较佳的,通过公式计算每个未丢弃网页的各评价短语的权值之和,其中,WS(CT)表示一个未丢弃网页中评价短语的情感倾向值,Document表示一个未丢弃网页的情感倾向值,若Document大于0,该文本为正面评价;若Document小于0,则该文本为负面评价。
优选的,步骤S3,用户在进行搜索时,选择要进行搜索的产品主题,然后根据关键词进行搜索,搜索结果按照情感倾向性的降序排序,包括:
用户输入关键字后,在选定的产品主题中进行搜索;
根据用户选择的主题及关键字与采集到的网页进行匹配,然后根据与产品主题的相关性的高低及网页的情感倾向值,按照情感倾向性的降序排序显示出相应的网页。
综上所述,本发明在保证查全率的前提下,根据产品的主题模型,抽取产品评价对象,并根据情感词词典分析产品评价的情感倾向性,排序后输出,从而得到更高的查准率。本发明对产品评价的主题采用产品对象、产品评价短语和情感倾向值的三元组表示,能够更清楚地表达不同产品评价的情感倾向。另外,对采集的页面从两个方面进行评分,与主题的相关度和产品评价的情感倾向值,更好地满足用户不仅对产品评价,还对评价的情感倾向感兴趣的需要,因此提高了搜索的准确性。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
显然,本领域的技术人员可以对发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。

Claims (10)

1.一种基于情感倾向的产品评论主题搜索方法,其特征在于,包括:
建立各种产品的主题模型,其中,每个主题模型包括多个产品主题;
对每个产品主题根据设定的种子网址进行爬行,对爬行采集到的网页进行处理,提取产品对象及产品评价短语,根据产品主题模型,计算网页与主题的相关度,高于预设的阈值的网页保留,然后再计算页面的产品评价的情感倾向值;
用户在进行搜索时,选择要进行搜索的产品主题,然后根据关键词进行搜索,搜索结果按照情感倾向性的降序排序。
2.如权利要求1所述的基于情感倾向的产品评论主题搜索方法,其特征在于,建立各种产品的主题模型,包括:
主题模型采取三元组Topic(C,W,V)来表示,形成主题树结构,其中:C表示产品对象;W表示产品评价短语;V表示产品评价的情感倾向值,C采用向量空间模型(VSM)来表示,使用二元组Ci(Keyi,Weighti),其中,Keyi表示关键词,Weighti表示关键词的权重,产品评价的情感倾向值V介于-1和1之间,正数表示对产品的正面评价,且值越大,情感倾向越高;负数表示对产品的负面评价,且值越小,负面情感倾向就越高。
3.如权利要求1所述的基于情感倾向的产品评论主题搜索方法,其特征在于,对每个产品主题根据设定的种子网址进行爬行,包括:
对每个产品主题设置几个爬行的种子网址,从网络上采集相关网页。
4.如权利要求1所述的基于情感倾向的产品评论主题搜索方法,其特征在于,对爬行采集到的网页进行处理,提取产品对象及产品评价短语,根据产品主题模型,计算网页与主题的相关度,高于预设的阈值的网页保留,然后再计算页面的产品评价的情感倾向值,包括:
提取网页的正文,并提取网页的正文的特征向量;
根据特征向量的夹角的余弦值来计算提取网页的相似度,去除重复的网页;
从剩余的网页中抽取评价对象,根据所述评价对象计算与所述产品主题的相关度;
抽取未丢弃网页中的产品评价短语;
据不同类型的产品评价短语分别计算其情感倾向值;
计算每个未丢弃网页的情感倾向值。
5.如权利要求4所述的基于情感倾向的产品评论主题搜索方法,其特征在于,从剩余的网页中抽取评价对象,根据所述评价对象计算与所述产品主题的相关度,包括:
对剩余的网页中的文本进行分词,根据分词的词性标注的出现规则抽取候选评价对象;
从召回率的角度出发,尽可能多的收集剩余的网页中评价对象的词性规则;
网页采用产品对象及关系的特征向量来表示,产品主题的各个子类的概念也是特征向量,根据向量空间模型,两特征向量夹角的余弦值表示它们的相关度,由此计算出一个网页与主题的相关度,并记录下来;
根据设定的相关度阈值,将低于相关度阈值的网页丢弃。
6.如权利要求4所述的基于情感倾向的产品评论主题搜索方法,其特征在于,抽取未丢弃网页中的产品评价短语,包括:
根据情感词词典,以情感词为中心,通过所述评价对象、程度词和否定词的修饰成分来识别评价短语。
7.如权利要求6所述的基于情感倾向的产品评论主题搜索方法,其特征在于,根据情感词词典,以情感词为中心,通过所述评价对象、程度词和否定词的修饰成分来识别评价短语的步骤中,根据情感词、否定词、程度词及其他成分,将产品评价短语划分为5类。
8.如权利要求4所述的基于情感倾向的产品评论主题搜索方法,其特征在于,计算每个未丢弃网页的情感倾向值,包括:
通过每个未丢弃网页的各评价短语的权值之和,来判断每个未丢弃网页的情感倾向性。
9.如权利要求8所述的基于情感倾向的产品评论主题搜索方法,其特征在于,通过每个未丢弃网页的各评价短语的权值之和中,
通过公式计算每个未丢弃网页的各评价短语的权值之和,其中,WS(CT)表示一个未丢弃网页中评价短语的情感倾向值,Document表示一个未丢弃网页的情感倾向值,若Document大于0,该文本为正面评价;若Document小于0,则该文本为负面评价。
10.如权利要求1所述的基于情感倾向的产品评论主题搜索方法,其特征在于,用户在进行搜索时,选择要进行搜索的产品主题,然后根据关键词进行搜索,搜索结果按照情感倾向性的降序排序,包括:
用户输入关键字后,在选定的产品主题中进行搜索;
根据用户选择的主题及关键字与采集到的网页进行匹配,然后根据与产品主题的相关性的高低及网页的情感倾向值,按照情感倾向性的降序排序显示出相应的网页。
CN201511003818.XA 2015-12-28 2015-12-28 基于情感倾向的产品评论主题搜索方法 Pending CN105512333A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201511003818.XA CN105512333A (zh) 2015-12-28 2015-12-28 基于情感倾向的产品评论主题搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511003818.XA CN105512333A (zh) 2015-12-28 2015-12-28 基于情感倾向的产品评论主题搜索方法

Publications (1)

Publication Number Publication Date
CN105512333A true CN105512333A (zh) 2016-04-20

Family

ID=55720313

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511003818.XA Pending CN105512333A (zh) 2015-12-28 2015-12-28 基于情感倾向的产品评论主题搜索方法

Country Status (1)

Country Link
CN (1) CN105512333A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021562A (zh) * 2016-05-31 2016-10-12 北京京拍档科技有限公司 用于电商平台的基于主题相关的推荐方法
CN106469145A (zh) * 2016-09-30 2017-03-01 中科鼎富(北京)科技发展有限公司 文本情感分析方法及装置
CN107220352A (zh) * 2017-05-31 2017-09-29 北京百度网讯科技有限公司 基于人工智能构建评论图谱的方法和装置
CN107305574A (zh) * 2016-04-25 2017-10-31 百度在线网络技术(北京)有限公司 对象搜索方法及装置
CN107767195A (zh) * 2016-08-16 2018-03-06 阿里巴巴集团控股有限公司 描述信息的展示***和展示、生成方法及电子设备
CN110096694A (zh) * 2018-01-30 2019-08-06 北京京东尚科信息技术有限公司 基于自然语言处理的信息生成方法和装置
CN110674415A (zh) * 2019-09-20 2020-01-10 北京浪潮数据技术有限公司 一种信息显示方法、装置及服务器
CN113254777A (zh) * 2021-06-07 2021-08-13 武汉卓尔数字传媒科技有限公司 信息推荐方法、装置、电子设备及存储介质
CN115795040A (zh) * 2023-02-10 2023-03-14 成都桉尼维尔信息科技有限公司 一种用户画像分析方法及***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102236722A (zh) * 2011-08-17 2011-11-09 广州索答信息科技有限公司 一种基于三元组的用户评论摘要的生成方法与***
CN103823893A (zh) * 2014-03-11 2014-05-28 北京大学 一种基于用户评论的产品检索方法及产品检索***
CN104484815A (zh) * 2014-12-18 2015-04-01 刘耀强 基于模糊本体面向产品方面的情感分析方法及***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102236722A (zh) * 2011-08-17 2011-11-09 广州索答信息科技有限公司 一种基于三元组的用户评论摘要的生成方法与***
CN103823893A (zh) * 2014-03-11 2014-05-28 北京大学 一种基于用户评论的产品检索方法及产品检索***
CN104484815A (zh) * 2014-12-18 2015-04-01 刘耀强 基于模糊本体面向产品方面的情感分析方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杜霖: "《基于句子结构化特征的情感倾向分析》", 《中国优秀硕士学位论文全文数据库》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107305574A (zh) * 2016-04-25 2017-10-31 百度在线网络技术(北京)有限公司 对象搜索方法及装置
CN106021562B (zh) * 2016-05-31 2019-05-24 北京京拍档科技有限公司 用于电商平台的基于主题相关的推荐方法
CN106021562A (zh) * 2016-05-31 2016-10-12 北京京拍档科技有限公司 用于电商平台的基于主题相关的推荐方法
CN107767195A (zh) * 2016-08-16 2018-03-06 阿里巴巴集团控股有限公司 描述信息的展示***和展示、生成方法及电子设备
CN106469145A (zh) * 2016-09-30 2017-03-01 中科鼎富(北京)科技发展有限公司 文本情感分析方法及装置
CN107220352B (zh) * 2017-05-31 2020-12-08 北京百度网讯科技有限公司 基于人工智能构建评论图谱的方法和装置
US10642938B2 (en) 2017-05-31 2020-05-05 Beijing Baidu Netcom Science And Technology Co., Ltd. Artificial intelligence based method and apparatus for constructing comment graph
CN107220352A (zh) * 2017-05-31 2017-09-29 北京百度网讯科技有限公司 基于人工智能构建评论图谱的方法和装置
CN110096694A (zh) * 2018-01-30 2019-08-06 北京京东尚科信息技术有限公司 基于自然语言处理的信息生成方法和装置
CN110674415A (zh) * 2019-09-20 2020-01-10 北京浪潮数据技术有限公司 一种信息显示方法、装置及服务器
CN110674415B (zh) * 2019-09-20 2022-06-17 北京浪潮数据技术有限公司 一种信息显示方法、装置及服务器
CN113254777A (zh) * 2021-06-07 2021-08-13 武汉卓尔数字传媒科技有限公司 信息推荐方法、装置、电子设备及存储介质
CN115795040A (zh) * 2023-02-10 2023-03-14 成都桉尼维尔信息科技有限公司 一种用户画像分析方法及***

Similar Documents

Publication Publication Date Title
CN105512333A (zh) 基于情感倾向的产品评论主题搜索方法
CN106649260B (zh) 基于评论文本挖掘的产品特征结构树构建方法
CN103544255B (zh) 基于文本语义相关的网络舆情信息分析方法
KR102080362B1 (ko) 쿼리 확장
CN101320375B (zh) 基于用户点击行为的数字图书搜索方法
CN106599054B (zh) 一种题目分类及推送的方法及***
CN103226578B (zh) 面向医学领域的网站识别和网页细分类的方法
CN106156372B (zh) 一种互联网网站的分类方法及装置
CN108197117A (zh) 一种基于文档主题结构与语义的中文文本关键词提取方法
CN103838833A (zh) 基于相关词语语义分析的全文检索***
CN106339502A (zh) 一种基于用户行为数据分片聚类的建模推荐方法
JP2005085285A5 (zh)
CN104778209A (zh) 一种针对千万级规模新闻评论的观点挖掘方法
CN104866572A (zh) 一种网络短文本聚类方法
CN104866554B (zh) 一种基于社会化标注的个性化搜索方法及***
CN101127042A (zh) 一种基于语言模型的情感分类方法
TW201214169A (en) Recognition of target words using designated characteristic values
CN101944099A (zh) 一种使用本体进行文本文档自动分类的方法
CN104317834A (zh) 一种基于深度神经网络的跨媒体排序方法
CN106126502A (zh) 一种基于支持向量机的情感分类***及方法
Sabuna et al. Summarizing Indonesian text automatically by using sentence scoring and decision tree
CN103049470A (zh) 基于情感相关度的观点检索方法
CN106484797A (zh) 基于稀疏学习的突发事件摘要抽取方法
CN110543595A (zh) 一种站内搜索***及方法
CN107203520A (zh) 酒店情感词典的建立方法、评论的情感分析方法及***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160420

WD01 Invention patent application deemed withdrawn after publication