CN106250513B - 一种基于事件建模的事件个性化分类方法及*** - Google Patents

一种基于事件建模的事件个性化分类方法及*** Download PDF

Info

Publication number
CN106250513B
CN106250513B CN201610630479.6A CN201610630479A CN106250513B CN 106250513 B CN106250513 B CN 106250513B CN 201610630479 A CN201610630479 A CN 201610630479A CN 106250513 B CN106250513 B CN 106250513B
Authority
CN
China
Prior art keywords
event
classification
library
theme
news
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201610630479.6A
Other languages
English (en)
Other versions
CN106250513A (zh
Inventor
陈雁
郭培伦
李平
孙先
杨先凤
胡栋
韩修龙
陈凯琪
朱鹏军
彭欣宇
刘婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Petroleum University
Original Assignee
Southwest Petroleum University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Petroleum University filed Critical Southwest Petroleum University
Priority to CN201610630479.6A priority Critical patent/CN106250513B/zh
Publication of CN106250513A publication Critical patent/CN106250513A/zh
Application granted granted Critical
Publication of CN106250513B publication Critical patent/CN106250513B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9562Bookmark management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于事件建模的事件个性化分类方法及***,方法包括1.对于每日发生的新闻,以及对应的微博及各大论坛上的评论进行数据爬取,建立新闻库;2.对新闻库中数据进行深度挖掘,建立相应的事件模型,并为每个事件产生多个标签,之后将事件信息保存在事件库中;3.通过客户端引导不同用户输入要求的不同分类情况和每一类的关键词;4.基于事件标签和其他属性,将事件库中的事件按照类别匹配和类别相似性进行不同的类别划分,并以直观方式展示在用户平台。本***能够充分利用现在快速发展的互联网以及大量涌现的新闻数据,实现对新闻事件数据按照不同要求进行个性化分类,并能方便地与各种新闻平台充分对接,为各类平台提供个性化信息服务。

Description

一种基于事件建模的事件个性化分类方法及***
技术领域
本发明涉及社交网络信息处理技术领域,尤其涉及社交网络事件分类的技术领域,特别是一种基于事件建模的事件个性化分类方法及***。
背景技术
随着网络的进一步普及和社交媒体的迅速发展,各种舆论信息以及事件传播的途径越来越多,速度也越来越快,信息量总体呈现一个***的趋势,如果不能对这些信息进行很好的归类处理,就很难帮助用户高效地获取自己想要的信息。
传统的事件分类技术往往是基于确定类别的,也就是事件被分成哪些类别是事先确定的,这样对一个事件库的划分就是确定目标的;另外,传统的分类方法中,一个事件只会被分到某一特定的类,也就是一个事件的类别属性是唯一的。而随着互联网数据量的越来越大,往往一个网站的新闻数据是来源于很多源站,源站的分类标准并不能满足目的网站的分类需求(比如,源站的某一事件被分到科技类,而目标网站没有这个类别)。因此如何利用统一的事件库,根据不同的平台的分类标准对事件进行个性化分类,以方便事件信息在不同平台展示,是在大数据背景下的信息获取和事件分析经常遇到的问题。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于事件建模的事件个性化分类方法及***,利用事件的特征、主题生成一系列事件标签,并根据用户分类需求计算事件标签和分类的相似性,从而对事件进行个性化分类,使一个事件库的事件可以满足不同平台上分类展示的要求。
本发明的目的是通过以下技术方案来实现的:一种基于事件建模的事件个性化分类方法,该方法包括如下步骤:
S1:获取相应时间的动态信息,爬取近x天发生的新闻及对应的微博和各大论坛上的评论,建立新闻库;
S2:对从各大平台获取的数据进行深度挖掘,建立事件模型,并保存到事件库;
S3:根据不同的分类要求对事件进行分类。
所述的步骤S2对数据进行深度挖掘,建立事件模型,并保存到事件库包括如下子步骤:
S21:提取事件语料中的词语,对语料进行分词、去停用词之后,将得到的词语存入词库,更新词库;
S22:获取相应的标识事件的主题分类库,根据语料的词的数量,按照时间窗内所有词的数量级的1/10获取的数据特征,建立主题分类库,对于下一个时间窗,如果词语数量级不变,则主题分类库不变,如果发生较大变化,则重新计算,进而提高分类的准确性;
S23:划分各个事件的主题,利用事件的文本特征来计算事件与各个主题之间的相似程度,保存相似度大于第一阈值的主题;
S24:获取相应的事件的标签,利用已有数据的特征和主题给事件打标签,一个事件可能会存在多个标签,事件库中需要保存阈值大于特定值的标签和每个标签的概率;
S25:建立相应的事件模型,基于事件的主题以及事件具备的标签,建立根据事件的主题或者标签进行分类的模型。
所述的建立主题分类库采用LDA算法。
给事件打标签采用TF-IWF算法或TF-IDF算法,TF-IDF算法公式如下:
Figure GDA0002978596790000031
说明:
Figure GDA0002978596790000032
表示该词在该文章中出现的次数占该文章中总词数的比例,m为该词出现的次数,M为该文章中总单词的数量,N为总的文章数,n为包含该词的文章数;
TF-IWF算法公式如下:
Figure GDA0002978596790000033
说明:
Figure GDA0002978596790000034
表示该词在该文章中出现的次数占该文章中总词数的比例,m为该词出现的次数,M为该文章中总单词的数量,K为包含所有文章中词的总数,k为该词在所有文章中出现的次数。
所述的步骤S3对事件进行分类包括如下子步骤:
S31:获取分类要求;
S32:首先根据事件词向量或Jaccard相似性计算方法计算主题跟对应主题分类库中的主题的相似程度,如果事件主题的匹配程度超过一个提前设定好的阈值Q,就划分到该主题;同理,计算该事件的标签类别;如果该事件的主题跟所有主题库中的主题相似程度均没有超过设定的阈值Q,那么找出K个相对来说最相似的主题,作为该事件的主题类别;同理,得到该事件的标签,其中K为预设的数值。
所述的Jaccard相似性计算方法的计算公式为:
Figure GDA0002978596790000035
所述的分类要求包括分成哪些类,每个类别的关键词以及一个事件能否属于多个类。
一种基于事件建模的事件个性化分类***,它包括:
数据爬取模块,该模块主要用于对各大新闻网站信息以及相关论坛和微博及其相关评论信息的爬取;
新闻库,存储数据爬取模块爬取的各类新闻和评论;
事件分析模块,该模块主要用于对新闻库中的信息进行数据挖掘和事件建模;
事件库,保存事件分析模块生成的各类事件信息;
分类模块,该模块主要获取分类标准,按照分类标准和分类规则进行分类;
用户前端模块,为用户提供界面方便其录入类别划分方法,用户通常为某网站或信息平台的管理人员;
用户后端模块,该模块主要调用分类模块的分类函数,根据用户的分类标准得到分类结果,分类结果存储后提供给特定网站进行调用。
本发明的有益效果是:本发明提供了一种基于事件建模的事件个性化分类方法及***,利用事件的特征、主题生成一系列事件标签,并根据用户分类需求计算事件标签和分类的相似性,从而对事件进行个性化分类,使一个事件库的事件可以满足不同平台上分类展示的要求;获取互联网大规模的实时事件数据进行分析,事件的规模由爬取的源站数量决定;对事件库中的事件进行多标签的标记,各个标签有特定权重,可以方便计算事件类别归属;可以灵活地按照用户要求对事件进行个性化分类,不再局限于特定的分类方式。
附图说明
图1为本发明方法的流程图;
图2为本发明的***框图。
具体实施方式
下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
一种基于事件建模的事件个性化分类方法,该方法包括如下步骤:
S1:获取相应时间的动态信息,爬取近x天发生的新闻及对应的微博和各大论坛上的评论,建立新闻库;
S2:对从各大平台获取的数据进行深度挖掘,建立事件模型,并保存到事件库;
S3:根据不同的分类要求对事件进行分类。
所述的步骤S2对数据进行深度挖掘,建立事件模型,并保存到事件库包括如下子步骤:
S21:提取事件语料中的词语,对语料进行分词、去停用词之后,将得到的词语存入词库,更新词库;
S22:获取相应的标识事件的主题分类库,根据语料的词的数量,按照时间窗内所有词的数量级的1/10获取的数据特征,建立主题分类库,对于下一个时间窗,如果词语数量级不变,则主题分类库不变,如果发生较大变化,则重新计算,进而提高分类的准确性,时间窗根据实际需要来定,一般定为一周;
S23:划分各个事件的主题,利用事件的文本特征来计算事件与各个主题之间的相似程度,保存相似度大于第一阈值的主题,第一阈值根据对相似程度的大小需求来定阈值;
S24:获取相应的事件的标签,利用已有数据的特征和主题给事件打标签,一个事件可能会存在多个标签,事件库中需要保存阈值大于特定值的标签和每个标签的概率;
S25:建立相应的事件模型,基于事件的主题以及事件具备的标签,建立根据事件的主题或者标签进行分类的模型。
所述的建立主题分类库采用LDA算法。
给事件打标签采用TF-IWF算法或TF-IDF算法,TF-IDF算法公式如下:
Figure GDA0002978596790000061
说明:
Figure GDA0002978596790000062
表示该词在该文章中出现的次数占该文章中总词数的比例,m为该词出现的次数,M为该文章中总单词的数量,N为总的文章数,n为包含该词的文章数;
TF-IWF算法公式如下:
Figure GDA0002978596790000063
说明:
Figure GDA0002978596790000064
表示该词在该文章中出现的次数占该文章中总词数的比例,m为该词出现的次数,M为该文章中总单词的数量,K为包含所有文章中词的总数,k为该词在所有文章中出现的次数。
所述的步骤S3对事件进行分类包括如下子步骤:
S31:获取分类要求;
S32:首先根据事件词向量或Jaccard相似性计算方法计算主题跟对应主题分类库中的主题的相似程度,如果事件主题的匹配程度超过一个提前设定好的阈值Q,就划分到该主题;同理,计算该事件的标签类别;如果该事件的主题跟所有主题库中的主题相似程度均没有超过设定的阈值Q,那么找出K个相对来说最相似的主题,作为该事件的主题类别;同理,得到该事件的标签,其中K为预设的数值。
所述的Jaccard相似性计算方法的计算公式为:
Figure GDA0002978596790000065
所述的分类要求包括分成哪些类,每个类别的关键词以及一个事件能否属于多个类。
如图2所示,一种基于事件建模的事件个性化分类***,它包括:
数据爬取模块,该模块主要用于对各大新闻网站信息以及相关论坛和微博及其相关评论信息的爬取;
新闻库,存储数据爬取模块爬取的各类新闻和评论;
事件分析模块,该模块主要用于对新闻库中的信息进行数据挖掘和事件建模;
事件库,保存事件分析模块生成的各类事件信息;
分类模块,该模块主要获取分类标准,按照分类标准和分类规则进行分类;
用户前端模块,为用户提供界面方便其录入类别划分方法,用户通常为某网站或信息平台的管理人员;
用户后端模块,该模块主要调用分类模块的分类函数,根据用户的分类标准得到分类结果,分类结果存储后提供给特定网站进行调用。
下面结合图1对本发明作进一步详细的说明,本实施例使用浏览器为载体,主要的流程如下:
步骤一、对于每日发生的新闻,以及对应的微博等各大论坛上的评论进行数据爬取,建立新闻库。主要网站包括:网易、腾讯、人民网、天涯、91等各大网站的新闻及相关评论的爬取。
步骤二、对从各大新闻和论坛平台爬取的数据进行深度挖掘,建立相应的事件模型,并保存在事件库中。主要分为四个步骤:数据预处理,主题提取,标签提取,事件聚类。然后把建模的事件模型和分析结果存入事件库。
步骤三、设计用户端页面,方便用户输入分类标准。
步骤四、根据用户要求,将事件库中的事件分为社会、娱乐、财经、体育、国际等五个类别,每个类别有一些关键词用于解释这个类别的分类依据。根据这一类别划分,如果某事件的标签有这5个其中之一,则将其划分入该类别,如果没有,则计算标签与类别关键词的相似性,划分到相似性最高的类别。

Claims (5)

1.一种基于事件建模的事件个性化分类方法,其特征在于,该方法包括如下步骤:
S1:获取相应时间的动态信息,爬取近x天发生的新闻及对应的微博和各大论坛上的评论,建立新闻库;
S2:对从各大平台获取的数据进行深度挖掘,建立事件模型,并保存到事件库;
所述的步骤S2对数据进行深度挖掘,建立事件模型,并保存到事件库包括如下子步骤:
S21:提取事件语料中的词语,对语料进行分词、去停用词之后,将得到的词语存入词库,更新词库;
S22:获取相应的标识事件的主题分类库,根据语料的词的数量,按照时间窗内所有词的数量级的1/10获取的数据特征,建立主题分类库,对于下一个时间窗,如果词语数量级不变,则主题分类库不变,如果发生较大变化,则重新计算,进而提高分类的准确性;
S23:划分各个事件的主题,利用事件的文本特征来计算事件与各个主题之间的相似程度,保存相似度大于阈值的主题;
S24:获取相应的事件的标签,利用已有数据的特征和主题给事件打标签,一个事件可能会存在多个标签,事件库中需要保存阈值大于特定值的标签和每个标签的概率;
S25:建立相应的事件模型,基于事件的主题以及事件具备的标签,建立根据事件的主题或者标签进行分类的模型;
S3:根据不同的分类要求对事件进行分类;
所述的步骤S3对事件进行分类包括如下子步骤:
S31:获取分类要求,所述的分类要求包括分成哪些类,每个类别的关键词以及一个事件能否属于多个类;
S32:首先根据事件词向量或Jaccard相似性计算方法计算主题跟对应主题分类库中的主题的相似程度,如果事件主题的匹配程度超过一个提前设定好的阈值Q,就划分到该主题;同理,计算该事件的标签类别;如果该事件的主题跟所有主题库中的主题相似程度均没有超过设定的阈值Q,那么找出K个相对来说最相似的主题,作为该事件的主题类别;同理,得到该事件的标签,其中K为预设的数值。
2.根据权利要求1所述的一种基于事件建模的事件个性化分类方法,其特征在于:所述的建立主题分类库采用LDA算法。
3.根据权利要求1所述的一种基于事件建模的事件个性化分类方法,其特征在于:给事件打标签采用TF-IWF算法或TF-IDF算法,TF-IDF算法公式如下:
Figure FDA0002978596780000021
说明:
Figure FDA0002978596780000022
表示该词在该文章中出现的次数占该文章中总词数的比例,m为该词出现的次数,M为该文章中总单词的数量,N为总的文章数,n为包含该词的文章数;
TF-IWF算法公式如下:
Figure FDA0002978596780000023
说明:
Figure FDA0002978596780000024
表示该词在该文章中出现的次数占该文章中总词数的比例,m为该词出现的次数,M为该文章中总单词的数量,K为包含所有文章中词的总数,k为该词在所有文章中出现的次数。
4.根据权利要求1所述的一种基于事件建模的事件个性化分类方法,其特征在于:所述的Jaccard相似性计算方法的计算公式为:
Figure FDA0002978596780000025
5.根据权利要求1-4任意一项所述的一种基于事件建模的事件个性化分类方法的一种基于事件建模的事件个性化分类***,其特征在于,它包括:
数据爬取模块,该模块主要用于对各大新闻网站信息以及相关论坛和微博及其相关评论信息的爬取;
新闻库,存储数据爬取模块爬取的各类新闻和评论;
事件分析模块,该模块主要用于对新闻库中的信息进行数据挖掘和事件建模;
事件库,保存事件分析模块生成的各类事件信息;
分类模块,该模块主要获取分类标准,按照分类标准和分类规则进行分类;
用户前端模块,为用户提供界面方便其录入类别划分方法,用户通常为某网站或信息平台的管理人员;
用户后端模块,该模块主要调用分类模块的分类函数,根据用户的分类标准得到分类结果,分类结果存储后提供给特定网站进行调用。
CN201610630479.6A 2016-08-02 2016-08-02 一种基于事件建模的事件个性化分类方法及*** Expired - Fee Related CN106250513B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610630479.6A CN106250513B (zh) 2016-08-02 2016-08-02 一种基于事件建模的事件个性化分类方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610630479.6A CN106250513B (zh) 2016-08-02 2016-08-02 一种基于事件建模的事件个性化分类方法及***

Publications (2)

Publication Number Publication Date
CN106250513A CN106250513A (zh) 2016-12-21
CN106250513B true CN106250513B (zh) 2021-04-23

Family

ID=57606479

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610630479.6A Expired - Fee Related CN106250513B (zh) 2016-08-02 2016-08-02 一种基于事件建模的事件个性化分类方法及***

Country Status (1)

Country Link
CN (1) CN106250513B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108320255B (zh) * 2017-01-16 2022-06-21 软通动力信息技术(集团)股份有限公司 一种信息处理方法及装置
CN107797983A (zh) * 2017-04-07 2018-03-13 平安科技(深圳)有限公司 微博数据处理方法、装置、计算机设备及存储介质
CN107231570A (zh) * 2017-06-13 2017-10-03 中国传媒大学 新闻数据内容特征获取***及应用***
CN107562785A (zh) * 2017-07-26 2018-01-09 深圳市赛亿科技开发有限公司 一种阅读内容整理分类方法及设备
CN107741929A (zh) * 2017-10-18 2018-02-27 网智天元科技集团股份有限公司 舆情分析方法及装置
CN108536673B (zh) * 2018-03-16 2022-06-21 数库(上海)科技有限公司 新闻事件抽取方法及装置
CN108763189B (zh) * 2018-04-12 2022-03-25 武汉斗鱼网络科技有限公司 一种直播间内容标签权重计算方法、装置及电子设备
CN109409529B (zh) * 2018-09-13 2020-12-08 北京中科闻歌科技股份有限公司 一种事件认知分析方法、***及存储介质
CN109241438B (zh) * 2018-09-27 2022-06-24 国家计算机网络与信息安全管理中心 基于要素的跨通道热点事件发现方法、装置及存储介质
CN111078867A (zh) * 2018-10-19 2020-04-28 北京国双科技有限公司 一种文本分类方法及装置
CN109299273B (zh) * 2018-11-02 2020-06-23 广州语义科技有限公司 基于改进seq2seq模型的多源多标签文本分类方法及其***
CN110457468B (zh) * 2019-07-05 2022-08-23 武楚荷 一种事件的分类方法、装置以及存储装置
CN111428127B (zh) * 2020-01-21 2023-08-11 江西财经大学 融合主题匹配与双向偏好的个性化事件推荐方法及***
CN111461266B (zh) * 2020-06-18 2020-12-01 爱保科技有限公司 一种车辆定损异常识别方法、装置、服务器以及存储介质
CN112084448B (zh) * 2020-08-31 2024-05-07 北京金堤征信服务有限公司 相似信息处理方法以及装置
CN113435199B (zh) * 2021-07-18 2023-05-26 谢勇 一种性格对应文化的存储读取干涉方法及***
CN113656697B (zh) * 2021-08-24 2023-12-12 北京字跳网络技术有限公司 对象推荐方法、装置、电子设备、存储介质
CN113821754A (zh) * 2021-09-18 2021-12-21 上海观安信息技术股份有限公司 一种敏感数据接口爬虫识别方法及装置
CN115329903B (zh) * 2022-10-12 2023-05-30 福建美舫时代科技有限公司 应用于数字孪生城市的空间数据集成方法及***
CN116634230B (zh) * 2023-05-24 2024-03-22 天津大学 一种基于多通道新媒体热点事件传播效果分析的投放方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102495872A (zh) * 2011-11-30 2012-06-13 中国科学技术大学 对移动设备用户进行个性化新闻推荐的方法和装置
US20120290518A1 (en) * 2011-03-29 2012-11-15 Manyworlds, Inc. Integrated search and adaptive discovery system and method
CN102831234A (zh) * 2012-08-31 2012-12-19 北京邮电大学 基于新闻内容和主题特征的个性化新闻推荐装置和方法
CN104217038A (zh) * 2014-09-30 2014-12-17 中国科学技术大学 一种针对财经新闻的知识网络构建方法
CN105045812A (zh) * 2015-06-18 2015-11-11 上海高欣计算机***有限公司 文本主题的分类方法及***
CN105550365A (zh) * 2016-01-15 2016-05-04 中国科学院自动化研究所 一种基于文本主题模型的可视化分析***

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104679875B (zh) * 2015-03-10 2017-12-15 杭州凡闻科技有限公司 一种基于数字报纸的资讯数据分类方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120290518A1 (en) * 2011-03-29 2012-11-15 Manyworlds, Inc. Integrated search and adaptive discovery system and method
CN102495872A (zh) * 2011-11-30 2012-06-13 中国科学技术大学 对移动设备用户进行个性化新闻推荐的方法和装置
CN102831234A (zh) * 2012-08-31 2012-12-19 北京邮电大学 基于新闻内容和主题特征的个性化新闻推荐装置和方法
CN104217038A (zh) * 2014-09-30 2014-12-17 中国科学技术大学 一种针对财经新闻的知识网络构建方法
CN105045812A (zh) * 2015-06-18 2015-11-11 上海高欣计算机***有限公司 文本主题的分类方法及***
CN105550365A (zh) * 2016-01-15 2016-05-04 中国科学院自动化研究所 一种基于文本主题模型的可视化分析***

Also Published As

Publication number Publication date
CN106250513A (zh) 2016-12-21

Similar Documents

Publication Publication Date Title
CN106250513B (zh) 一种基于事件建模的事件个性化分类方法及***
CN109271512B (zh) 舆情评论信息的情感分析方法、装置及存储介质
CN109325165B (zh) 网络舆情分析方法、装置及存储介质
CN107204184B (zh) 语音识别方法及***
CN109145216A (zh) 网络舆情监控方法、装置及存储介质
CN107220386A (zh) 信息推送方法和装置
WO2019041521A1 (zh) 用户关键词提取装置、方法及计算机可读存储介质
US9436768B2 (en) System and method for pushing and distributing promotion content
CN106547875B (zh) 一种基于情感分析和标签的微博在线突发事件检测方法
CN106874258B (zh) 一种基于汉字属性向量表示的文本相似性计算方法及***
CN103020159A (zh) 一种面向事件的新闻展现方法和装置
CN107944032B (zh) 用于生成信息的方法和装置
CN110321553A (zh) 短文本主题识别方法、装置及计算机可读存储介质
CN108959329B (zh) 一种文本分类方法、装置、介质及设备
CN103970891B (zh) 一种基于情境的用户兴趣信息查询方法
CN112632278A (zh) 一种基于多标签分类的标注方法、装置、设备及存储介质
WO2021184640A1 (zh) 基于稀疏矩阵的产品推送方法、装置、计算机设备及介质
CN107862058B (zh) 用于生成信息的方法和装置
CN106407473B (zh) 一种基于事件相似性建模的获取事件脉络的方法及其***
Chumwatana Using sentiment analysis technique for analyzing Thai customer satisfaction from social media
CN111651559B (zh) 一种基于事件抽取的社交网络用户关系抽取方法
CN113282754A (zh) 针对新闻事件的舆情检测方法、装置、设备和存储介质
CN110019820A (zh) 一种病历中主诉与现病史症状时间一致性检测方法
CN112395391A (zh) 概念图谱构建方法、装置、计算机设备及存储介质
CN103412880A (zh) 一种用于确定多媒体资源间隐式关联信息的方法与设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210423