CN112149422B - 一种基于自然语言的企业新闻动态监测方法 - Google Patents
一种基于自然语言的企业新闻动态监测方法 Download PDFInfo
- Publication number
- CN112149422B CN112149422B CN202011010471.2A CN202011010471A CN112149422B CN 112149422 B CN112149422 B CN 112149422B CN 202011010471 A CN202011010471 A CN 202011010471A CN 112149422 B CN112149422 B CN 112149422B
- Authority
- CN
- China
- Prior art keywords
- news
- business
- enterprise
- entity
- dynamic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012544 monitoring process Methods 0.000 title claims abstract description 16
- 238000012216 screening Methods 0.000 claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 8
- 238000004140 cleaning Methods 0.000 claims abstract description 7
- 230000000694 effects Effects 0.000 claims description 10
- 230000009193 crawling Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 claims description 3
- 238000009960 carding Methods 0.000 claims description 2
- 238000010276 construction Methods 0.000 claims 1
- 238000003058 natural language processing Methods 0.000 abstract description 3
- 230000007115 recruitment Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/258—Heading extraction; Automatic titling; Numbering
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于自然语言的企业新闻动态监测方法,属于自然语言处理领域。该方法包括步骤:步骤1:构建数据库;步骤2:训练命名实体识别NER模型;步骤3:读取新闻数据并进行数据清洗;步骤4:从新闻标题中提取企业实体和业务动态信息;步骤5:从新闻正文中提取企业实体;步骤6:筛选正文企业实体;步骤7:根据筛选后的企业实体从新闻正文中提取相应的业务动态信息;步骤8:将结果写入数据库,以企业为主体建立企业、新闻、业务动态维度的关联关系。本发明可快速、大量、自动化的从网络获取新闻信息,实现企业的高效新闻动态监测;大幅度降低了无关信息对识别结果的干扰,具有较高的稳定性和准确率。
Description
技术领域
本发明属于在自然语言处理领域,涉及一种基于自然语言的企业新闻动态监测方法。
背景技术
随着互联网的普及,以及各类互联网产品的推出,世界走入了信息***时代,网上新闻成为了人们获取信息的重要渠道。互联网上每天都有大量的新闻产生,对于园区管理、招商、运营等需要快速把握企业动态的领域来说,如何从海量的新闻数据中提取到关注的企业动态信息一直是工作中的痛点和难点。
一般的企业新闻动态监测方法大多直接采用企业关键字匹配的办法,直接通过搜索引擎等渠道搜索企业名称,查找相关新闻。该方法门槛较低,在处理的企业新闻动态较少时能取得较好的效果,但在园区招商、管理等对信息处理数据量大、精准度要求较高的环境中,直接搜索不能快速实现对企业动态信息维度的分类,同时企业名称关键字识别不准确,可能会识别出非企业实体的新闻,在数据量较大的情况下掺杂无效信息,降低了信息获取效率和准确性。
发明内容
有鉴于此,本发明的目的在于提供一种基于自然语言的企业新闻动态监测方法。
为达到上述目的,本发明提供如下技术方案:
一种基于自然语言的企业新闻动态监测方法,该方法包括以下步骤:
步骤1:构建数据库;爬取主流新闻网站实时数据构建新闻数据库,通过工商信息爬取和人工添加等方法构建企业数据库,通过人工梳理的方法构建业务动态关键字数据库;
步骤2:训练命名实体识别NER模型;采用成熟的线性链条件随机场(ConditionalRandom Field,CRF)方法和中文语料库训练命名实体识别(Named Entity Recognition,NER)模型;
对新闻数据库中每一条新闻,进行步骤3-8操作:
步骤3:读取新闻数据并进行数据清洗;按照预定方法从新闻数据库中读取新闻标题、新闻源文本、新闻发布时间等维度数据,并对新闻数据清洗,去除无效字符;
步骤4:从新闻标题中提取企业实体和业务动态信息;利用命名实体识别和企业名称匹配的方法从新闻标题文本中提取企业实体,利用文本匹配的方法提取业务动态信息,若标题中可提取到实体,则跳过步骤5,否则转到步骤5;
步骤5:从新闻正文中提取企业实体;利用命名实体识别的方法从新闻正文文本中提取企业实体;
步骤6:筛选正文企业实体;根据新闻正文中出现企业实体次数的数量、排名等信息,筛除关联性不大的企业实体,保留主要企业实体作为该新闻识别结果;
步骤7:根据筛选后的企业实体从新闻正文中提取相应的业务动态信息;查找正文中出现的业务动态关键字,计算各业务动态关键字与企业实体的空间距离,按照距离大小提取业务动态信息;
步骤8:将结果写入数据库;将步骤6中获得的主要企业实体、新闻数据、步骤4和步骤7中获得的涉及业务动态维度,按照预定关联方法写入数据库进行保存,以企业为主体建立企业、新闻、业务动态维度的关联关系。
可选的,所述步骤1中,构建数据库步骤中的企业数据库信息,包括企业基本信息、投融资信息、经营信息、司法欠税信息和产品技术信息的数据维度;动态关键字数据库包括多级关键字。
可选的,所述步骤4中,若标题中提取到企业实体,则有理由认为新闻明确与该企业实体相关联,可省略从新闻正文中再查找筛选企业实体的步骤;
可选的,所述步骤4-6中,判断新闻数据是否与企业相关时,一方面通过实体识别和名称匹配的方法识别出新闻中出现的企业,另一方面通过各企业实体出现的次数、排名、位置等信息构建筛选模型,去除关联性不强的企业,保留新闻涉及的主要企业实体;
具体分为以下步骤:
S01:判断新闻标题中是否出现企业实体;由于大量新闻标题中的企业以企业简称的形式出现,且标题存在语言结构不严谨、实体识别效果不好的现象,因此新闻标题采用文本匹配和实体识别相结合的方法进行判断;对前述企业数据库中的企业名称,包括全称和简称,按文本匹配的方法在新闻标题中查找是否出现企业名称,同时利用NER模型提取标题实体后查结合企业数据库判断该实体是否属于企业,二者结合得到新闻标题中出现的企业实体列表Y*;若Y*不为空集,则完成企业识别,否则转到S02;
S02:判断新闻正文中是否出现企业实体;利用前述NER模型对新闻正文文本进行实体识别,识别结果进行去重后得到实体名称列表Y=(Y1,Y2,Y3...Ym),对Y中每一个实体Yi,在前述企业数据库中查询是否存在该实体,若存在,则表明该实体属于企业;若不存在,则丢弃该实体,得到新闻正文中出现的企业实体列表Y'=(Y1,Y2,Y3...Yn);
S03:筛选企业实体;根据新闻正文中出现企业实体列表Y'中各实体次数的数量、排名等信息,筛除关联性不大的企业实体,具体的筛选逻辑及维度可根据模型实际运行效果进行调整,保留主要企业实体作为该新闻识别结果;
可选的,所述步骤4、步骤7中,判断新闻数据是否与业务动态维度相关时,一方面通过业务关键字匹配的方法识别到业务动态信息,另一方面,通过业务关键字与主要企业实体的空间距离对业务动态维度进行筛选,保留与企业关联性较强的业务动态维度,其中关键字与企业实体的空间距离计算方法和阈值可根据模型实际运行效果进行调整。
本发明的有益效果在于:本发明给出了一种企业新闻动态监测方法,可快速、大量、自动化的从网络获取新闻信息;对新闻信息进行实体识别和业务动态关键字匹配处理后,建立新闻、企业、动态维度三者的关联关系,实现企业的高效新闻动态监测和分类;新闻关联企业识别采用成熟的实体识别算法与企业名称匹配相结合的方法,大幅度降低了无关信息对识别结果的干扰,具有较高的稳定性和准确率。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为本发明实施例中的流程示意图。
图2为本发明实施例中步骤S01至S03的流程示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本发明的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本发明的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
本发明提供了一种基于自然语言处理的企业新闻动态监测方法,首先通过网络爬取或者人工添加的方法构建新闻数据库、业务动态关键字数据库、企业数据库,然后利用线性条件随机场(CRF)方法训练得到命名实体识别(NER)模型,利用NER模型和名称匹配的方法在新闻数据中识别筛选出企业实体,再对新闻数据进行动态关键字匹配,最后将新闻数据、动态关键字、企业实体名称写入数据库,以企业为主体建立企业、新闻、业务动态维度的关联关系。如附图1所示,具体步骤如下:
1.构建数据库。爬取主流新闻网站,如新浪、搜狐、腾讯等网站的公开新闻数据构建新闻数据库;爬取公开的企业信息和人工添加企业等方法构建企业数据库;通过人工梳理监测动态的关键字,如“上市”、“减产”、“签约”等字段,构建监测动态关键字数据库;
2.训练命名实体识别NER模型;采用成熟的线性链条件随机场(ConditionalRandom Field,CRF)方法和中文语料库训练命名实体识别(Named Entity Recognition,NER)模型;
对新闻数据库中每一条新闻,进行步骤3-8操作:
3.读取新闻数据并进行数据清洗;按照预定方法从新闻数据库中读取新闻标题、新闻源文本、新闻发布时间等维度数据,并对新闻数据清洗,去除无效字符;
4.从新闻标题中提取企业实体和业务动态信息;利用命名实体识别和企业名称匹配的方法从新闻标题文本中提取企业实体,利用文本匹配的方法提取业务动态信息,若标题中可提取到实体,则跳过步骤5,否则转到步骤5;
5.从新闻正文中提取企业实体;利用命名实体识别的方法从新闻正文文本中提取企业实体;
6.筛选正文企业实体;根据新闻正文中出现企业实体次数的数量、排名等信息,筛除关联性不大的企业实体,保留主要企业实体作为该新闻识别结果;
7.根据筛选后的企业实体从新闻正文中提取相应的业务动态信息;查找正文中出现的业务动态关键字,计算各业务动态关键字与企业实体的空间距离,按照距离大小提取业务动态信息;
8.将结果写入数据库;将步骤6中获得的主要企业实体、新闻数据、步骤4和步骤7中获得的涉及业务动态维度,按照预定关联方法写入数据库进行保存,以企业为主体建立企业、新闻、业务动态维度的关联关系;
进一步地,构建数据库步骤中的企业数据库信息,包括但不限于企业基本信息、投融资信息、经营信息、司法欠税信息、产品技术信息等数据维度。动态关键字数据库可包括多级关键字,举例如一级关键字为“业务动态”,二级关键字为“业务合作”、“产能动态”、“调研访谈”等,三级关键字为“拜访”、“交流”、“考察”、“调研”等。
进一步的,所述步骤4中,若标题中提取到企业实体,则有理由认为新闻明确与该企业实体相关联,可省略从新闻正文中再查找筛选企业实体的步骤;
进一步的,所述步骤4-6中,判断新闻数据是否与企业相关时,一方面通过实体识别和名称匹配的方法识别出新闻中出现的企业,另一方面通过各企业实体出现的次数、排名、位置等信息构建筛选模型,去除关联性不强的企业,保留新闻涉及的主要企业实体;
具体分为以下步骤:
S01:判断新闻标题中是否出现企业实体;由于大量新闻标题中的企业以企业简称的形式出现,且标题存在语言结构不严谨、实体识别效果不好的现象,因此新闻标题采用文本匹配和实体识别相结合的方法进行判断;对前述企业数据库中的企业名称,包括全称和简称,按文本匹配的方法在新闻标题中查找是否出现企业名称,同时利用NER模型提取标题实体后查结合企业数据库判断该实体是否属于企业,二者结合得到新闻标题中出现的企业实体列表Y*;若Y*不为空集,则完成企业识别,否则转到S02;
S02:判断新闻正文中是否出现企业实体;利用前述NER模型对新闻正文文本进行实体识别,识别结果进行去重后得到实体名称列表Y=(Y1,Y2,Y3...Ym),对Y中每一个实体Yi,在前述企业数据库中查询是否存在该实体,若存在,则表明该实体属于企业;若不存在,则丢弃该实体,得到新闻正文中出现的企业实体列表Y'=(Y1,Y2,Y3...Yn);
S03:筛选企业实体;根据新闻正文中出现企业实体列表Y'中各实体次数的数量、排名等信息,筛除关联性不大的企业实体,具体的筛选逻辑及维度可根据模型实际运行效果进行调整,保留主要企业实体作为该新闻识别结果;
进一步的,所述步骤4、步骤7中,判断新闻数据是否与业务动态维度相关时,一方面通过业务关键字匹配的方法识别到业务动态信息,另一方面,通过业务关键字与主要企业实体的空间距离对业务动态维度进行筛选,保留与企业关联性较强的业务动态维度,其中关键字与企业实体的空间距离计算方法和阈值可根据模型实际运行效果进行调整;
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (5)
1.一种基于自然语言的企业新闻动态监测方法,其特征在于:该方法包括以下步骤:
步骤1:构建数据库;爬取新闻网站实时数据构建新闻数据库,通过工商信息爬取和人工添加的方法构建企业数据库,通过人工梳理的方法构建业务动态关键字数据库;
步骤2:训练命名实体识别NER模型;采用成熟的线性链条件随机场CRF方法和中文语料库训练命名实体识别NER模型;
对新闻数据库中每一条新闻,进行步骤3-8操作:
步骤3:读取新闻数据并进行数据清洗;按照预定方法从新闻数据库中读取新闻标题、新闻源文本、新闻发布时间的维度数据,并对新闻数据清洗,去除无效字符;
步骤4:从新闻标题中提取企业实体和业务动态信息;利用命名实体识别和企业名称匹配的方法从新闻标题文本中提取企业实体,利用文本匹配的方法提取业务动态信息,若新闻标题中可提取到企业实体,则完成企业识别,否则转到步骤5;
步骤5:从新闻正文中提取企业实体;利用命名实体识别的方法从新闻正文文本中提取企业实体;
步骤6:筛选企业实体;根据新闻正文中出现企业实体次数的数量和排名信息,筛除关联性不大的企业实体,保留主要企业实体作为新闻识别结果;
步骤7:根据筛选后的企业实体从新闻正文中提取相应的业务动态信息;查找新闻正文中出现的业务动态关键字,计算各业务动态关键字与筛选后的企业实体的空间距离,按照距离大小提取业务动态信息;
步骤8:将结果写入数据库;将获得的主要企业实体、新闻数据、业务动态信息,按照预定关联方法写入数据库进行保存,以企业为主体建立企业、新闻、业务动态信息的关联关系。
2.根据权利要求1所述的一种基于自然语言的企业新闻动态监测方法,其特征在于:所述步骤1中,构建数据库步骤中的企业数据库信息,包括企业基本信息、投融资信息、经营信息、司法欠税信息和产品技术信息的数据维度;业务动态关键字数据库包括多级关键字。
3.根据权利要求1所述的一种基于自然语言的企业新闻动态监测方法,其特征在于:所述步骤4中,若新闻标题中提取到企业实体,则认为新闻明确与提取到的企业实体相关联,省略从新闻正文中再查找筛选企业实体的步骤。
4.根据权利要求1所述的一种基于自然语言的企业新闻动态监测方法,其特征在于:所述步骤4-6具体包括:
S01:判断新闻标题中是否出现企业实体;新闻标题采用企业名称匹配和命名实体识别相结合的方法进行判断;根据企业数据库中包括全称和简称的企业名称,按文本匹配的方法在新闻标题中查找是否出现企业名称,同时利用NER模型提取新闻标题中的实体,结合企业数据库判断所述新闻标题中的实体是否属于企业,二者结合得到新闻标题中出现的企业实体列表Y*;若Y*不为空集,则完成企业识别,否则转到S02;
S02:判断新闻正文中是否出现企业实体;利用NER模型对新闻正文文本进行实体识别,识别结果进行去重后得到实体名称列表Y=(Y1,Y2,Y3...Ym),对Y中每一个实体Yi,在企业数据库中查询是否存在该实体,若存在,则表明该实体属于企业;若不存在,则丢弃该实体,得到新闻正文中出现的企业实体列表Y'=(Y1,Y2,Y3...Yn);
S03:筛选企业实体;根据新闻正文的企业实体列表Y'中各实体出现次数的数量和排名信息,筛除关联性不大的企业实体,具体的筛选逻辑及维度根据实际效果进行调整,保留主要企业实体作为新闻识别结果。
5.根据权利要求1所述的一种基于自然语言的企业新闻动态监测方法,其特征在于:所述步骤4中,通过业务动态关键字匹配的方法识别业务动态信息;所述步骤7中,通过业务动态关键字与主要企业实体的空间距离对业务动态信息进行筛选,其中空间距离计算方法和阈值根据实际效果进行调整。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011010471.2A CN112149422B (zh) | 2020-09-23 | 2020-09-23 | 一种基于自然语言的企业新闻动态监测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011010471.2A CN112149422B (zh) | 2020-09-23 | 2020-09-23 | 一种基于自然语言的企业新闻动态监测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112149422A CN112149422A (zh) | 2020-12-29 |
CN112149422B true CN112149422B (zh) | 2024-04-05 |
Family
ID=73896286
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011010471.2A Active CN112149422B (zh) | 2020-09-23 | 2020-09-23 | 一种基于自然语言的企业新闻动态监测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112149422B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113129072A (zh) * | 2021-04-30 | 2021-07-16 | 上海药慧信息技术有限公司 | 一种基于投融资信息的企业估值确定方法及装置 |
CN113689299B (zh) * | 2021-05-10 | 2023-10-20 | 深圳价值在线信息科技股份有限公司 | 新闻信息指数模型的构建方法及新闻信息分析方法 |
CN115357688B (zh) * | 2022-10-12 | 2023-02-21 | 北京金堤科技有限公司 | 企业名单信息获取方法、装置、存储介质和电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109033200A (zh) * | 2018-06-29 | 2018-12-18 | 北京百度网讯科技有限公司 | 事件抽取的方法、装置、设备及计算机可读介质 |
CN110516077A (zh) * | 2019-08-20 | 2019-11-29 | 北京中亦安图科技股份有限公司 | 面向企业商情的知识图谱构建方法及装置 |
CN110929134A (zh) * | 2019-12-04 | 2020-03-27 | 深圳市新国都金服技术有限公司 | 投融资数据管理方法、装置、计算机设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160283876A1 (en) * | 2015-03-24 | 2016-09-29 | Tata Consultancy Services Limited | System and method for providing automomous contextual information life cycle management |
-
2020
- 2020-09-23 CN CN202011010471.2A patent/CN112149422B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109033200A (zh) * | 2018-06-29 | 2018-12-18 | 北京百度网讯科技有限公司 | 事件抽取的方法、装置、设备及计算机可读介质 |
CN110516077A (zh) * | 2019-08-20 | 2019-11-29 | 北京中亦安图科技股份有限公司 | 面向企业商情的知识图谱构建方法及装置 |
CN110929134A (zh) * | 2019-12-04 | 2020-03-27 | 深圳市新国都金服技术有限公司 | 投融资数据管理方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112149422A (zh) | 2020-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111723215B (zh) | 基于文本挖掘的生物技术信息知识图谱构建装置与方法 | |
CN111353030B (zh) | 基于旅游领域知识图谱的知识问答检索方法及装置 | |
CN112149422B (zh) | 一种基于自然语言的企业新闻动态监测方法 | |
CN103544255B (zh) | 基于文本语义相关的网络舆情信息分析方法 | |
Morita et al. | Information filtering based on user behavior analysis and best match text retrieval | |
CN102054015B (zh) | 使用有机物件数据模型来组织社群智能信息的***及方法 | |
CN110968684B (zh) | 一种信息处理方法、装置、设备及存储介质 | |
US20140304267A1 (en) | Suffix tree similarity measure for document clustering | |
CN111767716B (zh) | 企业多级行业信息的确定方法、装置及计算机设备 | |
CN112559684A (zh) | 一种关键词提取及信息检索方法 | |
KR20150096295A (ko) | 문답 데이터베이스 구축 시스템 및 방법, 그리고 이를 이용한 검색 시스템 및 방법 | |
CN110737821B (zh) | 相似事件查询的方法、装置、存储介质和终端设备 | |
CN111160019B (zh) | 一种舆情监测的方法、装置及*** | |
CN105893611A (zh) | 一种构建面向社交网络的兴趣主题语义网络的方法 | |
CN109460477B (zh) | 信息收集分类***和方法及其检索和集成方法 | |
CN111191051B (zh) | 一种基于中文分词技术的应急知识图谱的构建方法及*** | |
CN111475625A (zh) | 基于知识图谱的新闻稿件生成方法及*** | |
CN109522396B (zh) | 一种面向国防科技领域的知识处理方法及*** | |
CN106649308B (zh) | 一种分词词库更新方法及*** | |
CN113282754A (zh) | 针对新闻事件的舆情检测方法、装置、设备和存储介质 | |
CN111241299A (zh) | 一种法律咨询的知识图谱自动构建方法及其检索*** | |
CN116628173B (zh) | 一种基于关键字提取的智能客服信息生成***及生成方法 | |
CN112711716A (zh) | 一种基于知识图谱的海洋产业新闻推送方法及*** | |
CN104462065A (zh) | 事件情感类型的分析方法和装置 | |
CN107169065B (zh) | 一种特定内容的去除方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |