CN112395410A - 一种基于实体抽取的产业舆情推荐方法、装置及电子设备 - Google Patents

一种基于实体抽取的产业舆情推荐方法、装置及电子设备 Download PDF

Info

Publication number
CN112395410A
CN112395410A CN202110039121.7A CN202110039121A CN112395410A CN 112395410 A CN112395410 A CN 112395410A CN 202110039121 A CN202110039121 A CN 202110039121A CN 112395410 A CN112395410 A CN 112395410A
Authority
CN
China
Prior art keywords
public opinion
entity
industry
enterprise
opinion data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110039121.7A
Other languages
English (en)
Other versions
CN112395410B (zh
Inventor
孙会峰
邢婷
李健诚
金成振
易航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhiyuan Artificial Intelligence Research Institute
Original Assignee
Beijing Zhiyuan Artificial Intelligence Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhiyuan Artificial Intelligence Research Institute filed Critical Beijing Zhiyuan Artificial Intelligence Research Institute
Priority to CN202110039121.7A priority Critical patent/CN112395410B/zh
Publication of CN112395410A publication Critical patent/CN112395410A/zh
Application granted granted Critical
Publication of CN112395410B publication Critical patent/CN112395410B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于实体抽取的产业舆情推荐方法、装置及电子设备方法,包括:获取产业舆情数据;基于命名实体识别模型从所述产业舆情数据中识别实体;根据所识别的实体为所述产业舆情数据生成标签;基于所述标签向用户推荐所述产业舆情数据。该方法能够有效解决现有的未细分到各产业各地区,新闻处理颗粒度较粗,且客群大多是针对个人用户,无法满足不同产业企业用户需求的问题。

Description

一种基于实体抽取的产业舆情推荐方法、装置及电子设备
技术领域
本发明涉及新闻文本处理技术领域,尤其涉及一种基于实体抽取的产业舆情推荐方法、装置及电子设备。
背景技术
对于企业而言,需要及时获取相关的新闻等舆情情报以调整经营行为,然而伴随着互联网的发展,新闻的数据量日益繁多,企业用户如何从大量新闻中,及时准确地获取有价值的新闻成为一个难点。目前的新闻推荐通常是针对个人用户的,大都是将新闻划分为经济、体育、娱乐等类型,结合用户浏览数据进行推送,技术实现较为简单,分类颗粒度较粗,其方案无法满足企业用户的需求。
发明内容
本发明提供了一种基于实体抽取的产业舆情推荐方法、装置及电子设备,以满足不同企业类用户准确获取所需的产业舆情的需求。
根据本发明的第一方面,提供了一种基于实体抽取的产业舆情推荐方法,包括:
获取产业舆情数据;
基于命名实体识别模型从所述产业舆情数据中识别预设类型的实体;
根据所识别的实体为所述产业舆情数据生成标签;
基于所述标签向用户推荐所述产业舆情数据,包括:获取用户关联企业的企业名称;基于所述企业名称和预先构建的企业知识图谱确定所述企业的地址、所属产业以及与所述企业关联的其它企业和/或个人;根据所述地点标签查找与所述企业的地址匹配的产业舆情数据,根据所述产业标签查找与所述企业所属产业匹配的产业舆情数据,根据所述个人标签和/或企业标签查找与所述企业关联的其它企业和/或个人匹配的产业舆情数据;将上述查找到的产业舆情数据推荐至所述用户。
进一步地,所述基于命名实体识别模型从所述产业舆情数据中识别实体包括:
将所述产业舆情数据转码为文本信息;
对所述文本信息进行数据预处理,获得包含预设类型的实体的语料;
将所述语料输入预先训练的命名实体识别模型,得到所述语料中每个字的BIO标签,所述BIO标签包括预设类型的信息;
根据所述BIO标签获取预设类型的实体。
进一步地,所述对所述文本信息进行数据预处理,获得包含预设类型的实体的语料包括:
基于预先建立的关键词表,利用正则表达式匹配获得包含预设类型的实体的语料,所述关键词表包括地区名称、企业名称、企业相关的个人姓名。
进一步地,所述预设类型的实体包括人物实体、地点实体、企业实体和产业实体,所述根据所识别的实体为所述产业舆情数据生成标签包括:
根据所述人物实体生成个人标签;
根据所述地点实体生成地点标签;
根据所述企业实体生成企业标签;
根据所述产业实体生成产业标签。
进一步地,所述基于所述标签向用户推荐所述产业舆情数据还包括:
获取所述用户的浏览记录;
根据所述用户的浏览记录查找与先前浏览内容相似的产业舆情数据,推荐至所述用户。
进一步地,按照下述方式预先训练所述命名实体识别模型:
获取产业舆情训练数据;
使用NER模型对所述产业舆情训练数据进行实体预抽取,获得训练语料;
对所述训练语料进行分字并进行BIO实体标注,为每个字标注BIO标签,所述BIO标签包括预设类型的信息;
使用经过BIO实体标注后的训练语料训练BERT+BiLSTM+CRF模型,得到所述命名实体模型。
根据本发明的第二方面,提供了一种基于实体抽取的产业舆情推荐装置,包括:
产业舆情数据获取模块,用于获取产业舆情数据;
产业舆情实体识别模块,用于基于命名实体识别模型从所述产业舆情数据中识别预设类型的实体;
标签生成模块,用于根据所识别的实体为所述产业舆情数据生成标签;
信息推荐模块,用于基于所述标签向用户推荐所述产业舆情数据,包括:获取用户关联企业的企业名称;基于所述企业名称和预先构建的企业知识图谱确定所述企业的地址、所属产业以及与所述企业关联的其它企业和/或个人;根据所述地点标签查找与所述企业的地址匹配的产业舆情数据,根据所述产业标签查找与所述企业所属产业匹配的产业舆情数据,根据所述个人标签和/或企业标签查找与所述企业关联的其它企业和/或个人匹配的产业舆情数据;将上述查找到的产业舆情数据推荐至所述用户。
根据本发明的第三方面,提供了一种电子设备,包括处理器和存储器,所述存储器存储有多条指令,所述处理器用于读取所述多条指令并执行如第一方面所述的方法。
根据本发明的第四方面,提供了一种计算机可读存储介质,所述计算机存储介质存储有多条指令,所述多条指令可被处理器读取并执行如第一方面所述的方法。
本发明提供的基于实体抽取的产业舆情推荐方法、装置及电子设备,能够自动地向企业用户推荐匹配其需求的产业新闻;通过实体抽取生成多个类别的新闻标签,具有更细的颗粒度;通过预先训练的模型识别预设类型的实体且结合企业知识图谱,相比于传统的基于内容和用户的推荐具有更高的准确率和更少的遗漏。
附图说明
图1为本发明提供的基于实体抽取的产业舆情推荐方法一种实施例的流程图。
图2为本发明提供的基于实体抽取的产业舆情推荐装置一种实施例的结构示意图。
图3为本发明提供的电子设备一种实施例的结构示意图。
具体实施方式
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案做详细的说明。
参考图1,在一些实施例中,提供一种图像文档的文本抽取方法,包括:
步骤S101,获取产业舆情数据;
其中,可选地从网络上的公开数据中抓取产业舆情数据,例如从新闻网站、行业论坛、电子商务平台、财报公告等。
步骤S102,基于命名实体识别模型从所述产业舆情数据中识别实体;
步骤S103,根据所识别的实体为所述产业舆情数据生成标签;
步骤S104,基于所述标签向用户推荐所述产业舆情数据。
具体地,步骤S102中,所述基于命名实体识别模型从所述产业舆情数据中识别实体包括:
将所述产业舆情数据转码为文本信息;
对所述文本信息进行数据预处理,获得包含预设类型的实体的语料;
将所述语料输入预先训练的命名实体识别模型,得到所述语料中每个字的BIO标签,所述BIO标签包括预设类型的信息;
根据所述BIO标签获取预设类型的实体。
其中,将所述产业舆情数据转码为文本信息可以采用OCR方法。OCR,光学字符识别(Optical Character Recognition)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。由此,将每条产业舆情数据转化为文本格式。
对文本信息进行数据预处理包括基于预先建立的关键词表,利用正则表达式匹配获得包含预设类型的实体的语料,所述关键词表包括与预设类型的实体相关的地区名称、企业名称、企业相关的个人姓名等。即通过正则表达式匹配的方式将所获得的产业舆情数据与所述关键词表进行对比,筛除与预设类型的实体无关的产业舆情数据,保留包含预设类型的实体的产业舆情数据作为进一步处理的语料。所述预设类型的实体包括人物实体、地点实体、企业实体和产业实体。将所述语料输入预先训练的命名实体识别模型得到每个字的BIO标签,根据所述BIO标签获取预设类型的实体。BIO标签共9个类别:B-PER,I-PER,B-LOC,I-LOC,B-COM,I-COM,B-IND,I-IND,O。得到的BIO标签中,B表示开始,I表示中间部分,O表示其他非相关的词,PER表示人物实体、LOC表示地点实体、COM表示企业实体、IND表示产业实体。
以新闻报道“广东某某美甲创始人王某将在食品领域再次创业。”为例,其BIO标签示例如下:
Figure DEST_PATH_IMAGE001
根据所述BIO标签,可以确定该条新闻报道的实体包括:地点实体“广东”、个人实体“王某”、企业实体“某某美甲”和产业实体“食品”。
可选地,该命名实体识别模型为BERT模型、BiLSTM模型和CRF模型组成的三层模型,通过BERT模型获取字向量,提取文本的重要特征;通过BiLSTM模型深度学习上下文的特征信息,获取上下文有效特征信息,并进行命名实体识别;通过CRF模型对BiLSTM的输出序列处理,结合CRF中的状态转移矩阵,根据相邻之间变迁获得考虑标注序列顺序性的全局最优标注序列。
可选地,按照下述方式预先训练所述命名实体识别模型:
获取产业舆情训练数据;
使用开源的NER模型对所述产业舆情训练数据进行实体预抽取,获得训练语料;
对所述训练语料进行分字并进行BIO实体标注,为每个字标注BIO标签,所述BIO标签包括预设类型的信息;
使用经过BIO实体标注后的训练语料训练BERT+BiLSTM+CRF模型,得到所述命名实体模型。
在步骤S103中,根据所述人物实体生成个人标签;根据所述地点实体生成地点标签;根据所述企业实体生成企业标签;根据所述产业实体生成产业标签。基于以上示例,可获得此条新闻的标签如下:地点标签:广东;个人标签:王某;企业标签:某某美甲;产业标签:食品。
基于上述方式,为获取的每条产业舆情数据都生成标签并对应地存储,从而能够向合适的用户进行推荐。
在步骤S104中,所述基于所述标签向用户推荐所述产业舆情数据包括:获取用户关联企业的企业名称;基于所述企业名称和预先构建的企业知识图谱确定所述企业的地址、所属产业以及与所述企业关联的其它企业和/或个人;根据所述地点标签查找与所述企业的地址匹配的产业舆情数据,根据所述产业标签查找与所述企业所属产业匹配的产业舆情数据,根据所述个人标签和/或企业标签查找与所述企业关联的其它企业和/或个人匹配的产业舆情数据;将上述查找到的产业舆情数据推荐至所述用户。
其中,预先构建的企业知识图谱中包括大量企业的信息以及企业之间的关联关系,企业知识图谱中的实体包括企业名称、个人姓名、产业名称、地址等;关系包括法人代表、董事长、执行董事、监事、企业注册地址、企业办公地址、企业子公司、企业分支机构、企业产业类型、上下游供应关系、竞争、合作、参股、控股等;属性包括企业曾用名、企业简称等。企业知识图谱可以采用现有的方式进行构建,在此不再赘述。
例如对于某企业用户的ID:AAA,确定其企业名称为广州某某食品,则根据企业知识图谱可确定该企业的地址、所属产业、有关联的企业和个人等信息。对于上述示例的新闻报道“广东某某美甲创始人王某将在食品领域再次创业”,其地点标签和产业标签与用户“AAA”的地址和产业匹配,将会从产业舆情数据中查找得到。
可选地,基于所述标签向用户推荐所述产业舆情数据还包括:获取所述用户的浏览记录;根据所述用户的浏览记录查找与先前浏览内容相似的产业舆情数据,推荐至所述用户。
可选地,将上述查找到的产业舆情数据按照预设规则进行二次筛选,将筛选得到的产业舆情数据推荐至所述用户。所述预设规则例如为基于至少两个标签查找得到的产业舆情数据的交集,由此可以提高推荐的适配程度。
可选地,对于上述查找到的或二次筛选后的产业舆情数据,再利用Bert模型分别计算与浏览内容的相似度,选择相似度超过预设阈值的产业舆情数据或者按照相似度由高到低排列后预定范围内的产业舆情数据,推荐给用户。
参考图2,在一些实施例中,提供一种基于实体抽取的产业舆情推荐装置,包括:
产业舆情数据获取模块201,用于获取产业舆情数据;
产业舆情实体识别模块202,用于基于命名实体识别模型从所述产业舆情数据中识别实体;
标签生成模块203,用于根据所识别的实体为所述产业舆情数据生成标签;
信息推荐模块204,用于基于所述标签向用户推荐所述产业舆情数据。
其中,命名实体识别模型包括BERT模块、BLSTM模块和CRF模块,所述BERT模块用于获取字向量,提取TXT文本的重要特征;所述BiLSTM模块用于深度学习上下文的特征信息,获取上下文有效特征信息以解决特征表示的一词多义问题,并进行命名实体识别;所述CRF模块用于对BiLSTM的输出序列处理,结合CRF中的状态转移矩阵,根据相邻之间变迁获得考虑标注序列顺序性的全局最优标注序列。
上述产业舆情推荐装置的各模块执行参照图1所述的实施例中各方法步骤,具体内容参见上文描述,在此不再赘述。
参考图3,在一些实施例中,还提供一种电子设备,包括处理器301和存储器302,存储器302存储有多条指令,处理器301用于基于实体抽取的产业舆情推荐方法,例如获取产业舆情数据;基于命名实体识别模型从所述产业舆情数据中识别实体;根据所识别的实体为所述产业舆情数据生成标签;基于所述标签选择用户并向其推荐所述产业舆情数据。
在一些实施例中,还提供一种计算机可读存储介质,所述计算机存储介质存储有多条指令,所述多条指令可被处理器读取并执行上述的基于实体抽取的产业舆情推荐方法,例如包括:获取产业舆情数据;基于命名实体识别模型从所述产业舆情数据中识别实体;根据所识别的实体为所述产业舆情数据生成标签;基于所述标签选择用户并向其推荐所述产业舆情数据。
综上,上述实施例提供的基于实体抽取的产业舆情推荐方法、装置及电子设备,至少包括如下有益效果:
(1)所使用的Bert模型的较传统的word2vec,glove等word embedding技术效果更好,虽然word embedding技术也是通过无监督的训练让模型预先掌握了一些基础的语言知识,但是其无论从预训练的模型复杂度还是无监督学习的任务难度都无法和Bert相比。
(2)比传统的分类方法对新闻文本分类的准确率高,且可以精准地向不同产业不同地区的企业进行推荐,满足各地区各产业企业用户的需求。
(3)开创了产业类相关新闻的自动化分类。现有新闻平台对新闻的处理没有细分到各产业,或者没有细化到和产业,本发明能够根据新闻信息,将其划分到更细颗粒度,可准确的从新闻文本中发现新闻所描述的产业类型以及新闻发生地,比传统机器学习分类方法准确率更高,且不需要大量的人工标注,节约人力成本。
(4)更好的满足不同地区不同产业企业用户的需求,将新闻中自动化抽取到提及的产业作为新闻标签,结合企业知识图谱针对不同类型企业用户进行更细致的推荐,相比于传统的基于内容和基于用户的推荐准确率和新鲜度都更好。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (9)

1.一种基于实体抽取的产业舆情推荐方法,其特征在于,包括:
获取产业舆情数据;
基于命名实体识别模型从所述产业舆情数据中识别预设类型的实体;
根据所识别的实体为所述产业舆情数据生成标签;
基于所述标签向用户推荐所述产业舆情数据,包括:获取用户关联企业的企业名称;基于所述企业名称和预先构建的企业知识图谱确定所述企业的地址、所属产业以及与所述企业关联的其它企业和/或个人;根据所述地点标签查找与所述企业的地址匹配的产业舆情数据,根据所述产业标签查找与所述企业所属产业匹配的产业舆情数据,根据所述个人标签和/或企业标签查找与所述企业关联的其它企业和/或个人匹配的产业舆情数据;将上述查找到的产业舆情数据推荐至所述用户。
2.根据权利要求1所述的基于实体抽取的产业舆情推荐方法,其特征在于,所述基于命名实体识别模型从所述产业舆情数据中识别预设类型的实体包括:
将所述产业舆情数据转码为文本信息;
对所述文本信息进行数据预处理,获得包含预设类型的实体的语料;
将所述语料输入预先训练的命名实体识别模型,得到所述语料中每个字的BIO标签,所述BIO标签包括预设类型的信息;
根据所述BIO标签获取预设类型的实体。
3.根据权利要求2所述的基于实体抽取的产业舆情推荐方法,其特征在于,所述对所述文本信息进行数据预处理,获得包含预设类型的实体的语料包括:
基于预先建立的关键词表,利用正则表达式匹配获得包含预设类型的实体的语料,所述关键词表包括地区名称、企业名称、企业相关的个人姓名。
4.根据权利要求3所述的基于实体抽取的产业舆情推荐方法,其特征在于,所述预设类型的实体包括人物实体、地点实体、企业实体和产业实体,所述根据所识别的实体为所述产业舆情数据生成标签包括:
根据所述人物实体生成个人标签;
根据所述地点实体生成地点标签;
根据所述企业实体生成企业标签;
根据所述产业实体生成产业标签。
5.根据权利要求1所述的基于实体抽取的产业舆情推荐方法,其特征在于,所述基于所述标签向用户推荐所述产业舆情数据还包括:
获取所述用户的浏览记录;
根据所述用户的浏览记录查找与先前浏览内容相似的产业舆情数据,推荐至所述用户。
6.根据权利要求2所述的基于实体抽取的产业舆情推荐方法,其特征在于,按照下述方式预先训练所述命名实体识别模型:
获取产业舆情训练数据;
使用NER模型对所述产业舆情训练数据进行实体预抽取,获得训练语料;
对所述训练语料进行分字并进行BIO实体标注,为每个字标注BIO标签,所述BIO标签包括预设类型的信息;
使用经过BIO实体标注后的训练语料训练BERT+BiLSTM+CRF模型,得到所述命名实体模型。
7.一种基于实体抽取的产业舆情推荐装置,其特征在于,包括:
产业舆情数据获取模块,用于获取产业舆情数据;
产业舆情实体识别模块,用于基于命名实体识别模型从所述产业舆情数据中识别预设类型的实体;
标签生成模块,用于根据所识别的实体为所述产业舆情数据生成标签;
信息推荐模块,用于基于所述标签向用户推荐所述产业舆情数据,包括:获取用户关联企业的企业名称;基于所述企业名称和预先构建的企业知识图谱确定所述企业的地址、所属产业以及与所述企业关联的其它企业和/或个人;根据所述地点标签查找与所述企业的地址匹配的产业舆情数据,根据所述产业标签查找与所述企业所属产业匹配的产业舆情数据,根据所述个人标签和/或企业标签查找与所述企业关联的其它企业和/或个人匹配的产业舆情数据;将上述查找到的产业舆情数据推荐至所述用户。
8.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有多条指令,所述处理器用于读取所述多条指令并执行如权利要求1至6任一所述的基于实体抽取的产业舆情推荐方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述多条指令可被处理器读取并执行如权利要求1至6任一所述的基于实体抽取的产业舆情推荐方法。
CN202110039121.7A 2021-01-13 2021-01-13 一种基于实体抽取的产业舆情推荐方法、装置及电子设备 Active CN112395410B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110039121.7A CN112395410B (zh) 2021-01-13 2021-01-13 一种基于实体抽取的产业舆情推荐方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110039121.7A CN112395410B (zh) 2021-01-13 2021-01-13 一种基于实体抽取的产业舆情推荐方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN112395410A true CN112395410A (zh) 2021-02-23
CN112395410B CN112395410B (zh) 2021-05-14

Family

ID=74624877

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110039121.7A Active CN112395410B (zh) 2021-01-13 2021-01-13 一种基于实体抽取的产业舆情推荐方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN112395410B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112749341A (zh) * 2021-01-22 2021-05-04 南京莱斯网信技术研究院有限公司 重点舆情推荐方法、可读存储介质及数据处理装置
CN113221574A (zh) * 2021-05-31 2021-08-06 云南锡业集团(控股)有限责任公司研发中心 命名实体识别方法、装置、设备及计算机可读存储介质
CN113297498A (zh) * 2021-06-22 2021-08-24 南京晓庄学院 基于互联网的食品属性挖掘方法及***
CN113468340A (zh) * 2021-06-28 2021-10-01 北京众标智能科技有限公司 一种产业知识图谱的构建***及构建方法
CN114386422A (zh) * 2022-01-14 2022-04-22 淮安市创新创业科技服务中心 基于企业污染舆情抽取的智能辅助决策方法及装置
CN114398477A (zh) * 2022-01-19 2022-04-26 平安国际智慧城市科技股份有限公司 基于知识图谱的政策推荐方法及其相关设备
WO2022227196A1 (zh) * 2021-04-27 2022-11-03 平安科技(深圳)有限公司 一种数据分析方法、装置、计算机设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110191270A1 (en) * 2010-02-02 2011-08-04 Samsung Electronics Co. Ltd. Intelligent decision supporting system and method for making intelligent decision
CN109472018A (zh) * 2018-09-26 2019-03-15 深圳壹账通智能科技有限公司 企业舆情监测方法、装置、计算机设备和存储介质
CN111695346A (zh) * 2020-06-16 2020-09-22 广州商品清算中心股份有限公司 一种提升金融风险防控领域舆情实体识别率的方法
CN111859071A (zh) * 2020-07-21 2020-10-30 北京北斗天巡科技有限公司 一种基于互联网信息的商业信息挖掘***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110191270A1 (en) * 2010-02-02 2011-08-04 Samsung Electronics Co. Ltd. Intelligent decision supporting system and method for making intelligent decision
CN109472018A (zh) * 2018-09-26 2019-03-15 深圳壹账通智能科技有限公司 企业舆情监测方法、装置、计算机设备和存储介质
CN111695346A (zh) * 2020-06-16 2020-09-22 广州商品清算中心股份有限公司 一种提升金融风险防控领域舆情实体识别率的方法
CN111859071A (zh) * 2020-07-21 2020-10-30 北京北斗天巡科技有限公司 一种基于互联网信息的商业信息挖掘***

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112749341A (zh) * 2021-01-22 2021-05-04 南京莱斯网信技术研究院有限公司 重点舆情推荐方法、可读存储介质及数据处理装置
CN112749341B (zh) * 2021-01-22 2024-03-29 南京莱斯网信技术研究院有限公司 重点舆情推荐方法、可读存储介质及数据处理装置
WO2022227196A1 (zh) * 2021-04-27 2022-11-03 平安科技(深圳)有限公司 一种数据分析方法、装置、计算机设备及存储介质
CN113221574A (zh) * 2021-05-31 2021-08-06 云南锡业集团(控股)有限责任公司研发中心 命名实体识别方法、装置、设备及计算机可读存储介质
CN113297498A (zh) * 2021-06-22 2021-08-24 南京晓庄学院 基于互联网的食品属性挖掘方法及***
CN113297498B (zh) * 2021-06-22 2023-05-26 南京晓庄学院 基于互联网的食品属性挖掘方法及***
CN113468340A (zh) * 2021-06-28 2021-10-01 北京众标智能科技有限公司 一种产业知识图谱的构建***及构建方法
CN113468340B (zh) * 2021-06-28 2024-05-07 北京众标智能科技有限公司 一种产业知识图谱的构建***及构建方法
CN114386422A (zh) * 2022-01-14 2022-04-22 淮安市创新创业科技服务中心 基于企业污染舆情抽取的智能辅助决策方法及装置
CN114386422B (zh) * 2022-01-14 2023-09-15 淮安市创新创业科技服务中心 基于企业污染舆情抽取的智能辅助决策方法及装置
CN114398477A (zh) * 2022-01-19 2022-04-26 平安国际智慧城市科技股份有限公司 基于知识图谱的政策推荐方法及其相关设备

Also Published As

Publication number Publication date
CN112395410B (zh) 2021-05-14

Similar Documents

Publication Publication Date Title
CN112395410B (zh) 一种基于实体抽取的产业舆情推荐方法、装置及电子设备
CN110427623B (zh) 半结构化文档知识抽取方法、装置、电子设备及存储介质
CN112991017A (zh) 基于用户评论解析的标签体系精准推荐方法
CN108549723B (zh) 一种文本概念分类方法、装置及服务器
CN112270188B (zh) 一种提问式的分析路径推荐方法、***及存储介质
CN108021715B (zh) 基于语义结构特征分析的异构标签融合***
CN112069312B (zh) 一种基于实体识别的文本分类方法及电子装置
CN111737560B (zh) 内容搜索方法、领域预测模型训练方法、装置及存储介质
CN105653547B (zh) 一种提取文本关键词的方法和装置
CN113553429A (zh) 一种规范化标签体系构建及文本自动标注方法
CN109508458A (zh) 法律实体的识别方法及装置
CN109582788A (zh) 垃圾评论训练、识别方法、装置、设备及可读存储介质
CN111274822A (zh) 语义匹配方法、装置、设备及存储介质
CN113961666B (zh) 关键词识别方法、装置、设备、介质及计算机程序产品
Safrin et al. Sentiment analysis on online product review
CN111462752A (zh) 基于注意力机制、特征嵌入及bi-lstm的客户意图识别方法
CN111754208A (zh) 一种招聘简历自动筛选方法
Mounika et al. Design of book recommendation system using sentiment analysis
CN112989053A (zh) 一种期刊推荐方法及装置
CN115269816A (zh) 基于信息处理方法的核心人员挖掘方法、装置和存储介质
CN114090777A (zh) 文本数据处理方法及装置
Sungsri et al. The analysis and summarizing system of thai hotel reviews using opinion mining technique
CN111798217A (zh) 数据分析***及方法
Kim et al. Ranking Roughly Tourist Destinations Using BERT-Based Semantic Search
CN111625722A (zh) 一种基于深度学习的人才推荐方法、***及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant