CN108446355B - 投融资事件要素抽取方法、装置及设备 - Google Patents
投融资事件要素抽取方法、装置及设备 Download PDFInfo
- Publication number
- CN108446355B CN108446355B CN201810199789.6A CN201810199789A CN108446355B CN 108446355 B CN108446355 B CN 108446355B CN 201810199789 A CN201810199789 A CN 201810199789A CN 108446355 B CN108446355 B CN 108446355B
- Authority
- CN
- China
- Prior art keywords
- financing
- financing event
- investment
- text segment
- news text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种投融资事件要素抽取方法,能够通过对新闻文本段中的投融资事件要素进行命名实体识别,构建文本段特征向量;然后根据文本段特征向量,利用预先训练好的分类模型判断新闻文本段是否包含投融资事件;最后对从包含投融资事件的新闻文本段中抽取出投融资事件要素,得到投融资事件要素数据。可见,该方法能够将新闻文本中的投融资事件要素抽取出来,有效降低了分析投融资事件新闻的难度。此外,本发明还提供了一种投融资事件要素抽取装置、设备以及一种计算机可读存储介质,其作用与上述方法的作用相对应。
Description
技术领域
本发明涉及金融领域,特别是涉及一种投融资事件要素抽取方法、装置、设备以及一种计算机可读存储介质。
背景技术
企业投资是指企业以自有的资产投入,承担相应的风险,以期合法地取得更多的资产或权益的一种经济活动。企业融资是指企业从自身生产经营现状及资金运用情况出发,根据企业未来经营与发展策略的需要,通过一定的渠道和方式,利用内部积累或向企业的投资者及债权人筹集生产经营所需资金的一种经营活动。
随着“大众创新、万众创业”政策的开展,目前国内创新创业投融资活动较为频繁,2017年全国投融资金额接近1万亿人民币,关乎我国金融稳定运行。对投融资事件的分析,有助于帮助企业更好的利用资源。但是投融资新闻对于投融资事件的描述一般是文本格式的,难以直接进行结构化的计算和分析。
因此,如何降低分析投融资事件新闻的难度,是丞待本领域技术人员解决的问题。
发明内容
本发明的目的是提供一种投融资事件要素抽取方法、装置、设备以及一种计算机可读存储介质,用以解决传统分析投融资事件新闻难度较高的问题。
为解决上述技术问题,本发明提供一种投融资事件要素抽取方法,包括:
通过对新闻文本段中的投融资事件要素进行命名实体识别,构建文本段特征向量;
根据所述文本段特征向量,利用预先训练好的分类模型判断所述新闻文本段是否包含投融资事件;
若所述新闻文本段包含投融资事件,则将所述新闻文本段中的所述投融资事件要素抽取出来,得到投融资事件要素数据。
其中,在所述通过对新闻文本段中的投融资事件要素进行命名实体识别,构建文本段特征向量之前,包括:
利用爬虫从投融资事件发布平台获取新闻文本;
按照预设规则对所述新闻文本进行分段,得到新闻文本段。
其中,在所述若所述新闻文本段包含投融资事件,则将所述新闻文本段中的所述投融资事件要素抽取出来,得到投融资事件要素数据之后,包括:
将所述投融资事件要素数据写入数据库。
其中,在所述若所述新闻文本段包含投融资事件,则将所述新闻文本段中的所述投融资事件要素抽取出来,得到投融资事件要素数据之后,包括:
对所述投融资事件要素数据进行验证;
对验证通过的所述投融资事件要素数据进行标记。
其中,所述若所述新闻文本段包含投融资事件,则将所述新闻文本段中的所述投融资事件要素抽取出来,得到投融资事件要素数据包括:
若所述新闻文本段包含投融资事件,则将所述新闻文本段中的所述投融资事件要素抽取出来;
将抽取得到的所述投融资事件要素中的企业名称要素映射为预设企业名称格式,得到投融资事件要素数据。
其中,所述将抽取得到的所述投融资事件要素中的企业名称要素映射为预设企业名称格式,得到投融资事件要素数据包括:
预先通过建立企业名称库,构建企业名称映射方法;
通过所述企业名称映射方法,将抽取得到的所述投融资事件要素中的企业名称要素映射为预设企业名称格式,得到投融资事件要素数据。
本发明还提供了一种投融资事件要素抽取装置,包括:
特征向量构建模块:用于通过对新闻文本段中的投融资事件要素进行命名实体识别,构建文本段特征向量;
投融资事件判断模块:用于根据所述文本段特征向量,利用预先训练好的分类模型判断所述新闻文本段是否包含投融资事件;
投融资事件要素抽取模块:用于若所述新闻文本段包含投融资事件,则将所述新闻文本段中的所述投融资事件要素抽取出来,得到投融资事件要素数据。
其中,所述投融资事件要素抽取模块包括:
投融资事件要素抽取单元:用于若所述新闻文本段包含投融资事件,则将所述新闻文本段中的所述投融资事件要素抽取出来;
企业名称映射模块:用于将抽取得到的所述投融资事件要素中的企业名称要素映射为预设企业名称格式,得到投融资事件要素数据。
此外,本发明还提供了一种投融资事件要素抽取设备,包括:
存储器:用于存储计算机程序;
处理器:用于执行所述计算机程序,以实现如上所述的投融资事件要素抽取方法的步骤。
最后,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的投融资时间要素抽取方法的步骤。
本发明所提供的投融资事件要素抽取方法,能够通过对新闻文本段中的投融资事件要素进行命名体识别,构建文本段特征向量;然后根据文本段特征向量,利用预先训练好的分类模型判断新闻文本段是否包含投融资事件;最后对从包含投融资事件的新闻文本段中抽取出投融资事件要素,得到投融资事件要素数据。可见,该方法能够将新闻文本中的投融资事件要素抽取出来,有效降低了分析投融资事件新闻的难度。
本发明还提供了一种投融资事件要素抽取装置、设备以及一种计算机可读存储介质,其作用与上述方法的作用相对应,这里不再赘述。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种投融资事件要素抽取方法实施例的实现流程图;
图2为本发明提供的一种投融资事件要素抽取装置实施例的结构框图。
具体实施方式
本发明的核心是提供一种投融资事件要素抽取方法、装置、设备以及一种计算机可读存储介质,有效降低了分析投融资事件新闻的难度。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面开始详细介绍本发明提供的投融资事件要素抽取方法实施例,参见图1,该实施例具体包括:
步骤S11:通过对新闻文本段中的投融资事件要素进行命名实体识别,构建文本段特征向量。
可以利用爬虫从投融资事件发布平台获取新闻文本,按照预设规则对所述新闻文本进行分段,得到新闻文本段。命名体识别,指的是识别文中具有特定意义的实体,例如人名、地名、机构名以及专有词等。具体的,通过爬虫对各大投融资新闻网站、创业网站和地方园区发布平台进行监控和爬取,获取实时的新闻文本,对新闻文本进行分段,分段规则可以以每个自然段为一段,然后对每个文本段分词并进行命名实体识别,获取时间、机构名称和金融词汇等信息。
步骤S12:根据所述文本段特征向量,利用预先训练好的分类模型判断所述新闻文本段是否包含投融资事件。
通过获取的事件、机构名称和金融词汇以及相关关键词可以判断该文本段是否包含投融资事件,具体的,构建文本段特征向量,包括是否包含时间、是否包含机构、是否包含金额、是否包含相关金融词汇和文本段长度等,然后使用分类算法对特征向量进行训练,得到分类模型,通过分类模型可以判断后续文本段是否包含投融资事件。
步骤S13:若所述新闻文本段包含投融资事件,则将所述新闻文本段中的所述投融资事件要素抽取出来,得到投融资事件要素数据。
本实施例中,步骤S13通过预先经过训练的事件抽取模型来实现,对于事件抽取模型的训练过程,具体可以如下:
首先,准备用于训练模型的语料。在本实施例中,也就是对确定包含投融资事件的文本段进行序列标注,标注要素主要包括融资时间(time)、融资企业(fincom)、主营业务(business)、融资项目(project)、轮次(round)、金额(amount)、领投企业(leadinvcom)、其他投资企业(otherinvcom)、领头人(leadinvind)、其他投资人(otherinvind)、公司主营业务(business)等,可以采用BIOES标注法,其中B指开始(begin),I指中间(Internal),O指无关(Others),E指结束(End),S指单个元素(Single)。如“电商百宝新媒体于10月份完成1.4亿元B轮融资,由拉芳家化、新东方联合投资”的标注结果为“电商/business-S百宝/fincon-B新媒体/fincon-E于/O 10月份/time-S完成/O 1.4亿/amount-B元/amount-E B轮/round-s融资/O,由/O拉芳家化/leadinvcom-S、新东方联合/leadinvcom-S投资/O”。
然后,当积累一定的已经标注的文本段后,通过深度学习对部分语料进行训练,构建事件抽取模型,还可以把其余语料通过时间抽取模型进行事件要素识别,然后通过人工或脚本对识别结果进行校正,校正后的语料放回训练库重新训练。
具体的校正算法步骤可以如下:判断BIOES标签是否存在未开始、未结束、嵌套等情况;判断标注要素是否缺失,比如少了融资企业或轮次;通过词性规则判断标注是否闭合。
人工对算法提示的异常结果进行再次校正,由于语料规模比较大,可以不追求语料的完全准确,当算法加人工校正两到三轮后即可停止校正。通过多次迭代,构建了一段时间内所有投融资事件要素抽取语料,训练、优化后得到最终稳定的事件要素抽取模型。该模型算法可以分为以下五步:
1、选择投融资新闻座位语料,并分词,训练ngram(n=1,2,3)词向量表;
2、通过查找词向量表,把对已经标注的投融资文本段中包含的文本中的词转化为向量形式进行向量化,构建特征矩阵向量;
3、把特征矩阵向量输入多层神经网络进行编码;
4、在将编码后的隐层结果再输入概率图模型进行解码,;
5、通过前馈法对模型进行迭代优化,最终损失函数收敛,得到稳定的模型。
最终得到事件抽取模型,即可实现将新闻文本段中的所述投融资事件要素抽取出来,得到投融资事件要素数据的目的。具体的,在得到投融资事件要素数据之后,还可以将所述投融资事件要素数据写入数据库。甚至,还可以对所述投融资事件要素数据进行验证,对验证通过的所述投融资事件要素数据进行标记。
值得注意的是,由于新闻文本中的融资企业多为简称,规范性较差,难以和企业注册名称匹配,因此一般需要进行映射处理。比如“百宝新媒体”实际上是企业简称,有些文本可能会写作“百宝”等等,从字面上不能认定是同一家公司,所以需要映射到企业全称“宿迁市百宝信息科技有限公司”上,使用统一的ID,方便下游应用的计算。
目前映射处理主要有几种方法:一是直接通过企业名称库进行全文检索,完全匹配的可直接映射;二是对需要映射的企业名称进行互联网搜索,获取企业简介或者百科类文本,对文本进行命名实体识别,并对企业简称和文本中提及的企业名称进行关系判断,根据多篇文本中关系结果进行综合判断,确定企业全称;三是通过企业知识图谱进行判断,通过企业简介及百科类文本,对文本进行命名实体识别和关系识别,构建实体子图,在企业知识图谱中进行子图匹配,最终确定映射关系。
本实施例中,可以预先通过互联网信息或者知识图谱的方式,建立企业名称库,同时所述企业名称库确定企业名称映射方法。在后续映射步骤中,可以通过所述企业名称映射方法将抽取得到的所述投融资事件要素中的企业名称要素映射为预设企业名称格式。如果不能完全匹配,可以再进行互联网搜索,最后还可以考虑通过企业知识图谱来进行匹配。当然,本实施例对选择何种方法进行企业名称映射不做具体限定。
综上可知,本实施例所提供的投融资事件要素抽取方法,能够通过对新闻文本段中的投融资事件要素进行命名体识别,构建文本段特征向量;然后根据文本段特征向量,利用预先训练好的分类模型判断新闻文本段是否包含投融资事件;最后对从包含投融资事件的新闻文本段中抽取出投融资事件要素,得到投融资事件要素数据。实现了将新闻文本中的投融资事件要素抽取出来,将投融资新闻文本转化成了更便于分析的结构化数据,有效降低了分析投融资事件新闻的难度。
下面对本发明实施例提供的投融资事件要素抽取装置进行介绍,下文描述的投融资事件要素抽取装置与上文描述的投融资事件要素抽取方法可相互对应参照。
图2为本发明实施例提供的投融资事件要素抽取装置的结构框图,参照图2,该装置具体包括:
特征向量构建模块21:用于通过对新闻文本段中的投融资事件要素进行命名实体识别,构建文本段特征向量。
投融资事件判断模块22:用于根据所述文本段特征向量,利用预先训练好的分类模型判断所述新闻文本段是否包含投融资事件。
投融资事件要素抽取模块23:用于若所述新闻文本段包含投融资事件,则将所述新闻文本段中的所述投融资事件要素抽取出来,得到投融资事件要素数据。
其中,所述投融资事件要素抽取模块包括:
投融资事件要素抽取单元:用于若所述新闻文本段包含投融资事件,则将所述新闻文本段中的所述投融资事件要素抽取出来;
企业名称映射模块:用于将抽取得到的所述投融资事件要素中的企业名称要素映射为预设企业名称格式,得到投融资事件要素数据。
本实施例的投融资事件要素抽取装置用于实现前述的投融资事件要素抽取方法,因此该装置中的具体实施方式可见前文中的投融资事件要素抽取方法的实施例部分,例如,特征向量构建模块21、投融资事件判断模块22、投融资事件要素抽取模块23,分别用于实现上述投融资事件要素抽取方法中步骤S11、S12、S13,所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再赘述。
由于本实施例提供的投融资事件要素抽取装置用于实现前述投融资事件要素抽取方法,因此其作用与上述投融资事件要素抽取方法的作用相对应,这里不再赘述。
此外,本发明还提供了一种投融资事件要素抽取设备,包括:
存储器:用于存储计算机程序;
处理器:用于执行所述计算机程序,以实现如上所述的投融资事件要素抽取方法的步骤。
最后,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的投融资时间要素抽取方法的步骤。
由于本申请提供的投融资事件要素抽取设备以及一种计算机可读存储介质用于实现前述投融资事件要素抽取方法,因此其作用与上述投融资事件要素抽取方法的作用相对应,这里不再展开介绍。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的投融资事件要素抽取方法、装置、设备以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
Claims (7)
1.一种投融资事件要素抽取方法,其特征在于,包括:
通过对新闻文本段中的投融资事件要素进行命名实体识别,构建文本段特征向量,所述投融资事件要素包括融资时间、融资企业、主营业务、融资项目、轮次、金额、领投企业、其他投资企业、领头人、其他投资人、公司主营业务;
根据所述文本段特征向量,利用预先训练好的分类模型判断所述新闻文本段是否包含投融资事件;
若所述新闻文本段包含投融资事件,则将所述新闻文本段中的所述投融资事件要素抽取出来,得到投融资事件要素数据;
所述若所述新闻文本段包含投融资事件,则将所述新闻文本段中的所述投融资事件要素抽取出来,得到投融资事件要素数据包括:
若所述新闻文本段包含投融资事件,则将所述新闻文本段中的所述投融资事件要素抽取出来;
将抽取得到的所述投融资事件要素中的企业名称要素映射为预设企业名称格式,得到投融资事件要素数据;
所述将抽取得到的所述投融资事件要素中的企业名称要素映射为预设企业名称格式,得到投融资事件要素数据包括:
利用企业知识图谱进行判断,对企业简介及百科类文本进行命名实体识别和关系识别,构建实体子图,在企业知识图谱中进行实体子图匹配,最终确定企业名称映射方法;
通过所述企业名称映射方法,将抽取得到的所述投融资事件要素中的企业名称要素映射为预设企业名称格式,得到投融资事件要素数据。
2.如权利要求1所述的方法,其特征在于,在所述通过对新闻文本段中的投融资事件要素进行命名实体识别,构建文本段特征向量之前,包括:
利用爬虫从投融资事件发布平台获取新闻文本;
按照预设规则对所述新闻文本进行分段,得到新闻文本段。
3.如权利要求1所述的方法,其特征在于,在所述若所述新闻文本段包含投融资事件,则将所述新闻文本段中的所述投融资事件要素抽取出来,得到投融资事件要素数据之后,包括:
将所述投融资事件要素数据写入数据库。
4.如权利要求3所述的方法,其特征在于,在所述若所述新闻文本段包含投融资事件,则将所述新闻文本段中的所述投融资事件要素抽取出来,得到投融资事件要素数据之后,包括:
对所述投融资事件要素数据进行验证;
对验证通过的所述投融资事件要素数据进行标记。
5.一种投融资事件要素抽取装置,其特征在于,包括:
特征向量构建模块:用于通过对新闻文本段中的投融资事件要素进行命名实体识别,构建文本段特征向量,所述投融资事件要素包括融资时间、融资企业、主营业务、融资项目、轮次、金额、领投企业、其他投资企业、领头人、其他投资人、公司主营业务;
投融资事件判断模块:用于根据所述文本段特征向量,利用预先训练好的分类模型判断所述新闻文本段是否包含投融资事件;
投融资事件要素抽取模块:用于若所述新闻文本段包含投融资事件,则将所述新闻文本段中的所述投融资事件要素抽取出来,得到投融资事件要素数据;
所述投融资事件要素抽取模块包括:
投融资事件要素抽取单元:用于若所述新闻文本段包含投融资事件,则将所述新闻文本段中的所述投融资事件要素抽取出来;
企业名称映射模块:用于将抽取得到的所述投融资事件要素中的企业名称要素映射为预设企业名称格式,得到投融资事件要素数据;
所述企业名称映射模块具体用于:利用企业知识图谱进行判断,对企业简介及百科类文本进行命名实体识别和关系识别,构建实体子图,在企业知识图谱中进行实体子图匹配,最终确定企业名称映射方法;通过所述企业名称映射方法,将抽取得到的所述投融资事件要素中的企业名称要素映射为预设企业名称格式,得到投融资事件要素数据。
6.一种投融资事件要素抽取设备,其特征在于,包括:
存储器:用于存储计算机程序;
处理器:用于执行所述计算机程序,以实现如权利要求1-4任意一项所述的投融资事件要素抽取方法的步骤。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-4任意一项所述的投融资事件 要素抽取方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810199789.6A CN108446355B (zh) | 2018-03-12 | 2018-03-12 | 投融资事件要素抽取方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810199789.6A CN108446355B (zh) | 2018-03-12 | 2018-03-12 | 投融资事件要素抽取方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108446355A CN108446355A (zh) | 2018-08-24 |
CN108446355B true CN108446355B (zh) | 2022-05-20 |
Family
ID=63193999
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810199789.6A Active CN108446355B (zh) | 2018-03-12 | 2018-03-12 | 投融资事件要素抽取方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108446355B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111368542A (zh) * | 2018-12-26 | 2020-07-03 | 北京大学 | 一种基于递归神经网络的文本语言关联抽取方法和*** |
CN110929134A (zh) * | 2019-12-04 | 2020-03-27 | 深圳市新国都金服技术有限公司 | 投融资数据管理方法、装置、计算机设备及存储介质 |
CN111753197B (zh) * | 2020-06-18 | 2024-04-05 | 达观数据有限公司 | 新闻要素的提取方法、装置、计算机设备和存储介质 |
CN111782907B (zh) * | 2020-07-01 | 2024-03-01 | 北京知因智慧科技有限公司 | 新闻分类方法、装置及电子设备 |
CN112287118B (zh) * | 2020-10-30 | 2023-06-02 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 事件模式频繁子图挖掘与预测方法 |
CN112380300A (zh) * | 2020-12-11 | 2021-02-19 | 武汉烽火众智数字技术有限责任公司 | 多类别事件要素抽取分析方法及设备 |
CN113111075B (zh) * | 2021-03-19 | 2023-09-05 | 上海药慧信息技术有限公司 | 投融资信息挖掘方法、装置、电子设备和存储介质 |
CN112989031B (zh) * | 2021-04-28 | 2021-08-03 | 成都索贝视频云计算有限公司 | 基于深度学习的广播电视新闻事件要素抽取方法 |
CN115470871B (zh) * | 2022-11-02 | 2023-02-17 | 江苏鸿程大数据技术与应用研究院有限公司 | 基于命名实体识别与关系抽取模型的政策匹配方法及*** |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104199972A (zh) * | 2013-09-22 | 2014-12-10 | 中科嘉速(北京)并行软件有限公司 | 一种基于深度学习的命名实体关系抽取与构建方法 |
CN106021227A (zh) * | 2016-05-16 | 2016-10-12 | 南京大学 | 一种基于状态转移与神经网络的汉语组块分析方法 |
CN106933800A (zh) * | 2016-11-29 | 2017-07-07 | 首都师范大学 | 一种金融领域的事件句抽取方法 |
CN107122416A (zh) * | 2017-03-31 | 2017-09-01 | 北京大学 | 一种中文事件抽取方法 |
CN107239445A (zh) * | 2017-05-27 | 2017-10-10 | 中国矿业大学 | 一种基于神经网络的新闻事件抽取的方法及*** |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009097558A2 (en) * | 2008-01-30 | 2009-08-06 | Thomson Reuters Global Resources | Financial event and relationship extraction |
-
2018
- 2018-03-12 CN CN201810199789.6A patent/CN108446355B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104199972A (zh) * | 2013-09-22 | 2014-12-10 | 中科嘉速(北京)并行软件有限公司 | 一种基于深度学习的命名实体关系抽取与构建方法 |
CN106021227A (zh) * | 2016-05-16 | 2016-10-12 | 南京大学 | 一种基于状态转移与神经网络的汉语组块分析方法 |
CN106933800A (zh) * | 2016-11-29 | 2017-07-07 | 首都师范大学 | 一种金融领域的事件句抽取方法 |
CN107122416A (zh) * | 2017-03-31 | 2017-09-01 | 北京大学 | 一种中文事件抽取方法 |
CN107239445A (zh) * | 2017-05-27 | 2017-10-10 | 中国矿业大学 | 一种基于神经网络的新闻事件抽取的方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN108446355A (zh) | 2018-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108446355B (zh) | 投融资事件要素抽取方法、装置及设备 | |
CN110377759B (zh) | 事件关系图谱构建方法及装置 | |
US8452772B1 (en) | Methods, systems, and articles of manufacture for addressing popular topics in a socials sphere | |
AU2019219746A1 (en) | Artificial intelligence based corpus enrichment for knowledge population and query response | |
CN111325029B (zh) | 一种基于深度学习集成模型的文本相似度计算方法 | |
CN110414004B (zh) | 一种核心信息提取的方法和*** | |
CN109508458B (zh) | 法律实体的识别方法及装置 | |
CN115357719B (zh) | 基于改进bert模型的电力审计文本分类方法及装置 | |
CN111723569A (zh) | 一种事件抽取方法、装置和计算机可读存储介质 | |
US20240143644A1 (en) | Event detection | |
WO2022089227A1 (zh) | 地址参数处理方法及相关设备 | |
CN112989002B (zh) | 一种基于知识图谱的问答处理方法、装置及设备 | |
WO2020063524A1 (zh) | 一种法律文书的确定方法及*** | |
CN107958068B (zh) | 一种基于实体知识库的语言模型平滑方法 | |
CN113408287A (zh) | 实体识别方法、装置、电子设备及存储介质 | |
CN111158692B (zh) | 智能合约函数相似性的排序方法、***和存储介质 | |
CN116150651A (zh) | 基于ai的深度合成检测方法和*** | |
CN114117041B (zh) | 一种基于特定属性词上下文建模的属性级情感分析方法 | |
CN111506595A (zh) | 一种数据查询方法、***及相关设备 | |
CN117094325B (zh) | 水稻病虫害领域命名实体识别方法 | |
CN111767476A (zh) | 一种基于hmm模型的智慧城市时空大数据空间化引擎构建方法 | |
CN110287396A (zh) | 文本匹配方法及装置 | |
CN116028626A (zh) | 文本匹配方法、装置、存储介质以及电子设备 | |
CN114239555A (zh) | 一种关键词提取模型的训练方法及相关装置 | |
CN114254617A (zh) | 一种修订条款的方法、装置、计算设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |