CN109062893A - 一种基于全文注意力机制的商品名称识别方法 - Google Patents

一种基于全文注意力机制的商品名称识别方法 Download PDF

Info

Publication number
CN109062893A
CN109062893A CN201810768223.0A CN201810768223A CN109062893A CN 109062893 A CN109062893 A CN 109062893A CN 201810768223 A CN201810768223 A CN 201810768223A CN 109062893 A CN109062893 A CN 109062893A
Authority
CN
China
Prior art keywords
layer
full text
word
vector
attention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810768223.0A
Other languages
English (en)
Other versions
CN109062893B (zh
Inventor
苏锦钿
李鹏飞
周炀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201810768223.0A priority Critical patent/CN109062893B/zh
Publication of CN109062893A publication Critical patent/CN109062893A/zh
Application granted granted Critical
Publication of CN109062893B publication Critical patent/CN109062893B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于全文注意力机制的商品名称识别方法,包括:建立加入全文注意力机制的深度神经网络模型,在深度神经网络模型中加入全文注意力层,在全文注意力层当中,将全文的信息用词嵌入向量的方法来表示;接着,对于要标注的每一个词语,计算它们和全文注意力层词向量的相似性,从而让词语获得对全文的“注意力权重”,即让词语关注到文档的上下文信息,利用注意力权重和,计算出每一个词语的额外特征,用以进行商品名称的识别。本发明方法能够有效的从不规则的文本中提取出商品名,并解决了同一种商品在上下文识别不一致的问题,提高了识别的准确率。

Description

一种基于全文注意力机制的商品名称识别方法
技术领域
本发明涉及自然语言处理技术领域,特别涉及一种基于全文注意力机制的商品名称识别方法。
背景技术
命名实体识别是信息抽取的一项子任务,旨在识别出文本中的专有名词,并对它们进行分类。传统的命名实体任务有:人名、地名、机构名等。这是自然语言处理领域中一个相当重要的基础任务,比如:搜索引擎、问答***、推荐***、翻译***等。而近年来,随着电子商务的不断发展,针对电商领域的命名实体识别任务也开始为人们所关注,人们迫切需要从海量的、不规则的文本中提取出商品的名称,并将其用于智能客服、广告推荐等领域。
对于这个问题,经典的研究主要是基于归纳商品字典、完善正则表达式、界定规、构造隐马尔科夫模型、构造最大熵模型和构造条件随机场模型等方法,这些方法的缺点在于,它们无法对词语潜在的语义进行建模,只能通过增加外部特征来达到提升效果的目的。
而近几年来,随着深度学习的不断发展,很多学者开始利用深层神经网络来对文本建模,这些模型能够捕获到文本潜在的语义信息,大大减少了人工提取特征的工作量,具体到商品名称识别,目前较好的模型有BI-LSTM+CRF模型,CNN+CRF模型,这些模型基本上都是用了word-embedding技术,这能解决词典高维稀疏的问题,具有很强的泛化能力,使得我们不必统计完整的商品词典,同时,神经网络和CRF的结合,能够解决商品名识别标注矛盾的问题,提高识别准确率。然而,这些研究忽略了商品名识别不一致的问题,也就是说,同一个商品,在文本中的不同位置,被识别成了不同的类别。比如,“苹果”和“苹果手机”同时都在一篇文档中出现,但是如果应用上面所说的模型,有可能“苹果”被标注成水果,“苹果手机”则被标注成商品,出现这个问题的原因在于,模型并没有考虑到文档全文的信息,如果知道这篇文章是在讲手机相关的内容,那么“苹果”更大概率是一种商品。因此,提供一种基于全文注意力机制的商品名称识别方法,具有重要的现实意义。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种基于全文注意力机制的商品名称识别方法,基于深度学习技术,能够有效的从不规则的文本中提取出商品名,并解决了同一种商品在上下文识别不一致的问题,提高了识别的准确率。
本发明的目的通过以下的技术方案实现:一种基于全文注意力机制的商品名称识别方法,包括:建立加入全文注意力机制的深度神经网络模型,在深度神经网络模型中加入全文注意力层,在全文注意力层当中,将全文的信息用词嵌入向量的方法来表示;接着,对于要标注的每一个词语,计算它们和全文注意力层词向量的相似性,从而让词语获得对全文的“注意力权重”,即让词语关注到文档的上下文信息,利用注意力权重和,计算出每一个词语的额外特征,用以进行商品名称的识别。
优选的,加入全文注意力机制的深度神经网络模型包括:输入层、编码层、全文注意力层、输出层、提取层;
第一层是输入层,首先利用预训练好的词向量,将全文分词后的结果映射为向量矩阵,并将额外的词性信息编码为one-hot特征,拼接在向量矩阵后,形成模型的输入;
第二层是编码层,针对文章中的每一个句子,使用双向循环神经网络来进行编码;
第三层是全文注意力层,由于第二层已经对文中的每一个句子进行了建模,全文注意力层的任务是为每一个词语引入全文的信息,得到蕴含更多信息的编码;
第四层是输出层,考虑相邻标签之间的关系,加入标签转移得分,和全文注意力层输出的分数相结合,预测全局最优的标注序列;
最后一层是提取层,根据上一层输出的标注序列,提取出自定义商品名标注,并将其背后的文本拼接起来,从而识别、得到商品名。
优选的,输入层将词语序列转换成词语的特征向量,以传递给编码层处理,这一层的特征向量是由两种特征向量拼接而成,包括预训练词向量和词性特征向量;其中,预训练词向量的维度为N维,词性特征由NLTK给出,用随机初始化的方法将每种词性映射到指定维度的向量,最终,将词向量和词性特征向量拼接在一起,代表词语的特征向量。
优选的,编码层针对输入层的每一个句子特征向量,进行神经网络的前向传播,这一层使用两个独立的循环神经网络,首先使用前向LSTM学习词语的前向依赖关系,然后使用后向LSTM学习词语的后向依赖关系,最后将它们拼接成词语的总向量,此时词语的总向量就包含了句子内的上下文信息。
优选的,全文注意力层为编码层的每一个词语增加额外的全文特征;在这一层中,对于每一个词语,模型使用欧氏距离相似度函数计算当前词语向量和全文的每一个词语向量的相似性,得到注意力权重,用注意力权重和对应的全文向量相乘,得到当前词语的全局特征向量;最后,将全局特征向量拼接在原有的词语总向量之后,形成最终的词语输出向量。
优选的,输出层根据全文注意力层的输出词语向量,为词语预测对应的标签;这一层是一个标签联合预测的CRF层,借鉴条件随机场模型全局优化的思想,考虑相邻两个输出标签之间的关系,最后得到最优的标签序列。
优选的,在模型的训练过程中,使用dropout技术防止过拟合。
优选的,在模型的训练过程中,使用Adam优化器以自适应地计算每个参数的学习率。
本发明与现有技术相比,具有如下优点和有益效果:
本发明通过结合全文注意力的方法,给出一种基于深度学习技术的商品名识别方法,能够有效的从不规则的文本中提取出商品名,并解决了同一种商品在上下文识别不一致的问题,提高了识别的准确率。
本方法充分利用了神经网络注意力机制的优点,灵活的将全文信息以“注意力”的形式输入神经网络,使得神经网络能够关注到被忽略的重要的商品信息,从而最终输出更加准确的商品名。本发明可以应用到各种电子商务的场景当中,为许多应高级用提供底层基础服务。
附图说明
图1为实施例提供的商品名自动识别模型总体结构图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1
一种基于全文注意力机制的商品名称识别方法,加入全文注意力机制的深度神经网络模型,将其应用在商品名自动识别当中。
模型的改进思路主要在于全文注意力层。在这一层当中,将全文的信息用词嵌入向量的方法来表示,接着,对于要标注的每一个词语,用欧式距离相似度函数计算它们和全文注意力层词向量的相似性,从而让词语获得对全文的“注意力权重”,即让词语关注到文档的上下文信息。最后,利用注意力权重和,计算出每一个词语的额外特征,传递到输出层。这样一来,每一个词语就能额外获取到全文的信息,从而解决商品名标注不一致的问题。
具体来说,模型分为输入层、编码层、全文注意力层、输出层、提取层。
第一层是输入层,首先利用预训练好的词向量,将全文分词后的结果映射为向量矩阵,并将额外的词性信息编码为one-hot特征,拼接在向量矩阵后,形成模型的输入。
第二层是编码层,针对文章中的每一个句子,使用双向循环神经网络来进行编码,它在前向网络中,让词语获得句子级别的上文信息,在后向网络中,让词语获得句子级别的下文信息。
第三层是全文注意力层,由于第二层已经对文中的每一个句子进行了建模,全文注意力层的任务是为每一个词语引入全文的信息,得到蕴含更多信息的编码,旨在解决商品名识别前后不一致的问题。
第四层是输出层,这一层使用了CRF模型的转移矩阵,考虑了相邻标签之间的关系,加入标签转移得分,和全文注意力层输出的分数相结合,预测全局最优的标注序列。
最后一层是提取层,根据上一层输出的标注序列,提取出自定义商品名标注,并将其背后的文本拼接起来,从而识别、得到商品名。
所提出的商品名自动识别方法包括以下步骤:
步骤1:模型第一层将词语序列转换成词语的特征向量,以传递给编码层处理,这一层的特征向量是由两种特征向量拼接而成,包括预训练词向量和词性特征向量。其中,预训练词向量的维度为100维,词性特征由NLTK给出,用随机初始化的方法将每种词性映射到指定维度的向量。最终,将词向量和词性特征向量拼接在一起,代表词语的特征向量。
步骤2:模型第二层针对第一层的每一个句子特征向量,进行神经网络的前向传播。这一层使用两个独立的循环神经网络,首先使用前向LSTM学习词语的前向依赖关系,然后使用后向LSTM学习词语的后向依赖关系,最后将它们拼接成词语的总向量,此时词语的总向量就包含了句子内的上下文信息。
步骤3:模型第三层为第二层的每一个词语增加额外的全文特征。由于输入层、编码层的处理都是句子级别的,所以它们无法获取全文的信息。而在这一层中,对于每一个词语,模型使用欧氏距离相似度函数计算当前词语向量和全文的每一个词语向量的相似性,得到注意力权重,用注意力权重和对应的全文向量相乘,得到当前词语的全局特征向量。最后,将全局特征向量拼接在原有的词语总向量之后,形成最终的词语输出向量。
步骤4:模型第四层的任务是根据全文注意力层的输出词语向量,为词语预测对应的标签。这一层是一个标签联合预测的CRF层,借鉴了条件随机场模型全局优化的思想,考虑了相邻两个输出标签之间的关系,最后得到最优的标签序列。
在模型的训练过程中,使用了dropout技术防止过拟合,使用了Adam优化器以自适应地计算每个参数的学习率。
步骤5:模型的最后一层用于提取商品名,由步骤4,已经可以得到文本中每一个词语的标签,而这个步骤则是根据自定义商品名背后的标签,提取出原文词语,将这些词语拼接在一起,从而得到商品名。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (8)

1.一种基于全文注意力机制的商品名称识别方法,其特征在于,包括:建立加入全文注意力机制的深度神经网络模型,在深度神经网络模型中加入全文注意力层,在全文注意力层当中,将全文的信息用词嵌入向量的方法来表示;接着,对于要标注的每一个词语,计算它们和全文注意力层词向量的相似性,从而让词语获得对全文的“注意力权重”,即让词语关注到文档的上下文信息,利用注意力权重和,计算出每一个词语的额外特征,用以进行商品名称的识别。
2.根据权利要求1所述的基于全文注意力机制的商品名称识别方法,其特征在于,加入全文注意力机制的深度神经网络模型包括:输入层、编码层、全文注意力层、输出层、提取层;
第一层是输入层,首先利用预训练好的词向量,将全文分词后的结果映射为向量矩阵,并将额外的词性信息编码为one-hot特征,拼接在向量矩阵后,形成模型的输入;
第二层是编码层,针对文章中的每一个句子,使用双向循环神经网络来进行编码;
第三层是全文注意力层,由于第二层已经对文中的每一个句子进行了建模,全文注意力层的任务是为每一个词语引入全文的信息,得到蕴含更多信息的编码;
第四层是输出层,考虑相邻标签之间的关系,加入标签转移得分,和全文注意力层输出的分数相结合,预测全局最优的标注序列;
最后一层是提取层,根据上一层输出的标注序列,提取出自定义商品名标注,并将其背后的文本拼接起来,从而识别、得到商品名。
3.根据权利要求1所述的基于全文注意力机制的商品名称识别方法,其特征在于,输入层将词语序列转换成词语的特征向量,以传递给编码层处理,这一层的特征向量是由两种特征向量拼接而成,包括预训练词向量和词性特征向量;其中,预训练词向量的维度为N维,词性特征由NLTK给出,用随机初始化的方法将每种词性映射到指定维度的向量,最终,将词向量和词性特征向量拼接在一起,代表词语的特征向量。
4.根据权利要求1所述的基于全文注意力机制的商品名称识别方法,其特征在于,编码层针对输入层的每一个句子特征向量,进行神经网络的前向传播,这一层使用两个独立的循环神经网络,首先使用前向LSTM学习词语的前向依赖关系,然后使用后向LSTM学习词语的后向依赖关系,最后将它们拼接成词语的总向量,此时词语的总向量就包含了句子内的上下文信息。
5.根据权利要求1所述的基于全文注意力机制的商品名称识别方法,其特征在于,全文注意力层为编码层的每一个词语增加额外的全文特征;在这一层中,对于每一个词语,模型使用欧氏距离相似度函数计算当前词语向量和全文的每一个词语向量的相似性,得到注意力权重,用注意力权重和对应的全文向量相乘,得到当前词语的全局特征向量;最后,将全局特征向量拼接在原有的词语总向量之后,形成最终的词语输出向量。
6.根据权利要求1所述的基于全文注意力机制的商品名称识别方法,其特征在于,输出层根据全文注意力层的输出词语向量,为词语预测对应的标签;这一层是一个标签联合预测的CRF层,借鉴条件随机场模型全局优化的思想,考虑相邻两个输出标签之间的关系,最后得到最优的标签序列。
7.根据权利要求1所述的基于全文注意力机制的商品名称识别方法,其特征在于,在模型的训练过程中,使用dropout技术防止过拟合。
8.根据权利要求1所述的基于全文注意力机制的商品名称识别方法,其特征在于,在模型的训练过程中,使用Adam优化器以自适应地计算每个参数的学习率。
CN201810768223.0A 2018-07-13 2018-07-13 一种基于全文注意力机制的商品名称识别方法 Expired - Fee Related CN109062893B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810768223.0A CN109062893B (zh) 2018-07-13 2018-07-13 一种基于全文注意力机制的商品名称识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810768223.0A CN109062893B (zh) 2018-07-13 2018-07-13 一种基于全文注意力机制的商品名称识别方法

Publications (2)

Publication Number Publication Date
CN109062893A true CN109062893A (zh) 2018-12-21
CN109062893B CN109062893B (zh) 2021-09-21

Family

ID=64816366

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810768223.0A Expired - Fee Related CN109062893B (zh) 2018-07-13 2018-07-13 一种基于全文注意力机制的商品名称识别方法

Country Status (1)

Country Link
CN (1) CN109062893B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109710762A (zh) * 2018-12-26 2019-05-03 南京云问网络技术有限公司 一种融合多种特征权重的短文本聚类方法
CN109871538A (zh) * 2019-02-18 2019-06-11 华南理工大学 一种中文电子病历命名实体识别方法
CN109948604A (zh) * 2019-02-01 2019-06-28 北京捷通华声科技股份有限公司 不规则排列文本的识别方法、装置、电子设备及存储介质
CN110008469A (zh) * 2019-03-19 2019-07-12 桂林电子科技大学 一种多层次命名实体识别方法
CN110334339A (zh) * 2019-04-30 2019-10-15 华中科技大学 一种基于位置感知自注意力机制的序列标注模型与标注方法
CN110362681A (zh) * 2019-06-19 2019-10-22 平安科技(深圳)有限公司 问答***重复问题识别方法、装置及存储介质
CN110459282A (zh) * 2019-07-11 2019-11-15 新华三大数据技术有限公司 序列标注模型训练方法、电子病历处理方法及相关装置
CN110457682A (zh) * 2019-07-11 2019-11-15 新华三大数据技术有限公司 电子病历词性标注方法、模型训练方法及相关装置
CN110472229A (zh) * 2019-07-11 2019-11-19 新华三大数据技术有限公司 序列标注模型训练方法、电子病历处理方法及相关装置
CN110619124A (zh) * 2019-09-19 2019-12-27 成都数之联科技有限公司 一种结合注意力机制与双向lstm的命名实体识别方法及***
CN111522964A (zh) * 2020-04-17 2020-08-11 电子科技大学 一种藏医药文献核心概念挖掘方法
CN111538761A (zh) * 2020-04-21 2020-08-14 中南大学 基于注意力机制的点击率预测方法
CN111625634A (zh) * 2020-05-25 2020-09-04 泰康保险集团股份有限公司 词槽识别方法及装置、计算机可读存储介质、电子设备
CN111782768A (zh) * 2020-06-30 2020-10-16 首都师范大学 基于双曲空间表示和标签文本互动的细粒度实体识别方法
CN112016325A (zh) * 2020-09-04 2020-12-01 北京声智科技有限公司 语音合成方法及电子设备
CN113157918A (zh) * 2021-03-23 2021-07-23 浙江工业大学 一种基于注意力机制的商品名称短文本分类方法和***
CN115422939A (zh) * 2022-10-14 2022-12-02 重庆邮电大学 一种基于大数据的细粒度商品命名实体识别方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101187921A (zh) * 2007-12-20 2008-05-28 腾讯科技(深圳)有限公司 一种中文复合词的提取方法及提取***
CN105045909A (zh) * 2015-08-11 2015-11-11 北京京东尚科信息技术有限公司 从文本中识别商品名称的方法和装置
CN106503192A (zh) * 2016-10-31 2017-03-15 北京百度网讯科技有限公司 基于人工智能的命名实体识别方法及装置
CN107783960A (zh) * 2017-10-23 2018-03-09 百度在线网络技术(北京)有限公司 用于抽取信息的方法、装置和设备
US20180082183A1 (en) * 2011-02-22 2018-03-22 Thomson Reuters Global Resources Machine learning-based relationship association and related discovery and search engines

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101187921A (zh) * 2007-12-20 2008-05-28 腾讯科技(深圳)有限公司 一种中文复合词的提取方法及提取***
US20180082183A1 (en) * 2011-02-22 2018-03-22 Thomson Reuters Global Resources Machine learning-based relationship association and related discovery and search engines
CN105045909A (zh) * 2015-08-11 2015-11-11 北京京东尚科信息技术有限公司 从文本中识别商品名称的方法和装置
CN106503192A (zh) * 2016-10-31 2017-03-15 北京百度网讯科技有限公司 基于人工智能的命名实体识别方法及装置
CN107783960A (zh) * 2017-10-23 2018-03-09 百度在线网络技术(北京)有限公司 用于抽取信息的方法、装置和设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KATHERINE C.MOEN 等: "Selective attention meets spontaneous recognition memory: Evidence for effects at retrieval", 《ELSEVIER SCIENCE》 *
冯伟: "社交媒体中内容的标注与排序", 《中国博士学位论文全文数据库》 *
王宝鑫: "基于深度神经网络的文本蕴含识别及应用研究", 《万方数据库》 *

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109710762A (zh) * 2018-12-26 2019-05-03 南京云问网络技术有限公司 一种融合多种特征权重的短文本聚类方法
CN109710762B (zh) * 2018-12-26 2023-08-01 南京云问网络技术有限公司 一种融合多种特征权重的短文本聚类方法
CN109948604A (zh) * 2019-02-01 2019-06-28 北京捷通华声科技股份有限公司 不规则排列文本的识别方法、装置、电子设备及存储介质
CN109871538A (zh) * 2019-02-18 2019-06-11 华南理工大学 一种中文电子病历命名实体识别方法
CN110008469A (zh) * 2019-03-19 2019-07-12 桂林电子科技大学 一种多层次命名实体识别方法
CN110008469B (zh) * 2019-03-19 2022-06-07 桂林电子科技大学 一种多层次命名实体识别方法
CN110334339A (zh) * 2019-04-30 2019-10-15 华中科技大学 一种基于位置感知自注意力机制的序列标注模型与标注方法
CN110362681B (zh) * 2019-06-19 2023-09-22 平安科技(深圳)有限公司 问答***重复问题识别方法、装置及存储介质
CN110362681A (zh) * 2019-06-19 2019-10-22 平安科技(深圳)有限公司 问答***重复问题识别方法、装置及存储介质
CN110457682A (zh) * 2019-07-11 2019-11-15 新华三大数据技术有限公司 电子病历词性标注方法、模型训练方法及相关装置
CN110472229A (zh) * 2019-07-11 2019-11-19 新华三大数据技术有限公司 序列标注模型训练方法、电子病历处理方法及相关装置
CN110459282A (zh) * 2019-07-11 2019-11-15 新华三大数据技术有限公司 序列标注模型训练方法、电子病历处理方法及相关装置
CN110472229B (zh) * 2019-07-11 2022-09-09 新华三大数据技术有限公司 序列标注模型训练方法、电子病历处理方法及相关装置
CN110457682B (zh) * 2019-07-11 2022-08-09 新华三大数据技术有限公司 电子病历词性标注方法、模型训练方法及相关装置
CN110619124A (zh) * 2019-09-19 2019-12-27 成都数之联科技有限公司 一种结合注意力机制与双向lstm的命名实体识别方法及***
CN111522964A (zh) * 2020-04-17 2020-08-11 电子科技大学 一种藏医药文献核心概念挖掘方法
CN111538761A (zh) * 2020-04-21 2020-08-14 中南大学 基于注意力机制的点击率预测方法
CN111625634A (zh) * 2020-05-25 2020-09-04 泰康保险集团股份有限公司 词槽识别方法及装置、计算机可读存储介质、电子设备
CN111625634B (zh) * 2020-05-25 2023-08-22 泰康保险集团股份有限公司 词槽识别方法及装置、计算机可读存储介质、电子设备
WO2022001333A1 (zh) * 2020-06-30 2022-01-06 首都师范大学 基于双曲空间表示和标签文本互动的细粒度实体识别方法
CN111782768A (zh) * 2020-06-30 2020-10-16 首都师范大学 基于双曲空间表示和标签文本互动的细粒度实体识别方法
CN112016325A (zh) * 2020-09-04 2020-12-01 北京声智科技有限公司 语音合成方法及电子设备
CN113157918B (zh) * 2021-03-23 2022-07-22 浙江工业大学 一种基于注意力机制的商品名称短文本分类方法和***
CN113157918A (zh) * 2021-03-23 2021-07-23 浙江工业大学 一种基于注意力机制的商品名称短文本分类方法和***
CN115422939A (zh) * 2022-10-14 2022-12-02 重庆邮电大学 一种基于大数据的细粒度商品命名实体识别方法
CN115422939B (zh) * 2022-10-14 2024-04-02 芽米科技(广州)有限公司 一种基于大数据的细粒度商品命名实体识别方法

Also Published As

Publication number Publication date
CN109062893B (zh) 2021-09-21

Similar Documents

Publication Publication Date Title
CN109062893A (zh) 一种基于全文注意力机制的商品名称识别方法
CN109146610B (zh) 一种智能保险推荐方法、装置及智能保险机器人设备
CN110717017B (zh) 一种处理语料的方法
CN109933664B (zh) 一种基于情感词嵌入的细粒度情绪分析改进方法
Perone et al. Evaluation of sentence embeddings in downstream and linguistic probing tasks
CN110134771B (zh) 一种基于多注意力机制融合网络问答***的实现方法
CN109753566B (zh) 基于卷积神经网络的跨领域情感分析的模型训练方法
CN109271537B (zh) 一种基于蒸馏学习的文本到图像生成方法和***
CN109697239B (zh) 用于生成图文信息的方法
CN111368548A (zh) 语义识别方法及装置、电子设备和计算机可读存储介质
CN111325571B (zh) 一种多任务学习的商品评论标签自动生成方法、装置及***
CN114565104A (zh) 语言模型的预训练方法、结果推荐方法及相关装置
CN109165291A (zh) 一种文本匹配方法及电子设备
CN104462064A (zh) 一种移动终端信息通讯提示输入内容的方法和***
CN110188346A (zh) 一种基于信息抽取的网络安全法案件智能研判方法
CN113761890A (zh) 一种基于bert上下文感知的多层级语义信息检索方法
CN112434142A (zh) 一种标记训练样本的方法、服务器、计算设备及存储介质
CN115238691A (zh) 基于知识融合的嵌入的多意图识别与槽位填充模型
CN113392179A (zh) 文本标注方法及装置、电子设备、存储介质
CN117313728A (zh) 实体识别方法、模型训练方法、装置、设备和存储介质
CN117851871A (zh) 一种境外互联网社交阵地多模态数据识别方法
CN115269828A (zh) 用于生成评论回复的方法、设备和介质
CN116958997B (zh) 一种基于异质图神经网络的图文摘要方法及***
Xie et al. Extractive text-image summarization with relation-enhanced graph attention network
CN112949284B (zh) 一种基于Transformer模型的文本语义相似度预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210921