CN110163772A - 一种基于BiLSTM-CRF的旅游行程路线生成方法 - Google Patents

一种基于BiLSTM-CRF的旅游行程路线生成方法 Download PDF

Info

Publication number
CN110163772A
CN110163772A CN201910315957.8A CN201910315957A CN110163772A CN 110163772 A CN110163772 A CN 110163772A CN 201910315957 A CN201910315957 A CN 201910315957A CN 110163772 A CN110163772 A CN 110163772A
Authority
CN
China
Prior art keywords
bilstm
word
sequence
crf
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910315957.8A
Other languages
English (en)
Inventor
汤景凡
林培捷
王晶晶
曹祥彪
姜明
张旻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN201910315957.8A priority Critical patent/CN110163772A/zh
Publication of CN110163772A publication Critical patent/CN110163772A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/14Travel agencies

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于BiLSTM‑CRF的旅游行程路线生成方法。本发明步骤如下:步骤(1)训练BiLSTM‑CRF模型;步骤(2)将文章输入训练好的BiLSTM‑CRF模型,输出文章中含有的中文命名体集合;步骤(3)对模型输出的命名体集合进行规则化筛选,挑选出符合条件的中文景区名称;步骤(4)将经过筛选的命名体集合,输入到蚁群算法,输出旅游行程路线。本发明利用BiLSTM‑CRF模型识别旅游攻略和游记中的中文景区名称,结合蚁群算法,基于景区之间的距离生成旅游行程路线,这种方法能有效结合智慧旅游概念,充分利用海量的旅游资源,个性化推荐旅游行程方案,满足广大游客的需求。

Description

一种基于BiLSTM-CRF的旅游行程路线生成方法
技术领域
本发明属于智慧旅游智能推荐领域,涉及人工智能算法与行程规划算法,具体来讲是一种基于BiLSTM-CRF(Bi-directional Long Short-Term Memory-ConditionalRandom Fields)的旅游行程路线生成方法。
背景技术
智慧旅游,利用云计算、人工智能等新技术,通过互联网/移动互联网,借助便携的终端上网设备,主动感知旅游资源、旅游经济、旅游活动等方面的信息。在这一领域,面向旅游行程路线智能推荐的解决方案十分稀少,大多数旅游网站、机构仍然停留在人工制定旅游行程的传统方法。该方法成本高昂,无法满足数量庞大的游客旅游出行需求,也与智慧旅游相去甚远。所以更好的制定旅游行程路线方法是利用人工智能技术,通过深度学习建立领域模型,让模型自动学习大量旅游攻略和游记的行程路线,从而自动高效迅速的生成旅游行程路线方案。
发明内容
本发明针对智慧旅游领域在旅游行程路线推荐方面无法提供高效解决方法的问题,公开一种基于BiLSTM-CRF的旅游行程路线生成方法,一种能够从大量旅游攻略和游记中自动识别并生成旅游行程路线的方法。
为实现以上的技术目的,本发明将采取以下的技术方案:
步骤(1)训练BiLSTM-CRF模型;
步骤(2)将文章输入训练好的BiLSTM-CRF模型,输出文章中含有的中文命名体集合(人名、地名和组织机构名);
步骤(3)对模型输出的命名体集合进行规则化筛选,挑选出符合条件的中文景区名称;
步骤(4)将经过筛选的命名体集合,输入到蚁群算法,输出旅游行程路线。
步骤(1)所述的训练BiLSTM-CRF模型,具体实现如下:
1-1.对收集到的文章使用BIO标注集,构建字典,构造查找表,构建词嵌入向量,获取数据集。
1-2.构建BiLSTM循环神经网络框架;
1-3.构建CRF条件随机场算法框架;
1-4.计算句子中每个字的所有标签的各自得分,将步骤1-1处理后的数据集输入BiLSTM循环神经网络,计算出得分;
1-5.将步骤1-4中计算出的每个字的所有标签的各自得分归一化后当作CRF模型的发射概率输入CRF模型中,计算得出每个字对应的预测标签序列。
1-6.对步骤1-5中求得的标签序列通过Viterbi(维特比)算法来解得最优解,计算出最优标签序列。
进一步的,步骤1-1具体为:
将每个元素标注为“B-X”、“I-X”或者“O”。其中,“B-X”表示此元素所在的片段属于X类型并且此元素在此片段的开头;“I-X”表示此元素所在的片段属于X类型并且此元素在此片段的中间位置;“O”表示不属于任何类型。
进一步将BIO应用到NER中,即B-PER、I-PER分别代表人名首字、人名非首字,B-LOC、I-LOC分别代表地名首字、地名非首字,B-ORG、I-ORG分别代表组织机构名首字、组织机构名非首字,O代表该字不属于任何类型。
首先构建字典,将每个句子的每个字按照其在句子中的位置设置编号,记作ni,i表示该字在句子的位置;
接着构建每个字的one-hot矩阵,通过one-hot矩阵表示一个字,one-hot矩阵是指每一行有且只有一个元素为1,其他元素都是0的矩阵。针对字典中的每个字,根据其编号,对某个句子进行编码时,将句子中的每个字转换成字典里面这个字的编号对应的位置为1的one-hot矩阵,如下所示:
接下来,利用预训练或随机初始化的向量矩阵将句子中的每个字由one-hot矩阵映射为低维稠密的字向量(character embedding)。
进一步的,步骤1-2中:
将前向的LSTM与后向的LSTM结合成BiLSTM,可以更好的捕捉双向的语义依赖,其中LSTM的计算过程如下:
(1)计算遗忘门f,选择要遗忘的信息:
ft=σ(Wf·[ht-1,xt]+bf)
(2)计算记忆门的值it,选择要记忆的信息:
it=σ(Wi·[ht-1,xt]+bi)
(3)计算当前时刻细胞状态:
(4)计算输出门的值ot和当前时刻隐层状态ht
ot=σ(Wo·[ht-1,xt]+bo)
ht=ot*tanh(ct)
最终得到与句子长度相同的隐层状态序列。
其中,参数t表示计算过程中的时刻,ht-1为前一时刻的隐层状态,xt为当前时刻的输入词,ft为遗忘门的值,W表示权重矩阵,b表示偏置值,是sigmoid函数,下标f表示遗忘门本身,下标i表示输入门本身,下标c表示临时细胞状态本身,下标o表示输出门本身;为临时细胞状态;ot为输出门的值。
进一步的,步骤1-3中:
选择线性链条件随机场作为标注模型,即在给定随机变量序列X的条件下,随机变量序列Y的条件概率分布为P(Y|X)构成条件随机场,且满足马尔可夫性。
进一步的,在随机变量X取值为x的条件下,随机变量Y取值为y的条件概率具有如下形式:
其中:
式中,tk和sl是特征函数,λk和μl是对应的权值;Z(x)是规范化因子,求和是在所有可能的输出序列上进行的;其中下标k表示边,下标l表示结点,下标i表示y的取值可能。
进一步的,条件随机场的学习算法,通过给定训练数据集估计条件随机场模型参数,采用极大似然估计法计算权重参数,训练数据的对数似然函数为:
其中,为训练样本集中样本x和样本y的经验概率,等同于x和y同时出现的次数除以样本空间容量;为训练样本集中样本x的经验概率,等于x出现的次数除以样本空间容量;之后对λ求导、求解。
进一步的,步骤1-6中的Viterbi算法公式为:
其中x为观察序列(也称输入序列,即步骤1-5中求得的标签序列),y为标记序列(也称输出序列,即最终所求的最优序列)。
进一步的,步骤(3)所述的对模型输出的包含文章命名体的最优序列,将其对照事先准备好的字典(字典为一系列命名体集合)进行筛选,即剔除序列中所有不包含在字典内的命名体,只留下实际需要的景区或地名等。
进一步的,步骤(4)所述的对经过筛选的景区或地名,根据各景点之间的实际距离,利用蚁群算法计算出最优路径(即各景点走一遍后回到原点所走过的长度最短),即最终的旅游行程路线方案,具体实现方法如下:
4-1.初始化存储信息素表,已走过景点表,未走过景点表,定义固定数量的蚂蚁,其中蚂蚁每经过一个景点就会释放信息素。
4-2.通过计算转移概率,为每只蚂蚁选择下一个节点(景点),该公式如下:
其中,表示选择景点j的概率,k表示第k个蚂蚁;τij (t)表示景点i,j在第t时刻的信息素浓度;ηij (t)表示从景点i到景点j的可见度;τis (t)表示景点i,s在第t时刻的信息素浓度;ηis (t)表示从景点i到景点s的可见度;dij表示景点i,j之间的距离;α表示信息素的相对重要程度;β表示启发式因子的相对重要程度;Jk(i)表示蚂蚁k下一步允许选择的城市集合;
4-3.当所有蚂蚁完成一次循环计算后,更新各路径上的信息素,具体计算方式如下:
τij (t+n)=ρ·τij (t)+Δτij
若蚂蚁k在本次行走过程中经过地点i和j,否则为0。
其中,τij (t+n)为t+n时刻景点i与j之间的信息浓度,ρ为控制参数,Q为正常数,Lk为蚂蚁k在本次行走中所走过的路径的长度。
4-4.设置算法迭代次数为140次,当迭代次数达到最大迭代次数时,算法终止,跳到步骤4-5;否则,重复执行步骤4-2、4-3、4-4直到迭代结束;
4-5.输出计算结果,即最优路径(最优旅游行程路线)。
本发明由于采取以上技术方案,具有如下优点:
本发明利用前后向循环神经网络结合条件随机场实现对文章的命名体识别,随后再利用蚁群算法实现路径规划,最终输出合理可解释的旅游行程路线方案,这种方法能有效结合智慧旅游概念,充分利用海量的旅游资源,形成个性化推荐旅游行程方案,满足广大游客的需求。
附图说明
图1是本发明的整体实施方案流程图;
图2是本发明的训练模型示意图;
图3是本发明工艺实施方案的具体流程图;
具体实施方式
附图非限制性的公开了本发明所涉及优选实施例的流程示意图;以下将结合附图详细的说明本发明的技术方案。
一种基于BiLSTM-CRF的旅游行程路线生成方法,其基本步骤如下:
训练BiLSTM-CRF模型;
将文章输入训练好的BiLSTM-CRF模型,输出文章中含有的中文命名体(人名、地名和组织机构名);
对模型输出的命名体进行规则化筛选,挑选出符合条件的中文地名,中文景区名称;
对经过筛选的结果使用蚁群算法计算行程路线,输出行程方案。
其中训练训练BiLSTM-CRF模型的步骤如下:
从网络上采集所需旅游攻略游记,以篇为单位,做好前期标注工作,并将所有数据集分为两部分,一部分作为训练集,一部分作为测试集。
取训练集中的文章,对文章的每个字构造词嵌入向量,构造查找表。接着将词嵌入向量输入BiLSTM网络,计算出每个字的对应各个类别的分数,全部字的类别分数构成一个矩阵。
将上述字的类别分数矩阵输入CRF模型,输出每个字或词的预测标签,最终通过维特比算法求出最优解,此时得到的是一个包含文章所有命名体的结果。
通过上述步骤可以训练出BiLSTM-CRF模型。
本发明详细流程如图1和图3。其中具体的BiLSTM-CRF模型模型如图2。
实施例:
从网络上采集所需旅游攻略游记,以篇为单位,做好前期标注工作,具体例子如下:
小(B-PER)明(I-PER)在(O)希(B-ORG)望(I-ORG)小(I-ORG)学(I-ORG)读(O)书(O)
并将所有数据集分为两部分,一部分作为训练集,一部分作为测试集。取训练集中的文章,以句子为单位,构造词嵌入向量,构造查找表。
如图1,将词嵌入向量输入BiLSTM网络,计算出每个字的对应各个类别的分数,全部字的类别分数构成一个矩阵,具体实现步骤如下:
将一个句子的各个字的词嵌入向量序列作为双向LSTM各个步的输入,再将正向LSTM的输出的隐状态序列与反向LSTM的隐状态序列在各个位置输出的隐状态序列进行拼接,得到完整的隐状态序列;
最后将隐状态序列依照标签数变换成字的类别标签分数矩阵。
如图3,将上述字的类别标签分数矩阵输入CRF模型,输出每个字或词的预测标签,最终通过维特比算法求出最优解,此时得到的是一个包含文章所有命名体的结果;
为上述步骤设置1000次左右的迭代训练次数,次数过多会发生过拟合,期望测试结果是识别效果达到百分之八十以上。
将上述所得的命名体集合通过字典进行规则化筛选,筛除部分不符合要求的命名体;接着对经过筛选后的命名体集合,利用蚁群算法求解出基于距离长短的最优路径,最终输出合理的旅游行程路线方案。

Claims (4)

1.一种基于BiLSTM-CRF的旅游行程路线生成方法,其特征在于包括如下步骤:
步骤(1)训练BiLSTM-CRF模型;
步骤(2)将文章输入训练好的BiLSTM-CRF模型,输出文章中含有的中文命名体集合;
步骤(3)对模型输出的命名体集合进行规则化筛选,挑选出符合条件的中文景区名称;
步骤(4)将经过筛选的命名体集合,输入到蚁群算法,输出旅游行程路线;
步骤(1)所述的训练BiLSTM-CRF模型,具体实现如下:
1-1.对收集到的文章使用BIO标注集,构建字典,构造查找表,构建词嵌入向量,获取数据集;
1-2.构建BiLSTM循环神经网络框架;
1-3.构建CRF条件随机场算法框架;
1-4.计算句子中每个字的所有标签的各自得分,将步骤1-1处理后的数据集输入BiLSTM循环神经网络,计算出得分;
1-5.将步骤1-4中计算出的每个字的所有标签的各自得分归一化后当作CRF模型的发射概率输入CRF模型中,计算得出每个字对应的预测标签序列;
1-6.对步骤1-5中求得的标签序列通过Viterbi(维特比)算法来解得最优解,计算出最优标签序列。
2.根据权利要求1所述的一种基于BiLSTM-CRF的旅游行程路线生成方法,其特征在于步骤1-1具体为:
将每个元素标注为“B-X”、“I-X”或者“O”;其中,“B-X”表示此元素所在的片段属于X类型并且此元素在此片段的开头;“I-X”表示此元素所在的片段属于X类型并且此元素在此片段的中间位置;“O”表示不属于任何类型;
将BIO应用到NER中,即B-PER、I-PER分别代表人名首字、人名非首字,B-LOC、I-LOC分别代表地名首字、地名非首字,B-ORG、I-ORG分别代表组织机构名首字、组织机构名非首字,O代表该字不属于任何类型;
首先构建字典,将每个句子的每个字按照其在句子中的位置设置编号,记作ni,i表示该字在句子的位置;
接着构建每个字的one-hot矩阵,通过one-hot矩阵表示一个字,one-hot矩阵是指每一行有且只有一个元素为1,其他元素都是0的矩阵;针对字典中的每个字,根据其编号,对某个句子进行编码时,将句子中的每个字转换成字典里面这个字的编号对应的位置为1的one-hot矩阵;
其次利用预训练或随机初始化的向量矩阵将句子中的每个字由one-hot矩阵映射为低维稠密的字向量(character embedding);
步骤1-2具体为:
将前向的LSTM与后向的LSTM结合成BiLSTM,从而更好的捕捉双向的语义依赖,其中LSTM的计算过程如下:
(1)计算遗忘门f,选择要遗忘的信息:
ft=σ(Wf·[ht-1,xt]+bf)
(2)计算记忆门的值it,选择要记忆的信息:
it=σ(Wi·[ht-1,xt]+bi)
(3)计算当前时刻细胞状态:
(4)计算输出门的值ot和当前时刻隐层状态ht
ot=σ(Wo·[ht-1,xt]+bo)
ht=ot*tanh(ct)
最终得到与句子长度相同的隐层状态序列;
其中,参数t表示计算过程中的时刻,ht-1为前一时刻的隐层状态,xt为当前时刻的输入词,ft为遗忘门的值,W表示权重矩阵,b表示偏置值,是sigmoid函数,下标f表示遗忘门本身,下标i表示输入门本身,下标c表示临时细胞状态本身,下标o表示输出门本身;为临时细胞状态;ot为输出门的值;
步骤1-3具体为:
选择线性链条件随机场作为标注模型,即在给定随机变量序列X的条件下,随机变量序列Y的条件概率分布为P(Y|X)构成条件随机场,且满足马尔可夫性;
在随机变量X取值为x的条件下,随机变量Y取值为y的条件概率具有如下形式:
其中:
式中,tk和sl是特征函数,λk和μl是对应的权值;Z(x)是规范化因子,求和是在所有可能的输出序列上进行的;其中下标k表示边,下标l表示结点,下标i表示y的取值;
通过给定训练数据集估计条件随机场模型参数,采用极大似然估计法计算权重参数,训练数据的对数似然函数为:
其中,为训练样本集中样本x和样本y的经验概率,等同于x和y同时出现的次数除以样本空间容量;为训练样本集中样本x的经验概率,等于x出现的次数除以样本空间容量;之后对λ求导、求解;
步骤1-6中的Viterbi算法公式为:
其中x为观察序列,也称输入序列,即步骤1-5中求得的标签序列;y为标记序列,也称输出序列,即最终所求的最优序列。
3.根据权利要求2所述的一种基于BiLSTM-CRF的旅游行程路线生成方法,其特征在于步骤(3)所述的对模型输出的命名体集合的最优序列,将其对照事先准备好的字典进行筛选,剔除序列中所有不包含在字典内的命名体,只留下实际需要的景区或地名。
4.根据权利要求3所述的一种基于BiLSTM-CRF的旅游行程路线生成方法,其特征在于步骤(4)所述的对经过筛选的景区或地名,根据各景点之间的实际距离,利用蚁群算法计算出最优路径,即最终的旅游行程路线方案,具体实现方法如下:
4-1.初始化存储信息素表,已走过景点表,未走过景点表,定义固定数量的蚂蚁,其中蚂蚁每经过一个景点就会释放信息素;
4-2.通过计算转移概率,为每只蚂蚁选择下一个景点,该公式如下:
其中,表示选择景点j的概率,k表示第k个蚂蚁;τij(t)表示景点i,j在第t时刻的信息素浓度;ηij(t)表示从景点i到景点j的可见度;τis(t)表示景点i,s在第t时刻的信息素浓度;ηis(t)表示从景点i到景点s的可见度;dij表示景点i,j之间的距离;α表示信息素的相对重要程度;β表示启发式因子的相对重要程度;Jk(i)表示蚂蚁k下一步允许选择的城市集合;
4-3.当所有蚂蚁完成一次循环计算后,更新各路径上的信息素,具体计算方式如下:
τij(t+n)=ρ·τij(t)+Δτij
若蚂蚁k在本次行走过程中经过地点i和j,否则为0。
其中,τij(t+n)为t+n时刻景点i与j之间的信息浓度,ρ为控制参数,Q为正常数,Lk为蚂蚁k在本次行走中所走过的路径的长度;
4-4.设置算法迭代次数为140次,当迭代次数达到最大迭代次数时,算法终止,跳到步骤4-5;否则,重复执行步骤4-2、4-3、4-4直到迭代结束;
4-5.输出计算结果,即最优路径。
CN201910315957.8A 2019-04-19 2019-04-19 一种基于BiLSTM-CRF的旅游行程路线生成方法 Pending CN110163772A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910315957.8A CN110163772A (zh) 2019-04-19 2019-04-19 一种基于BiLSTM-CRF的旅游行程路线生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910315957.8A CN110163772A (zh) 2019-04-19 2019-04-19 一种基于BiLSTM-CRF的旅游行程路线生成方法

Publications (1)

Publication Number Publication Date
CN110163772A true CN110163772A (zh) 2019-08-23

Family

ID=67639665

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910315957.8A Pending CN110163772A (zh) 2019-04-19 2019-04-19 一种基于BiLSTM-CRF的旅游行程路线生成方法

Country Status (1)

Country Link
CN (1) CN110163772A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110751576A (zh) * 2019-10-21 2020-02-04 中国民航信息网络股份有限公司 一种旅客行程确定方法、装置及服务器
CN112182398A (zh) * 2020-10-13 2021-01-05 福州大学 考虑用户的长期偏好与短期偏好的景点推荐方法和***
CN113112058A (zh) * 2021-03-30 2021-07-13 西安理工大学 一种基于知识图谱与蚁群算法的旅游路线推荐方法
CN114065761A (zh) * 2021-10-14 2022-02-18 西安理工大学 基于词汇增强的中文命名体识别方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108268444A (zh) * 2018-01-10 2018-07-10 南京邮电大学 一种基于双向lstm、cnn和crf的中文分词方法
CN108959242A (zh) * 2018-05-08 2018-12-07 中国科学院信息工程研究所 一种基于中文字符词性特征的目标实体识别方法及装置
CN109145303A (zh) * 2018-09-06 2019-01-04 腾讯科技(深圳)有限公司 命名实体识别方法、装置、介质以及设备
US20190034795A1 (en) * 2017-07-28 2019-01-31 Microsoft Technology Licensing, Llc Domain addition systems and methods for a language understanding system
CN109635279A (zh) * 2018-11-22 2019-04-16 桂林电子科技大学 一种基于神经网络的中文命名实体识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190034795A1 (en) * 2017-07-28 2019-01-31 Microsoft Technology Licensing, Llc Domain addition systems and methods for a language understanding system
CN108268444A (zh) * 2018-01-10 2018-07-10 南京邮电大学 一种基于双向lstm、cnn和crf的中文分词方法
CN108959242A (zh) * 2018-05-08 2018-12-07 中国科学院信息工程研究所 一种基于中文字符词性特征的目标实体识别方法及装置
CN109145303A (zh) * 2018-09-06 2019-01-04 腾讯科技(深圳)有限公司 命名实体识别方法、装置、介质以及设备
CN109635279A (zh) * 2018-11-22 2019-04-16 桂林电子科技大学 一种基于神经网络的中文命名实体识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
GUILLAUME LAMPLE ET AL.: "Neural Architectures for Named Entity Recognition", 《PROCEEDINGS OF NAACL-HLT 2016》 *
徐锋 等: "改进蚁群算法在旅游路线规划中的应用研究", 《计算机工程与应用》 *
柏兵 等: "基于 CRF 和 BI-LSTM 的命名实体识别方法", 《北京信息科技大学学报》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110751576A (zh) * 2019-10-21 2020-02-04 中国民航信息网络股份有限公司 一种旅客行程确定方法、装置及服务器
CN112182398A (zh) * 2020-10-13 2021-01-05 福州大学 考虑用户的长期偏好与短期偏好的景点推荐方法和***
CN112182398B (zh) * 2020-10-13 2022-05-10 福州大学 考虑用户的长期偏好与短期偏好的景点推荐方法和***
CN113112058A (zh) * 2021-03-30 2021-07-13 西安理工大学 一种基于知识图谱与蚁群算法的旅游路线推荐方法
CN113112058B (zh) * 2021-03-30 2023-07-18 西安理工大学 一种基于知识图谱与蚁群算法的旅游路线推荐方法
CN114065761A (zh) * 2021-10-14 2022-02-18 西安理工大学 基于词汇增强的中文命名体识别方法

Similar Documents

Publication Publication Date Title
CN110163772A (zh) 一种基于BiLSTM-CRF的旅游行程路线生成方法
CN110555112B (zh) 一种基于用户正负偏好学习的兴趣点推荐方法
CN110188227B (zh) 一种基于深度学习与低秩矩阵优化的哈希图像检索方法
CN110134774A (zh) 一种基于注意力决策的图像视觉问答模型、方法和***
CN109886072B (zh) 基于双向Ladder结构的人脸属性分类***
CN107918782A (zh) 一种生成描述图像内容的自然语言的方法与***
CN107066973A (zh) 一种利用时空注意力模型的视频内容描述方法
CN106095872A (zh) 用于智能问答***的答案排序方法及装置
CN111198964B (zh) 图像检索方法及***
CN104035996B (zh) 基于Deep Learning的领域概念抽取方法
CN111506835B (zh) 一种融合用户时间特征和个性特征的数据特征提取方法
CN110321862B (zh) 一种基于紧致三元损失的行人再识别方法
CN111985572A (zh) 基于特征比较的通道注意力机制的细粒度图像识别方法
CN111400494B (zh) 一种基于GCN-Attention的情感分析方法
CN113361278B (zh) 一种基于数据增强与主动学习的小样本命名实体识别方法
CN106228139A (zh) 一种基于卷积网络的表观年龄预测算法及其***
CN109784288A (zh) 一种基于判别感知融合的行人再识别方法
CN112347269A (zh) 基于BERT和Att-BiLSTM的论点对识别方法
CN114625882A (zh) 提高图像文本描述独特多样性的网络构建方法
CN114821770B (zh) 文本到图像的跨模态行人再识别方法、***、介质和设备
CN110196918A (zh) 一种基于目标检测的无监督深度哈希方法
CN108985378B (zh) 一种基于混合交叉深度网络的域自适应方法
CN110502964A (zh) 一种无监督数据驱动的行人重识别方法
CN112926323B (zh) 基于多级残差卷积与注意力机制的中文命名实体识别方法
CN113657473A (zh) 一种基于迁移学习的Web服务分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190823