CN106611041A - 一种新的文本相似度求解方法 - Google Patents

一种新的文本相似度求解方法 Download PDF

Info

Publication number
CN106611041A
CN106611041A CN201610863609.0A CN201610863609A CN106611041A CN 106611041 A CN106611041 A CN 106611041A CN 201610863609 A CN201610863609 A CN 201610863609A CN 106611041 A CN106611041 A CN 106611041A
Authority
CN
China
Prior art keywords
text
word
information
vocabulary
follows
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610863609.0A
Other languages
English (en)
Inventor
金平艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Yonglian Information Technology Co Ltd
Original Assignee
Sichuan Yonglian Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Yonglian Information Technology Co Ltd filed Critical Sichuan Yonglian Information Technology Co Ltd
Priority to CN201610863609.0A priority Critical patent/CN106611041A/zh
Publication of CN106611041A publication Critical patent/CN106611041A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

一种新的文本相似度求解方法,先对两文本进行分词和去停用词处理,基于信息论方法,计算词汇在文本中权重值,再对其进行归一化处理,根据词汇位置信息和词频计算词汇的权重,综合上述所有因子,构造文本中的特征值目标函数,提取文本中的特征值,最后,根据皮尔森相关系数求解文本相似度。本发明比传统文本相似度计算方法准确度更高,适用性更广,具有更大的应用价值,计算不同词汇对文本思想的贡献度具有更高的精确度,同时为后续的文本聚类提供良好的理论基础。

Description

一种新的文本相似度求解方法
技术领域
本发明涉及语义网络技术领域,具体涉及一种新的文本相似度求解方法。
背景技术
文本语义相似度计算是知识产权保护、文本分类、机器翻译、自然语言处理、复制检测、自动问答和信息检索等领域的核心技术。现有的文本相似度计算方法大致可以归纳为两类,第一类是基于文本特征统计的方法,第二类则是基于文本语义理解的方法。基于文本特征统计的方法在长文本等大粒度实体的相似度计算方面取得了较好的效果,其中最具代表性的就是向量空间模型,简称VSM和广义向量空间模型,简称GVSM。GVSM在VSM的基础上利用文本特征项的共现信息,对VSM模型中特征项正交的假设进行了改进。基于语义理解的方法,通常以某种知识库作为依据实现词语之间或者句子之间相似度的计算。基于统计的方法简单高效,但是缺乏语义,没有考虑到文本中特征词汇中不同词汇对文本重要程度的差异问题。而基于语义理解的方法往往计算比较复杂,不适合大规模的文本处理。为了满足上述需求,本发明提供了一种新的文本相似度求解方法。
发明内容
针对于文本中特征词汇中不同词汇对文本的重要程度的差异问题以及计算文本相似度问题,本发明提供了一种新的文本相似度求解方法。
为了解决上述问题,本发明是通过以下技术方案实现的:
步骤1:初始化文本语料库模块,对待比较文本(W1,W2)的进行预处理。
步骤2:基于信息论方法,计算词汇在文本中权重值WI
步骤3:根据词汇位置信息,计算词汇在文本中的权重值
步骤4:综合考虑上述两因子,构造提取文本(W1,W2)中的特征值目标函数分别提取文本(W1,W2)中的特征值。
步骤5:根据皮尔森相关系数求解待比较文本(W1,W2)间的文本相似度sim(W1,W2)。
本发明有益效果是:
1、此方法比传统的文本相似度计算方法得到的结果具有更高的准确性,更符合人工提取的结果。
2、此方法在信息检索、机器翻译、自动问答***等领域都具有更好的适用性。
3、此算法具有更大的利用价值。
4、此方法粗略计算了特征词汇中不同词汇对文本思想的贡献度。
5、计算特征词汇中不同词汇对文本思想的贡献度具有更高的精确度。
6、为后续的文本聚类提供良好的理论基础。
附图说明
图1一种新的文本相似度求解方法的结构流程图
图2 n元语法分词算法图
具体实施方式
为了解决文本中特征词汇中不同词汇对文本的重要程度的差异和计算文本间的相似度,结合图1对本发明进行了详细说明,其具体实施步骤如下:
步骤1:初始化文本语料库模块,对待比较文本(W1,W2)的进行预处理,其具体描述过程如下:
利用停用表对文本(W1,W2)进行分词和去停用词处理。
这里分词方法利用一种基于信息论中文自动分词算法,其具体分词和去停用词步骤如下:
步骤1.1:利用停用表分别对文本(W1,W2)进行去停用词处理。
步骤1.2:根据《分词词典》找到待分词句子中与词典中匹配的词,其具体描述如下:
把待分词的汉字串完整的扫描一遍,在***的词典里进行查找匹配,遇到字典里有的词就标识出来;如果词典中不存在相关匹配,就简单地分割出单字作为词;直到汉字串为空。
步骤1.3:依据概率统计学,将待分词句子拆分为网状结构,即得n个可能组合的句子结构,把此结构每条顺序节点依次规定为SM1M2M3M4M5E,其结构图如图2所示。
步骤1.4:基于信息论方法,给上述网状结构每条边赋予一定的权值,其具体计算过程如下:
根据《分词词典》匹配出的字典词与未匹配的单个词,第i条路径包含词的个数为ni。即n条路径词的个数集合为(n1,n2,…,nn)。
得min()=min(n1,n2,…,nn)
在上述留下的剩下的(n-m)路径中,求解每条相邻路径的权重大小。
在统计语料库中,计算每个词的信息量X(Ci),再求解路径相邻词的共现信
息量X(Ci,Ci+1)。既有下式:
X(Ci)=|x(Ci)1-x(Ci)2|
上式x(Ci)1为文本语料库中词Ci的信息量,x(Ci)2为含词Ci的文本信息量。
x(Ci)1=-p(Ci)1lnp(Ci)1
上式p(Ci)1为Ci在文本语料库中的概率,n为含词Ci的文本语料库的个数。
x(Ci)2=-p(Ci)2lnp(Ci)2
上式p(Ci)2为含词Ci的文本数概率值,N为统计语料库中文本总数。
同理X(Ci,Ci+1)=|x(Ci,Ci+1)1-x(Ci,Ci+1)2|
x(Ci,Ci+1)1为在文本语料库中词(Ci,Ci+1)的共现信息量,x(Ci,Ci+1)2为相邻词(Ci,Ci+1)共现的文本信息量。
同理x(Ci,Ci+1)1=-p(Ci,Ci+1)1lnp(Ci,Ci+1)1
上式p(Ci,Ci+1)1为在文本语料库中词(Ci,Ci+1)的共现概率,m为在文本库中词(Ci,Ci+1)共现的文本数量。
X(Ci,Ci+1)2=-P(Ci,Ci+1)2lnp(Ci,Ci+1)2
p(Ci,Ci+1)2为文本库中相邻词(Ci,Ci+1)共现的文本数概率。
综上可得每条相邻路径的权值为
w(Ci,Ci+1)=X(Ci)+X(Ci+1)-2X(Ci,Ci+1)
步骤1.5:找到权值最大的一条路径,即为待分词句子的分词结果,其具体计算过程如下:
有n条路径,每条路径长度不一样,假设路径长度集合为(L1,L2,…,Ln)。
假设经过取路径中词的数量最少操作,排除了m条路径,m<n。即剩下(n-m)路径,设其路径长度集合为
则每条路径权重为:
上式w(C1,C2),w(C2,C3),…,分别为第1,2到路径边的权重值,根据步骤1.4可以一一计算得出,为剩下(n-m)路径中第Sj条路径的长度。
权值最大的一条路径:
步骤2:基于信息论方法,计算词汇在文本中权重值WI,其具体计算过程如下:
基于信息论词频的计算公式有:
上式为词汇关于词频在文档中所具有的信息量,p(c1,2)分别为词c1、c2在文本中的概率值。
基于信息论文档频率的计算公式有:
为词汇关于文档频率在文档库中所具有的信息量,为分别含有c1、c2的文档数,N为文档库中文档的总个数。
综上所述,有基于信息论计算词汇权重的函数,归一化后,如下式:
步骤3:根据词汇位置信息,计算词汇在文本中的权重值其具体计算过程如下:
根据调研资料显示,特征词越在文本靠前位置,越能代表文本的中心思想,特征词在文本中出现的次数越多,越具有文本含义的代表性。通过步骤2得到词汇在文本的权重值,取前20个特征词汇。对这些词汇进行位置权重划分。
在文本中每个特征词至少出现一次,文本特征词c(1,2)i构成的位置向量,如下:
则每个特征词位置权重函数为:
上式k为特征词ci出现在文本中的段落数,qh为含有特征词ci的第h段对文本思想的贡献值,qh值由相应文本领域专家经过调研可以得出。nh为特征词ci在第h段出现的次数。
步骤4:综合考虑上述两因子,构造提取文本(W1,W2)中的特征值目标函数分别提取文本(W1,W2)中的特征值,其具体计算过程如下:
提取文本(W1,W2)中的特征值目标函数为:
上式α、β分别为WI对特征提取影响的权重系数,α+β=1,一般α>β,即基于信息论得到的词频与文档频率的权重函数对文本(W1,W2)中特征提取的影响更大,其值可以根据实验测试出来。
步骤5:根据皮尔森相关系数求解待比较文本(W1,W2)间的文本相似度sim(W1,W2),其具体计算过程如下:
根据步骤4计算得出的特征词汇权重值,相关领域专家选取前m位关键词,这里m<20,既分别有文本(W1,W2)对应的特征词向量。
文本W1对应的特征词的平均权重函数为
同理,文本W2对应特征词的平均权重函数为
根据皮尔森相关系数,即可得文本(W1,W2)间的文本相似度sim(W1,W2),有下式:
一种新的文本相似度求解方法,其伪代码计算过程:
输入:待比较待比较文本(W1,W2)。
输出:文本(W1,W2)间的相似度sim(W1,W2)。

Claims (5)

1.一种新的文本相似度求解方法,本发明涉及语义网络技术领域,具体涉及一种新的文本相似度求解方法,其特征是,包括如下步骤:
步骤1:初始化文本语料库模块,对待比较文本的进行预处理,其具体处理过程如下:
利用停用表对文本进行分词和去停用词处理
这里分词方法利用一种基于信息论中文自动分词算法,其具体分词和去停用词步骤如下:
步骤1.1:利用停用表分别对文本进行去停用词处理
步骤1.2:根据《分词词典》找到待分词句子中与词典中匹配的词,其具体描述如下:
把待分词的汉字串完整的扫描一遍,在***的词典里进行查找匹配,遇到字典里有的词就标识出来;如果词典中不存在相关匹配,就简单地分割出单字作为词;直到汉字串为空
步骤1.3:依据概率统计学,将待分词句子拆分为网状结构,即得n个可能组合的句子结构,把此结构每条顺序节点依次规定为,其结构图如图2所示
步骤1.4:基于信息论方法,给上述网状结构每条边赋予一定的权值,其具体计算过程如下:
根据《分词词典》匹配出的字典词与未匹配的单个词,第i条路径包含词的个数为,即n条路径词的个数集合为
在上述留下的剩下的(n-m)路径中,求解每条相邻路径的权重大小
在统计语料库中,计算每个词的信息量,再求解路径相邻词的共现信息量,既有下式:
上式为文本语料库中词的信息量,为含词的文本信息量
上式在文本语料库中的概率,n为含词的文本语料库的个数
上式为含词的文本数概率值,N为统计语料库中文本总数
同理
为在文本语料库中词的共现信息量,为相邻词共现的文本信息量
同理
上式为在文本语料库中词的共现概率,m为在文本库中词共现的文本数量
为文本库中相邻词共现的文本数概率
综上可得每条相邻路径的权值为
步骤1.5:找到权值最大的一条路径,即为待分词句子的分词结果,其具体计算过程如下:
有n条路径,每条路径长度不一样,假设路径长度集合为
假设经过取路径中词的数量最少操作,排除了m条路径,m<n,即剩下(n-m)路径,设其路径长度集合为
则每条路径权重为:
上式分别为第1,2到路径边的权重值,根据步骤1.4可以一一计算得出,为剩下(n-m)路径中第条路径的长度
权值最大的一条路径:
步骤2:基于信息论方法,计算词汇在文本中权重值
步骤3:根据词汇位置信息,计算词汇在文本中的权重值
步骤4:综合考虑上述两因子,构造提取文本中的特征值目标函数,分别提取文本中的特征值
步骤5:根据皮尔森相关系数求解待比较文本间的文本相似度
2.根据权利要求1中所述的一种新的文本相似度求解方法,其特征是,以上所述步骤2中的具体计算过程如下:
步骤2:基于信息论方法,计算词汇在文本中权重值,其具体计算过程如下:
基于信息论词频的计算公式有:
上式为词汇关于词频在文档中所具有的信息量,分别为词在文本中的概率值
基于信息论文档频率的计算公式有:
为词汇关于文档频率在文档库中所具有的信息量,为分别含有的文档数,N为文档库中文档的总个数
综上所述,有基于信息论计算词汇权重的函数,归一化后,如下式:
3.根据权利要求1中所述的一种新的文本相似度求解方法,其特征是,以上所述步骤3中的具体计算过程如下:
步骤3:根据词汇位置信息,计算词汇在文本中的权重值,其具体计算过程如下:
根据调研资料显示,特征词越在文本靠前位置,越能代表文本的中心思想,特征词在文本中出现的次数越多,越具有文本含义的代表性,通过步骤2得到词汇在文本的权重值,取前20个特征词汇,对这些词汇进行位置权重划分
在文本中每个特征词至少出现一次,文本特征词构成的位置向量,如下:
则每个特征词位置权重函数为:
上式k为特征词出现在文本中的段落数,为含有特征词的第h段对文本思想的贡献值,值由相应文本领域专家经过调研可以得出,为特征词在第h段出现的次数。
4.根据权利要求1中所述的一种新的文本相似度求解方法,其特征是,以上所述步骤4中的具体计算过程如下:
步骤4:综合考虑上述两因子,构造提取文本中的特征值目标函数,分别提取文本中的特征值,其具体计算过程如下:
提取文本中的特征值目标函数为:
上式分别为对特征提取影响的权重系数,,一般,即基于信息论得到的词频与文档频率的权重函数对文本中特征提取的影响更大,其值可以根据实验测试出来。
5.根据权利要求1中所述的一种新的文本相似度求解方法,其特征是,以上所述步骤5中的具体计算过程如下:
步骤5:根据皮尔森相关系数求解待比较文本间的文本相似度,其具体计算过程如下:
根据步骤4计算得出的特征词汇权重值,相关领域专家选取前m位关键词,这里m<20,既分别有文本对应的特征词向量
文本对应的特征词的平均权重函数为
同理,文本对应特征词的平均权重函数为
根据皮尔森相关系数,即可得文本间的文本相似度,有下式:
CN201610863609.0A 2016-09-29 2016-09-29 一种新的文本相似度求解方法 Pending CN106611041A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610863609.0A CN106611041A (zh) 2016-09-29 2016-09-29 一种新的文本相似度求解方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610863609.0A CN106611041A (zh) 2016-09-29 2016-09-29 一种新的文本相似度求解方法

Publications (1)

Publication Number Publication Date
CN106611041A true CN106611041A (zh) 2017-05-03

Family

ID=58614814

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610863609.0A Pending CN106611041A (zh) 2016-09-29 2016-09-29 一种新的文本相似度求解方法

Country Status (1)

Country Link
CN (1) CN106611041A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108717407A (zh) * 2018-05-11 2018-10-30 北京三快在线科技有限公司 实体向量确定方法及装置,信息检索方法及装置
CN108829780A (zh) * 2018-05-31 2018-11-16 北京万方数据股份有限公司 文本检测方法、装置、计算设备及计算机可读存储介质
CN108984556A (zh) * 2017-06-01 2018-12-11 北京京东尚科信息技术有限公司 用于数据处理的方法、装置及计算机可读存储介质
CN109003662A (zh) * 2018-07-11 2018-12-14 腾讯科技(深圳)有限公司 医师信息的提供方法、装置、设备及存储介质
CN109783816A (zh) * 2019-01-11 2019-05-21 河北工程大学 短文本聚类方法及终端设备
CN110619117A (zh) * 2018-06-19 2019-12-27 广州优视网络科技有限公司 关键词提取方法和装置
CN111797214A (zh) * 2020-06-24 2020-10-20 深圳壹账通智能科技有限公司 基于faq数据库的问题筛选方法、装置、计算机设备及介质
CN113658672A (zh) * 2021-08-23 2021-11-16 平安国际智慧城市科技股份有限公司 医师多点执业管理方法、装置、设备及存储介质
CN114036957A (zh) * 2021-12-27 2022-02-11 中科大数据研究院 一种快速语义相似度计算方法
CN116484830A (zh) * 2023-06-26 2023-07-25 山东省标准化研究院(Wto/Tbt山东咨询工作站) 基于大数据的互联网广告智能监测***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224695A (zh) * 2015-11-12 2016-01-06 中南大学 一种基于信息熵的文本特征量化方法和装置及文本分类方法和装置
CN105808711A (zh) * 2016-03-04 2016-07-27 北京工业大学 一种基于文本语义的概念生成模型的***和方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224695A (zh) * 2015-11-12 2016-01-06 中南大学 一种基于信息熵的文本特征量化方法和装置及文本分类方法和装置
CN105808711A (zh) * 2016-03-04 2016-07-27 北京工业大学 一种基于文本语义的概念生成模型的***和方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
BECK_ZHOU: "中文分词语言模型和动态规划", 《CSDN博客HTTPS://BLOG.CSDN.BET/ZHOUBL668/ARTICLE/DETAILS/6896438》 *
刘景方: "一种改进的本体概念语义相似度算法研究", 《武汉理工大学学报》 *
杨云 等: "基于潜在特征词的文本相似度计算方法", 《计算机工程与设计》 *
陈德人: "《网络零售(第2版)》", 31 August 2015, 清华大学出版社 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108984556A (zh) * 2017-06-01 2018-12-11 北京京东尚科信息技术有限公司 用于数据处理的方法、装置及计算机可读存储介质
CN108717407B (zh) * 2018-05-11 2022-08-09 北京三快在线科技有限公司 实体向量确定方法及装置,信息检索方法及装置
CN108717407A (zh) * 2018-05-11 2018-10-30 北京三快在线科技有限公司 实体向量确定方法及装置,信息检索方法及装置
CN108829780A (zh) * 2018-05-31 2018-11-16 北京万方数据股份有限公司 文本检测方法、装置、计算设备及计算机可读存储介质
CN110619117A (zh) * 2018-06-19 2019-12-27 广州优视网络科技有限公司 关键词提取方法和装置
CN110619117B (zh) * 2018-06-19 2024-03-19 阿里巴巴(中国)有限公司 关键词提取方法和装置
CN109003662A (zh) * 2018-07-11 2018-12-14 腾讯科技(深圳)有限公司 医师信息的提供方法、装置、设备及存储介质
CN109783816A (zh) * 2019-01-11 2019-05-21 河北工程大学 短文本聚类方法及终端设备
CN109783816B (zh) * 2019-01-11 2023-04-07 河北工程大学 短文本聚类方法及终端设备
CN111797214A (zh) * 2020-06-24 2020-10-20 深圳壹账通智能科技有限公司 基于faq数据库的问题筛选方法、装置、计算机设备及介质
CN113658672A (zh) * 2021-08-23 2021-11-16 平安国际智慧城市科技股份有限公司 医师多点执业管理方法、装置、设备及存储介质
CN114036957B (zh) * 2021-12-27 2022-06-21 中科大数据研究院 一种快速语义相似度计算方法
CN114036957A (zh) * 2021-12-27 2022-02-11 中科大数据研究院 一种快速语义相似度计算方法
CN116484830A (zh) * 2023-06-26 2023-07-25 山东省标准化研究院(Wto/Tbt山东咨询工作站) 基于大数据的互联网广告智能监测***
CN116484830B (zh) * 2023-06-26 2023-12-26 山东省标准化研究院(Wto/Tbt山东咨询工作站) 基于大数据的互联网广告智能监测***

Similar Documents

Publication Publication Date Title
CN106611041A (zh) 一种新的文本相似度求解方法
CN106610951A (zh) 改进的基于语义分析的文本相似度求解算法
CN106598940A (zh) 基于全局优化关键词质量的文本相似度求解算法
CN109753660B (zh) 一种基于lstm的中标网页命名实体抽取方法
CN110134946B (zh) 一种针对复杂数据的机器阅读理解方法
CN105068997B (zh) 平行语料的构建方法及装置
CN110362678A (zh) 一种自动提取中文文本关键词的方法与装置
CN107102983B (zh) 一种基于网络知识源的中文概念的词向量表示方法
CN106528621A (zh) 一种改进的密度文本聚类算法
CN106570112A (zh) 基于改进的蚁群算法实现文本聚类
CN109635297A (zh) 一种实体消歧方法、装置、计算机装置及计算机存储介质
CN106598941A (zh) 一种全局优化文本关键词质量的算法
CN112069312B (zh) 一种基于实体识别的文本分类方法及电子装置
CN106610952A (zh) 一种混合的文本特征词汇提取方法
CN103324626A (zh) 一种建立多粒度词典的方法、分词的方法及其装置
CN107102985A (zh) 改进的文档中多主题的关键词提取技术
CN112364628B (zh) 一种新词识别方法、装置、电子设备及存储介质
CN106610954A (zh) 基于统计学的文本特征词汇提取方法
CN106610949A (zh) 一种基于语义分析的文本特征提取方法
CN106570120A (zh) 一种改进的关键词优化实现搜索引擎优化技术
CN106610937A (zh) 一种基于信息论的中文自动分词算法
CN106610953A (zh) 基于基尼指数求解文本相似度的方法
CN108287825A (zh) 一种术语识别抽取方法及***
CN106776678A (zh) 新的关键词优化实现搜索引擎优化技术
CN114398943B (zh) 样本增强方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170503