CN105868773A - 一种基于层次随机森林的多标签分类方法 - Google Patents

一种基于层次随机森林的多标签分类方法 Download PDF

Info

Publication number
CN105868773A
CN105868773A CN201610171082.5A CN201610171082A CN105868773A CN 105868773 A CN105868773 A CN 105868773A CN 201610171082 A CN201610171082 A CN 201610171082A CN 105868773 A CN105868773 A CN 105868773A
Authority
CN
China
Prior art keywords
label
data
random forest
tag
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610171082.5A
Other languages
English (en)
Inventor
吴庆耀
谭明奎
陈健
林世杭
黄翰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201610171082.5A priority Critical patent/CN105868773A/zh
Publication of CN105868773A publication Critical patent/CN105868773A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于层次随机森林的多标签分类方法,所述方法包括:从训练数据集中随机抽取一部分数据,使用这部分随机抽取的数据训练一棵层次树,层次树中节点的分列基于节点中所有数据的标签的聚类结果,重复建立多棵层次树,进而建立层次随机森林作为多标签分类器,并使用建立的层次随机森林多标签分类器对无标签的对象进行分类。该方法利用数据的多个标签之间总有一定的关联性的基本思想,基于标签的聚类结果建立层次树,并为树的每个节点都建立一个分类器;使用随机森林的思想,建立层次随机森林,充分考虑标签之间关联的各种可能性,泛化层次树的分类误差,提高多标签分类问题的速度和准确度。

Description

一种基于层次随机森林的多标签分类方法
技术领域
本发明涉及涉及多标签分类领域,具体涉及基于层次随机森林的多标签分类方法。
背景技术
多标签分类问题是分类问题中比较复杂的问题,不同于两类分类问题,它允许问题中存在多个类别;不同于多类分类问题,它允许分类对象同时属于多个类别。现实中存在许多多标签分类问题。一个比较常见的问题是为电影分类,电影的类别有很多种,比如,科幻、喜剧、动作、剧情等,一部电影可以同时属于喜剧和剧情,即同时属于不止一个类别,而且绝大多数电影都是属于多个类别的。在文本分类中,可以将一篇文章分到多个话题中,比如,社会、科学、体育、娱乐、教育等;在风景图像分类中,一幅图像可以有多个主题,比如,树林、海滩、山、草原等。多标签问题在现实生活中具有极其广泛的应用,因此对多标签分类问题的研究无疑具有非常重大的现实意义。目前,多标签分类问题的算法主要有两大类,一类是基于数据集分解的方法,另一类是基于单个优化问题的方法。虽然对多标签分类问题的研究已经有了一定的成果,但是在分类的速度和准确度上仍然有待提高。
发明内容
本发明的目的是提供一种基于层次随机森林的多标签分类方法,克服现有技术存在的上述不足。
本发明的目的可以通过采取如下技术方案实现。
一种基于层次随机森林的多标签分类方法,包括如下步骤:
S1、从训练数据集中随机抽取一部分数据;
S2、使用步骤S1抽取的数据建立一棵层次树;
S3、重复步骤S1-S2,建立层次随机森林作为多标签分类器;
S4、使用步骤S3建立的多标签分类器对无标签的对象进行分类。
作为一种具体的实施方案,步骤S1中,所述的从训练数据集中随机抽取一部分数据,具体方法为:使用bagging方法对训练数据集进行有放回地抽样,随机抽取N次,将随机抽取的数据中重复出现的数据删除。
作为一种具体的实施方案,步骤S2中,所述的建立一棵层次树,具体方法包括以下步骤:
S31、创建一个根节点,此节点包含数据所有的标签和步骤S1中抽取的所有训练数据;
S32、使用平衡k-means算法对层次树中的父节点中的标签进行聚类;
S33、根据步骤S32中对父节点中的标签聚类的数量建立相同个数的子节点,将每个簇划分到不同的子节点中,第c个子节点包含的标签用集合Lc表示,数据对象e属于的标签用集合μe表示,如果则将数据对象e划分到子节点c中;
S34、将每个子节点中的数据由(xe,Ye)转换为(xe,Ze),其中Ye和Ze分别为数据对象e在父节点中的标签集和在当前子节点中的标签集;
S35、使用分类算法对每个子节点分别训练一个分类器,其中训练数据为步骤S34转换后的数据;
S36、重复步骤S32-S35,直到子节点中所有数据的标签都一样,或者无法使用分类器对子节点中的数据进一步划分。
作为一种具体的实施方案,步骤S32中,所述的平衡k-means算法,具体方法包括以下步骤:
S41、随机找k个标签作为初始的聚类中心;
S42、对于剩余的标签,计算每个标签与每个聚类中心的距离,如果距离标签最近的聚类中心所在的簇包含的标签数量小于则将其归为这个簇;否则,就找距离聚类中心第二近的簇,依次类推,直到将其归到一个簇中,其中,L是标签数量,k是聚类中心(簇)的数量;标签之间距离的计算公式具体如下:
其中,P(yi,yj)表示标签yi和标签yj同时出现的概率,P(yi)表示标签yi出现的概率,Sij 越大表示两个标签一起出现的概率越大,则两个标签越相似。
S43、当对所有标签都被划分到某个簇中后,重新计算每一个簇的中心;
S44、重复步骤S42-S43,当所有的簇所包含的标签都不再改变时,算法结束。
作为一种具体的实施方案,步骤S4中,所述的使用层次随机森林多标签分类器对无标签的对象进行分类,具体计算方法为:
其中,HTi(u)(i=1,2,…,M)表示层次随机森林中第i棵层次树对无标签数据对象u的标签的预测结果,是一个长度为M的0-1向量,M表示层次随机森林中层次树的个数;P(λ12,…,λL)表示层次随机森林分类器对无标签数据对象u的标签的预测结果,L表示标签的数量,λi的计算方法如下:
其中,λ为预先设置好的阈值,pi为层次随机森林中预测无标签数据对象u的标签是yi的层次树的百分比。
与现有技术相比,本发明具有如下优点和技术效果:
本发明利用数据的多个标签之间总有一定的关联性的基本思想,基于标签的聚类结果建立层次树,并为树的每个节点都建立一个分类器;使用随机森林的思想,建立层次随机森林,充分考虑标签之间关联的各种可能性,泛化层次树的分类误差。该方法可以提高多标签分类问题的速度和准确度。
附图说明
图1为本发明实施例1的一种基于层次随机森林的多标签分类方法的流程图。
图2为本发明实施例1的建立一棵层次树的流程图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1:
如图1所示,本实施例1的一种基于层次随机森林的多标签分类方法,包括以下步骤:
S1、从训练数据集中随机抽取一部分数据;
S2、使用步骤S1抽取的数据建立一棵层次树;
S3、重复步骤S1-S2,建立层次随机森林作为多标签分类器;
S4、使用步骤S3建立的多标签分类器对无标签的对象进行分类。
所述的训练数据集是分类研究领域对用于学习分类模型的数据的简称,这些数据可以是使用文本、图片、视频等表示的医疗数据、互联网数据、银行数据等。
所述的从训练数据集中随机抽取一部分数据,具体方法为:使用bagging方法对训练数据集进行有放回地抽样,随机抽取N次(作为实例,N通常为训练数据集的2/3),将随机抽取的数据中重复出现的数据删除,将这些数据作为建立一棵层次树的训练数据。其中,
如图2所示,本实施例1的一种基于层次随机森林的多标签分类方法,所述的建立一棵层次树,具体方法包括以下步骤:
S31、创建一个根节点,此节点包含数据所有的标签和步骤S1中抽取的所有训练数据;
S32、使用平衡k-means算法对层次树中的父节点中的标签进行聚类;
S33、根据步骤S32中对父节点中的标签聚类的数量建立相同个数的子节点,将每个簇划分到不同的子节点中,第c个子节点包含的标签用集合Lc表示,数据对象e属于的标签用集合μe表示,如果则将数据对象e划分到子节点c中;
S34、将每个子节点中的数据由(xe,Ye)转换为(xe,Ze),其中Ye和Ze分别为数据对象e在父节点中的标签集和在当前子节点中的标签集;
S35、使用分类算法对每个子节点分别训练一个分类器,其中训练数据为步骤S34转换后的数据,这里的分类算法可以是C4.5、SVM等分类方法;
S36、重复步骤S32-S35,直到子节点中所有数据的标签都一样,或者无法使用分类器对子节点中的数据进一步划分。
所述的平衡k-means算法,具体方法包括以下步骤:
S41、随机找k个标签作为初始的聚类中心;
S42、对于剩余的标签,计算每个标签与每个聚类中心的距离,如果距离标签最近的聚类中心所在的簇包含的标签数量小于则将其归为这个簇;否则,就找距离聚类中心第二近的簇,依次类推,直到将其归到一个簇中,其中,L是标签数量,k是聚类中心(簇)的数量;标签之间距离的计算公式具体如下:
其中,P(yi,yj)表示标签yi和标签yj同时出现的概率,P(yi)表示标签yi出现的概率,Sij越大表示两个标签一起出现的概率越大,则两个标签越相似。
S43、当对所有标签都被划分到某个簇中后,重新计算每一个簇的中心;
S44、重复步骤S42-S43,当所有的簇所包含的标签都不再改变时,算法结束。
步骤S4所述的使用层次随机森林多标签分类器对无标签的对象进行分类,具体计算方法为:
其中,HTi(u)(i=1,2,…,M)表示层次随机森林中第i棵层次树对无标签数据对象u的标签的预测结果,是一个长度为M的0-1向量,M表示层次随机森林中层次树的个数;P(λ12,…,λL)表示层次随机森林分类器对无标签数据对象u的标签的预测结果,L表示标签的数量,λi的计算方法如下:
其中,λ为预先设置好的阈值,pi为层次随机森林中预测无标签数据对象u的标签是yi的层次树的百分比。
上述实例使用随机森林的思想,建立层次随机森林,充分考虑标签之间关联的各种可能性,泛化层次树的分类误差,可以提高多标签分类问题的速度和准确度。
以上所述,仅为本发明专利优选的实施例,但本发明专利的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明专利所公开的范围内,根据本发明专利的技术方案及其发明专利构思加以等同替换或改变,都属于本发明专利的保护范围。

Claims (5)

1.一种基于层次随机森林的多标签分类方法,其特征在于:包括以下步骤:
S1、从训练数据集中随机抽取一部分数据;
S2、使用步骤S1抽取的数据建立一棵层次树;
S3、重复步骤S1-S2,建立层次随机森林作为多标签分类器即层次随机森林分类器;
S4、使用步骤S3建立的多标签分类器对无标签的对象进行分类。
2.根据权利要求1所述的一种基于层次随机森林的多标签分类方法,其特征在于:步骤S1所述的从训练数据集中随机抽取一部分数据,具体为:使用bagging方法对训练数据集进行有放回地抽样,随机抽取N次,将随机抽取的数据中重复出现的数据删除。
3.根据权利要求1所述的一种基于层次随机森林的多标签分类方法,其特征在于:步骤S2所述的建立一棵层次树,具体方法包括以下步骤:
S31、创建一个根节点,此节点包含使用步骤S1所描述的方法从训练数据集中抽样的数据,以及训练数据集包含的所有标签。
S32、使用平衡k-means算法对层次树中的父节点中的标签进行聚类;
S33、根据步骤S32中对父节点中的标签聚类的数量建立相同个数的子节点,将每个簇划分到不同的子节点中,第c个子节点包含的标签用集合Lc表示,数据对象e所有的标签用集合μe表示,如果则将数据对象e划分到当前节点的第c个子节点中;
S34、将每个子节点中的数据由(xe,Ye)转换为(xe,Ze),其中xe表示对象e,Ye和Ze分别为数据对象e在父节点中的标签集和在当前子节点中的标签集;
S35、使用分类算法对每个子节点分别训练一个分类器,其中训练数据为步骤S34转换后的数据;
S36、重复步骤S32-S35,直到子节点中所有对象的标签都一样,或者无法使用分类器对子节点中的数据进一步划分。
4.根据权利要求3所述的一种基于层次化随机森林的多标签分类方法,其特征在于:步骤S32所述的平衡k-means算法,具体方法包括以下步骤:
S41、随机找k个标签作为初始的聚类中心;
S42、对于剩余的标签,计算每个标签与每个聚类中心的距离,如果距离标签最近的聚类中心所在的簇包含的标签数量小于则将其归为这个簇;否则,就找距离聚类中心第二近的簇,依次类推,直到将其归到一个簇中,其中,L是标签数量,k是聚类中心的数量;
S43、当所有标签都被划分到某个簇中后,重新计算每一个簇的中心;
S44、重复步骤S42-S43,直到所有簇的聚类中心不再改变。
5.根据权利要求1所述的一种基于层次化随机森林的多标签分类方法,其特征在于:步骤S4所述的使用多标签分类器对无标签的对象进行分类,具体计算方法为:
P ( λ 1 , λ 2 , ... , λ L ) = HT 1 ( u ) + HT 2 ( u ) + ... + HT M ( u ) M
其中,HTi(u)表示层次随机森林中第i棵层次树对无标签数据对象u的标签的预测结果,是一个长度为M的0-1向量,i=1,2,…,M,M表示层次随机森林中层次树的个数;P(λ12,…,λL)表示层次随机森林分类器对无标签数据对象u的标签的预测结果,L表示标签的数量,λi的计算方法如下:
&lambda; i = 1 , p i &GreaterEqual; &lambda; ; 0 , p i < &lambda; .
其中,λ为预先设置好的阈值,pi为层次随机森林中预测无标签数据对象u的标签是yi的层次树的百分比。
CN201610171082.5A 2016-03-23 2016-03-23 一种基于层次随机森林的多标签分类方法 Pending CN105868773A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610171082.5A CN105868773A (zh) 2016-03-23 2016-03-23 一种基于层次随机森林的多标签分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610171082.5A CN105868773A (zh) 2016-03-23 2016-03-23 一种基于层次随机森林的多标签分类方法

Publications (1)

Publication Number Publication Date
CN105868773A true CN105868773A (zh) 2016-08-17

Family

ID=56625425

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610171082.5A Pending CN105868773A (zh) 2016-03-23 2016-03-23 一种基于层次随机森林的多标签分类方法

Country Status (1)

Country Link
CN (1) CN105868773A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106875278A (zh) * 2017-01-19 2017-06-20 浙江工商大学 基于随机森林的社交网络用户画像方法
CN107392176A (zh) * 2017-08-10 2017-11-24 华南理工大学 一种基于kmeans的高效车辆检测方法
CN107577785A (zh) * 2017-09-15 2018-01-12 南京大学 一种适用于法律识别的层次多标签分类方法
CN109211814A (zh) * 2018-10-29 2019-01-15 中国科学院南京土壤研究所 一种基于三维光谱曲面分区特征的土壤剖面类型识别方法
CN109492682A (zh) * 2018-10-30 2019-03-19 桂林电子科技大学 一种多分枝随机森林数据分类方法
CN109886335A (zh) * 2019-02-21 2019-06-14 厦门美图之家科技有限公司 分类模型训练方法及装置
CN109934489A (zh) * 2019-03-12 2019-06-25 广东电网有限责任公司 一种电力设备状态评价方法
CN109993391A (zh) * 2017-12-31 2019-07-09 ***通信集团山西有限公司 网络运维任务工单的派发方法、装置、设备及介质
CN110135185A (zh) * 2018-02-08 2019-08-16 苹果公司 使用生成式对抗网络进行私有化的机器学习
CN110347839A (zh) * 2019-07-18 2019-10-18 湖南数定智能科技有限公司 一种基于生成式多任务学习模型的文本分类方法
WO2021024080A1 (en) * 2019-08-05 2021-02-11 International Business Machines Corporation Active learning for data matching
CN112883189A (zh) * 2021-01-26 2021-06-01 浙江香侬慧语科技有限责任公司 基于标签描述的文本分类方法、装置、存储介质及设备
US11663275B2 (en) 2019-08-05 2023-05-30 International Business Machines Corporation Method for dynamic data blocking in a database system
US20230195773A1 (en) * 2019-10-11 2023-06-22 Ping An Technology (Shenzhen) Co., Ltd. Text classification method, apparatus and computer-readable storage medium
CN117891411A (zh) * 2024-03-14 2024-04-16 济宁蜗牛软件科技有限公司 一种海量档案数据优化存储方法

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106875278B (zh) * 2017-01-19 2020-11-03 浙江工商大学 基于随机森林的社交网络用户画像方法
CN106875278A (zh) * 2017-01-19 2017-06-20 浙江工商大学 基于随机森林的社交网络用户画像方法
CN107392176A (zh) * 2017-08-10 2017-11-24 华南理工大学 一种基于kmeans的高效车辆检测方法
CN107392176B (zh) * 2017-08-10 2020-05-22 华南理工大学 一种基于kmeans的高效车辆检测方法
CN107577785A (zh) * 2017-09-15 2018-01-12 南京大学 一种适用于法律识别的层次多标签分类方法
CN107577785B (zh) * 2017-09-15 2020-02-07 南京大学 一种适用于法律识别的层次多标签分类方法
CN109993391B (zh) * 2017-12-31 2021-03-26 ***通信集团山西有限公司 网络运维任务工单的派发方法、装置、设备及介质
CN109993391A (zh) * 2017-12-31 2019-07-09 ***通信集团山西有限公司 网络运维任务工单的派发方法、装置、设备及介质
CN110135185B (zh) * 2018-02-08 2023-12-22 苹果公司 使用生成式对抗网络进行私有化的机器学习
CN110135185A (zh) * 2018-02-08 2019-08-16 苹果公司 使用生成式对抗网络进行私有化的机器学习
CN109211814A (zh) * 2018-10-29 2019-01-15 中国科学院南京土壤研究所 一种基于三维光谱曲面分区特征的土壤剖面类型识别方法
CN109492682A (zh) * 2018-10-30 2019-03-19 桂林电子科技大学 一种多分枝随机森林数据分类方法
CN109886335A (zh) * 2019-02-21 2019-06-14 厦门美图之家科技有限公司 分类模型训练方法及装置
CN109886335B (zh) * 2019-02-21 2021-11-26 厦门美图之家科技有限公司 分类模型训练方法及装置
CN109934489A (zh) * 2019-03-12 2019-06-25 广东电网有限责任公司 一种电力设备状态评价方法
CN110347839B (zh) * 2019-07-18 2021-07-16 湖南数定智能科技有限公司 一种基于生成式多任务学习模型的文本分类方法
CN110347839A (zh) * 2019-07-18 2019-10-18 湖南数定智能科技有限公司 一种基于生成式多任务学习模型的文本分类方法
WO2021024080A1 (en) * 2019-08-05 2021-02-11 International Business Machines Corporation Active learning for data matching
GB2600369A (en) * 2019-08-05 2022-04-27 Ibm Active learning for data matching
US11409772B2 (en) 2019-08-05 2022-08-09 International Business Machines Corporation Active learning for data matching
US11663275B2 (en) 2019-08-05 2023-05-30 International Business Machines Corporation Method for dynamic data blocking in a database system
US20230195773A1 (en) * 2019-10-11 2023-06-22 Ping An Technology (Shenzhen) Co., Ltd. Text classification method, apparatus and computer-readable storage medium
CN112883189A (zh) * 2021-01-26 2021-06-01 浙江香侬慧语科技有限责任公司 基于标签描述的文本分类方法、装置、存储介质及设备
CN117891411A (zh) * 2024-03-14 2024-04-16 济宁蜗牛软件科技有限公司 一种海量档案数据优化存储方法
CN117891411B (zh) * 2024-03-14 2024-06-14 济宁蜗牛软件科技有限公司 一种海量档案数据优化存储方法

Similar Documents

Publication Publication Date Title
CN105868773A (zh) 一种基于层次随机森林的多标签分类方法
CN106250412B (zh) 基于多源实体融合的知识图谱构建方法
CN111767408B (zh) 一种基于多种神经网络集成的因果事理图谱构建方法
CN106294593B (zh) 结合从句级远程监督和半监督集成学习的关系抽取方法
WO2021068339A1 (zh) 文本分类方法、装置及计算机可读存储介质
CN107944559B (zh) 一种实体关系自动识别方法及***
CN102289522B (zh) 一种对于文本智能分类的方法
CN104574192B (zh) 在多个社交网络中识别同一用户的方法及装置
CN109918532A (zh) 图像检索方法、装置、设备及计算机可读存储介质
CN105469096A (zh) 一种基于哈希二值编码的特征袋图像检索方法
CN102411611B (zh) 一种面向即时交互文本的事件识别与跟踪方法
Lee Unsupervised and supervised learning to evaluate event relatedness based on content mining from social-media streams
CN107251060A (zh) 针对序列标签器的预训练和/或迁移学习
CN113407660B (zh) 非结构化文本事件抽取方法
CN109840322A (zh) 一种基于强化学习的完形填空型阅读理解分析模型及方法
CN115393692A (zh) 基于生成式预训练语言模型的联想文本到图像生成方法
CN105718532A (zh) 一种基于多深度网络结构的跨媒体排序方法
CN107992890B (zh) 一种基于局部特征的多视角分类器及设计方法
CN112819023A (zh) 样本集的获取方法、装置、计算机设备和存储介质
CN111027595A (zh) 双阶段语义词向量生成方法
CN104331523B (zh) 一种基于概念对象模型的问句检索方法
CN103412878B (zh) 基于领域知识地图社区结构的文档主题划分方法
CN109522416A (zh) 一种金融风险控制知识图谱的构建方法
CN109740151A (zh) 基于迭代膨胀卷积神经网络的公安笔录命名实体识别方法
Wang et al. A deep clustering via automatic feature embedded learning for human activity recognition

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160817