CN109101495A

CN109101495A - 一种基于图像识别和知识图谱的时尚领域文本生成方法

Info

Publication number: CN109101495A
Application number: CN201810982554.4A
Authority: CN
Inventors: 黄佳威
Original assignee: Shanghai Bao Zun Agel Ecommerce Ltd
Current assignee: Shanghai Bao Zun Agel Ecommerce Ltd
Priority date: 2018-08-27
Filing date: 2018-08-27
Publication date: 2018-12-28

Abstract

本发明涉及一种基于图像识别和知识图谱的时尚领域文本生成方法，步骤S1、采用深度学习的方法，对基本的图片视频数据进行基础信息的提取，并对针对所有的时尚的基础信息进行分解和整理，训练深度学习的算法，对图像基础信息进行提取；步骤S2、预先准备时尚领域的知识图谱，对市面上的流行元素进行定义，将基础信息和流行信息相关联；步骤S3、将上述的基本信息和推理的高阶抽象标签作为搜索关键字，在已有的时尚领域专业文章库中搜索相似文本，按照相似度排序，生成摘要文字。其优点表现在：能够解决在时尚领域中需要撰写大量和图片文字相关性非常大的领域专业文稿的问题，提供时尚编辑文字素材，以激发时尚编辑的灵感，提高时尚撰稿效率。

Description

一种基于图像识别和知识图谱的时尚领域文本生成方法

技术领域

本发明涉及互联网大数据领域，时尚领域，计算机技术领域，具体地说，是一种基于图像识别和知识图谱的时尚领域文本生成方法。

背景技术

文本自动生成是自然语言处理领域的一个重要研究方向，实现文本自动生成也是人工智能走向成熟的一个重要标志。

当前文本自动生成的方式主要集中在两种方面：

第一种是基于全文搜索领域往往采用互联网公开数据，通过搜索引擎查询出若干篇与主题相近和相似的文章，通过一定的算法进行摘要选取，最终生成一篇可被理解的文章。

这种方法需要大量开源的相似文章，并且无法对图片等信息进行文本生成。

第二种是基于深度学习的文本自动生成工具，采用类似s2s或者neuraltalk一类算法，对关键字或者图片进行扩充，从而产生一篇可被理解的文章。

这种技术的难点在于深度学习的训练复杂，推广难度大，生成文字简单，并且对未知图像准确率依旧是一个挑战。

另外，在时尚领域中需要撰写大量的图片和文字，时尚领域的变化往往先于所有领域，所谓浪尖潮人，所以导致时尚领域的文字信息存在诸多难点。

1、每天都在产生大量时尚信息；

2、时尚信息的主体风格和内在信息存在非常大的变化。

3、数据类型十分复杂，从文字到图像到视频都是处理的目标数据。

针对以上几个难点，当前的方法都无法很好得适用于这些情况。传统的信息检索的方式能够快速适应变化，但是对多媒体信息却缺乏处理能力；深度学习的方法可以处理多种媒体信息，但是需要大量的标注数据，而标注需要大量人工信息，往往无法很好地做到适应潮流。

中国专利文献CN201410032479.7，申请日20140123，专利名称为：对文本进行自动注音处理及显示的方法和装置，公开了一种对文本进行自动注音处理及显示的方法和装置，其中，对文本进行自动注音处理的方法包括：基于隐码模型将源语言的文本转换为目标语言的注音文本；获得需求用户的标识信息；接收当前用户通过客户端发送的当前文本需求信息，根据标识信息确定当前用户为需求用户，根据当前文本需求信息向客户端发送对应的注音文本，以用于向当前用户进行展现。

上述专利文献对文本进行自动注音处理的方法可以根据外文源语言文本自动生成易理解的或易发音的中文注音文本，并主动将中文注音文本提供给需求用户，便于需求用户轻松的学习外文源语言歌曲的发音，用户体验度高，并且成本低。但是关于一种解决在时尚领域中需要撰写大量和图片文字相关性非常大的领域专业文稿的问题，提供时尚编辑文字素材，提高时尚撰稿效率的技术方案则未进行相应的公开。

综上所述，需要一种解决在时尚领域中需要撰写大量和图片文字相关性非常大的领域专业文稿的问题，提供时尚编辑文字素材，提高时尚撰稿效率的文本生成方法，而关于这种文本生成方法目前还未见报道。

发明内容

本发明的目的是针对现有技术中的不足，提供一种解决在时尚领域中需要撰写大量和图片文字相关性非常大的领域专业文稿的问题，提供时尚编辑文字素材，提高时尚撰稿效率的文本生成方法。

为实现上述目的，本发明采取的技术方案是：

一种基于图像识别和知识图谱的时尚领域文本生成方法，所述方法包括以下步骤：

步骤S1、采用深度学习的方法，对基本的图片视频数据进行基础信息的提取，并对针对所有的时尚的基础信息进行分解和整理，训练深度学习的算法，对图像基础信息进行提取；

步骤S2、预先准备时尚领域的知识图谱，对市面上的流行元素进行定义，将基础信息和流行信息相关联；

步骤S3、将步骤S1和步骤S2中获取的基本信息和推理的高阶抽象标签作为搜索关键字，在已有的时尚领域专业文章库中搜索相似文本，按照相似度排序，生成摘要文字。

作为一种优选的技术方案，所述方法采用时尚领域的知识图谱的形式来提供标签中的逻辑关系的存储和表示。

作为一种优选的技术方案，所述方法采用算法和数据结构所形成的方式来提供标签中的逻辑关系的存储和表示。

作为一种优选的技术方案，所述方法采用深度学习配合逻辑推断的方式扩充时尚领域图像中包含的标签信息的***设计架构。

作为一种优选的技术方案，所述方法采用时尚领域图片标签算法和时尚标签库配合，达到标签多样性的设计架构。

作为一种优选的技术方案，所述步骤S1中的提取对象是时尚领域的基础信息是变化比较慢的，并且有多媒体的特征。

作为一种优选的技术方案，所步骤S2中产生基于基本元素的高阶抽象元素，由此产生高阶抽象标签。

本发明优点在于：

1、本发明的一种基于图像识别和知识图谱的时尚领域文本生成方法，能够解决在时尚领域中需要撰写大量和图片文字相关性非常大的领域专业文稿的问题，提供时尚编辑文字素材，以激发时尚编辑的灵感，提高时尚撰稿效率。

2、降低深度学习的学习成本，提高模型的可用性。

3、提供快速变化的时尚信息的更新。

4、人工维护的知识库能够提供更多的领域知识，避免信息过时和不准确的情况。

附图说明

附图1是本发明的一种基于图像识别和知识图谱的时尚领域文本生成方法的流程示意图。

具体实施方式

下面结合附图对本发明提供的具体实施方式作详细说明。

请参照图1，图1是本发明的一种基于图像识别和知识图谱的时尚领域文本生成方法的流程示意图。一种基于图像识别和知识图谱的时尚领域文本生成方法，所述方法包括以下步骤：

步骤S1、采用深度学习的方法，对基本的图片视频数据进行基础信息的提取，并对针对所有的时尚的基础信息进行分解和整理，训练深度学习的算法，对图像基础信息进行提取，比如说图像的主体、材料、纹理、质地等信息，比如说图中的主体是一条“裙子”，裙子的材料是“丝绸”，裙子的颜色是“蓝色”和“红色”的，裙子的质地是“顺滑”的等基础信息。

步骤S2、预先准备时尚领域的知识图谱，对市面上的流行元素进行定义，将基础信息和流行信息相关联，比如：“连衣裙”和“蕾丝”可以产生“复古”；“蓝色”和“红色”可以产生“撞色”；“短裙”和“板鞋”可以推出“街头”。由此产生高阶抽象标签。

该实施例需要说明的是：

该实例中采用时尚领域的知识图谱的形式来提供标签中的逻辑关系，但不仅限于该方式实现标签间的逻辑关系的存储和表示，其他算法和数据结构所形成的技术方案也应涵盖在该发明构思下。

该实例中采用深度学习配合逻辑推断的方式扩充时尚领域图像中包含的标签信息的***设计架构，但不限于上述实例中的特定组合。其他时尚领域图片标签算法和时尚标签库配合，以达到标签多样性为目的的设计架构都应涵盖在本发明的构思之下。

本发明的一种基于图像识别和知识图谱的时尚领域文本生成方法，能够解决在时尚领域中需要撰写大量和图片文字相关性非常大的领域专业文稿的问题，提供时尚编辑文字素材，以激发时尚编辑的灵感，提高时尚撰稿效率；降低深度学习的学习成本，提高模型的可用性；提供快速变化的时尚信息的更新；人工维护的知识库能够提供更多的领域知识，避免信息过时和不准确的情况。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员，在不脱离本发明方法的前提下，还可以做出若干改进和补充，这些改进和补充也应视为本发明的保护范围。

Claims

1.一种基于图像识别和知识图谱的时尚领域文本生成方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的基于图像识别和知识图谱的时尚领域文本生成方法，其特征在于，所述方法采用时尚领域的知识图谱的形式来提供标签中的逻辑关系的存储和表示。

3.根据权利要求1所述的基于图像识别和知识图谱的时尚领域文本生成方法，其特征在于，所述方法采用算法和数据结构所形成的方式来提供标签中的逻辑关系的存储和表示。

4.根据权利要求1所述的基于图像识别和知识图谱的时尚领域文本生成方法，其特征在于，所述方法采用深度学习配合逻辑推断的方式扩充时尚领域图像中包含的标签信息的***设计架构。

5.根据权利要求1所述的基于图像识别和知识图谱的时尚领域文本生成方法，其特征在于，所述方法采用时尚领域图片标签算法和时尚标签库配合，达到标签多样性的设计架构。

6.根据权利要求1所述的基于图像识别和知识图谱的时尚领域文本生成方法，其特征在于，所述步骤S1中的提取对象是时尚领域的基础信息是变化比较慢的，并且有多媒体的特征。

7.根据权利要求1所述的基于图像识别和知识图谱的时尚领域文本生成方法，其特征在于，步骤S2中产生基于基本元素的高阶抽象元素，由此产生高阶抽象标签。