CN111859930A

CN111859930A - 一种标题生成方法、装置、电子设备和存储介质

Info

Publication number: CN111859930A
Application number: CN202010730817.XA
Authority: CN
Inventors: 申思杰
Original assignee: Beijing ByteDance Network Technology Co Ltd
Current assignee: Beijing ByteDance Network Technology Co Ltd
Priority date: 2020-07-27
Filing date: 2020-07-27
Publication date: 2020-10-30

Abstract

本申请提供了一种标题生成方法、装置、电子设备和存储介质，其中，该方法包括：获取原始描述文案对应的特征信息；针对预设的多种第一标题字数范围中的每种第一标题字数范围，将所述特征信息和该种第一标题字数范围输入到概率预测模型中，得到与该种第一标题字数范围对应的至少一个候选标题，其中，每个所述候选标题中包括的字符数位于该种第一标题字数范围内；根据预设筛选规则，从所述至少一个候选标题中筛选出目标标题，通过上述方法，可以得到包含多种字数范围的目标标题，从而满足不同场景的使用需求，由于上述标题可以自动生成，进而有利于降低人工工作量。

Description

一种标题生成方法、装置、电子设备和存储介质

技术领域

本申请涉及计算机技术领域，具体而言，涉及一种标题生成方法、装置、电子设备和存储介质。

背景技术

媒体内容投放平台在投放媒体内容(如：广告和文章等)之前，需要先获得媒体内容，其中，媒体内容包括媒体内容标题和媒体内容正文。媒体内容投放平台在获得一个完整的媒体内容后，可以将该媒体内容投放给用户端，该媒体内容在用户端展示时，只展示媒体内容标题，用户可以根据媒体内容标题中的内容确定是否打开该媒体内容，以查看该媒体内容中的媒体内容正文。

对于一个媒体内容而言，媒体内容投放平台可以将该媒体内容投放到多个场景中，并且，由于在不同的场景中对媒体内容标题包括的字数是有不同要求的，因此，在投放该媒体内容之前，需要根据将要投放的场景为该媒体内容提供包含不同字数的媒体内容标题，在目前技术中，不同场景对应的媒体内容标题均是通过人工设计产生的，当将要投放的场景较多时，会使人工工作量较大。

发明内容

有鉴于此，本申请实施例提供了一种标题生成方法、装置、电子设备和存储介质，以降低人工工作量。

第一方面，本申请实施例提供了一种标题生成方法，包括：

获取原始描述文案对应的特征信息；

针对预设的多种第一标题字数范围中的每种第一标题字数范围，将所述特征信息和该种第一标题字数范围输入到概率预测模型中，得到与该种第一标题字数范围对应的至少一个候选标题，其中，每个所述候选标题中包括的字符数位于该种第一标题字数范围内；

根据预设筛选规则，从所述至少一个候选标题中筛选出目标标题。

可选地，所述特征信息包括以下至少一种：

行业信息、实体对象名称、为实体对象设置的标语。

可选地，所述将所述特征信息和该种第一标题字数范围输入到概率预测模型中，得到与该种第一标题字数范围对应的至少一个候选标题，包括：

将所述特征信息和该种第一标题字数范围输入到概率预测模型中，利用所述概率预测模型得到目标字典中的多个字符在各预设位置上的概率，其中，所述预设位置为该第一标题字数范围下最大字数的标题的各个字符位置；

根据所述概率，从所述目标字典中选择出该次输入对应的目标字符，以得到该次输入下按照所述目标字符的选择顺序构成的所述候选标题。

可选地，所述根据所述概率，从所述目标字典中选择出该次输入对应的目标字符，以得到该次输入下按照所述目标字符的选择顺序构成的所述候选标题，包括：

按照所述预设位置在所述候选标题中的先后顺序，从所述目标字典中依次确定所述目标字符，以得到该次输入下的所述候选标题；

其中，所述候选标题中的第一个字符位置上的目标字符依据概率采样从所述目标字典中确定；所述候选标题中位于所述第一个字符位置之后的目标字符依据概率采样和位于该目标字符之前的字符的语义从所述目标字典中确定，直至得到最后一个目标字符。

可选地，所述根据预设筛选规则，从所述至少一个候选标题中筛选出目标标题，包括：

将各所述候选标题作为输入参数，输入到语言模型中，得到该候选标题的语句通顺程度得分；

对各所述候选标题和为所述原始描述文案设定的标准标题进行相似度比对，得到该候选标题的相似度得分；

对同一候选标题的所述语句通顺程度得分和所述相似度得分进行加权求和，得到该候选标题的排序得分；

根据各所述候选标题的排序得分，对各所述候选标题进行排序；

依据所述排序，依次确定各所述候选标题中包含目标特征信息的目标标题，直至得到预设数量的目标标题为止。

可选地，所述方法还包括：

获取目标标题训练样本、所述目标标题训练样本所属描述文案训练样本对应的特征信息训练样本，以及针对所述目标标题训练样本设定的各第二标题字数范围；

针对每种第二标题字数范围，根据所述特征信息训练样本和该第二标题字数范围构建训练样本；

使用所述训练样本和所述目标标题训练样本对所述概率预测模型进行训练。

可选地，所述使用所述训练样本和所述目标标题训练样本对所述概率预测模型进行训练，包括：

针对每个训练样本，将该训练样本作为输入参数，输入到所述概率预测模型中，得到用于表示输出语句的矩阵；

确定用于表示输出语句的矩阵和所述目标标题训练样本对应的矩阵之间的损失值；

将所述损失值作为输入参数，输入到指定的反向传播算法中；

使用携带有输入参数的反向传播算法对所述概率预测模型中的可学习参数进行调整，直至得到的用于表示输出语句的矩阵和所述目标标题训练样本对应的矩阵之间的损失值的变化范围位于预设范围内。

第二方面，本申请实施例提供了一种标题生成装置，包括：

获取单元，用于获取原始描述文案对应的特征信息；

生成单元，用于针对预设的多种第一标题字数范围中的每种第一标题字数范围，将所述特征信息和该种第一标题字数范围输入到概率预测模型中，得到与该种第一标题字数范围对应的至少一个候选标题，其中，每个所述候选标题中包括的字符数位于该种第一标题字数范围内；

筛选单元，用于根据预设筛选规则，从所述至少一个候选标题中筛选出目标标题。

可选地，所述特征信息包括以下至少一种：

行业信息、实体对象名称、为实体对象设置的标语。

可选地，所述生成单元用于将所述特征信息和该种第一标题字数范围输入到概率预测模型中，得到与该种第一标题字数范围对应的至少一个候选标题时，包括：

可选地，所述生成单元用于根据所述概率，从所述目标字典中选择出该次输入对应的目标字符，以得到该次输入下按照所述目标字符的选择顺序构成的所述候选标题时，包括：

可选地，所述筛选单元用于根据预设筛选规则，从所述至少一个候选标题中筛选出目标标题时，包括：

可选地，所述装置还包括：

训练单元，用于获取目标标题训练样本、所述目标标题训练样本所属描述文案训练样本对应的特征信息训练样本，以及针对所述目标标题训练样本设定的各第二标题字数范围；针对每种第二标题字数范围，根据所述特征信息训练样本和该第二标题字数范围构建训练样本；使用所述训练样本和所述目标标题训练样本对所述概率预测模型进行训练。

可选地，所述训练单元用于使用所述训练样本和所述目标标题训练样本对所述概率预测模型进行训练时，包括：

第三方面，本公开实施例提供了一种电子设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行如第一方面所述的标题生成方法的步骤。

第四方面，本公开实施例提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如第一方面所述的标题生成方法的步骤。

本申请的实施例提供的技术方案可以包括以下有益效果：

在本申请中，为了能够在一定字数范围内使标题包含主要信息，需要先获得原始描述文案对应的特征信息，其中，特征信息能够体现原始描述文案特点，因此可以将特征信息作为输入参数，同时在输入参数中还需要增加当前将要生成的标题的字数范围(即：第一标题字数范围)，以使概率预测模型生成的候选标题中包含与特征信息相关的内容，同时，还可以使候选标题包含的字数位于一定范围内，并且，为了能够得到质量较高的目标标题，还需要对候选标题进行筛选，以得到目标标题，通过上述方法，可以得到包含多种字数范围的目标标题，从而满足不同场景的使用需求，由于上述标题可以自动生成，进而有利于降低人工工作量。

为使本申请的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例一提供的一种标题生成方法的流程示意图；

图2为本申请实施例一提供的另一种标题生成方法的流程示意图；

图3为本申请实施例一提供的另一种标题生成方法的流程示意图；

图4为本申请实施例一提供的另一种标题生成方法的流程示意图；

图5为本申请实施例一提供的另一种标题生成方法的流程示意图；

图6为本申请实施例二提供的一种标题生成装置的结构示意图；

图7为本申请实施例二提供的另一种标题生成装置的结构示意图；

图8为本申请实施例三提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

媒体内容(如：产品广告和产品文章等)在投放给用户之前，需要先确定媒体内容的媒体内容标题，在将媒体内容投放给用户之后，在用户的用户端上会显示该媒体内容的媒体内容标题，用户可以根据媒体内容标题的内容来确定是否打开该媒体内容。对于一个媒体内容而言，媒体内容投放平台可以将该媒体内容投放到多个场景(如：多个应用程序或者多个媒体展示平台)中，由于不同的场景对媒体内容标题包括的字数有不同的要求，例如：有的场景中要求标题的字数在10-15内，而有的场景要求标题的字数在15-20内，因此为了满足不同场景的需求，在投放媒体内容之前，需要根据将要投放的场景为该媒体内容提供包含满足字数要求的标题，当将要投放的场景为多个时，则需要提供多个标题，在目前技术中，所有场景的标题均是通过人工设计产生的，当将要投放的场景较多时，会使人工工作量较大。

考虑到将要投放到场景中的标题需要包括用于对媒体内容进行描述的文案的关键信息，并且标题包含的字数需要满足将要投放到场景对字数的要求，申请提供了一种标题生成方法、装置、电子设备和存储介质，针对预设的多种第一标题字数范围中的每种第一标题字数范围，将原始描述文案对应的特征信息和该种第一标题字数范围输入到概率预测模型中，得到与该种第一标题字数范围对应的至少一个候选标题，由于特征信息能够体现原始描述文案特点，该种第一标题字数范围能够限定生成的候选标题的字数，因此得到的候选标题不仅包含与特征信息相关的内容，同时，还可以使候选标题包含的字数位于一定范围内，并且可以根据多种第一标题字数范围得到多种字数范围的候选标题，同时，为了能够得到质量较高的目标标题，还需要对候选标题进行筛选，以得到目标标题，通过上述方法，可以得到包含多种字数范围的目标标题，从而满足不同场景的使用需求，由于上述标题可以自动生成，进而有利于降低人工工作量，同时，还有利于提高工作效率。

需要说明的是，本申请实施例中的原始描述文案为对将要投放的媒体内容进行描述的文案信息，原始描述文案可以包括多种信息，以媒体内容为商品广告为例，原始描述文案可以包括为该商品设定的原始标题、该商品的行业信息、该商品的品牌信息、该商品的标语信息(如：商品的买点信息)，以及该商品的商品名称信息等，以按摩椅广告为例，原始标题可以为：爆款家用按摩椅，质保五年，送货上门，免安装费，行业信息可以为：3C及电器，品牌信息可以为：按摩椅的品牌名称，标语信息可以为：爆款、质保五年、送货上门和/或免安装费，商品名称信息为：按摩椅，上述仅以示例性的说明，关于具体的原始描述文案可以根据实际需要进行设定，在此不做具体限定。

以下是对本申请实施例的详细说明。

实施例一

图1为本申请实施例一提供的一种标题生成方法的流程示意图，如图1所示，该方法包括以下步骤：

步骤101、获取原始描述文案对应的特征信息。

步骤102、针对预设的多种第一标题字数范围中的每种第一标题字数范围，将所述特征信息和该种第一标题字数范围输入到概率预测模型中，得到与该种第一标题字数范围对应的至少一个候选标题，其中，每个所述候选标题中包括的字符数位于该种第一标题字数范围内。

步骤103、根据预设筛选规则，从所述至少一个候选标题中筛选出目标标题。

具体的，媒体内容投放商在投放媒体内容之前需要给出该媒体内容对应的原始描述文案，具体的原始描述文案考参考上述对原始描述文案的说明，在得到上述的原始描述文案后，需要获得该原始描述文案对应的特征信息，以便后续生成的候选标题中包含与该特征信息相关内容，从而使用户在看到标题之后能够迅速获知媒体内容所要表达的关键点，同时还需要设置多种第一标题字数范围，例如：设定的多种第一标题字数范围可以包括4-7字、8-9字、10-12和13-16字等，在得到上述两种信息后，每种第一标题字数范围和上述的特征信息都可以构成一组输出参数输入到概率预测模型中，概率预测模型在获取到输入参数后，对输入参数进行处理，并输出多个候选结果，其中，每个候选结果均是在本次输出参数的约束下产生的，因此可以得到多个满足该种第一标题字数范围要求且与特征信息相关的候选标题，例如：可以将4-7字的标题字数范围和上述的特征信息构成一组输出参数输入到概率预测模型中，得到多个字数位于4-7字范围内的候选标题，然后将8-9字的标题字数范围和上述的特征信息构成一组输出参数输入到概率预测模型中，得到多个字数位于8-9字范围内的候选标题，在然后将10-12字的标题字数范围和上述的特征信息构成一组输出参数输入到概率预测模型中，得到多个字数位于10-12字范围内的候选标题，以此类推，直至将得到每种第一标题字数范围对应的多个候选标题为止。

在得到上述候选标题后，为了能够挑选出质量较高的目标标题以备后用，对于每种第一标题字数范围对应的多个候选标题，还需要根据筛选条件对候选标题进行筛选，以得到每种第一标题字数范围下的目标标题，例如：对4-7字对应的候选标题进行筛选，得到4-7字对应的目标标题，对8-9字对应的候选标题进行筛选，得到8-9字对应的目标标题，对10-12字对应的候选标题进行筛选，得到10-12字对应的目标标题，以此类推，直至得到各第一标题字数范围对应的目标标题为止，其中，在对各第一标题字数范围对应的候选标题进行筛选时，可以使用相同的筛选条件进行筛选，或者依据为各第一标题字数范围设定的筛选条件，对对应的第一标题字数范围对应的候选标题进行筛选。

在经过上述处理后，可以得到各种第一标题字数范围对应的目标标题，以供不同场景使用，并且由于上述标题可以自动生成，进而有利于降低人工工作量。

需要说明的是，具体的特征信息、具体的第一标题字数范围，以及具体的筛选规则都可以根据实际需要进行设定，以商品广告为例，可以将该商品所属的行业信息、该商品的标语信息和该商品的商品名称信息等作为特征信息，设定的第一标题字数范围可以包括4-7字、8-9字、10-12和13-16字等，筛选条件可以为同时包含标语信息和商品名称信息的标题为符合条件的标题，上述内容在此不做具体限定。

需要再次说明的是，在生成各第一标题字数范围对应的至少一个候选标题时，还可以设定生成的候选标题的数量，以得到各第一标题字数范围下对应数量的候选标题，在设定上述数量后，可以避免生成过多候选标题，从而有利于提高数据处理速度，以及降低数据处理量。

在一个可行的实施方案中，所述特征信息包括以下至少一种：行业信息、实体对象名称、为实体对象设置的标语。

举例说明，以商品广告为例，行业信息为该商品所属行业，实体对象名称可以为该商品的商品名称，为实体对象设置的标语可以为为该商品设置的买点信息，以按摩椅为例，行业信息为：3C及电器，实体对象名称为：按摩椅，为实体对象设置的标语可以为：爆款、质保五年，送货上门和/或免安装费等，以酒为例，行业信息为：快速消费品，实体对象名称为：原浆酒，为实体对象设置的标语可以为：陈年窖藏。

需要说明的是，关于具体的标语可以根据实际需要进行设定，在此不做具体限定。

在一个可行的实施方案中，图2为本申请实施例一提供的另一种标题生成方法的流程示意图，如图2所示，在执行步骤102时，可以通过以下步骤实现：

步骤201、将所述特征信息和该种第一标题字数范围输入到概率预测模型中，利用所述概率预测模型得到目标字典中的多个字符在各预设位置上的概率，其中，所述预设位置为该第一标题字数范围下最大字数的标题的各个字符位置。

步骤202、根据所述概率，从所述目标字典中选择出该次输入对应的目标字符，以得到该次输入下按照所述目标字符的选择顺序构成的所述候选标题。

具体的，在将特征信息和该种第一标题字数范围输入到概率预测模型后，可以利用概率预测模型得到目标字典中各个字符在该种第一标题字数范围下最大字数的标题上的各字符位置上的概率，以该种第一标题字数范围为4-7字为例，生成的标题的最大字数为7个字，即：生成的标题中最多可以包括7个字符位置，利用概率预测模型可以得到目标字典中各个字符在这7个字符位置中每个字符位置上的概率，进一步地，利用概率预测模型可以得到目标字典中的各个字符在第一个字符位置上的概率，目标字典中的各个字符在第二个字符位置上的概率，直至得到目标字典中的各个字符在第七字符位置上的概率，由于目标字典中不同字符在不同字符位置上与输入参数的关联程度不同，因此对于同一个字符位置，得到的目标字典中的各个字符的概率是不同的，并且对于不同字符位置，目标字典中的同一字符的概率也是不同的，以目标字典中的“第”和“一”这两字符为例，当生成的标题的字数为5个字时，对于第一个字符位置，“第”的概率可能是0.5，“一”的概率可能为0.7，对于第二字符位置，“第”的概率可能是0.6，“一”的概率可能为0.6，对于第三字符位置，“第”的概率可能是0.3，“一”的概率可能为0.9，对于第四字符位置，“第”的概率可能是0.5，“一”的概率可能为0.9，对于第五字符位置，“第”的概率可能是0.1，“一”的概率可能为0.3。

在得到目标字典中各个字符在最大字数的标题上的各字符位置上的概率后，根据上述得到的概率，从目标字典中选择出目标字符，然后按照目标字符在候选标题的字符位置上的位置顺序生成候选标题，例如：候选标题的字数范围为8-12字时，确定出来的目标字符数量可能为10个，或者也可能为8个，并且，每个目标字符都对应一个字符位置，且目标字符是按照字符位置的先后顺序依次确定出来的，因此可以根据目标字符的选择顺序构成候选题目。

通过上述方法，得到的候选标题不仅满足字数范围的要求，而且还是与特征信息相，例如：当原始描述文案为下列内容时，商品行业：3C及电器、商品名称：按摩椅、商品标题1：爆款家用按摩椅，质保五年，送货上门，免安装费，商品标题2：这款液晶操控屏按摩椅太划算了！火爆热销，货到付款！，商品标语：爆款、送货上门、免安装费、液晶屏、火爆热销、质保五年、划算，设定的字数范围包括：2-6字、6-10字和10字以上，得到的候选标题包括以下几种：2-6字：(1)、“家用按摩椅”；(2)、“爆款按摩椅”；(3)、“热销按摩椅”等；6-10字：(1)、“爆款热销家用按摩椅”；(2)、“液晶操控屏按摩椅”；(3)、“按摩椅送货上门”等；10字以上：(1)、“家用按摩椅，质保五年，送货上门”；(2)、“爆款按摩椅热销中，货到付款！”；(3)、“液晶操控屏按摩椅太划算了！”等。

需要说明的是，输入参数在输入概率预测模型前可以根据实际需要对输入参数进行转换，例如：在得到输入参数包括的各内容对应的向量后，对各向量进行拼接处理，然后将拼接后的向量输入到概率预测模型中，或者是，直接将各向量输入到概率预测模型中，关于输入参数在输入到概率预测模型之前进行何种处理在此不做具体限定，并且，关于具体使用的概率预测模型在此不做具体限定。

在一个可行的实施方案中，在执行步骤202时，按照所述预设位置在所述候选标题中的先后顺序，从所述目标字典中依次确定所述目标字符，以得到该次输入下的所述候选标题；其中，所述候选标题中的第一个字符位置上的目标字符依据概率采样从所述目标字典中确定；所述候选标题中位于所述第一个字符位置之后的目标字符依据概率采样和位于该目标字符之前的字符的语义从所述目标字典中确定，直至得到最后一个目标字符。

具体的，在确定出目标字典中的各个字符在本次输入下最大字数标题的各字符位置上的概率后，需要先从目标字典中确定第一个字符位置上的目标字符，在确定第一个字符位置上的目标字符时，可以直接通过概率采样的方式从目标字典中确定，在确定出第一个字符位置上的目标字符后，再从目标字典中确定第二个字符位置上的目标字符，在确定第二个字符位置上的目标字符时依据第一个字符位置上的目标字符的语义，通过概率采样的方式从目标字典中确定，使得第二个字符位置上的目标字符和第一个字符位置上的目标字符具有语义关系，从目标字典中确定第三个字符位置上的目标字符时，在确定第三个字符位置上的目标字符时依据前两个字符位置上的目标字符的语义，通过概率采样的方式从目标字典中确定，使得第三个字符位置上的目标字符和前两个字符位置上的目标字符具有语义关系，以此类推，直至得到最后一个目标字符。

需要说明的是，本申请实施例中设定了候选标题的字数范围，最后一个目标字符所在的字符位置位于字符范围内对应的最大字符位置之前，例如：字数范围为12-15字时，根据语义，最后一个目标字符所在字符位置可能是第13个字符位置，或者也可能是第14个字符位置。

需要注意的是，在将一个媒体内容(包括目标标题)投放给用户之前，需要先对人群进行圈选，然后再将该媒体内容投放给圈选结果中包括的用户，举例说明，投放平台可以根据用户在该平台上的行为信息为该用户设置标签，然后根据为用户设置的标签，将该用户的UID(User Identification，用户身份标识)设置到对应的人群包中，从而可以得到多个人群包，然后平台根据媒体内容投放商设定的媒体内容投放人群，确定出多个目标人群包，然后从多个目标人群包中圈选出符合要求的用户，以作为将要投放目标媒体内容的用户，例如：当平台根据用户在平台上的行为信息确定该用户的年龄为18岁、所在位置为北京，兴趣爱好为骑行时，将该用户的UID设置到18岁对应的人群包、北京对应的人群包和骑行对应的人群包中，当媒体内容投放商在该平台投放目标媒体内容为自行车，目标媒体内容的投放人群为18岁爱好骑行的北京青年时，确定出来的人群包包括：18岁对应的人群包、北京对应的人群包和骑行对应的人群包，然后对上述三个人群包进行圈选，得到同时存在于上述三个人群包的用户，并将圈选出来的用户作为将要投放目标媒体内容的用户，或者是将整个平台下的用户都作为将要投放目标媒体内容的用户等，具体确定将要投放目标媒体内容的用户的方法在此不做具体限定，同时，为该媒体内容设置的标题需要根据当前的投放场景从上述得到的目标标题中进行选择。

在一个可行的实施方案中，图3为本申请实施例一提供的另一种标题生成方法的流程示意图，如图3所示，在执行步骤103时，可以通过以下步骤实现：

步骤301、将各所述候选标题作为输入参数，输入到语言模型中，得到该候选标题的语句通顺程度得分。

步骤302、对各所述候选标题和为所述原始描述文案设定的标准标题进行相似度比对，得到该候选标题的相似度得分。

步骤303、对同一候选标题的所述语句通顺程度得分和所述相似度得分进行加权求和，得到该候选标题的排序得分。

步骤304、根据各所述候选标题的排序得分，对各所述候选标题进行排序。

步骤305、依据所述排序，依次确定各所述候选标题中包含目标特征信息的目标标题，直至得到预设数量的目标标题为止。

具体的，对于某种第一标题字数范围下的多个候选标题而言，该多个候选标题与特征信息的匹配程度时不相同的，因此需要确定出该多个候选标题与原始描述文案的匹配程度的排序，以选择出与特征信息的匹配程度较高的候选标题作为目标标题，在对该多个候选标题进行排序时，选通过语言模型确定各候选标题的语句通顺程度得分，然后在得到各候选标题与原始描述文案的相似度得分，再根据为上述两种得分分配的权重对同一候选标题的语句通顺程度得分和相似度得分进行加权求和，以得到用于表示与原始描述文案的匹配程度的得分，以将用于表示与原始描述文案的匹配程度的得分作为该候选标题的排序得分，然后根据各候选标题的排序得分对各候选标题进行排序，排序越高表示与原始描述文案越匹配，同时，为了获得能够突出表达原始描述文案内容的候选标题，可以根据上述的排序，按照匹配程度从高到低顺序依次判断候选标题中是否包含设定的目标特征信息，然后将包括目标特征信息的候选标题作为目标标题，直至得到预设数量的目标标题为止，通过上述方法可以得到该种第一标题字数范围对应的目标标题，对于各第一标题字数范围对应的目标标题可以通过重复上述过程得到。

需要说明的是，设定的目标特征信息可以包括：实体对象名称和为实体对象设置的标语。

在一个可行的实施方案中，图4为本申请实施例一提供的另一种标题生成方法的流程示意图，如图4所示，在执行步骤101之前，该方法还包括以下步骤：

步骤401、获取目标标题训练样本、所述目标标题训练样本所属描述文案训练样本对应的特征信息训练样本，以及针对所述目标标题训练样本设定的各第二标题字数范围。

步骤402、针对每种第二标题字数范围，根据所述特征信息训练样本和该第二标题字数范围构建训练样本。

步骤403、使用所述训练样本和所述目标标题训练样本对所述概率预测模型进行训练。

具体的，在使用概率预测模型之前，需要对概率预测模型进行训练，在对概率预测模型进行训练时，需要先构建模型训练样本。在构建一个模型训练样本之前，先设定目标标题训练样本和目标标题训练样本所属描述文案训练样本对应的特征信息训练样本，以及针对目标标题训练样本设定的各第二标题字数范围，然后将每种第二标题字数范围和上述的特征信息训练样本均可以构成一个训练样本，然后使用该训练样本和所述目标标题训练样本对所述概率预测模型进行训练。

需要说明的是，在构建训练样本时，不同的信息之间使用特定的分隔符进行连接，各第二标题字数范围可以使用不同的标识进行表示。

举例说明，描述文案训练样本包括行业信息和设定的原始标题，其中，行业信息为快速消费品，设定的原始标题为：XX镇原浆酒，陈年窖藏，限时批发特惠，其中，XX镇原浆酒、陈年窖藏和限时批发特惠构成特征信息训练样本，并且，设定的各第二标题字数范围包括4-7字(标识为L1)、8-9字(标识为L2)、10-12字(标识为L3)和13-16字(标识为L4)，构成的训练样本包括：样本1、L1$快速消费品*XX镇原浆酒，陈年窖藏，限时批发特惠；样本2、L2$快速消费品*XX镇原浆酒，陈年窖藏，限时批发特惠；样本3、L3$快速消费品*XX镇原浆酒，陈年窖藏，限时批发特惠；样本4、L4$快速消费品*XX镇原浆酒，陈年窖藏，限时批发特惠，其中，为4-7字设定的目标标题训练样本为：XX镇原浆酒，为8-9字设定的目标标题训练样本为：XX镇窖藏原浆酒，为10-12字设定的目标标题训练样本为：XX镇原浆酒，限时特惠，为13-16字设定的目标标题训练样本为：XX镇陈年窖藏原浆酒，限时特惠，对于4-7字，使用样本1和为4-7字设定的目标标题训练样本对概率预测模型进行训练，对于为8-9字，使用样本2和为8-9字设定的目标标题训练样本对概率预测模型进行训练，对于为10-12字，使用样本3和为10-12字设定的目标标题训练样本对概率预测模型进行训练，对于为13-16字，使用样本4和为13-16字设定的目标标题训练样本对概率预测模型进行训练。

在一个可行的实施方案中，图5为本申请实施例一提供的另一种标题生成方法的流程示意图，如图5所示，在执行步骤403时，可以通过以下步骤实现：

步骤501、针对每个训练样本，将该训练样本作为输入参数，输入到所述概率预测模型中，得到用于表示输出语句的矩阵。

步骤502、确定用于表示输出语句的矩阵和所述目标标题训练样本对应的矩阵之间的损失值。

步骤503、将所述损失值作为输入参数，输入到指定的反向传播算法中。

步骤504、使用携带有输入参数的反向传播算法对所述概率预测模型中的可学习参数进行调整，直至得到的用于表示输出语句的矩阵和所述目标标题训练样本对应的矩阵之间的损失值的变化范围位于预设范围内。

具体的，在将模型训练样本输入到概率预测模型后，概率预测模型对模型训练样本进行处理后可以得到输出语句的矩阵，该矩阵能够表示输出语句，即：输出的标题，为了使输出的标题与设定的目标标题训练样本比较接近，需要计算输出语句的矩阵和目标标题训练样本对应的矩阵之间的损失值，然后将损失值作为输入参数通过反向传播算法对概率预测模型中的可学习参数进行调整，以上为一次训练过程，在经过多次训练后，可以对可学习参数进行调整，并且每次调整后都可以减小输出的语句的矩阵与目标标题训练样本对应的矩阵之间的损失值，直至损失值预设范围内，此时则完成了训练，使用训练完成的概率预测模型再次得到的输出语句能够与目标标题训练样本基本相同，或者能够表示基本相同的语义，从而在使用训练完成的概率预测模型生成目标标题时，可以使目标标题与预想的标题基本一致。

需要说明的是，针对每种字数范围的训练样本可以构建多个，以使概率预测模型生成的各种字数范围的候选标题都比较准确。

需要再次说明的是，第一标题字数范围和第二标题字数范围的设定方式可以是相同的，或者也可以是不相同的，具体根据实际需要进行设定，在此不做具体限定。

实施例二

图6为本申请实施例二提供的一种标题生成装置的结构示意图，如图6所示，该装置包括：

获取单元61，用于获取原始描述文案对应的特征信息；

生成单元62，用于针对预设的多种第一标题字数范围中的每种第一标题字数范围，将所述特征信息和该种第一标题字数范围输入到概率预测模型中，得到与该种第一标题字数范围对应的至少一个候选标题，其中，每个所述候选标题中包括的字符数位于该种第一标题字数范围内；

筛选单元63，用于根据预设筛选规则，从所述至少一个候选标题中筛选出目标标题。

在一个可行的实施方案中，所述特征信息包括以下至少一种：

行业信息、实体对象名称、为实体对象设置的标语。

在一个可行的实施方案中，所述生成单元62用于将所述特征信息和该种第一标题字数范围输入到概率预测模型中，得到与该种第一标题字数范围对应的至少一个候选标题时，包括：

在一个可行的实施方案中，所述生成单元62用于根据所述概率，从所述目标字典中选择出该次输入对应的目标字符，以得到该次输入下按照所述目标字符的选择顺序构成的所述候选标题时，包括：

在一个可行的实施方案中，所述筛选单元63用于根据预设筛选规则，从所述至少一个候选标题中筛选出目标标题时，包括：

在一个可行的实施方案中，图7为本申请实施例二提供的另一种标题生成装置的结构示意图，如图7所示，所述装置还包括：

训练单元64，用于获取目标标题训练样本、所述目标标题训练样本所属描述文案训练样本对应的特征信息训练样本，以及针对所述目标标题训练样本设定的各第二标题字数范围；针对每种第二标题字数范围，根据所述特征信息训练样本和该第二标题字数范围构建训练样本；使用所述训练样本和所述目标标题训练样本对所述概率预测模型进行训练。

在一个可行的实施方案中，所述训练单元64用于使用所述训练样本和所述目标标题训练样本对所述概率预测模型进行训练时，包括：

关于实施例二的原理说明可参考实施例一的相关解释，在此不做具体限定。

通过上述方法，可以得到包含多种字数范围的目标标题，从而满足不同场景的使用需求，由于上述标题可以自动生成，进而有利于降低人工工作量。

实施例三

图8为本申请实施例三提供的一种电子设备的结构示意图，包括：处理器801、存储介质802和总线803，所述存储介质802存储有所述处理器801可执行的机器可读指令，当电子设备运行上述的标题生成方法时，所述处理器801与所述存储介质802之间通过总线803通信，所述处理器801执行所述机器可读指令，以执行实施例一中任一所述的方法的步骤。

实施例四

本申请实施例四还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行实施例一中任一所述的方法的步骤。

在本申请所提供的实施例中，应该理解到，所揭露装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请提供的实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释，此外，术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

最后应说明的是：以上所述实施例，仅为本申请的具体实施方式，用以说明本申请的技术方案，而非对其限制，本申请的保护范围并不局限于此，尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种标题生成方法，其特征在于，包括：

获取原始描述文案对应的特征信息；

2.如权利要求1所述的方法，其特征在于，所述特征信息包括以下至少一种：

行业信息、实体对象名称、为实体对象设置的标语。

3.如权利要求1所述的方法，其特征在于，所述将所述特征信息和该种第一标题字数范围输入到概率预测模型中，得到与该种第一标题字数范围对应的至少一个候选标题，包括：

4.如权利要求3所述的方法，其特征在于，所述根据所述概率，从所述目标字典中选择出该次输入对应的目标字符，以得到该次输入下按照所述目标字符的选择顺序构成的所述候选标题，包括：

5.如权利要求1所述的方法，其特征在于，所述根据预设筛选规则，从所述至少一个候选标题中筛选出目标标题，包括：

6.如权利要求2所述的方法，其特征在于，所述方法还包括：

7.如权利要求6所述的方法，其特征在于，所述使用所述训练样本和所述目标标题训练样本对所述概率预测模型进行训练，包括：

8.一种标题生成装置，其特征在于，包括：

获取单元，用于获取原始描述文案对应的特征信息；

9.一种电子设备，其特征在于，包括：处理器、存储介质和总线，所述存储介质存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储介质之间通过总线通信，所述处理器执行所述机器可读指令，以执行如权利要求1至7中任一项所述的标题生成方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行如权利要求1至7中任一项所述的标题生成方法的步骤。