CN110765753A - 文案生成方法、***、计算机设备和存储介质 - Google Patents
文案生成方法、***、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN110765753A CN110765753A CN201911372226.3A CN201911372226A CN110765753A CN 110765753 A CN110765753 A CN 110765753A CN 201911372226 A CN201911372226 A CN 201911372226A CN 110765753 A CN110765753 A CN 110765753A
- Authority
- CN
- China
- Prior art keywords
- entity
- document
- information
- file
- knowledge graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
申请提供一种文案生成方法、***、计算机设备和存储介质,所述方法包括:获取由关键信息填入文案模板所得的文案初稿;通过实体序列模型识别文案初稿中长文案知识图谱的实体,从长文案知识图谱中调取实体所在的知识图谱,并将实体所在的知识图谱的信息整合成自然语言,得到扩展语句;将扩展语句添加至文案初稿中,生成目标文案。上述方法通过实体序列模型识别出文案初稿中的实体,并将实体所在的知识图谱的信息整合成扩展语句,将扩展语句添加至文案初稿,生成完成扩展的目标文案,根据指定领域的长文案知识图谱限定扩展语句的扩展方向,同时长文案知识图谱的广度大,提供多元扩展方向,提高长文案创作的效率。
Description
技术领域
本申请涉及数据处理技术领域,具体而言,本申请涉及一种文案生成方法、***、计算机设备和存储介质。
背景技术
人工写作文案往往需要花费大量时间和心思搜集资料以及构思写作,以满足不同场景下的文案需求,可谓费时费力。
近几年来,随着人工智能的不断发展,开始发展出应用在各领域的智能写作,提高文案写作效率。智能写作还可以在特定领域下,根据关键变量基于写作模板生成文章,如生成天气预报、股市报道、体育赛事等风格的文章。通过写作模板可以按照方向性地勾勒该领域文章的表现风格。
在房地产营销中,需要大量的长文案辅助房地产项目的推广,依据固定的若干种类型的房地产长文案写作模板,只能生成指定若干种风格的房地产长文案,大量房地产长文案显得刻板和固化,使得长文案创作的效率低。
发明内容
基于此,有必要针对上述的技术缺陷,特别是文案创作效率低的技术缺陷,提供一种文案生成方法、***、计算机设备和存储介质。
一种文案生成方法,包括如下步骤:
获取由关键信息填入文案模板所得的文案初稿;
通过实体序列模型识别所述文案初稿中长文案知识图谱的实体,其中,所述实体序列模型是根据标记有实体的文章训练得到;
从所述长文案知识图谱中调取所述实体所在的知识图谱,并将所述实体所在的知识图谱的信息整合成自然语言,得到扩展语句;
将所述扩展语句添加至所述文案初稿中,生成目标文案。
在一个实施例中,所述获取由关键信息填入文案模板所得的文案初稿的步骤,包括:
根据用户输入的变量信息和关键信息匹配出所述文案模板;接收用户输入所述文案模板的补充信息;根据所述关键信息、补充信息和文案模板生成所述文案初稿。
在一个实施例中,所述获取由关键信息填入文案模板所得的文案初稿的步骤之前,还包括:
对文案数据库中各个文案标注变量信息;从所述文案中划分出各种类型的内容模块,分别从各个内容模块提取写作模板;根据该内容模板中关键信息为该内容模板标注关键信息类型;
将用户输入的变量信息和关键信息与标注的变量信息和关键信息类型进行匹配,获得所述文案模板。
在一个实施例中,在所述从所述长文案知识图谱中调取所述实体所在的知识图谱的步骤之前,还包括:
对文案数据库中各个文案进行应用命名实体识别和关系抽取,获得文案中的实体和实体关系;
根据对文案数据库标注的变量信息、关键信息类型、指定专业知识和文案中的实体以及实体关系,构建所述长文案知识图谱。
在一个实施例中,在所述通过实体序列模型识别所述文案初稿中长文案知识图谱的实体的步骤之前,还包括:
将文案内容中标注有所述长文本知识图谱中所对应实体的文案样本输入初始的实体序列模型,训练出所述实体序列模型。
在一个实施例中,所述从所述长文案知识图谱中调取所述实体所在的知识图谱,并将所述实体所在的知识图谱的信息整合成自然语言,得到扩展语句的步骤,包括:
调取与所述实体连接的关系实体及其之间的关系信息,以及获取所述关系实体的实体属性;从资料库中查找所述实体与所述关系实体、关系信息和实体属性相关联的特征信息;根据所述特征信息和所述关系信息按照自然语言进行整合,生成所述扩展语句。
在一个实施例中,所述扩展语句包括一级扩展语句;
所述从所述长文案知识图谱中调取所述实体所在的知识图谱,并将所述实体所在的知识图谱的信息整合成自然语言,得到扩展语句的步骤,包括:
从所述长文案知识图谱中调取与所述实体直接连接的一级关系实体及其之间的一级关系信息;获取所述实体和一级关系实体在所述长文案知识图谱中的实体属性;根据所述一级关系实体、一级关系信息和实体属性整合成自然语言,得到一级扩展语句。
在一个实施例中,所述扩展语句还包括多级扩展语句;
所述从所述长文案知识图谱中调取所述实体所在的知识图谱,并将所述实体所在的知识图谱的信息整合成自然语言,得到扩展语句的步骤,还包括:
从所述长文案知识图谱中调取与所述实体间接连接的多级关系实体及其之间的多级关系信息;获取所述实体和多级关系实体在所述长文案知识图谱中的实体属性;根据所述多级关系实体、多级关系信息和实体属性整合成自然语言,得到多级扩展语句。
在一个实施例中,在所述从所述长文案知识图谱中调取所述实体所在的知识图谱的步骤之后,还包括:
根据所述实体所在的知识图谱中的实体和实体关系,生成扩展建议信息;向用户返回所述扩展建议信息,以及接收用户根据所述扩展建议信息输入的扩展文本;在所述文案初稿中添加所述扩展文本,生成所述目标文案。
在一个实施例中,在所述生成目标文案的步骤之后,还包括:
将所述目标文案进行文本纠错检查和违禁词检查;若所述目标文案中存在语法错误,则以下划线标出所述语法错误;若所述目标文案中存在违禁词,则以方框框出所述违禁词。
在一个实施例中,所述内容模块的类型包括:物业、装修、园林、项目规划、市政配套、智能化、教育、户型说明、产品优势、地段、商圈、交通、主题说辞、礼品和赠送及优惠折扣中的一项或多项。
在一个实施例中,所述文案数据库中存储有楼盘推广文案,所述变量信息包括广告目的、项目属性、行文风格、类型中的一项或多项。
在一个实施例中,所述长文案知识图谱中实体的类型包括楼盘小区、交通设施、学校、体育健身设施、医院、银行、物业、装修、户型中的一项或多项。
在一个实施例中,所述实体关系的类型包括楼盘小区与交通设施、学校、医院、银行之间的距离,还包括楼盘小区与体育健身设施、物业、装修、户型之间的附属性质中的一项或多项。
一种文案生成***,包括:
获取模块,用于获取由关键信息填入文案模板所得的文案初稿;
识别模块,用于通过实体序列模型识别所述文案初稿中长文案知识图谱的实体,其中,所述实体序列模型是根据标记有实体的文章训练得到;
调取模块,用于从所述长文案知识图谱中调取所述实体所在的知识图谱,并将所述实体所在的知识图谱的信息整合成自然语言,得到扩展语句;
生成模块,用于在所述文案初稿中添加所述扩展语句,生成目标文案。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例所述文案生成方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施例所述文案生成方法的步骤。
上述的文案生成方法、***、计算机设备和存储介质,通过实体序列模型识别出文案初稿中的实体,找基于长文案知识图谱找出可扩展项,以及调取实体所在的知识图谱,并将实体所在的知识图谱的信息整合成扩展语句,将扩展语句添加至文案初稿,生成完成扩展的目标文案,长文案知识图谱还可以保障扩展方向限定在长文案知识图谱所在的指定领域,同时长文案知识图谱的广度大,提供多元扩展方向,提高长文案创作的效率。
本申请附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过实践了解到。
附图说明
上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为一个实施例中文案模板的示意图;
图2为一个实施例中文案生成方法的流程图;
图3为一个实施例中知识图谱的示意图;
图4为一个实施例中房地产项目文案应用下的知识图谱的示意图;
图5为一个实施例中标注语法错误和违禁词的示意图;
图6为又一个实施例中文案模板的示意图;
图7为一个实施例中扩展建议信息的示意图;
图8为一个实施例中文案生成***的结构示意图;
图9为一个实施例中计算机设备的内部结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
如图1所示,图1为一个实施例中文案模板的示意图,该文案模板中中,“X”代表固定的文本,下划线代表需要另外补充的关键信息。
在一个实施例中,如图2所示,图2为一个实施例中文案生成方法的流程图,本实施例中提出了一种文案生成方法,该文案生成方法可以应用于计算机设备中,具体可以包括以下步骤:
步骤S210:获取由关键信息填入文案模板所得的文案初稿。
本步骤中,文案模板可以来自用户的选择,在确定文案模板中待填入的关键信息后,关键信息被填入文案模板的相应位置中,获得文案初稿。例如,用户可以输入补充文案模板的关键信息,或者,关键信息也可以从对应的预存数据中查找而获得。
具体地,在一个实施例中,步骤S210中获取由关键信息填入文案模板所得的文案初稿的步骤,可以包括:
S211:根据用户输入的变量信息和关键信息匹配出文案模板。
获取用户提供的变量信息和关键信息,将变量信息和关键信息与文案模板的标签进行比对,匹配出相关度高的若干个文案模板。若匹配出多个文案模板,可以多个文案模板展示给用户并根据用户的选择确定一个或多个文案模板。
S212:接收用户输入文案模板的补充信息。
根据关键信息和匹配出的文案模板确定还需补充的部分,提示用户输入补充信息,待用户输入文案模板的补充信息后,即可接收用户输入的文案模板的补充信息。
S213:根据关键信息、补充信息和文案模板生成文案初稿。
将关键信息和补充信息填入文案模板的相应位置中,生成完整的文案初稿。
步骤S220:通过实体序列模型识别文案初稿中长文案知识图谱的实体,其中,实体序列模型是根据标记有实体的文章训练得到。
本步骤中,识别出文案初稿中可以归类到长文案知识图谱的实体,从而为文案初稿识别出可基于长文案知识图谱进行文案扩展的可扩展项。
被识别出的实体可以属于文案初稿中的关键信息,也可以属于文案初稿中的文案模板,关键信息和文案模板的内容均可以作为文案扩展的可扩展项。
各个知识图谱有着相对应的指定领域,长文案知识图谱中的实体和实体关系属于其指定领域中的特征信息,长文案知识图谱以及基于长文案知识图谱的实体序列模块都是限定在指定领域中的,这有利于在指定领域中确定可扩展项,有效地指引扩展方向。
实体序列模型是根据标记有实体的文章训练得到。向训练后的实体序列模型输入文案初稿,实体序列模型可以输出文案初稿中的实体。实体序列模型可以使用Bi-LSTM+CRF模型进行训练,或者也可以使用Bi-GRU+CRF模型或CRF++工具进行训练(Bi-LSTM:bidirectional long / short term memory networks,双向长短期记忆网络;CRF:Conditional Random Field,条件随机场;Bi-GRU:bidirectional gated recurrentunits,双向门控循环单元)。
步骤S230:从长文案知识图谱中调取实体所在的知识图谱,并将实体所在的知识图谱的信息整合成自然语言,得到扩展语句。
本步骤中,调取实体所在的知识图谱,获取与实体相关的实体和实体关系,按照自然语言规则将该相关的实体与其对应的实体关系组织成扩展语句,依据完成可扩展项(实体)在可扩展方向(相关的实体和实体关系)上的扩展。根据指定领域的长文案知识图谱可以限定扩展语句的扩展方向,如图3所示,图3为一个实施例中知识图谱的示意图,图3表示了实体1所在的知识图谱;如图4所示,图4为一个实施例中房地产项目文案应用下的知识图谱的示意图,图4表示了“小区”这个实体所在的知识图谱。
步骤S240:将扩展语句添加至文案初稿中,生成目标文案。
本步骤中,将扩展语句添加入文案初稿,实现对文案初稿的扩展。
扩展语句可由用户选择放置的位置,或者也可以由用户选择是否添加入文案初稿内。若扩展语句的语句不通顺或缺少信息时,亦可以通过用户修改和添加信息。
上述文案生成方法,通过实体序列模型识别出文案初稿中的实体,找基于长文案知识图谱找出可扩展项,以及调取实体所在的知识图谱,并将实体所在的知识图谱的信息整合成扩展语句,将扩展语句添加至文案初稿,生成完成扩展的目标文案,长文案知识图谱还可以保障扩展方向限定在长文案知识图谱所在的指定领域,同时长文案知识图谱的广度大,提供多元扩展方向,提高长文案创作的效率。
在一个实施例中,在步骤S240中生成目标文案的步骤之后,还包括:
步骤S251:将目标文案进行文本纠错检查和违禁词检查;步骤S252:若目标文案中存在语法错误, 则以下划线标出语法错误;步骤S253:若目标文案中存在违禁词,则以方框框出违禁词。
上述文案生成方法,可以进行智能纠错以及违禁词检查,以保证生成文本的质量。文本纠错检查中判断目标文案中是否存在语法错误,用下划线标出可疑错误,违禁词检查中会检测目标文案中是否使用违禁词,用方框框出可疑违禁词。例如,如图5所示,图5为一个实施例中标注语法错误和违禁词的示意图,在向用户返回显示该目标文案时,下划线和方框亦可同时显示,向用户提示可疑错误和可疑违禁词。
在一个实施例中,步骤S230中从长文案知识图谱中调取实体所在的知识图谱,并将实体所在的知识图谱的信息整合成自然语言,得到扩展语句的步骤,可以包括:
S231:调取与实体连接的关系实体及其之间的关系信息,以及获取关系实体的实体属性。
确定与实体连接的关系实体,以及调取该关系实体和关系实体的实体属性,以及调取实体与该关系实体之间的关系信息。
文案初稿中的“天幕府”被匹配出长文案知识图谱(如图4所示)中的实体为“小区”,以实体“小区”为例,“小区”的属性包括“名称”,调取“小区”所在的知识图谱,与“小区”连接的关系实体包括“学校”、“地铁站”和“体育配套设施”。“学校”的属性包括“规模”和“性质”,“小区”与“学校”之间的关系信息为“距离”;“地铁站”的属性包括“名称”和“几号线”,“小区”与“地铁站”之间的关系信息为“距离”;“体育配套设施”的属性包括“所占面积”、“类型”和“适应人群”,“小区”与“体育配套设施”之间的关系信息为“具备”。
S232:查找实体与关系实体、关系信息和实体属性相关联的特征信息。
从资料库中查找基于该实体下关系实体所对应的特征信息或者提示用户提供相关联的特征信息。
特征信息包括与该实体真实相关的具体信息。以前面所匹配实体的“天幕府”为例,从资料库中查找“天幕府”附近距离内的“学校”、“地铁站”以及“天幕府”自身所具备的“体育配套设施”,以及提取“学校”的“规模”和“性质”,确定“地铁站”的“名称”以及位于“几号线”,确定“体育配套设施”“所占面积”、所属“类型”和“适应人群”。如查找到“天幕府”附近距离500米内配套的“学校”有第一小学,第一小学“性质”是公办,“规模”是教学班60个,学生3000人等。
S233:根据特征信息和关系信息按照自然语言进行整合,生成扩展语句。
将关系信息和特征信息进行组合,生成扩展语句,以“学校”和“距离”的特征信息为例生成扩展语句:“第一小学距离500米”。也可以调用匹配的扩展模板整合特征信息和关系信息,如“天幕府毗邻第一小学”。
与实体连接的关系可以包括直接连接的一级关系和间接连接的多级关系。例如,可以实体的若干级关系或指定级关系下的关系实体及其之间的关系信息以及实体属性。以下分别以一级关系和多级关系下实体所在的知识图谱为例,扩展一级扩展语句和多级扩展语句,请见下面的实施例。
在一个实施例中,扩展语句包括一级扩展语句,一级扩展语句是与实体直接相关的扩展语句。步骤S230中从长文案知识图谱中调取实体所在的知识图谱,并将实体所在的知识图谱的信息整合成自然语言,得到扩展语句的步骤,可以包括:
S2301:从长文案知识图谱中调取与实体直接连接的一级关系实体及其之间的一级关系信息。S2302:获取实体和一级关系实体在长文案知识图谱中的实体属性。以及S2303:根据一级关系实体、一级关系信息和实体属性整合成自然语言,得到一级扩展语句。
上述文案生成方法,可以按照最相关的一级关系进行文案扩展,提高扩展内容与文案初稿的关联性,提高长文案扩展的范围和效率。
在一个实施例中,扩展语句还包括多级扩展语句,多级扩展语句是与实体间接相关的扩展语句。步骤S230中从长文案知识图谱中调取实体所在的知识图谱,并将实体所在的知识图谱的信息整合成自然语言,得到扩展语句的步骤,还可以包括:
S2304:从长文案知识图谱中调取与实体间接连接的多级关系实体及其之间的多级关系信息。S2305:获取实体和多级关系实体在长文案知识图谱中的实体属性。S2306:根据多级关系实体、多级关系信息和实体属性整合成自然语言,得到多级扩展语句。
上述文案生成方法,还可以按照间接相关的多级关系进行文案扩展,在一级关系的基础上还可以更深入、全面和多方位地增加扩展方向,丰富文案创作的思路,提高长文案创作的效率。
在一个实施例中,获取由关键信息填入文案模板所得的文案初稿的步骤之前,还可以包括:
S201:对文案数据库中各个文案标注变量信息。S202:从文案中划分出各种类型的内容模块,分别从各个内容模块提取写作模板。
写作模板的抽取基础是大量带有标注的真实文案数据,对于每一篇文案,需要对各段文案进行划分和标注对应所属于的变量信息,以及标明各段文案中内容属于何种内容模块。
S203:根据该内容模板中关键信息为该内容模板标注关键信息类型。
对于任一内容模块还需要将其中的关键信息加以标注。关键信息启示是专属于文案的特殊信息,将这些特殊信息抠出,所剩下的内容便是写作模板。在将用户自定义的关键信息填充进去,便可生成专属文案。
S204:将用户输入的变量信息和关键信息与标注的变量信息和关键信息类型进行匹配,获得文案模板。
上述文案生成方法,提取文案模板,以及根据用户输入信息提供匹配的文案模板,提高文案生成的效率。
以应用在房地产项目文案的文案模板为例,文案数据库中包含有大量的房地产项目文案,需要对这些房地产项目文案的整体标注广告目的、项目属性、行文风格、类型等。图6为又一个实施例中文案模板的示意图,如图6中所示的第一段内容模块为价值输出类相关的写作模板,该模板带有促销、中式豪宅(项目属性)、人文风(行文风格)、硬广(类型)的标签,并且在某些位置填充物业的认证资质以及专属服务信息。
其中,以房地产项目文案为例,内容模块的类型包括:物业、装修、园林、项目规划、市政配套、智能化、教育、户型说明、产品优势、地段、商圈、交通、主题说辞、礼品和赠送及优惠折扣中的一项或多项。
文案数据库中存储有楼盘推广文案,变量信息包括广告目的、项目属性、行文风格、类型一项或多项。
长文案知识图谱中实体的类型包括楼盘小区、交通设施、学校、体育健身设施、医院、银行、物业、装修、户型中的一项或多项;
实体关系的类型包括楼盘小区与交通设施、学校、医院、银行之间的距离,还包括楼盘小区与体育健身设施、物业、装修、户型之间的附属性质一项或多项。
变量信息可以包括广告目的、项目属性、行文风格、文案类型以及价值输出类、品牌价值类、常规促销类和节点促销类的内容模块。关键信息可以包括在应用领域中各类内容模块的特征信息。
以房地产项目文案的特征信息为例,内容模块的类型包括价值输出类、品牌价值类、常规促销类、节点促销类中一类或多类。
价值输出类内容模块的信息包括:物业信息、装修信息、园林信息、项目规划信息、市政配套信息、智能化信息、教育信息、户型说明信息、产品优势信息、地段信息、商圈信息和交通信息中的一项或多项。例如,物业信息包括认证资质、专属服务等信息;装修信息包括装修价格、装修风格、设计师等;园林信息包括风格、面积、亮点等信息;项目规划信息包括容积率、占地面积、绿化率、建筑面积等信息;市政配套信息包括政府投入、市政等信息;智能化信息包括新风、净水、门禁、安防等信息;教育信息包括小学、初中、高中、大学等信息;户型说明信息:或输入户型特点、面积、厅室等信息;产品优势信息包括户型特点、面积、厅室等信息;地段信息包括医院、银行、娱乐生活休闲设施等信息;商圈信息包括医院、银行、娱乐生活休闲等设施和购物中心等信息;交通信息包括地铁、公路、快速路、城轨、高速等信息。
品牌价值类内容模块的信息可选文案库中集团简介,集团架构,发展历程,所获荣誉,业务范围,集团理念,发展目标,企业文化,社会责任,公益活动,集团大事记等的内容。
常规促销类内容模块的信息可以包括:主题说辞信息、礼品信息和赠送及优惠折扣信息中的一项或多项。节点促销类内容模块的房地产项目信息包括:主题说辞信息、礼品信息、尾盘钜惠信息和赠送及优惠折扣信息中的一项或多项。例如,主题说辞信息包括主题、促销手段、促销力度等信息;赠送及优惠折扣信息包括折扣、赠送等信息;礼品信息包括礼品、领取条件;尾盘钜惠信息包括买房的优惠、折扣等信息。
以房地产项目文案为例,项目属性可以包括中式豪宅、一般豪宅、品质型常规住宅、生活型常规住宅、滨海、温泉、山水、公寓、写字楼等;行文风格可以包括人文风、土豪风、轻奢风、文艺风、青春风、度假休闲风、办公商务风、投资升值风、英伦贵族风、商业风、情感诉求风等;价值输出类的内容模块可以包括与项目相关的物业、装修、园林、项目规划、市政配套、智能化、教育、户型说明、产品优势、地段、商圈、交通等信息。
在一个实施例中,在从长文案知识图谱中调取实体所在的知识图谱的步骤之前,还可以包括:
S261:对文案数据库中各个文案进行应用命名实体识别和关系抽取,获得文案中的实体和实体关系。
利用命名实体识别以及关系抽取工具对文案数据库中现有文案进行处理,识别现有文案中的实体以及抽取实体之间的实体关系,并对获得的实体和实体关系进行汇总。
S261:根据对文案数据库标注的变量信息、关键信息类型、指定专业知识和文案中的实体以及实体关系,构建长文案知识图谱。
根据对文案数据库标注的变量信息、关键信息类型、指定专业知识和文案中的实体以及实体关系,确定可纳入长文案知识图谱的实体和实体关系,并构建长文案知识图谱。
比如,在房地产项目文案中,“楼盘名”、“小区名”、“周边地铁线”、“周边学校名”、“装修风格”等可作为实体的类型和属性,比如“名称”、“类型”等,“两地之间的距离”、“两地之间的交通方式”等可作为实体关系类型。最后综合以上工作,将这些信息进整合成知识图谱。
在一个实施例中,在通过实体序列模型识别文案初稿中长文案知识图谱的实体的步骤之前,还可以包括:
将文案内容中标注有长文本知识图谱中所对应实体的文案样本输入初始的实体序列模型,训练出实体序列模型。
文案样本中的文案内容上标注着实体,标注的是长文本知识图谱中的实体。实体序列模型的目的是能够识别出一个文本中所包含的实体,特别是能够识别长文本知识图谱中实体。向训练后的实体序列模型输入文案初稿,实体序列模型可以输出文案初稿中的实体,例如输出的标签中标识文案初稿具备哪些实体。根据输出的实体可以对应确定其在文案初稿的位置,在实体所在位置进行扩展语句的添加,增强文案扩展的流畅性。还可以在文案初稿可视化显示中,根据实体的位置对实体进行下划线的标注以向用户提示。
在一个实施例中,在步骤S230中所述从所述长文案知识图谱中调取所述实体所在的知识图谱的步骤之后,还可以包括:
S271:根据所述实体所在的知识图谱中的实体和实体关系,生成扩展建议信息。
调用扩展建议模板,将实体和实体关系添加进扩展建议模板,得到扩展建议信息。
S272:向用户返回所述扩展建议信息,以及接收用户根据所述扩展建议信息输入的扩展文本。
图7为一个实施例中扩展建议信息的示意图,如图7所示,向用户返回和显示对“天幕府”的扩展信息建议,用户的光标箭头移动至该处时显示对应于“天幕府”的扩展信息建议,其余具有下划线的文本也相应配有对应的扩展信息建议。用户根据相关的扩展建议,输入对文案初稿进行补充扩展的扩展文本。
S273:在所述文案初稿中添加所述扩展文本,生成所述目标文案。
上述文案生成方法,在文案初稿中添加根据扩展建议信息进行补充的扩展文本后,完成对文案初稿的扩展,得到目标文案,用户可以根据扩展建议信息自由扩展和创作不同长度的文案,适应不同的场景,提高长文案创作的效率。
在一个实施例中,如图8所示,图8为一个实施例中文案生成***的结构示意图,本申请还提供一种文案生成***,具体可以包括:获取模块810、识别模块820、调取模块830和生成模块840,其中:
获取模块810,用于获取由关键信息填入文案模板所得的文案初稿。
获取模块810文案模板可以来自用户的选择,在确定文案模板中待填入的关键信息后,关键信息被填入文案模板的相应位置中,获得文案初稿。例如,用户可以输入补充文案模板的关键信息,或者,关键信息也可以从对应的预存数据中查找而获得。
识别模块820,用于通过实体序列模型识别文案初稿中长文案知识图谱的实体,其中,所述实体序列模型是根据标记有实体的文章训练得到。
识别模块820中识别出文案初稿中可以归类到长文案知识图谱的实体,从而为文案初稿识别出可基于长文案知识图谱进行文案扩展的可扩展项。
被识别出的实体可以属于文案初稿中的关键信息,也可以属于文案初稿中的文案模板,关键信息和文案模板的内容均可以作为文案扩展的可扩展项。
各个知识图谱有着相对应的指定领域,长文案知识图谱中的实体和实体关系属于其指定领域中的特征信息,长文案知识图谱以及基于长文案知识图谱的实体序列模块都是限定在指定领域中的,这有利于在指定领域中确定可扩展项,有效地指引扩展方向。
调取模块830,用于从长文案知识图谱中调取实体所在的知识图谱,并将实体所在的知识图谱的信息整合成自然语言,得到扩展语句。
调取模块830调取实体所在的知识图谱,获取与实体相关的实体和实体关系,按照自然语言规则将该相关的实体与其对应的实体关系组织成扩展语句,依据完成可扩展项(实体)在可扩展方向(相关的实体和实体关系)上的扩展。
生成模块840,用于在文案初稿中添加扩展语句,生成目标文案。
生成模块840将扩展语句添加入文案初稿,实现对文案初稿的扩展。
扩展语句可由用户选择放置的位置,或者也可以由用户选择是否添加入文案初稿内。若扩展语句的语句不通顺或缺少信息时,亦可以通过用户修改和添加信息。
上述文案生成***,通过实体序列模型识别出文案初稿中的实体,找基于长文案知识图谱找出可扩展项,以及调取实体所在的知识图谱,并将实体所在的知识图谱的信息整合成扩展语句,将扩展语句添加至文案初稿,生成完成扩展的目标文案,长文案知识图谱还可以保障扩展方向限定在长文案知识图谱所在的指定领域,同时长文案知识图谱的广度大,提供多元扩展方向,提高长文案创作的效率。
关于文案生成***的具体限定可以参见上文中对于文案生成方法的限定,在此不再赘述。上述文案生成***中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
如图9所示,图9为一个实施例中计算机设备的内部结构示意图。该计算机设备包括通过***总线连接的处理器、非易失性存储介质、存储器和网络接口。其中,该计算机设备的非易失性存储介质存储有操作***、数据库和计算机程序,该计算机程序被处理器执行时,可使得处理器实现一种文案生成方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器执行一种文案生成方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述任一实施例所述的文案生成方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一实施例所述的文案生成方法的步骤。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (14)
1.一种文案生成方法,其特征在于,包括如下步骤:
获取由关键信息填入文案模板所得的文案初稿;
通过实体序列模型识别所述文案初稿中长文案知识图谱的实体,其中,所述实体序列模型是根据标记有实体的文章训练得到;
从所述长文案知识图谱中调取所述实体所在的知识图谱,并将所述实体所在的知识图谱的信息整合成自然语言,得到扩展语句;
将所述扩展语句添加至所述文案初稿中,生成目标文案。
2.根据权利要求1所述的文案生成方法,其特征在于,所述获取由关键信息填入文案模板所得的文案初稿的步骤,包括:
根据用户输入的变量信息和关键信息匹配出所述文案模板;
接收用户输入所述文案模板的补充信息;
根据所述关键信息、补充信息和文案模板生成所述文案初稿。
3.根据权利要求1所述的文案生成方法,其特征在于,所述获取由关键信息填入文案模板所得的文案初稿的步骤之前,还包括:
对文案数据库中各个文案标注变量信息;
从所述文案中划分出各种类型的内容模块,分别从各个内容模块提取写作模板;
根据该内容模板中关键信息为该内容模板标注关键信息类型;
将用户输入的变量信息和关键信息与标注的变量信息和关键信息类型进行匹配,获得所述文案模板。
4.根据权利要求3所述的文案生成方法,其特征在于,在所述从所述长文案知识图谱中调取所述实体所在的知识图谱的步骤之前,还包括:
对文案数据库中各个文案进行应用命名实体识别和关系抽取,获得文案中的实体和实体关系;
根据对文案数据库标注的变量信息、关键信息类型、指定专业知识和文案中的实体以及实体关系,构建所述长文案知识图谱。
5.根据权利要求4所述的文案生成方法,其特征在于,在所述通过实体序列模型识别所述文案初稿中长文案知识图谱的实体的步骤之前,还包括:
将文案内容中标注有所述长文本知识图谱中所对应实体的文案样本输入初始的实体序列模型,训练出所述实体序列模型。
6.根据权利要求1所述的文案生成方法,其特征在于,所述从所述长文案知识图谱中调取所述实体所在的知识图谱,并将所述实体所在的知识图谱的信息整合成自然语言,得到扩展语句的步骤,包括:
调取与所述实体连接的关系实体及其之间的关系信息,以及获取所述关系实体的实体属性;
从资料库中查找所述实体与所述关系实体、关系信息和实体属性相关联的特征信息;
根据所述特征信息和所述关系信息按照自然语言进行整合,生成所述扩展语句。
7.根据权利要求1所述的文案生成方法,其特征在于,所述扩展语句包括一级扩展语句;
所述从所述长文案知识图谱中调取所述实体所在的知识图谱,并将所述实体所在的知识图谱的信息整合成自然语言,得到扩展语句的步骤,包括:
从所述长文案知识图谱中调取与所述实体直接连接的一级关系实体及其之间的一级关系信息;
获取所述实体和一级关系实体在所述长文案知识图谱中的实体属性;
根据所述一级关系实体、一级关系信息和实体属性整合成自然语言,得到一级扩展语句。
8.根据权利要求7所述的文案生成方法,其特征在于,所述扩展语句还包括多级扩展语句;
所述从所述长文案知识图谱中调取所述实体所在的知识图谱,并将所述实体所在的知识图谱的信息整合成自然语言,得到扩展语句的步骤,还包括:
从所述长文案知识图谱中调取与所述实体间接连接的多级关系实体及其之间的多级关系信息;
获取所述实体和多级关系实体在所述长文案知识图谱中的实体属性;
根据所述多级关系实体、多级关系信息和实体属性整合成自然语言,得到多级扩展语句。
9.根据权利要求1所述的文案生成方法,其特征在于,在所述从所述长文案知识图谱中调取所述实体所在的知识图谱的步骤之后,还包括:
根据所述实体所在的知识图谱中的实体和实体关系,生成扩展建议信息;
向用户返回所述扩展建议信息,以及接收用户根据所述扩展建议信息输入的扩展文本;
在所述文案初稿中添加所述扩展文本,生成所述目标文案。
10.根据权利要求1所述的文案生成方法,其特征在于,在所述生成目标文案的步骤之后,还包括:
将所述目标文案进行文本纠错检查和违禁词检查;
若所述目标文案中存在语法错误,则以下划线标出所述语法错误;
若所述目标文案中存在违禁词,则以方框框出所述违禁词。
11.根据权利要求4所述的文案生成方法,其特征在于,所述内容模块的类型包括:物业、装修、园林、项目规划、市政配套、智能化、教育、户型说明、产品优势、地段、商圈、交通、主题说辞、礼品和赠送及优惠折扣中的一项或多项;
所述文案数据库中存储有楼盘推广文案,所述变量信息包括广告目的、项目属性、行文风格、类型中的一项或多项;
所述长文案知识图谱中实体的类型包括楼盘小区、交通设施、学校、体育健身设施、医院、银行、物业、装修、户型中的一项或多项;
所述实体关系的类型包括楼盘小区与交通设施、学校、医院、银行之间的距离,还包括楼盘小区与体育健身设施、物业、装修、户型之间的附属性质中的一项或多项。
12.一种文案生成***,其特征在于,包括:
获取模块,用于获取由关键信息填入文案模板所得的文案初稿;
识别模块,用于通过实体序列模型识别所述文案初稿中长文案知识图谱的实体,其中,所述实体序列模型是根据标记有实体的文章训练得到;
调取模块,用于从所述长文案知识图谱中调取所述实体所在的知识图谱,并将所述实体所在的知识图谱的信息整合成自然语言,得到扩展语句;
生成模块,用于在所述文案初稿中添加所述扩展语句,生成目标文案。
13.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至11中任一项所述的文案生成方法的步骤。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至11中任一项所述的文案生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911372226.3A CN110765753B (zh) | 2019-12-27 | 2019-12-27 | 文案生成方法、***、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911372226.3A CN110765753B (zh) | 2019-12-27 | 2019-12-27 | 文案生成方法、***、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110765753A true CN110765753A (zh) | 2020-02-07 |
CN110765753B CN110765753B (zh) | 2023-07-14 |
Family
ID=69341567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911372226.3A Active CN110765753B (zh) | 2019-12-27 | 2019-12-27 | 文案生成方法、***、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110765753B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111666746A (zh) * | 2020-06-05 | 2020-09-15 | 中国银行股份有限公司 | 会议纪要的生成方法及装置、电子设备及存储介质 |
CN111930959A (zh) * | 2020-07-14 | 2020-11-13 | 上海明略人工智能(集团)有限公司 | 用于图谱知识生成文本的方法与装置 |
CN112348638A (zh) * | 2020-11-09 | 2021-02-09 | 上海风秩科技有限公司 | 一种活动文案推荐方法、装置、电子设备和存储介质 |
CN112507128A (zh) * | 2020-12-07 | 2021-03-16 | 云南电网有限责任公司普洱供电局 | 配电网作业文件的内容填写提示方法及相关设备 |
CN112733515A (zh) * | 2020-12-31 | 2021-04-30 | 贝壳技术有限公司 | 文本生成方法、装置、电子设备及可读存储介质 |
CN113553436A (zh) * | 2020-04-23 | 2021-10-26 | 广东博智林机器人有限公司 | 一种知识图谱更新方法、装置、电子设备和存储介质 |
CN113935306A (zh) * | 2021-09-14 | 2022-01-14 | 有米科技股份有限公司 | 广告文案模板处理方法及装置 |
WO2023221934A1 (zh) * | 2022-05-19 | 2023-11-23 | 北京沃东天骏信息技术有限公司 | 文案生成方法、模型训练方法及装置、设备、存储介质 |
CN117350271A (zh) * | 2023-09-28 | 2024-01-05 | 上海臣道网络科技有限公司 | 一种基于大语言模型的ai内容生成方法及服务云平台 |
CN118095293A (zh) * | 2024-04-24 | 2024-05-28 | 卓世未来(天津)科技有限公司 | 一种基于大语言模型的文案扩展方法及*** |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130262361A1 (en) * | 2012-04-02 | 2013-10-03 | Playence GmBH | System and method for natural language querying |
CN106844322A (zh) * | 2017-01-22 | 2017-06-13 | 百度在线网络技术(北京)有限公司 | 智能文章生成方法和装置 |
CN106970749A (zh) * | 2017-02-06 | 2017-07-21 | 广东小天才科技有限公司 | 一种基于移动终端的写作方法及装置 |
WO2018072563A1 (zh) * | 2016-10-18 | 2018-04-26 | 中兴通讯股份有限公司 | 一种知识图谱构建方法、装置及*** |
CN108563620A (zh) * | 2018-04-13 | 2018-09-21 | 上海财梵泰传媒科技有限公司 | 文本自动写作方法和*** |
CN110309320A (zh) * | 2019-06-28 | 2019-10-08 | 浙江传媒学院 | 结合nba赛事知识图谱的nba篮球新闻自动生成方法 |
-
2019
- 2019-12-27 CN CN201911372226.3A patent/CN110765753B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130262361A1 (en) * | 2012-04-02 | 2013-10-03 | Playence GmBH | System and method for natural language querying |
WO2018072563A1 (zh) * | 2016-10-18 | 2018-04-26 | 中兴通讯股份有限公司 | 一种知识图谱构建方法、装置及*** |
CN106844322A (zh) * | 2017-01-22 | 2017-06-13 | 百度在线网络技术(北京)有限公司 | 智能文章生成方法和装置 |
CN106970749A (zh) * | 2017-02-06 | 2017-07-21 | 广东小天才科技有限公司 | 一种基于移动终端的写作方法及装置 |
CN108563620A (zh) * | 2018-04-13 | 2018-09-21 | 上海财梵泰传媒科技有限公司 | 文本自动写作方法和*** |
CN110309320A (zh) * | 2019-06-28 | 2019-10-08 | 浙江传媒学院 | 结合nba赛事知识图谱的nba篮球新闻自动生成方法 |
Non-Patent Citations (7)
Title |
---|
中国风险投资研究院编著: "《中国风险投资年鉴.2015-2016,2017年6月第1版》", 30 June 2017, 中国发展出版社, pages: 701 - 706 * |
孙安 等: "序列标注模型中不同输入特征组合的集成学习与直推学习方法研究——以CCCKS-2018电子病历命名实体识别任务为例", 《情报杂志》 * |
孙安 等: "序列标注模型中不同输入特征组合的集成学习与直推学习方法研究——以CCCKS-2018电子病历命名实体识别任务为例", 《情报杂志》, vol. 38, no. 10, 31 October 2019 (2019-10-31), pages 176 - 183 * |
王蕾: "基于神经网络的中文命名实体识别研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
王蕾: "基于神经网络的中文命名实体识别研究", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 03, 15 March 2018 (2018-03-15), pages 138 - 2197 * |
闫燕勤 等: "基于人工智能的电视数据新闻自动化生产技术研究", 《广播与电视技术》 * |
闫燕勤 等: "基于人工智能的电视数据新闻自动化生产技术研究", 《广播与电视技术》, vol. 46, no. 6, 15 June 2019 (2019-06-15), pages 38 - 41 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113553436A (zh) * | 2020-04-23 | 2021-10-26 | 广东博智林机器人有限公司 | 一种知识图谱更新方法、装置、电子设备和存储介质 |
CN111666746A (zh) * | 2020-06-05 | 2020-09-15 | 中国银行股份有限公司 | 会议纪要的生成方法及装置、电子设备及存储介质 |
CN111666746B (zh) * | 2020-06-05 | 2023-09-29 | 中国银行股份有限公司 | 会议纪要的生成方法及装置、电子设备及存储介质 |
CN111930959B (zh) * | 2020-07-14 | 2024-02-09 | 上海明略人工智能(集团)有限公司 | 用于图谱知识生成文本的方法与装置 |
CN111930959A (zh) * | 2020-07-14 | 2020-11-13 | 上海明略人工智能(集团)有限公司 | 用于图谱知识生成文本的方法与装置 |
CN112348638A (zh) * | 2020-11-09 | 2021-02-09 | 上海风秩科技有限公司 | 一种活动文案推荐方法、装置、电子设备和存储介质 |
CN112348638B (zh) * | 2020-11-09 | 2024-02-20 | 上海秒针网络科技有限公司 | 一种活动文案推荐方法、装置、电子设备和存储介质 |
CN112507128A (zh) * | 2020-12-07 | 2021-03-16 | 云南电网有限责任公司普洱供电局 | 配电网作业文件的内容填写提示方法及相关设备 |
CN112733515A (zh) * | 2020-12-31 | 2021-04-30 | 贝壳技术有限公司 | 文本生成方法、装置、电子设备及可读存储介质 |
CN113935306A (zh) * | 2021-09-14 | 2022-01-14 | 有米科技股份有限公司 | 广告文案模板处理方法及装置 |
WO2023221934A1 (zh) * | 2022-05-19 | 2023-11-23 | 北京沃东天骏信息技术有限公司 | 文案生成方法、模型训练方法及装置、设备、存储介质 |
CN117350271A (zh) * | 2023-09-28 | 2024-01-05 | 上海臣道网络科技有限公司 | 一种基于大语言模型的ai内容生成方法及服务云平台 |
CN118095293A (zh) * | 2024-04-24 | 2024-05-28 | 卓世未来(天津)科技有限公司 | 一种基于大语言模型的文案扩展方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN110765753B (zh) | 2023-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110765753B (zh) | 文案生成方法、***、计算机设备和存储介质 | |
Drucker | The digital humanities coursebook: an introduction to digital methods for research and scholarship | |
Wartmann et al. | Describing and comparing landscapes using tags, texts, and free lists: an interdisciplinary approach | |
CN106934032B (zh) | 一种城市知识图谱构建方法及装置 | |
CN109543034B (zh) | 基于知识图谱的文本聚类方法、装置及可读存储介质 | |
WO2020103899A1 (zh) | 用于生成图文信息的方法和用于生成图像数据库的方法 | |
CN104102639A (zh) | 基于文本分类的推广触发方法和装置 | |
CN112417100A (zh) | 辽代历史文化领域知识图谱及其智能问答***的构建方法 | |
US20180314715A1 (en) | Content Based Image Management and Selection | |
CN103544186A (zh) | 挖掘图片中的主题关键词的方法和设备 | |
CN109858024B (zh) | 一种基于word2vec的房源词向量训练方法及装置 | |
Schröder et al. | Supporting land reuse of former open pit mining sites using text classification and active learning | |
CN111126422B (zh) | 行业模型的建立及行业的确定方法、装置、设备及介质 | |
Zhao et al. | Identifying Shan‐Shui characteristics for national landscape heritage: Reconciling western and Chinese landscape characterisation from a trans‐cultural perspective | |
Chang | [Retracted] An Integrated Development Model of Cultural and Creative Industry and Rural Tourism Industry Based on Data Mining | |
CN103577414B (zh) | 数据处理方法和设备 | |
CN110309355A (zh) | 内容标签的生成方法、装置、设备及存储介质 | |
CN116719915A (zh) | 智能问答方法、装置、设备及存储介质 | |
CN114118068B (zh) | 训练文本数据的扩增方法、装置及电子设备 | |
Ballatore | Semantic challenges for volunteered geographic information | |
CN114637831A (zh) | 基于语义分析的数据查询方法及其相关设备 | |
Pu et al. | A vision-based approach for deep web form extraction | |
Ravindranath et al. | Inferring structure and meaning of semi-structured documents by using a gibbs sampling based approach | |
CN113268607A (zh) | 知识图谱的构建方法和装置 | |
CN112989068A (zh) | 针对唐诗知识的知识图谱构建方法及唐诗知识问答*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |