CN110245339A - 文章生成方法、装置、设备和存储介质 - Google Patents

文章生成方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN110245339A
CN110245339A CN201910536677.XA CN201910536677A CN110245339A CN 110245339 A CN110245339 A CN 110245339A CN 201910536677 A CN201910536677 A CN 201910536677A CN 110245339 A CN110245339 A CN 110245339A
Authority
CN
China
Prior art keywords
place
paragraph
information
article
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910536677.XA
Other languages
English (en)
Other versions
CN110245339B (zh
Inventor
卞东海
蒋帅
陈思姣
罗雨
陈奇石
曾启飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910536677.XA priority Critical patent/CN110245339B/zh
Publication of CN110245339A publication Critical patent/CN110245339A/zh
Application granted granted Critical
Publication of CN110245339B publication Critical patent/CN110245339B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例提出一种文章生成方法、装置、设备和存储介质,其中的方法包括:根据轨迹确定待生成文章需要包括的各地点;根据各地点的第一信息生成与各地点分别对应的段落;根据地点在轨迹上的顺序,确定地点对应的段落在待生成文章中的顺序;按照各段落的顺序组合各段落以生成文章。本发明实施例的方法可以高效、便捷地帮助用户自动生成文章。

Description

文章生成方法、装置、设备和存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种文章生成方法、装置、设备和存储介质。
背景技术
目前的旅行规划文章或游记文章多是人工编辑的,耗时且成本巨大。为此需要一个简单有效的方法帮助用户自动生成旅行规划文章或游记文章。
发明内容
本发明实施例提供一种文章生成方法、装置、设备和存储介质,以解决现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种文章生成方法,包括:
根据轨迹确定待生成文章需要包括的各地点;
根据各地点的第一信息生成与各地点分别对应的段落;
根据所述地点在轨迹上的顺序,确定所述地点对应的段落在所述待生成文章中的顺序;
按照各段落的顺序组合各段落以生成文章。
在一种实施方式中,所述第一信息包括文字信息和候选图像,根据各地点的第一信息生成与各地点分别对应的段落,包括:
获取与所述地点对应的至少一张候选图像;
获取与所述地点对应的多种类型的文字信息;
根据所述文字信息的类型,确定所述文字信息在所述地点对应的段落中的顺序;
在不同类型的文字信息之间***所述候选图像,生成与所述地点对应的段落。
在一种实施方式中,获取与所述地点对应的至少一张候选图像,包括:
检测所述地点对应的上传图像的数量是否符合预设值;
如果否,则从知识图谱中获取与所述地点对应的候选图像。
在一种实施方式中,所述第一信息还包括所述候选图像的图像介绍信息,根据各地点的第一信息生成与各地点分别对应的段落,还包括:
识别所述候选图像中的实体信息;
根据所述实体信息为所述候选图像添加所述图像介绍信息。
在一种实施方式中,获取与所述地点对应的多种类型的文字信息,包括以下方式中的至少两种:
从地图端数据库中获取基本内容类型的文字信息;
从知识图谱中获取百科类型的文字信息;
获取攻略类型的文字信息。
在一种实施方式中,按照各段落的顺序组合各段落以生成文章,包括:
根据相邻两个段落分别对应的地点的第二信息,生成相邻两个段落之间的过渡段;
按照各段落的顺序组合各段落,并在相邻两个段落之间添加相应的过渡段,以生成所述文章。
在一种实施方式中,所述第二信息包括坐标,根据相邻两个段落分别对应的地点的第二信息,生成相邻两个段落之间的过渡段,包括:
获取第一地点和第二地点分别对应的第一轨迹点和第二轨迹点;
将所述第一轨迹点和所述第二轨迹点分别转化为第一坐标和第二坐标,所述第一坐标和所述第二坐标均为经纬度坐标;
根据所述第一坐标和所述第二坐标,确定所述第一地点和所述第二地点之间的距离;
根据所述第一地点和所述第二地点之间的距离,生成所述第一地点对应的段落与所述第二地点对应的段落之间的过渡段。
在一种实施方式中,所述第二信息包括特点标签,根据相邻两个段落分别对应的地点的第二信息,生成相邻两个段落之间的过渡段,包括:
从地图端数据库和/或知识图谱中获取所述地点的至少一个候选标签;
如果所述候选标签有多个,则根据每个候选标签在多个候选标签中的重要度从多个候选标签中选取所述地点的特点标签;
根据第一地点的特点标签和第二地点的特点标签,生成所述第一地点对应的段落与所述第二地点对应的段落之间的过渡段。
在一种实施方式中,所述第二信息包括兴趣点信息,根据相邻两个段落分别对应的地点的第二信息,生成相邻两个段落之间的过渡段,包括:
获取与第一地点的距离符合预设范围的多个兴趣点;
将所述第二地点作为所述第一地点的兴趣点,描述各兴趣点的兴趣点信息,生成所述第一地点对应的段落与所述第二地点对应的段落之间的过渡段。
第二方面,本发明实施例提供一种文章生成装置,包括:
地点确定模块,用于根据轨迹确定待生成文章需要包括的各地点;
段落生成模块,用于根据各地点的第一信息生成与各地点分别对应的段落;
顺序确定模块,用于根据所述地点在轨迹上的顺序,确定所述地点对应的段落在所述待生成文章中的顺序;
组合模块,用于按照各段落的顺序组合各段落以生成文章。
在一种实施方式中,所述组合模块包括:
过渡段生成子模块,用于根据相邻两个段落分别对应的地点的第二信息,生成相邻两个段落之间的过渡段;
组合添加子模块,用于按照各段落的顺序组合各段落,并在相邻两个段落之间添加相应的过渡段,以生成所述文章。
第三方面,本发明实施例提供了一种文章生成设备,所述设备的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
在一个可能的设计中,所述设备的结构中包括处理器和存储器,所述存储器用于存储支持所述设备执行上述文章生成方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述设备还可以包括通信接口,用于与其他设备或通信网络通信。
第四方面,本发明实施例提供了一种计算机可读存储介质,用于存储文章生成设备所用的计算机软件指令,其包括用于执行上述文章生成方法所涉及的程序。
本发明实施例的方法基于轨迹确定待生成文章需要包括的地点,并根据地点的第一信息生成该地点的描述性段落,进而根据轨迹确定各段落的顺序,可以自动生成文章。本发明实施例的方法可以高效、便捷地帮助用户生成文章。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。
图1示出根据本发明实施例的文章生成方法的流程图。
图2示出根据本发明实施例的一种实施方式的文章生成方法的流程图。
图3示出根据本发明实施例的另一种实施方式的文章生成方法的流程图。
图4-1示出根据本发明实施例的一种文章生成装置的其中一个模块的结构框图。
图4-2示出根据本发明实施例的一种文章生成装置的其中一个模块的结构框图。
图4-3示出根据本发明实施例的一种文章生成装置的其中一个模块的结构框图。
图4-4示出根据本发明实施例的一种文章生成装置的其中一个模块的结构框图。
图5示出根据本发明实施例的文章生成装置的结构框图。
图6示出根据本发明实施例的一种实施方式中的文章生成装置的结构框图。
图7示出根据本发明实施例的文章生成设备的结构框图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
图1示出根据本发明实施例的文章生成方法的流程图。如图1所示,本发明实施例的文章生成方法可以包括:
步骤S101、根据轨迹确定待生成文章需要包括的各地点。
本实施例中,轨迹可以为用户规划的待出行轨迹,也可以为用户旅行完以后的游玩路线。轨迹上的各轨迹点按照规划顺序或实际游玩顺序排列。轨迹点对应有地点,可以根据各轨迹点确定待生成文章需要包括的各地点。
步骤S102、根据各地点的第一信息生成与各地点分别对应的段落。
也就是说,对于每个地点,可以根据该地点的第一信息生成该地点对应的段落。其中,段落可以为一段或多段,本实施例不作限定。每个段落用于描述一个地点。
第一信息可以包括文字信息和候选图像。文字信息可以包括基本内容类型的文字信息、百科类型的文字信息和攻略类型的文字信息中至少一种。
基本内容类型的文字信息可以包括名称、地址、开放时间、评价、门票信息等。在一种实施方式中,可以从地图端数据库中获取基本内容类型的文字信息。其中,地图端可以为地图类型的应用程序(Application,APP)。地图端数据库中可以包括地图数据、地图上给地点的名称、地址、开放时间、评价、门票信息等数据。
在一种实施方式中,可以从知识图谱中获取百科类型的文字信息。知识图谱通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。本实施例中,知识图谱除了可以包括可视化的图谱,还可以包括互联网上的各种百科数据。
在一个示例中,可以对网页形式的百科数据进行解析处理,以提取百科类型的文字信息。如果提取到的文字信息内容较多,例如字数或句子数量超过设定,则可以从提取到的文字信息截取一部分(如50个字或3个句子),得到用于生成文章的百科类型的文字信息。
在一种实施方式中,可以从互联网上的旅行网站或游记文章中,获取攻略类型的文字信息。
候选图像可以为用户上传的图像。在一个示例中,本实施例的方法可以根据上传的图像中自带的位置信息,以及各地点的位置信息,为该图像匹配一个地点。其中,图像中自带的位置信息,可以由图像的拍摄设备在拍摄时所述的位置生成,也可以根据图像中具有地理标识的实体确定。在另一个示例中,可以根据用户为图像指定的位置信息,以及各地点的位置信息,为该图像匹配一个地点。候选图像也可以为从知识图谱中获取的图像。进一步地,可以将从知识图谱中获取的低质图像过滤掉。低质图像可以包括具有广告或商标(logo)的图像,还可以包括低分辨率等不清楚的图像。
在一个示例中,获取到的文字信息可能只有一种类型或两种类型,那么可以在文字信息之后或之前***候选图像,生成段落。或者,在两种类型的文字信息之间***候选图像,生成段落。
在一种实施方式中,如图2所示,在步骤S102中可以包括:
步骤S201、获取与所述地点对应的至少一张候选图像;
步骤S202、获取与所述地点对应的多种类型的文字信息;
步骤S203、根据所述文字信息的类型,确定所述文字信息在所述地点对应的段落中的顺序;
步骤S204、在不同类型的文字信息之间***所述候选图像,生成与所述地点对应的段落。
也就是说,如果获取到的文字信息包括两种以上(包括两种)类型的文字信息,则可以根据文字信息的类型,确定文字信息在段落中的顺序,进而在相邻类型的文字信息之间***一张或多张候选图像,以生成段落。
例如:将百科类型的文字信息作为段落中的第一段,并在第一段后***1~3张候选图片;将基本内容类型的文字信息作为段落中的第二段,并在第二端后***1~2张其他候选图片;将攻略类型的文字信息作为段落中的第三段,在第三段之后可以***候选图像,也可以不***候选图片。
需要说明的是,并不是每相邻两个类型的文字信息之间均要***候选图像,可以根据候选图像的数量进行设置。
在一种实施方式中,在步骤S201中可以包括:检测所述地点对应的上传图像的数量是否符合预设值;如果否,则从知识图谱中获取与所述地点对应的候选图像。
如果某一地点对应的用户上传的上传图像的数量符合预设值,即数量较多,则可以将上传图像作为候选图像。如果某一地点对应的上传图像的数量不符合预设值,如数量较少或没有,则可以从知识图谱中获取与该地点对应的候选图像。
在一种实施方式中,第一信息还可以包括候选图像的图像介绍信息。在步骤S102中还可以包括:识别所述候选图像中的实体信息;根据所述实体信息为所述候选图像添加所述图像介绍信息。
例如:可以基于区域卷积神经网络(Region-Convolutional Neural Networks,R-CNN)或一次识别模型(You Only Look Once,YOLO)或单发多盒探测器(Single ShotMultiBox Detector,SSD)等模型,识别候选图像中的实体,得到实体信息。然后,根据实体信息在候选图像的上方或下方添加图像介绍信息。例如:在候选图像中识别到了故宫,则可以在候选图像的下方添加图像介绍信息“故宫”。又例如:在候选图像中识别到了晚霞和故宫,则可以在候选图像的下方添加图像介绍信息“晚霞下的故宫”。
如图1所示,本发明实施例的文章生成方法还包括:
步骤S103、根据所述地点在轨迹上的顺序,确定所述地点对应的段落在所述待生成文章中的顺序;
步骤S104、按照各段落的顺序组合各段落以生成文章。
每个地点均对应有轨迹点,可以根据轨迹点在轨迹上的顺序,确定对应的地点的段落在待生成文章中的顺序,然后按照各段落的顺序组合各段落生成文章,如旅行规划文章或游记文章。
在一种实施方式中,如图3所示,在步骤S104中可以包括:
步骤S301、根据相邻两个段落分别对应的地点的第二信息,生成相邻两个段落之间的过渡段;
步骤S302、按照各段落的顺序组合各段落,并在相邻两个段落之间添加相应的过渡段,以生成所述文章。
也就是说,在确定了各段落的顺序后,可以在相邻的两个段落,如第一段落和第二段落之间添加过渡段,进而生成文章。其中,第一段落对应第一地点,第二段落对应第二地点。根据第一地点的第二信息以及第二地点的第二信息,生成第一段落和第二段落之间的过渡段。其中,第二信息可以包括坐标、特点标签、兴趣点信息等。
在一种实施方式中,在步骤S301中可以包括:获取第一地点和第二地点分别对应的第一轨迹点和第二轨迹点;将所述第一轨迹点和所述第二轨迹点分别转化为第一坐标和第二坐标,所述第一坐标和所述第二坐标均为经纬度坐标;根据所述第一坐标和所述第二坐标,确定所述第一地点和所述第二地点之间的距离;根据所述第一地点和所述第二地点之间的距离,生成所述第一地点对应的段落与所述第二地点对应的段落之间的过渡段。
在一个示例中,轨迹点可以通过用户从地图上选取或从APP提供的菜单中选取得到,因此,需要将用户选取的轨迹点转换为地图端APP可以识别的坐标,如墨卡托坐标。在另一个示例中,可以将地图端APP可以识别的坐标转化为经纬度坐标。因此,本实施例的坐标可以为墨卡托坐标,也可以为经纬度坐标。
进一步地,可以根据第一坐标和第二坐标确定第一地点和第二地点之间的距离,进而生成第一段落和第二段落之间的过渡段。例如:计算得到第一地点和第二地点之间的距离为10公里,则第一段落和第二段落之间的过渡段可以为“在距离第一地点10公里处,还有第二地点”。
在一种实施方式中,在步骤S301中可以包括:从地图端数据库和/或知识图谱中获取所述地点的至少一个候选标签;如果所述候选标签有多个,则根据每个候选标签在多个候选标签中的重要度从多个候选标签中选取所述地点的特点标签;根据第一地点的特点标签和第二地点的特点标签,生成所述第一地点对应的段落与所述第二地点对应的段落之间的过渡段。
在一个示例中,某一地点的候选标签有多个,则可以根据候选标签的特点从多个候选标签中选择一个最佳的作为该地点的特点标签。例如:可以将每个候选标签的词频(Term Frequency,TF)-逆文本频率指数(Inverse Document Frequency,IDF)值作为候选标签的重要度,根据每个候选标签的TF-IDF值确定特点标签。在另一个示例中,某一地点的候选标签只有一个,则可以直接将该候选标签作为该地点的特点标签。
进一步地,根据第一地点的特点标签和第二地点的特点标签,生成第一段落与第二段落之间的过渡段。例如:第一地点的特点标签为风景胜地,第二地点的特点标签为人文胜地,则第一段落和第二段落之间的过渡段可以为“在游览完第一地点这一风景胜地后,游览人文胜地,如第二地点”。
在一种实施方式中,在步骤S301中可以包括:获取与第一地点的距离符合预设范围的多个兴趣点;将所述第二地点作为所述第一地点的兴趣点,描述各兴趣点的兴趣点信息,生成所述第一地点对应的段落与所述第二地点对应的段落之间的过渡段。
可以从地图端数据库中,获取每个地点周边的兴趣点(Point of Interest)。例如:将与第一地点的距离在预设范围内的地点作为第一地点的POI。进一步地,可以将第二地点作为第一地点的POI,生成第一段落和第二段落之间的过渡段,如“在第一地点周边还有第二地点”。
本发明实施例中,可以根据用户规划的待出行轨迹生成旅行规划文章,也可以根据用户的游玩路线生成游记文章。地点可以为景点。需要说明的是,本发明实施例中,景点包括但不限于收费景区、免费景区、供用户游玩的地点等。下面以景点为例介绍本发明实施例的文章生成装置,该APP可以执行以上任一所述的文章生成方法。
如图4-1所示,文章生成装置可以包括用户数据处理模块,用于接收用户上传的数据。用户上传的数据可以包括轨迹信息(如用户选取的轨迹点)和图片信息(如上传图像)。在一个示例中,本发明实施例的方法可以使用X型引擎(Engine X,NGINX)作为后台服务,实时接收用户发来的请求,并从请求中获取用户上传的数据。
用户数据处理模块还可以用于对轨迹信息进行预处理。例如:将轨迹点转化为地图端APP可以识别的坐标。用户数据处理模块还可以用于对图片信息进行预处理。例如:识别上传图像中的实体信息,供后续生成文章使用。用户数据处理模块还可以用于图片映射。例如:根据上传图像的位置信息和轨迹点(或景点)的位置信息,将属于同一轨迹点的上传图像进行聚合,进而得到属于同一轨迹点的一张或多张上传图像。
如图4-2所示,文章生成装置还可以包括地图端数据处理模块,用于根据用户轨迹(轨迹信息)得到各景点,并从地图端数据库中获取景点基本信息(基本内容类型的文字信息)。如景点的名称、地址、开放时间、评价、门票信息等。地图端数据处理模块还可以用于将地图端APP可以识别的坐标,如墨卡托坐标,转化为经纬度坐标(景点位置),供后续生成文章使用。地图端数据处理模块还可以用于根据景点的候选标签的TF-IDF值确定景点标签(景点的特点标签)。进而,景点标准数据可以包括景点基本信息、景点标签和景点位置。
如图4-3所示,文章生成装置还可以包括知识图谱数据处理模块,用于根据景点名称获取景点百科(百科类型的文字信息)、景点图片(候选图像)、景点周边(POI)、景点攻略(攻略类型的文字信息)以及其他景点相关数据(其他类型的文字信息)。
如图4-4所示,文章生成装置还可以包括文字生成模块,用于根据用户轨迹中各轨迹点的顺序,为各景点排序。文字生成模块还可以用于生成文章的首段。例如:通过在网上获取游记型相关文章,并取其首段作为参考,进而生成多个段首模板,进而基于段首模板生成文章的首段。文字生成模块还可以用于生成两个景点之间的过渡段,以及生成各景点的景点段落。进一步地,文字生成模块还可以用于生成文章标题。例如:可以将用户指定的标题作为文章标题,也可以根据预先配置好的模板生成文章标题。
需要说明的是,上述文章生成装置中的景点仅是一种地点的示例,即上述描述中,也可以将景点替换为地点。
在人们旅游时,人们喜欢把旅行当中的所见所闻记录下来,有些是通过图片,有些是通过文本,最后通过对这些图片和文本的组合构思转化为一篇旅行游记文章,由于涉及到用户个人的相关性,生成的文章可以说是千人千面另外,在人们进行旅行规划时,需要制定旅行规划文章,如路书。目前还没有自动生成这些类型文章的方法。
本发明实施例的方法通过基于轨迹信息确定待生成文章需要包括的地点,并根据地点的第一信息生成该地点的描述性段落,进而根据轨迹信息确定各段落的顺序,可以自动生成文章。进一步地,还可以根据两个地点的第二信息,生成这两个地点之间的过段段,使生成文章更通顺流畅。在获取第一信息和第二信息时,可以基于知识图谱,从而丰富了生成文章的素材,使生成的文章更生动更专业。本发明实施例的方法可以高效、便捷地帮助用户生成文章,解决用户耗时长、选择难等多种问题。进一步地,本发明实施例的方法可以实时帮助用户生成属于自己的文章,并可以保存留念或者分享给朋友,在满足用户对高品质服务诉求的同时,也提升了相关产品的商业价值。
图5示出根据本发明实施例的文章生成装置的结果框图。如图5所示,该装置可以包括:
地点确定模块501,用于根据轨迹确定待生成文章需要包括的各地点;
段落生成模块502,用于根据各地点的第一信息生成与各地点分别对应的段落;
顺序确定模块503,用于根据所述地点在轨迹上的顺序,确定所述地点对应的段落在所述待生成文章中的顺序;
组合模块504,用于按照各段落的顺序组合各段落以生成文章。
在一种实施方式中,段落生成模块502可以包括:
第一获取子模块,用于获取与所述地点对应的至少一张候选图像;
第二获取子模块,用于获取与所述地点对应的多种类型的文字信息;
第一确定子模块,用于根据所述文字信息的类型,确定所述文字信息在所述地点对应的段落中的顺序;
***子模块,用于在不同类型的文字信息之间***所述候选图像,生成与所述地点对应的段落。
在一种实施方式中,第一获取子模块可以包括:
检测单元,用于检测所述地点对应的上传图像的数量是否符合预设值;
获取单元,用于在否的情况下,从知识图谱中获取与所述地点对应的候选图像。
在一种实施方式中,所述第一信息还包括所述候选图像的图像介绍信息,段落生成模块502可以包括:
识别子模块,用于识别所述候选图像中的实体信息;
添加子模块,用于根据所述实体信息为所述候选图像添加所述图像介绍信息。
在一种实施方式中,第二获取子模块可以用于以下方式中的至少两种:
从地图端数据库中获取基本内容类型的文字信息;
从知识图谱中获取百科类型的文字信息;
获取攻略类型的文字信息。
在一种实施方式中,如图6所示,组合模块504可以包括:
过渡段生成子模块601,用于根据相邻两个段落分别对应的地点的第二信息,生成相邻两个段落之间的过渡段;
组合添加子模块602,用于按照各段落的顺序组合各段落,并在相邻两个段落之间添加相应的过渡段,以生成所述文章。
在一种实施方式中,所述第二信息包括坐标,过渡段生成子模块601可以包括:
第一获取单元,用于获取第一地点和第二地点分别对应的第一轨迹点和第二轨迹点;
转化单元,用于将所述第一轨迹点和所述第二轨迹点分别转化为第一坐标和第二坐标,所述第一坐标和所述第二坐标均为经纬度坐标;
距离确定单元,用于根据所述第一坐标和所述第二坐标,确定所述第一地点和所述第二地点之间的距离;
第一过渡段生成单元,用于根据所述第一地点和所述第二地点之间的距离,生成所述第一地点对应的段落与所述第二地点对应的段落之间的过渡段。
在一种实施方式中,所述第二信息包括特点标签,过渡段生成子模块601可以包括:
第二获取单元,用于从地图端数据库和/或知识图谱中获取所述地点的至少一个候选标签;
选取单元,用于在所述候选标签有多个的情况下,根据每个候选标签在多个候选标签中的重要度从多个候选标签中选取所述地点的特点标签;
第二过渡段生成单元,用于根据第一地点的特点标签和第二地点的特点标签,生成所述第一地点对应的段落与所述第二地点对应的段落之间的过渡段。
在一种实施方式中,所述第二信息包括兴趣点信息,过渡段生成子模块601可以包括:
第三获取单元,用于获取与第一地点的距离符合预设范围的多个兴趣点;
第三过段段生成单元,用于将所述第二地点作为所述第一地点的兴趣点,描述各兴趣点的兴趣点信息,生成所述第一地点对应的段落与所述第二地点对应的段落之间的过渡段。
本发明实施例各装置中的各模块的功能可以参见上述方法中的对应描述,在此不再赘述。
图7示出根据本发明实施例的文章生成设备的结构框图。如图7所示,该设备可以包括:存储器701和处理器702,存储器701内存储有可在处理器702上运行的计算机程序。所述处理器702执行所述计算机程序时实现上述实施例中的文章生成方法。所述存储器701和处理器702的数量可以为一个或多个。
该设备还可以包括:
通信接口703,用于与外界设备进行通信,进行数据交互传输。
存储器701可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器701、处理器702和通信接口703独立实现,则存储器701、处理器702和通信接口703可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,PeripheralComponent Interconnect)总线或扩展工业标准体系结构(EISA,Extended IndustryStandard Architecture)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器701、处理器702及通信接口703集成在一块芯片上,则存储器701、处理器702及通信接口703可以通过内部接口完成相互间的通信。
本发明实施例提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现上述实施例中任一所述的方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (13)

1.一种文章生成方法,其特征在于,包括:
根据轨迹确定待生成文章需要包括的各地点;
根据各地点的第一信息生成与各地点分别对应的段落;
根据所述地点在轨迹上的顺序,确定所述地点对应的段落在所述待生成文章中的顺序;
按照各段落的顺序组合各段落以生成文章。
2.根据权利要求1所述的方法,其特征在于,所述第一信息包括文字信息和候选图像,根据各地点的第一信息生成与各地点分别对应的段落,包括:
获取与所述地点对应的至少一张候选图像;
获取与所述地点对应的多种类型的文字信息;
根据所述文字信息的类型,确定所述文字信息在所述地点对应的段落中的顺序;
在不同类型的文字信息之间***所述候选图像,生成与所述地点对应的段落。
3.根据权利要求2所述的方法,其特征在于,获取与所述地点对应的至少一张候选图像,包括:
检测所述地点对应的上传图像的数量是否符合预设值;
如果否,则从知识图谱中获取与所述地点对应的候选图像。
4.根据权利要求2所述的方法,其特征在于,所述第一信息还包括所述候选图像的图像介绍信息,根据各地点的第一信息生成与各地点分别对应的段落,还包括:
识别所述候选图像中的实体信息;
根据所述实体信息为所述候选图像添加所述图像介绍信息。
5.根据权利要求2所述的方法,其特征在于,获取与所述地点对应的多种类型的文字信息,包括以下方式中的至少两种:
从地图端数据库中获取基本内容类型的文字信息;
从知识图谱中获取百科类型的文字信息;
获取攻略类型的文字信息。
6.根据权利要求1至5任一项所述的方法,其特征在于,按照各段落的顺序组合各段落以生成文章,包括:
根据相邻两个段落分别对应的地点的第二信息,生成相邻两个段落之间的过渡段;
按照各段落的顺序组合各段落,并在相邻两个段落之间添加相应的过渡段,以生成所述文章。
7.根据权利要求6所述的方法,其特征在于,所述第二信息包括坐标,根据相邻两个段落分别对应的地点的第二信息,生成相邻两个段落之间的过渡段,包括:
获取第一地点和第二地点分别对应的第一轨迹点和第二轨迹点;
将所述第一轨迹点和所述第二轨迹点分别转化为第一坐标和第二坐标,所述第一坐标和所述第二坐标均为经纬度坐标;
根据所述第一坐标和所述第二坐标,确定所述第一地点和所述第二地点之间的距离;
根据所述第一地点和所述第二地点之间的距离,生成所述第一地点对应的段落与所述第二地点对应的段落之间的过渡段。
8.根据权利要求6所述的方法,其特征在于,所述第二信息包括特点标签,根据相邻两个段落分别对应的地点的第二信息,生成相邻两个段落之间的过渡段,包括:
从地图端数据库和/或知识图谱中获取所述地点的至少一个候选标签;
如果所述候选标签有多个,则根据每个候选标签在多个候选标签中的重要度从多个候选标签中选取所述地点的特点标签;
根据第一地点的特点标签和第二地点的特点标签,生成所述第一地点对应的段落与所述第二地点对应的段落之间的过渡段。
9.根据权利要求6所述的方法,其特征在于,所述第二信息包括兴趣点信息,根据相邻两个段落分别对应的地点的第二信息,生成相邻两个段落之间的过渡段,包括:
获取与第一地点的距离符合预设范围的多个兴趣点;
将所述第二地点作为所述第一地点的兴趣点,描述各兴趣点的兴趣点信息,生成所述第一地点对应的段落与所述第二地点对应的段落之间的过渡段。
10.一种文章生成装置,其特征在于,包括:
地点确定模块,用于根据轨迹确定待生成文章需要包括的各地点;
段落生成模块,用于根据各地点的第一信息生成与各地点分别对应的段落;
顺序确定模块,用于根据所述地点在轨迹上的顺序,确定所述地点对应的段落在所述待生成文章中的顺序;
组合模块,用于按照各段落的顺序组合各段落以生成文章。
11.根据权利要求10所述的装置,其特征在于,所述组合模块包括:
过渡段生成子模块,用于根据相邻两个段落分别对应的地点的第二信息,生成相邻两个段落之间的过渡段;
组合添加子模块,用于按照各段落的顺序组合各段落,并在相邻两个段落之间添加相应的过渡段,以生成所述文章。
12.一种文章生成设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至9中任一项所述的方法。
13.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至9中任一项所述的方法。
CN201910536677.XA 2019-06-20 2019-06-20 文章生成方法、装置、设备和存储介质 Active CN110245339B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910536677.XA CN110245339B (zh) 2019-06-20 2019-06-20 文章生成方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910536677.XA CN110245339B (zh) 2019-06-20 2019-06-20 文章生成方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN110245339A true CN110245339A (zh) 2019-09-17
CN110245339B CN110245339B (zh) 2023-04-18

Family

ID=67888498

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910536677.XA Active CN110245339B (zh) 2019-06-20 2019-06-20 文章生成方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN110245339B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021115144A1 (zh) * 2019-12-13 2021-06-17 汉海信息技术(上海)有限公司 社交信息的发布
CN113807055A (zh) * 2021-09-22 2021-12-17 北京百度网讯科技有限公司 用于编辑信息的方法和装置

Citations (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05181855A (ja) * 1991-09-04 1993-07-23 Fujitsu Ltd データ登録支援装置
US6279017B1 (en) * 1996-08-07 2001-08-21 Randall C. Walker Method and apparatus for displaying text based upon attributes found within the text
JP2009223446A (ja) * 2008-03-14 2009-10-01 Mitsubishi Space Software Kk データ配信装置及びデータ配信方法及びデータ配信プログラム
CN101694669A (zh) * 2009-10-16 2010-04-14 北京灵图软件技术有限公司 路书制作方法和装置、路书制作与共享***
US20110282649A1 (en) * 2010-05-13 2011-11-17 Rene Waksberg Systems and methods for automated content generation
CN103246710A (zh) * 2013-04-22 2013-08-14 张经纶 一种多媒体旅游游记的自动生成方法及装置
US20140181645A1 (en) * 2012-12-21 2014-06-26 Microsoft Corporation Semantic searching using zoom operations
CN104331515A (zh) * 2014-11-27 2015-02-04 惠州Tcl移动通信有限公司 一种自动生成旅游日记的方法和***
CN106248072A (zh) * 2016-07-15 2016-12-21 上海跑下去网络科技有限公司 一种趣味性电子路书的处理方法
CN106462888A (zh) * 2014-05-28 2017-02-22 富士通株式会社 订购程序、订购装置以及订购方法
CN106663087A (zh) * 2014-10-01 2017-05-10 株式会社日立制作所 文章生成***
US20170169032A1 (en) * 2015-12-12 2017-06-15 Hewlett-Packard Development Company, L.P. Method and system of selecting and orderingcontent based on distance scores
CN106933789A (zh) * 2015-12-30 2017-07-07 阿里巴巴集团控股有限公司 旅游攻略生成方法和生成***
CN106970898A (zh) * 2017-03-31 2017-07-21 百度在线网络技术(北京)有限公司 用于生成文章的方法和装置
CN107066622A (zh) * 2017-05-11 2017-08-18 山东慧行天下文化传媒有限公司 基于智能导游导览***的游玩手札自动生成***及方法
CN107145482A (zh) * 2017-03-28 2017-09-08 百度在线网络技术(北京)有限公司 基于人工智能的文章生成方法及装置、设备与可读介质
WO2018092016A1 (en) * 2016-11-19 2018-05-24 Yogesh Chunilal Rathod Providing location specific point of interest and guidance to create visual media rich story
CN108268613A (zh) * 2017-12-29 2018-07-10 广州都市圈网络科技有限公司 基于语义分析的旅游行程生成方法、电子设备及存储介质
WO2018150244A1 (en) * 2017-02-18 2018-08-23 Yogesh Chunilal Rathod Registering, auto generating and accessing unique word(s) including unique geotags
CN109388708A (zh) * 2018-06-15 2019-02-26 云天弈(北京)信息技术有限公司 一种个性化定制写作***
CN109446505A (zh) * 2018-10-31 2019-03-08 广东小天才科技有限公司 一种范文生成方法及***
CN109614558A (zh) * 2018-12-10 2019-04-12 湘潭大学 一种多定位旅游日志自动生成方法及***
CN109657043A (zh) * 2018-12-14 2019-04-19 北京百度网讯科技有限公司 自动生成文章的方法、装置、设备及存储介质
CN109743589A (zh) * 2018-12-26 2019-05-10 百度在线网络技术(北京)有限公司 文章生成方法及装置
US20190147042A1 (en) * 2017-11-14 2019-05-16 Microsoft Technology Licensing, Llc Automated travel diary generation
CN109784165A (zh) * 2018-12-12 2019-05-21 平安科技(深圳)有限公司 诗词内容的生成方法、装置、终端及存储介质

Patent Citations (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05181855A (ja) * 1991-09-04 1993-07-23 Fujitsu Ltd データ登録支援装置
US6279017B1 (en) * 1996-08-07 2001-08-21 Randall C. Walker Method and apparatus for displaying text based upon attributes found within the text
JP2009223446A (ja) * 2008-03-14 2009-10-01 Mitsubishi Space Software Kk データ配信装置及びデータ配信方法及びデータ配信プログラム
CN101694669A (zh) * 2009-10-16 2010-04-14 北京灵图软件技术有限公司 路书制作方法和装置、路书制作与共享***
US20110282649A1 (en) * 2010-05-13 2011-11-17 Rene Waksberg Systems and methods for automated content generation
US20140181645A1 (en) * 2012-12-21 2014-06-26 Microsoft Corporation Semantic searching using zoom operations
CN103246710A (zh) * 2013-04-22 2013-08-14 张经纶 一种多媒体旅游游记的自动生成方法及装置
CN106462888A (zh) * 2014-05-28 2017-02-22 富士通株式会社 订购程序、订购装置以及订购方法
CN106663087A (zh) * 2014-10-01 2017-05-10 株式会社日立制作所 文章生成***
CN104331515A (zh) * 2014-11-27 2015-02-04 惠州Tcl移动通信有限公司 一种自动生成旅游日记的方法和***
US20170169032A1 (en) * 2015-12-12 2017-06-15 Hewlett-Packard Development Company, L.P. Method and system of selecting and orderingcontent based on distance scores
CN106933789A (zh) * 2015-12-30 2017-07-07 阿里巴巴集团控股有限公司 旅游攻略生成方法和生成***
CN106248072A (zh) * 2016-07-15 2016-12-21 上海跑下去网络科技有限公司 一种趣味性电子路书的处理方法
WO2018092016A1 (en) * 2016-11-19 2018-05-24 Yogesh Chunilal Rathod Providing location specific point of interest and guidance to create visual media rich story
WO2018150244A1 (en) * 2017-02-18 2018-08-23 Yogesh Chunilal Rathod Registering, auto generating and accessing unique word(s) including unique geotags
CN107145482A (zh) * 2017-03-28 2017-09-08 百度在线网络技术(北京)有限公司 基于人工智能的文章生成方法及装置、设备与可读介质
CN106970898A (zh) * 2017-03-31 2017-07-21 百度在线网络技术(北京)有限公司 用于生成文章的方法和装置
CN107066622A (zh) * 2017-05-11 2017-08-18 山东慧行天下文化传媒有限公司 基于智能导游导览***的游玩手札自动生成***及方法
US20190147042A1 (en) * 2017-11-14 2019-05-16 Microsoft Technology Licensing, Llc Automated travel diary generation
CN108268613A (zh) * 2017-12-29 2018-07-10 广州都市圈网络科技有限公司 基于语义分析的旅游行程生成方法、电子设备及存储介质
CN109388708A (zh) * 2018-06-15 2019-02-26 云天弈(北京)信息技术有限公司 一种个性化定制写作***
CN109446505A (zh) * 2018-10-31 2019-03-08 广东小天才科技有限公司 一种范文生成方法及***
CN109614558A (zh) * 2018-12-10 2019-04-12 湘潭大学 一种多定位旅游日志自动生成方法及***
CN109784165A (zh) * 2018-12-12 2019-05-21 平安科技(深圳)有限公司 诗词内容的生成方法、装置、终端及存储介质
CN109657043A (zh) * 2018-12-14 2019-04-19 北京百度网讯科技有限公司 自动生成文章的方法、装置、设备及存储介质
CN109743589A (zh) * 2018-12-26 2019-05-10 百度在线网络技术(北京)有限公司 文章生成方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021115144A1 (zh) * 2019-12-13 2021-06-17 汉海信息技术(上海)有限公司 社交信息的发布
CN113807055A (zh) * 2021-09-22 2021-12-17 北京百度网讯科技有限公司 用于编辑信息的方法和装置
CN113807055B (zh) * 2021-09-22 2024-06-04 北京百度网讯科技有限公司 用于编辑信息的方法和装置

Also Published As

Publication number Publication date
CN110245339B (zh) 2023-04-18

Similar Documents

Publication Publication Date Title
Netzel et al. User performance and reading strategies for metro maps: An eye tracking study
Murrieta-Flores et al. GIS and Literary History: Advancing Digital Humanities research through the Spatial Analysis of historical travel writing and topographical literature
Preuss The conceptualisation and measurement of mega sport event legacies
Brabyn et al. Using viewsheds, GIS, and a landscape classification to tag landscape photographs
Ali et al. Ambiguity and plausibility: managing classification quality in volunteered geographic information
CN104794171B (zh) 标记图片地理位置信息的方法及装置
CN109710705A (zh) 地图兴趣点处理方法和装置
CN110222654A (zh) 文本分割方法、装置、设备及存储介质
CN110245339A (zh) 文章生成方法、装置、设备和存储介质
CN109388725A (zh) 通过视频内容进行搜索的方法及装置
Wang et al. Hierarchical route maps for efficient navigation
CN111930976B (zh) 演示文稿生成方法、装置、设备及存储介质
Reuschel et al. Modelling uncertain geodata for the literary atlas of Europe
Lloyd et al. Cartographic veracity in medieval mapping: analyzing geographical variation in the Gough Map of Great Britain
Roby Experiencing geometry in Roman surveyors’ texts
Lorimer et al. Disorderly archives and orderly accounts: Reflections on the occasion of Glasgow's geographical centenary
Tateosian et al. Story-telling maps generated from semantic representations of events
Blaise et al. Citizen contributions and minor heritage: feedback on modeling and visualising an information mash-up
Yifei et al. RESEARCH ON VISUALLY PERCEIVED IMAGE AND STRATEGIES FOR VISTA VIEW SYSTEM IMPROVEMENT OF THE JINSITAO WATERFRONT OF SHICHAHAI IN BEIJING.
Trieu et al. A computer vision-based concept model to recommend domestic overseas-like travel experiences: A design science study
Bergman Knowing their place: the Blue Hill Observatory and the value of local knowledge in an era of synoptic weather forecasting, 1884–1894
Bianchetti Raisz’s physiographic method of landform mapping
CN117422510B (zh) 基于位置信息的分布式广告投放***
Huth et al. Judging and Visualizing the Quality of Spatio-Temporal Data on the Kakamega-Nandi Forest Area in West Kenya
Watt Treasures from the Maps Room, a Journey Through the Bodleian Collections

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant