CN110472217A - 一种基于重组策略的内容动态重组方法 - Google Patents

一种基于重组策略的内容动态重组方法 Download PDF

Info

Publication number
CN110472217A
CN110472217A CN201910767781.XA CN201910767781A CN110472217A CN 110472217 A CN110472217 A CN 110472217A CN 201910767781 A CN201910767781 A CN 201910767781A CN 110472217 A CN110472217 A CN 110472217A
Authority
CN
China
Prior art keywords
content
recombination strategy
product
strategy
recombination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910767781.XA
Other languages
English (en)
Inventor
陈琳
陈海涛
刘振东
李海卜
吴竟飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TONGFANG KNOWLEDGE NETWORK (BEIJING) TECHNOLOGY Co Ltd
Original Assignee
TONGFANG KNOWLEDGE NETWORK (BEIJING) TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TONGFANG KNOWLEDGE NETWORK (BEIJING) TECHNOLOGY Co Ltd filed Critical TONGFANG KNOWLEDGE NETWORK (BEIJING) TECHNOLOGY Co Ltd
Priority to CN201910767781.XA priority Critical patent/CN110472217A/zh
Publication of CN110472217A publication Critical patent/CN110472217A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于重组策略的内容动态重组方法,包括以下步骤:基于出版物目标内容的领域知识配置重组策略,依据领域知识生成产品内容大纲,并按照章节细粒度配置产品内容的筛选条件;执行重组策略,即对配置的重组策略进行解释执行,生成重组产品;调整重组产品内容,即根据实际需要在推荐的素材列表中选择符合需要的素材,并可对素材内容进行编辑;生成新的数字内容产品。本发明提供的方法通过配置并执行重组策略,将素材库中经过碎片化加工处理后的素材进行重新组装,生成新的数字内容产品。

Description

一种基于重组策略的内容动态重组方法
技术领域
本发明涉及数字出版技术领域,尤其涉及一种基于重组策略的内容动态重组方法。
背景技术
传统出版是通过传统印刷技术的纸质出版,其物质媒介是纸张。传统出版必须将内容物化在物质媒介上,其产品具有明确的物质形态以及实物可保存性。数字出版是利用信息技术将出版物以网络、光盘等形式投放市场的出版方式。
随着社会的进步,读者对知识获取的需求也在不断提高,尤其是在专业出版领域,读者的需求逐步在向个性化发展。新闻出版单位作为内容的提供者,也需要能够提供个性化产品。但是,由于传统出版的周期比较长,很难满足各类读者的需求。
内容动态重组基于碎片化加工的素材资源,根据各种媒体资源及内容单元之间关联性,以及不同专业领域的特点,快速完成个性化产品内容的生成,从而缩短出版周期,为读者提供个性化服务。
DocBook提供了整个书写结构化文档的体系,它使用SGML/XML定义了一系列文档元素,并可以利用工具把原始的文档源文件转换成各种文档格式。简单说,DocBook就是一组对于XML文档进行解析的规范。对于一个按照DocBook格式写好的XML文件,使用DocBook的一些相关工具,就可以按照用户的要求生成各种各样的输出。顾名思义,DocBook是专门为写书籍或者类似书籍的文档所设计的。目前,国内出版社普遍采用基于DocBook的标准对出版物资源进行碎片化加工。
面向出版领域的内容重组技术,国内外直接相关的技术标准还不存在,技术的发展还处于萌芽阶段。国际上由OASIS(The Organization for the Advancement ofStructured Information Standards)组织维护的开放性标准--DITA(DarwinInformation Typing Architecture),存在相关技术的理念。DITA是一套基于XML的面向主题的数字内容结构化写作与发布方案。
国内外也存在个别对于碎片化加工的内容,按用户需要进行动态重组的业务模式,例如培生在其网站上允许用户选购碎片化的章节内容,自行按照需要打包付费购买。但是相关的技术和应用还存在许多问题,例如业务模式应用面窄,重组产品构建为用户手动操作,自动化水平低。
发明内容
为解决上述技术问题,本发明的目的是提供一种基于重组策略的内容动态重组方法,该方法通过配置并执行重组策略,将素材库中经过碎片化加工处理后的素材进行重新组装,生成新的数字内容产品。
本发明的目的通过以下的技术方案来实现:
一种基于重组策略的内容动态重组方法,包括
A基于出版物目标内容的领域知识配置重组策略,依据领域知识生成产品内容大纲,并按照章节细粒度配置产品内容的筛选条件;
B执行重组策略,即对配置的重组策略进行解释执行,生成重组产品;
C调整重组产品内容,即根据实际需要在推荐的素材列表中选择符合需要的素材,并可对素材内容进行编辑;
D生成新的数字内容产品。
与现有技术相比,本发明的一个或多个实施例可以具有如下优点:
该内容动态重组方法尤其适用于领域专著的自动重组,适合专业出版社的业务应用,在重组策略中强调领域知识的作用,领域知识通常是领域词表或者领域本体。通过配置领域知识定制重组产品涉及的素材内容,通过领域知识的组织结构确定内容的组织结构从而生成重组产品的大纲,并在大纲中可以细粒度地控制章节的筛选条件。
该内容动态重组方法实现了自动化的重组,基于重组策略的自动执行,可以生成重组产品,其中重组策略的执行可以配置相应的执行算法。典型地,根据重组产品的大纲构建提取计划,大纲中各个节点的内容提取可以采用特定的算法,例如采用经典的信息检索算法。此外,由于领域知识的引入,在进行内容提取时,可以结合领域知识,进一步提高内容提取的质量,例如通过领域知识的相关知识扩展提取指令,从而提高内容提取的准确率。
该内容动态重组方法引入了内容矫正的机制,该方法自动化执行重组策略从而生成重组产品,但其结果难免有不符合用户要求的内容,用户可以用依据配置的算法及提取数量确定的其他推荐的素材替换***自动提取填充的素材,也可根据权限进行内容的编辑,从而生成满足用户需求的重组产品。
附图说明
图1是基于重组策略的内容动态重组方法流程图;
图2是配置重组策略的领域知识示意图;
图3是根据领域知识生成大纲并配置筛选条件示意图;
图4是配置执行算法示意图;
图5是调整重组产品内容示意图;
图6是输出产品的EPUB示例示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合实施例及附图对本发明作进一步详细的描述。
如图1所示,为基于重组策略的内容动态重组方法流程,包括:
步骤10基于出版物目标内容的领域知识配置重组策略,依据领域知识生成产品内容大纲,并按照章节细粒度配置产品内容的筛选条件;
步骤20行重组策略,即对配置的重组策略进行解释执行,生成重组产品;
步骤30调整重组产品内容,即根据实际需要在推荐的素材列表中选择符合需要的素材,并可对素材内容进行编辑;
步骤40生成新的数字内容产品。
上述步骤10配置重组策略,配置重组策略的领域知识(如图2所示),重组策略是对重组产品需求的规格说明。典型的,重组策略包括:策略名称,策略ID,策略关键词,领域知识配置,内容筛选条件,如图3为根据领域知识生成大纲并配置筛选条件。
领域知识通常是专业出版社构建的专业领域知识体系,通常以领域词表或者领域本体的形式描述。领域知识包括领域中的概念及概念间的关系,典型的领域词表中的关系包括用、代、属、分、参,领域本体通常还包括内置的一般性关系(例如反义)和大量的自定义关系。领域知识配置在重组策略中规定策略所使用的领域知识,可以是领域词表或者领域本体中的所有知识,也可以选取部分知识。
领域知识通常按概念的分类层次进行组织,例如词表中的属分关系,领域本体中的SubClassof关系。因此在配置领域知识时,通常亦可以将领域知识构建成具有分类层次的结构。***可以根据用户配置的领域知识,生成期望重组产品的大纲,其中的章节结构对应领域知识中的概念层次。针对生成的大纲,可以在重组策略中进一步规定各章节的筛选条件,其配置可以是细粒度的,即具体配置到特定小节。筛选条件典型地包括:作者,版权信息,出版机构,时间范围,语种,面向用户定位。
重组策略配置完成后,通常可以将数据保存为XML或者JSON格式。
上述步骤20执行重组策略,执行重组策略是对步骤10配置的重组策略进行解释执行,生成重组产品的过程。
执行重组策略涉及对执行算法的配置。重组策略的执行依据重组策略,按照策略中确定的大纲进行内容组织,大纲中的章节内容依据特定的算法从素材库中提取。因此,算法配置是执行重组策略的必要环节。实现者可以根据特定的应用领域,特定的部署架构提供不同算法的支持,例如在分布式集群部署环境下,可以利用Map-Reduce的编程模式实现并行的重组算法,如图4是配置执行算法示意图。
另一方面,在重组策略中引入了领域知识,如步骤10所述,领域知识通常按概念的分类层次进行组织。在算法执行中,需要充分考虑领域知识的作用,以提升内容提取的质量。通常算法的执行需要以特定知识概念为中心,进行相应知识概念的扩展,从而提升内容提取的召回率和准确率。知识扩展的层次通常是执行算法配置的关键一步,该参数对内容提取的质量、性能有着重要的影响。
执行重组策略还可以涉及其他的参数,视具体的业务和算法需求而定。
提取的内容按照大纲进行组织,从而生成重组产品,此时的重组产品是自动化构建的,需要引入人工调整的环节,因此步骤20输出的重组产品是一个中间产物。
上述步骤30为调整重组产品内容(如图5所示),基于执行重组策略自动构建的重组产品很难做到完全符合用户的需求,因此引入调整重组产品内容的步骤。该步骤为人工调整的环节,用户可以调整所用素材。执行重组策略时,内容提取算法通常提取相关的一组素材,而在构建的重组产品中只选用最相关的素材,用户可以基于此选取其他素材,或者同时选用;用户还可以根据权限设定(通常受版权、政策等非技术因素影响),决定是否允许用户对内容进行编辑,例如删除部分文字。
上述步骤40生成最终产品,基于上述步骤构建的重组产品还是一种中间产品的状态,通常的数字出版物的载体文件格式是PDF或者EPUB。基于上述数据,即可遍历大纲中的各章节(条目),通过格式变换生成最终产品。如图6所示,为输出产品的EPUB示例示意图。
虽然本发明所揭露的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (5)

1.一种基于重组策略的内容动态重组方法,其特征在于,所述方法包括以下步骤:
A基于出版物目标内容的领域知识配置重组策略,依据领域知识生成产品内容大纲,并按照章节细粒度配置产品内容的筛选条件;
B执行重组策略,即对配置的重组策略进行解释执行,生成重组产品;
C调整重组产品内容,即根据实际需要在推荐的素材列表中选择符合需要的素材,并可对素材内容进行编辑;
D生成新的数字内容产品。
2.如权利要求1所述的基于重组策略的内容动态重组方法,其特征在于,所述步骤A中:
重组策略包括:策略名称、策略ID、策略关键词、领域知识配置及内容筛选条件;
领域知识通常以领域词表和领域本体的形式描述;
内容筛选条件是业务相关的,包括版权、作者、时间、相关度与提取数量。
3.如权利要求1所述的基于重组策略的内容动态重组方法,其特征在于,所述步骤B中重组策略的执行:依据重组策略,按照策略中基于领域知识确定的大纲进行内容组织,并对大纲中的章节内容依据特定的算法从素材库中提取。
4.如权利要求1所述的基于重组策略的内容动态重组方法,其特征在于,所述步骤C中,用户可以根据自己的判断调整重组产品内容,用推荐的素材替换,或使用***中其他不在推荐范围内的素材,用户也可以修改重组的内容。
5.如权利要求1所述的基于重组策略的内容动态重组方法,其特征在于,对调整后的重组产品内容进行格式变换,格式包括PDF或EPUB,完成内容动态重组,生成用户可以阅读的数字出版物产品。
CN201910767781.XA 2019-08-20 2019-08-20 一种基于重组策略的内容动态重组方法 Pending CN110472217A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910767781.XA CN110472217A (zh) 2019-08-20 2019-08-20 一种基于重组策略的内容动态重组方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910767781.XA CN110472217A (zh) 2019-08-20 2019-08-20 一种基于重组策略的内容动态重组方法

Publications (1)

Publication Number Publication Date
CN110472217A true CN110472217A (zh) 2019-11-19

Family

ID=68511964

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910767781.XA Pending CN110472217A (zh) 2019-08-20 2019-08-20 一种基于重组策略的内容动态重组方法

Country Status (1)

Country Link
CN (1) CN110472217A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160124A (zh) * 2019-12-11 2020-05-15 浙江大学 一种基于知识重组的深度模型定制方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927339A (zh) * 2014-03-27 2014-07-16 北大方正集团有限公司 知识重组***和知识重组方法
US8856650B1 (en) * 2012-06-15 2014-10-07 Gregory S. Off System and method for interactive digital content generation
CN107704636A (zh) * 2017-11-09 2018-02-16 安徽教育网络出版有限公司 一种动态数字出版***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8856650B1 (en) * 2012-06-15 2014-10-07 Gregory S. Off System and method for interactive digital content generation
CN103927339A (zh) * 2014-03-27 2014-07-16 北大方正集团有限公司 知识重组***和知识重组方法
CN107704636A (zh) * 2017-11-09 2018-02-16 安徽教育网络出版有限公司 一种动态数字出版***

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160124A (zh) * 2019-12-11 2020-05-15 浙江大学 一种基于知识重组的深度模型定制方法

Similar Documents

Publication Publication Date Title
CN103955345B (zh) 一种数据打印方法及***
CN106339363B (zh) 一种ppt报告的制作方法和装置
CN101561826B (zh) 基于节点粒度语义的在线非结构化文档共享协同方法及其应用
US20090019358A1 (en) Extensible business reporting language (xbrl) enabler for business documents
US20060184539A1 (en) XBRL Enabler for Business Documents
CN110413954A (zh) 制式文件打印预览方法、装置、设备和存储介质
CN107145480A (zh) 一种基于Word进行XBRL报告编制的方法
CN103838706A (zh) 一种可定制流程与表单的柔性管理信息***
CN107688557A (zh) 排版方法、排版***和终端
CN105068812B (zh) 一种表单生成方法及装置
CN106202292A (zh) 一种基于结构化数据模型的标准信息分析方法
CN110232177A (zh) 一种政务领域的标书生成***及方法
CN105468571B (zh) 一种用于自动生成报告的方法及装置
JPH05101052A (ja) 文書作成支援装置
CN104112004A (zh) 一种用户界面上智能拷贝数据的方法
CN109635262B (zh) 标书自动生成管理方法及***
CN110472217A (zh) 一种基于重组策略的内容动态重组方法
CN103377403B (zh) 企业业务组件建模方法和***
CN107193549A (zh) 基于元数据的网页快速开发方法
CN109710906A (zh) 经营范围辅助填报方法、装置、终端设备及存储介质
CN106844490A (zh) Bim非几何信息数据库的结构化与交互的方法及***
CN107239285A (zh) 一种单据开发方法及装置、可读介质和存储控制器
CN110457664A (zh) 一种基于模板的内容动态重组方法
GB2458692A (en) A process for generating database-backed, web-based documents
Salminen et al. Experiences of SGML standardization: The case of the Finnish legislative documents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination