CN112883687A - 一种基于合同文本标记语言的法律合同交互式标注方法 - Google Patents
一种基于合同文本标记语言的法律合同交互式标注方法 Download PDFInfo
- Publication number
- CN112883687A CN112883687A CN202110162638.5A CN202110162638A CN112883687A CN 112883687 A CN112883687 A CN 112883687A CN 202110162638 A CN202110162638 A CN 202110162638A CN 112883687 A CN112883687 A CN 112883687A
- Authority
- CN
- China
- Prior art keywords
- legal
- text
- contract
- user
- asset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 85
- 238000002372 labelling Methods 0.000 title claims abstract description 66
- 239000000470 constituent Substances 0.000 claims abstract description 16
- 230000014509 gene expression Effects 0.000 claims description 99
- 238000000034 method Methods 0.000 claims description 83
- 230000009471 action Effects 0.000 claims description 81
- 230000006870 function Effects 0.000 claims description 43
- 230000008569 process Effects 0.000 claims description 35
- 238000012546 transfer Methods 0.000 claims description 33
- 230000003993 interaction Effects 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 9
- 230000008520 organization Effects 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000000926 separation method Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 2
- 238000010276 construction Methods 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 10
- 238000011161 development Methods 0.000 abstract description 7
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 230000006399 behavior Effects 0.000 description 24
- 230000007246 mechanism Effects 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 230000008676 import Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 235000011371 Brassica hirta Nutrition 0.000 description 1
- RWSOTUBLDIXVET-UHFFFAOYSA-N Dihydrogen sulfide Chemical compound S RWSOTUBLDIXVET-UHFFFAOYSA-N 0.000 description 1
- 241000220262 Sinapis alba Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000029305 taxis Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/117—Tagging; Marking up; Designating a block; Setting of attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
- G06F40/157—Transformation using dictionaries or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Technology Law (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于合同文本标记语言的法律合同交互式标注方法,其步骤包括:1)用户选取法律合同文本中法律构成要素,以交互方式提示用户对所选法律构成要素的法律属性、法律成分及特征进行指定或修订,生成法律合同文本的标记框架;2)建立合同文本标记语言CTML,按照标记类型,所述合同文本标记语言CTML包括语义标记和数源标记;3)添加所述语义标记和面向用户定制数据的数源标记到所述法律合同文本的标记框架中,实现带有法律元素标记的合同文本生成。本发明为用户处理法律合同提供自动化生成符合上述语言中语法规范的标注,将有利于采用数字化手段理解合同语义和规范化处理、区块链智能合约通用开发与样式个性化显示。
Description
技术领域
本发明涉及信息技术领域,特别是指一种基于合同文本标记语言的法律合同交互式标注方法,用于法律合同相关的信息服务与应用开发。
背景技术
合同是民事主体之间设立、变更、终止民事法律关系的协议,是维护市场经济秩序和保障当事人合法权益的重要手段,在市场经济中具有重要的地位。近年来随着信息、计算机和网络技术的发展,特别是电子签名、区块链、智能合约等技术的出现,从合同的电子化和自动处理、到采用计算机实现合同条款的自动执行、乃至计算法律学都已成为现实或未来法律发展的方向。然而,由于法律合同文本采用自然语言撰写,目前仍然不能由计算机直接进行处理,这直接导致法律合同处理仍然依赖法律人士来解读法律上的意思表示,严重影响了法律合同的深层应用。特别对于区块链智能合约而言,目前缺少一种准确理解合同内容和意思表示的有效方法,导致由法律合同文本到智能合约代码依然需要法律界人士和程序员合作实现,其编写的智能合约程序也缺少法律认可和相应的法律效力。
究其原因,可归结到法律合同意思表示准确性问题与法律合同意思表示的计算机理解问题。合同文本作为一种符合法律的文档,尽管具有法律效力,但由于合同文本所使用的自然语言客观上存在着表达上二义性,易于引起不同法律主体理解上的歧义性,而计算机语言表示的程序不允许二义性存在,这就存在着法律文档计算机处理过程中二义性消除、以及如何采用更加有效形式表示合约内容等现实问题。
解决此问题的一条解决路径是:建立一种将法律合同文本中内容和意思表示进行规范化的方法,通过对文档中语法、结构、词汇的内容进行标注,便于各种人员更加准确和一致性的理解法律合同文本。尽管已经存在一些工作对合同文本中进行信息提取,但是目前尚缺少一种依照现行法律要求对合同中法律元素及其特征提取的有效方法,同时也没有一种对提取信息进行易于计算机处理的法律元素及其特征予以规范化表示的方法。
发明内容
针对上述技术问题,本发明提出一种合同文本标记语言(CTML),是一种创建法律合同或对法律合同进行意思表示的规范性计算机处理语言,遵循《中华人民共和国民法典》(下称民法典)等相关法律的基础性文档规范。在此基础上,本发明提供一种基于合同文本标记语言的法律合同交互式标注方法,通过交互方式为用户处理法律合同文本提供自动化生成符合合同文本标记语言(CTML)中语法规范的标注,并通过支持交换标记数据表(EMD,简称交换表),实现更加规范化的合同文本设计和法律合同相关应用开发。
本发明是通过以下技术方案实现的:
本发明中标记语言是一种将文本以及文本相关信息结合起来,展现出关于文档结构、特征、词汇意义及意思表示、和数据处理细节的计算机可处理文字编码。
本发明中法律合同是指民事主体之间设立、变更、终止民事法律关系的协议,合同文本中相关法律词汇解释参见《民法典》《电子签名法》等相关法律法规,数据电文是指以电子、光学、磁或者类似手段生成、发送、接收或者储存的信息。合同条款是合同条件的表现和固定化,是确定合同当事人权利和义务的根据,即从法律文书而言,合同的内容是指合同的各项条款。本发明中法律要素是指法律规范存在所必须的基本因素或元素,由法律规则、原则和概念构成。法律要素意思解释是指对法律合同中法律要素在法律属性、法律成分及特征等方面所表达意思的解释。
下述给出本发明所采用符号及说明如下:
@ 标识前缀
| 同级元素或
[] 关键词任选
# 可选特征指示符
% 类型指示符
+ 零或多项
. 层级关系连接符
<<>><</>> 语义标记
<{}> 数源标记
本发明假设法律合同文本不含有与语义标记和数源标记相同的标记符号。语义标记中的标记信息置于双尖括号内部,并将前后部语义标记置于被标注文本外侧,即<<标记信息>>文本<</标记信息>>。
一种基于合同文本标记语言的法律合同交互式标注方法,如图1所示,所述方法包括:
(1)用户选取法律合同文本中法律构成要素factor,以交互方式提示用户对所选法律构成要素factor的法律属性property、法律成分component及特征attribute进行指定或修订,提取用户选取的法律合同文本中法律要素意思解释;
(2)建立合同文本标记语言CTML,将所述法律要素意思解释生成合同文本标记语言CTML表达的标记,本发明所述合同文本标记语言CTML是一种将法律要素规范性表达与合同文本结合,通过标记对合同元素进行标识和说明,展现文档结构、特征、词汇的法律意义,描述数据处理方法的计算机可处理语言,按照标记类型,所述合同文本标记语言CTML包括语义标记和数源标记;
所述语义标记也称为可嵌套标记或复杂标记,用于对文档中法律构成要素、法律属性、法律成分进行标注;具有指示性作用,并可提供法律上的意思表示。
所述数源标记,用于对文档中基本且不可分割词汇进行标识,这些基本词汇被称为交互数据exchangedData,常用于合约当事人进行宣称、填入或选择,可以在文档中任何地方使用数源标记;
嵌套结构可以通过层级关系连接符加以表示,数源标记可在文本中任何地方被使用。
根据合同文本标记语言CTML中的形式文法形成层级语义标注。所述语义标记采用层级语义标注方法,所述层级语义标注包括法律要素标注LFM、法律属性标注LPM、法律成分标注LCM以及辅助性标记,所述辅助性标记包括域标记;
所述语义标记采用如下格式:
<<要素|属性|成分|域参数列表>>文本<</要素|属性|成分|域>>
对应英文表示为
<<factor|property|component|field parameterList>>text<</factor|property|component|field>>
其中,factor、property、field分别为表示要素、属性、域的保留字,component为具体法律成分,parameterList表示参数列表,依据标记种类具有不同定义,text表示被标注文本。
本发明所述嵌套结构是指由要素标识、属性、成分构成的标识或名称通过层级关系连接符加以表示的元素间包含关系。
本发明中所述数源标记采用如下格式:
数源标记::=<{[要素标识]@交互数据标识[%类型](#选择方式=备选数据)+}>
对应英文表示为
metadataExpression::=<{[factorID]@exchangedDataID[%type](#option=value)+}>
其中,factorID表示交互数据所属层次中最外层的要素标识,exchangedDataID表示该交互数据的唯一标识,option表示交互数据的选择方式,可包括单选singleOption、多选multiOption、外部输入import、触发trigger、分配allocate等,选择方式的集合表示optionSet是
optionSet::={singleOption|multiOption,import,trigger,allocate}
其中,value表示合同文本在此处的备选数据或取值,type表示交互数据的类型,可分为数据类型dataType和权属类型rightType,外部输入import表示可接收用户传入数据、触发trigger表示可接收外部事件、分配allocate表示可接收用户定义的复杂类型数据。
(3)添加所述语义标记和面向用户定制数据的数源标记到合同文本中,实现带有法律元素标记的合同文本生成。
进一步地,所述方法还包括步骤(4):构造交换标记数据表EMD,即采用可交换的表式结构提取、记录和设置合同文本标记语言CTML中已标注交互数据必要属性,并通过设定必要属性对合同文本中用户可定制数据进行约束与限定,实现合同语义与用户数据分离,为当事人之间的合同协商与执行的数据交互提供基础。
进一步地,步骤(2)中,所述法律要素标注LFM属于一级标注功能,用于为法律规定的合同法律构成要素(简称要素factor)提供提取、识别和要素形式化表示factorExpression,标注过程描述如下:
用户选择需标注法律构成要素factor的文本并指定该文本所属要素类别factorSet后,用户获得自动生成的要素标识factorID供使用或修订;
提示用户从所述需标注法律构成要素factor的文本中选择或输入所述需标注要素所具有的特征attribute及特征值value;根据要素类别不同可具有多个特征;
再将文本所属要素类别factorSet、要素标识factorID特征attribute及特征值value按照要素形式化表示factorExpression添加到所选择标注要素文本的外侧,实现法律要素的形式化表达和意思表示的规范化;
其中,所述要素类别factorSet包括:标题title、当事人party、资产asset、条款term、合同订立conclusion、附加信息addition;所述当事人分为个体当事人party(简称当事人)、群体当事人group(简称群体或机构),所述条款分为一般条款genTerm、违约条款breTerm、仲裁条款arbiTerm。
合同法律构成要素(要素factor)是指当事人姓名或者名称和住所、标的、数量、质量、价款或者报酬、履行期限、地点和方式、违约责任、解决争议的方法等文本信息。
合同法律属性(属性property)是指法律构成要素中的基本性质,包括资产的属性与权属、合同条款的行为、前置条件、伴随条件、后置条件、违反、争议、机构以及合同订立中的签名等文本信息。
合同法律成分(成分component)是指法律属性表达所涉及到的限定信息,包括时间表达中的行为时间、时间谓词、边界谓词,资产操作中的存入动作、取回动作、转移动作以及资产表达式等文本信息。
本发明中特征attribute是用于描述文本内容中有别于其他意思表示的特点,是法律要素、属性、成分表示的最小元素。
所述法律要素标注LFM的要素形式化表示factorExpression定义为:
要素形式化表示::=<<要素要素类别@要素标识(#特征=特征值)+>>文本<</要素>>对应英文格式为:
factorExpression::=<<factor factorSet@factorID(#attribute=value)+>>text<</factor>>
其中,factor为保留字,factorID表示要素标识,attribute表示该要素所具有的法律特征,value表示特征值,factorSet表示该要素具体的要素类别,采用集合形式表示要素类别如下:
要素类别::={标题,当事人|群体,资产,一般条款|违约条款|仲裁条款,合同订立,附加信息}
对应英文表示为
factorSet::={title,party|group,asset,genTerm|breTerm|arbiTerm,conclusion,addition}
其中,符号|用于分割同一要素的不同种类。
进一步地,步骤(2)中,所述法律属性标注LPM属于二级标注功能,用于对法律构成要素factor下的法律属性(简称属性property)进行提取、识别和法律属性形式化表示propertyExpression,标注过程如下:
用户通过在所述法律要素标注LFM标注后的具有要素标识factorID的文本中选择需标注法律属性property的文本并指定该文本所属属性类别propertySet后,用户获得自动生成的属性标识propertyID供使用或修订;
提示用户从文本中选择或输入所述需标注法律属性property所具有的特征attribute及其特征值value;根据属性类别不同可具有多个特征;
将上述文本所属要素标识factorID、属性类别propertySet、属性标识propertyID、特征attribute及其特征值value按照法律属性形式化表示propertyExpression添加到所选标注属性文本的外侧;
其中,所述属性类别propertySet包括:信息info、权属right、行为action、前置条件preCondition、伴随条件adjCondition、后置条件postCondition、违反against、争议controversy、机构institution、签名signature。
所述法律属性标注LPM中法律属性形式化表示propertyExpression定义为:
法律属性形式化表示::=<<属性[要素标识.]属性类别[@属性标识](#特征=特征值)+>>文本<</属性>>
对应英文格式:
propertyExpression::=<<property[factorID.]propertySet[@propertyID]
(#attribute=value)+>>text<</property>>
其中,property为保留字,propertySet表示该属性具体的法律属性,propertyID表示属性标识。
如果LPM被嵌套到一级标注中,则可对要素标识.(即factorID.)予以省略。当要素标识对应到该属性的次数有且只有一次时,则可对@属性标识(即@propertyID)予以省略。
本发明所述法律属性标注LPM可采用集合形式表示法律属性如下:
属性类别::={信息,权属,行为,前置条件,伴随条件,后置条件,违反,争议,机构}
对应英文表示为
propertySet::={info,right,action,preCondition,adjCondition,postcondition,against,controversy,institution,signature}
进一步地,步骤(2)中,所述法律成分标注LCM属于三级标注功能,用于对特定法律构成要素、法律属性及法律成分(简称成分component)下的法律成分提供嵌套式提取与识别功能,其中,法律成分标注内可嵌套其他法律成分标注,进而形成法律成分形式化表示componentExpression;标注过程如下:
用户选择在法律属性标注LPM标注后的具有属性标识propertyID的文本中选择需标注法律成分component的文本后,用户获得法律成分所属成分标注方法的类别选择,法律成分所属成分标注方法的可选类别包括时间表示标注功能、资产操作标注功能、资产表示标注功能;
提示用户从其中选择或输入所需标注法律成分component中应标注的特征attribute及特征值value;其中,根据法律成分component不同可允许用户标注不同特征;
将上述文本所属法律成分component、特征attribute及其特征值value按照法律成分形式化表示componentExpression添加到所选标注属性文本的外侧。
所述法律成分标注LCM中法律成分形式化表示componentExpression定义为:
法律成分形式化表示::=<<成分(#特征=特征值)+>>文本<</成分>>
对应英文格式:
componentExpression::=<<component(#attribute=value)+>>text<</component>>
其中,component表示从前述成分集合中指定的具体法律成分。
本发明所述法律成分标注LCM可采用集合形式表示法律成分如下:
成分::={行为时间,时间谓词,边界谓词,存入动作|取回动作|转移动作,资产表达式}
对应英文表示为
component::={actionTime,timePredicate,rangePredicate,
deposit|withdraw|transfer,assetExpression}
进一步地,步骤(2)中,所述域标记属于辅助性标注功能,用于对描述法律构成要素或法律属性下所拥有的特性field及特征值value提供提取与识别功能,并形成域信息形式化表示fieldExpression;标注过程如下:
用户通过在所述法律要素标注LFM标注后具有要素标识factorID的文本或在所述法律属性标注LPM标注后具有属性标识propertyID的文本中选择需标注域信息的文本,用户获得自动生成的域标识fieldID供使用或修订;
提示用户选择或输入所述需标注域信息所应标注的特性的类型type、域值quantity及域值取值value、特性所属的要素标识factorID及属性类别propertySet;再将所述需标注域信息所应标注的特性的类型type、域值quantity及域值取值value、特性所属的要素标识factorID及属性类别propertySet按照域信息形式化表示fieldExpression添加到所选标注文本的外侧。
所述域标记中域信息形式化表示fieldExpression定义为:
域信息形式化表示::=<<域[要素标识.属性集]@域标识[%类型]
[#域值=取值]>>文本<</域>>
对应英文格式:
fieldExpression::=<<field[factorID.propertySet]@fieldID[%type]
[#quantity=value]>>text<</field>>
其中,域值quantity为保留字。
本发明中数据类型dataType表示属性的数据类型,数据类型分为字符串、货币、日期、整数、浮点数、布尔值、时间,采用英文集合表示如下:
dataType::={String,Money,Date,Integer,Float,Boolean,Time}。
合同文本标记语言CTML不限制语言种类,故在下述公式表示上只显示英文,相应的中文对照将在解释中加以说明。
本发明采用所述合同文本标记语言CTML按照层级标注方法可实现法律合同文本中法律构成要素的标注,标注元素关系图如图2所示,包括:
——合同标题(title)用于描述法律合同文件相关信息及其标注,包括:合约标识(titleID)、合约序号(serialNumber),具体格式如下:
<<factor title@titleID[#serialNumber=value]>>text<</factor>>
其中,title为标题保留字,titleID表示合约标识,serialNumber为特征关键词,value表示合约序号,serialNumber可被缺省。
——当事人(party)标记用于对当事人相关信息进行宣称,包括当事人唯一性的身份信息、联系方式等。当事人又分为个体当事人party和群体当事人group,标注通过当事人标识对所有已声明当事人进行区分,格式如下:
●个体当事人(party):
<<factor party@partyID>>text<</factor>>
●群体当事人(group):
<<factor group@groupID>>text<</factor>>
其中,party为个体当事人保留字,partyID为个体当事人标识,group为群体当事人保留字,groupID为群体当事人标识。
——标的(asset)标记用于描述当事人权利和义务共同指向的对象以及对象的权属关系,对象被称为资产,一般分为物、行为、智力成果等。标注通过资产标识对已声明资产进行区分,格式如下:
<<factor asset@assetID>>text<</factor>>
其中,asset为资产保留字,assetID为资产标识。
声明资产时需标注信息包括与合约相关资产属性信息(info)与资产权属信息(right),两者均属于资产要素下的法律属性,格式如下:
●资产属性信息(info):
<<property[assetID.]info>>text<</property>>
●资产权属信息(right):
<<property[assetID.]right>>text<</property>>
其中,info为资产属性信息保留字,right为资产权属信息保留字,assetID为指定资产标识。
在资产属性信息info与资产权属信息right的标记文本中,应使用域标记对其拥有的特性及取值进行标定。资产权属信息在标记类型时应使用权属类型(rightType),权属类型分为使用权(useRight)、所有权(ownershipRight)、占有权(possessRight)、收益权(usufructRight)、处分权(disposeRight)、以及特定属性下允许用户自定义的专有权属(Right),采用英文集合表示如下:
rightType::={Right,useRight,ownershipRight,possessRight,usufructRight,disposeRight}。
如果标的物属性采用非集中方式进行描述,可采用如下形式:
<<field assetID.info@fieldID%dataType>>text<</field>>
如果标的物权属采用非集中方式进行描述,可采用如下形式:
<<field assetID.right@fieldID%rightType>>text<</field>>
——条款标记用于当事人权利和义务的宣称,可细分为一般条款(genTerm)、违约条款(breTerm)和仲裁条款(arbiTerm),属于法律要素。
一般条款(genTerm)是用于当事人在权利与义务、条款执行条件、资产转移以及条款执行后应满足的后置条件进行约定。若一般条款间在逻辑上具有上下级层次结构,则称对应下级条款为子条款,子条款应在特征terms中进行声明,子条款标识需通过层次命名方法加以区分,格式如下:
<<factor genTerm@termID[#terms={(termID)+}]>>text<</factor>>
其中,genTerm为一般条款保留字,termID为条款标识,terms为特征关键词,等号后面为子条款标识集,子条款可以有多个。
在合同文本标记语言CTML中,一般条款genTerm以行为(action)、前置条件(preCondition)、伴随条件(adjCondition)和后置条件(postCondition)四类属性对条款构成进行标记:
●行为(action):标记条款的具体动作,一般条款genTerm下都需标记条款对应行为属性
<<property[termID.]action@actionID#party=(partyID|groupID)
#duty=Duty>>text<</property>>
其中,termID为对应条款标识,action为行为保留字,actionID是行为标识,party特征用于标识条款当事人,duty特征用于标识该当事人权利和义务,二者在标记中必须明确规定。
本发明所述权利和义务包括权利限制(can)、应当限制(must)和禁止限制(cannot),用集合形式Duty进行表示:
Duty::={can,must,cannot}
●前置条件(preCondition):标记条款执行前需要满足的要求,即条款执行条件
<<property[termID.]preCondition[@preConditionID]>>text<</property>>
其中,termID为对应的条款标识,preCondition为前置条件保留字,preConditionID在termID条款对应的前置条件标记超过一处时作为前置条件标识。
●伴随条件(adjCondition):标记条款执行过程中伴随的资产操作
<<property[termID.]adjCondition[@adjConditionID]>>text<</property>>
其中,termID为对应的条款标识,adjCondition是伴随条件保留字,adjConditionID在termID条款对应的伴随条件标记超过一处时作为伴随条件标识。
●后置条件(postCondition):标记条款执行后应满足的条件
<<property[termID.]postCondition[@postConditionID]>>text<</property>>
其中,termID为对应的条款标识,postCondition是后置条件保留字,postConditionID在termID条款对应的后置条件标记超过一处时作为后置条件标识。
违约条款(breTerm)是指双方约定的当事人在不履行合同中规定的义务或履行义务不符合约定时应承担的法律责任。在违约条款存在子条款时,依旧在特征terms中进行声明,格式如下:
<<factor breTerm@breTermID[#terms={(termID)+}]>>text<</factor>>
其中,breTerm为违约条款保留字,breTermID为违约条款标识。
在法律合同文本中,违约条款需要指出本条款针对哪个或哪些条款,在合同文本标记语言中使用违反(against)属性对其进行标记,针对条款在属性的特征terms中进行声明:
●违反(against):
<<property[breTermID.]against@againstID#terms={(termID)+}>>text<</property>>
其中,breTermID为违约条款标识,against为违反保留字,againstID为违反标识,terms为特征关键字,等号后面为针对条款标识集,该特征不能被缺省。
同时,违约条款要素中同样具有行为action、前置条件preCondition、伴随条件adjCondition和后置条件postCondition四类属性,且必须对行为action进行标注。
仲裁条款(arbiTerm)用于规定解决争议的方法,并可指定仲裁机构,格式定义如下:
<<factor arbiTerm@termID>>text<</factor>>
其中,arbiTerm为仲裁条款保留字,termID为条款标识。在仲裁条款要素下,依据合同陈述的事实对其规定的争议(controversy)和机构(institution)进行标记:
●争议(controversy):
<<property[termID.]controversy[@controveryID]>>text<</property>>
其中,termID为对应要素标识,controversy为争议保留字,controversyID在termID条款对应的争论标记超过一处时作为争论标识。
●机构(institution):
<<property[termID.]institution[@institutionID]>>text<</property>>
其中,termID为对应要素标识,institution为争议保留字,institutionID在termID条款对应的机构标记超过一处时作为机构标识。
——附加信息(addition)标记可给出其它补充条件的定义,标记格式如下:
<<factor addition@additionID>>text<</factor>>
其中,addition为附加信息保留字,additionID为附加信息标识。附加信息中应使用域标记对其拥有的特性及其取值进行标定。
——合同订立(conclusion)标记指所有当事人的约定总结,意味着缔约当事人相互为意思表示并达成合意而成立了合同,标记格式如下:
<<factor conclusion@conclusionID>>text<</factor>>
其中,conclusion为合同订立保留字,conclusionID为合同订立标识。
合同订立要素下还应包含当事人的签名(signature),代表双方同意合同相关陈述并对合同进行签署,格式如下:
<<property[conclusionID.]signature[@signatureID]
#party=(partyID|groupID)>>text<</property>>
其中,conlusionID为对应的订立标识,signature为签名保留字,signatureID为签名标识。party为特征关键词,其特征值为签名对应的当事人标识。
进一步地,在条款的订立中,对时间和资产操作信息的提取和识别是条款计算机处理的基础,在本发明中将它们归类为法律成分,所述法律成分标注LCM包括时间表示、资产操作和资产表示的标注功能;
时间表示标注功能,是指对合同中时间信息提供提取和表示的能力,分为行为时间actionTime、时间谓词timePredicate、边界谓词rangePredicate三种标注功能;
资产操作标注功能,是指对合同中实现标的物在不同当事人之间的转移动作提供提取和表示的能力,分为存入动作deposit、取回动作withdraw、转移动作transfer三种标注功能;
资产表示标注功能,是指对合同中资产操作所涉及的资产信息提供提取和表示的能力。
进一步地,行为时间actionTime标注流程包括:用户在前置条件preCondition和后置条件postCondition标注的文本中选择当事人party完成特定动作action的行为时间表达文本,并将其嵌入到该前置条件preCondition和后置条件postCondition标注的文本中,提示用户从行为时间表达文本中选择或输入应标注的特定动作action和执行动作当事人party,再获得时间限制limit的选择提示,在用户确定当事人party中任意all、存在some、当前this三种选择之一执行动作的时间冠词后,将用户指定的特定动作action、执行动作当事人party、时间限制limit按照行为时间表示actionTimeExpression添加到所述行为时间表达文本的外侧;
时间谓词timePredicate标注流程包括:用户采用嵌套方式在前置条件preCondition和后置条件postCondition标注文本中选择表示某一目标时间与某一基准时间之间关系的时间谓词表达文本,提示用户从时间谓词表达式文本中选择或输入应标注的基准时间baseTime、时间方向介词prep、目标时间targetTime、判断词judge,并将用户指定的基准时间baseTime、时间方向介词prep、目标时间targetTime、判断词judge按照时间谓词表示timePredicateExpression添加到所述时间谓词表达文本的外侧;
边界谓词rangePredicate标注流程包括:用户采用嵌套方式在前置条件preCondition和后置条件postCondition标注文本中选择表示某一基准时间前后某一范围的边界谓词表达文本,提示用户从边界谓词表达式文本中选择或输入应标注的基准时间baseTime、时间方向介词prep、边界判定词within、时间范围boundary,并将用户指定的基准时间baseTime、时间方向介词prep、边界判定词within、时间范围boundary按照边界谓词表示rangePredicateExpression添加到所述边界谓词表达文本的外侧。
存入动作deposit标注流程包括:用户采用嵌套方式在伴随条件adjCondition标注文本中选择当事人主动存入资产的存入行为表达文本,调用资产表示标注功能生成存入资产的资产表达式AssetExpression,再提示用户从所述存入行为表达文本中选择或输入应标注的价值要求condition,并将用户指定的资产表达式AssetExpression和标注的价值要求condition按照存入动作表示depositExpression添加到所选存入行为表达文本的外侧;
取回动作withdraw标注流程包括:用户采用嵌套方式在伴随条件adjCondition标注文本中选择当事人取回资产的取回行为表达文本,调用资产表示标注功能生成取回资产的资产表达式AssetExpression,并将用户指定的资产表达式AssetExpression按照取回动作表示withdrawExpression添加到所选取回行为表达文本的外侧;
转移动作transfer标注流程包括:用户采用嵌套方式在伴随条件adjCondition标注文本中选择向特定目标当事人转移资产的转移行为表达文本,调用资产表示标注功能生成转移资产的资产表达式AssetExpression,再提示用户从转移行为表达文本中选择或输入应标注的目标当事人target,并将用户指定的资产表达式AssetExpression和目标当事人target按照转移动作表示transferExpression添加到所选转移行为表达文本的外侧。
资产表示标注功能的标注流程包括:用户采用嵌套方式在资产操作标注功能中的行为表达文本中选择资产操作所涉及的资产信息的表达文本,提示用户选择或输入应标注的资产标识assetID、被转移资产的权属类型assetRight、转移资产数量amount;并将用户指定的资产标识assetID、权属类型assetRight、转移资产数量amount按照资产表达式assetExpression添加到所选表达文本的外侧,其中,可供选择的权属类型assetRight包括所有权ownershipRight、使用权useRight、占有权possessRight、收益权usufructRight、处分权disposeRight。
上述时间表示标注功能所使用的时间表达描述如下:
●行为时间(action):当事人完成某项动作的行为时间表示
actionTimeExpression::=<<actionTime[#limit=(all|some|this)]#party=(partyID|groupID)
#action=actionID>>text<</actionTime>>
其中,actionTime为行为时间保留字;limit特征为限制冠词,等号后面标识任意(all)、存在(some)、当前(this)的限制信息;party特征用于规定当事人标识;action特征用于规定行为标识。
●时间谓词(timePredicate):某一目标时间与某一基准时间之间的关系
timePredicateExpression::=<<timePredicate[#targetTime=timeID][#judge=(is|isn't)]
[#prep=(before|after)]#baseTime=timePoint>>text<</timePredicate>>
其中,timePredicate为时间谓词保留字;targetTime为目标时间特征关键词,timeID为指定时间标识;judge表示判断词特征,等号后面指定是(is)否(isn’t);prep特征用于规定时间方向介词,特征值可选择时间之前(before)和时间之后(after);baseTime为基准时间关键词,其特征值可包括时间类型(Date),当前时间(now)和行为时间(action),用集合timePoint进行表示,即:
timepoint::={Date,now,actionTime}
●边界谓词(rangePredicate):某一基准时间前后的某一范围
rangePredicateExpress::=<<rangePredicate[#within=(true|false)]#boundary=TIME
[#prep=(before|after)]#baseTime=timePoint>>text<</rangePredicate>>
其中,rangePredicate为边界谓词保留字;within特征表示边界判定,特征值规定为布尔值,boundary特征表示时间范围,特征值规定为时间类型(TIME)。
上述资产操作标注功能所使用的时间表达描述如下:
●存入动作(deposit):当事人存入资产
depositExpression::=<<deposit[#condition=STRING]>>text<</deposit>>
其中,deposit为存入动作保留字,condition特征表示价值要求,特征值规定为字符串类型(STRING)。
●取回动作(withdraw):当事人取回资产
withdrawExpression::=<<withdraw>>text<</withdraw>>
其中,withdraw为取回动作保留字。
●转移动作(transfer):向特定目标当事人转移资产
transferExpression::=<<transfer#target=partyID>>text<</transfer>>
其中,transfer为转移动作保留字,target为特征关键词,特征值partyID为当事人标识。
资产表达式(assetExpression)用于条款中资产的调用,特征包括具体数量(amount),具体权属(assetRight),指定资产(assetTarget),格式如下:
assetExpression::=<<assetExpression[#amount=(FLOAT|INT)][#assetRight=fieldID]
#assetTarget=assetID>>text<</assetExpression>>
其中,assetExpression为资产表达式保留字,amount、assetRight、assetTarget为特征关键词,amount对应特征值应为浮点型(FLOAT)或整型(INT),在缺省情况下特征值为1,assetRight对应特征值为标的物权属,在缺省情况下合约处置对象的权属为资产所有权,assetTarget对应特征值为资产标识,在声明时不允许被缺省。
进一步地,构造交换标记数据表EMD,是指从合同文本标记语言CTML标注合同文本中按照结构化表格形式提取和记录数源标记metadataExpression及数源标记特征信息的用户交互过程,包括数源标记生成和交换标记数据表EMD生成两个过程:
数源标记metadataExpression生成过程是指:用户选择需标注交互数据在文本中位置或选择需标注交互数据所在文本,并指定该交互数据所属类型type;用户获得自动生成包含文本所在要素的要素标识factorID的交互数据标识exchangedDataID供使用或修订,进而根据交互数据所属类型type提示用户选择、确认和设定该交互数据exchangedData的选择方式option,供选择的选择方式包括单选singleOption、多选multiOption、外部输入import、触发trigger、分配allocate,并将上述用户指定的交互数据标识exchangedDataID、交互数据所属类型type、选择方式option按照数源标记metadataExpression填入到用户指定位置或替代所选需标注交互数据所在的文本;
交换标记数据表EMD生成过程是指:采用遍历方式从已标注的合同文本中逐个提取数源标记,对每一个数源标记在交换标记数据表EMD中生成一个以该数源标记中交互数据标识exchangedDataID命名的记录,提示用户通过选择或编辑方式对记录中的交互数据必要属性进行确认、特指或限制,并将上述用户指定的交互数据必要属性写入到交换标记数据表EMD对应记录中;可供选择的交互数据必要属性包括:使用方法usage、来源标识ctmlID、法律合同文本转化为目标智能合约后的目标转化合约对应标识targetID、类型type、缺省值defaultValue、确值条件condition、交互过程中填写的交互数据值value;所述交互数据必要属性是指合同协商与执行过程中对当事人交互数据进行约束与限定的特定性质或关系。
所述交互数据必要属性包括但不限于上述属性,采用集合表示为
交互数据必要属性::={使用方法、来源标识、目标转化合约对应标识、类型、缺省值、确值条件、交互过程中填写的交互数据值}
对应英文格式为:
dataEssentialAttribute::={usage,ctmlID,targetID,type,defaultValue,condition,value}
所述交互数据必要属性中,使用方法usage属性用于对交互数据的操作状态进行约束,约束的限定时段分为合约签订前、合约签订中、合约签订后三个阶段,每一阶段使用状态权限分为可读、可写两类,对可写权限的约束分为必须填写、可选填写两种。
使用方法usage可使用六个字符进行表示,每两个字符为一组,分别为合约签订前、中、后阶段对变量的状态权限约束。其中,用户使用状态权限分为读R、写W两种,以及必须填写C、非必须填写U两种对写权限的约束,逻辑关系如下:
1)R表示此变量仅可读;
2)W表示此变量可写;
3)C与W共同使用形成WC,表示此变量必须填写;
4)U和W共同使用形成WU,表示此变量非必须填写;
5)此变量为可读状态时,其权限约束表示用“_”表示。
确值条件condition用于对交互数据的值域范围限定、填写人约束条件进行约束,其中,若数源标记中含单选singleOption特征,则表明相应交互数据为单选项,并记录取值范围;若含多选multiOption特征,则表明相应交互数据为多选项,同时记录取值范围;若相应交互数据需由指定当事人填写,则记录相应当事人标识partyID。
法律合同文本转化为目标智能合约后的目标转化合约对应标识targetID是指目标合约中所使用的变量名,其中,目标合约是指由被标注合约所转化的高级智能合约或智能合约,通常由计算机可执行语言所编写。
本发明的有益技术效果
本发明提供的方法中,采用合同文本标记语言CTML及交换标记数据表EMD,其中,合同文本标记语言CTML,通过标注形式将法律合同文本中的法律基本要素和语义予以明确化,通过层次结构将法律要素、法律属性、法律成分从粗到细地加以形式化表示,可有效避免合同文本所使用自然语言带来的二义性,便于不同领域人员对法律合同文本的准确理解,也有利于对法律合同文档的进一步分析与应用。
通过对合同文本标记语言CTML中文本元素区分语义标记和数源标记,由前者表示法律合同的语义信息并形成“合同范例”,进而转化为智能法律合约程序与通用性智能合约程序及代码,而由后者标注因合同当事人或标的物等不同而带来合同个性化的文本元素(被称为交互数据),并提取这些标记信息构成交换标记数据表EMD,从而实现本发明所提出的代码与数据分离原则,便于智能合约通用开发与个性化应用、以及计算机高效处理与样式个性化显示(如对交互数据的单选与多选样式定制)。
本发明给出了一种通过采用形式化语言的标注方式对法律合同中法律要素和意思表示进行准确描述和解释的方法,去除了自然语言表述的二义性,达到了不同领域人员对法律内容进行有效识别和无偏差理解的目的。
本发明所提出的合同文本标记语言CTML采用了基于层级标注的结构化表示形式,并按照现行法律要求提取文档中法律构成要素、属性、成分、特征等法律关键信息,有利于采用计算机及其他数字化手段理解合同语义和规范化处理。
采用本发明所提出的合同文本标记语言CTML生成的格式化法律合同文件便于转化为其它格式化文档,例如,转化为智能法律合约SLC程序、超文本标记语言HTML文件,并将其渲染成可视化网页;转化为PDF文档,方便作为书面纸质合同打印。
本发明所述方法允许程序员在合同文本标记语言CTML中嵌入脚本语言,如JavaScript、SPESC、ASP、JSP、PHP、Perl语言,从而指导计算机自动履行合同条款,也用于创建交互式表单。
本发明所述方法通过将交互数据的类型、约束、许可等限定信息引入到交换标记数据表EMD,允许客户作为合同当事人依据上述限定信息对交互数据进行确认、特指或限制;
本发明所述方法支持使用交换标记数据表EMD采用交互方式,生成基于用户定制的“合同实例”,进而实现智能合约程序的定制开发,从而支持客户与服务器间基于要约、承诺的合同协商、订立与执行,最终可实现一种高效、自动、可定制的智能合约生成方法与***。
附图说明
图1为本发明实施例中基于合同文本标记语言的法律合同交互式标注方法示意图;
图2为本发明实施例中合同文本标记语言中元素关系图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
相反,本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本发明有更好的了解,在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。
本实施例中将以一个简单的房屋买卖合同为例子,演示如何使用合同文本标记语言实现法律合同标记及其效果,进而实现智能合约生成方法,即从法律合同文本→合同文本标记语言CTML标注的法律合同文本→交换标记数据表→由被标注法律合同文本生成的智能法律合约程序。
在本实施例中,对一个法律合同文本进行标记,并抽取对应的交换标记数据表,翻译为对应的智能法律合约:合约当事人买卖双方对房屋进行购买交易,具体合同内容、标记结果、交换标记数据表和智能法律合约将在后面进行逐个介绍。
一、法律合同文本
房屋买卖合同
卖方:__________________(以下简称甲方)
买方:___________________(以下简称乙方)
一)、为房屋买卖有关事宜,经双方协商,订合同如下:甲方自愿下列房屋卖给乙方所有:
1.房屋状况:(请按《房屋所有权证》填写)
房屋坐落 幢号 室号 套(间)数 建筑结构 总层数 建筑面积(平方) 用途
2.该房屋的土地使用权取得方式“√”:出让()划拨()
二)、甲乙双方商定成交价格为人民币________元,(大写)_____佰_____拾_____万_____仟_____佰_____拾元整。
乙方在__________年_____月_____日前分_____次付清,付款方式:
三)、甲方在__________年_____月_____日将上述房屋交付给乙方。该房屋占用范围内土地使用权同时转让。
四)、若乙方未能够按期付款,则按规定给甲方5%滞纳金,滞纳金根据合同法规定予以得出。
五)、本合同经双方签章并经嘉兴市房地产交易管理所审查鉴定后生效,并对双方都具有约束力,应严格履行。如有违约,违约方愿承担违约责任,并赔偿损失,支付违约费用。
六)、双方愿按国家规定交纳税、费及办理有关手续。未尽事宜,双方愿按国家有关规定办理。如发生争议,双方协商解决;协商不成的,双方愿向(___________)仲裁委员会申请仲裁。
七)、本合同一式四份,甲、乙双方及税务部门各一份,房管部门一份。
八)、双方约定的其它事项:___________________________________
甲方(签名或盖章)_______________
签订日期:___________年____月____日
乙方(签名或盖章)_______________
签订日期:___________年____月____日
二、合同文本标记语言CTML标注说明
1)标题:房屋买卖合同,声明标识为printerDeal,定义如下:
<<factor title@printerDeal>>房屋买卖合同<</factor>>
2)当事人:包括买方和卖方
买卖双方在合同文本开头即可使用当事人要素party对其进行声明,由于需要在范例中填入姓名,需以数源标记进行占位,对应标记结果如下:
<<factor party@Seller>>卖方:<{Seller@name%String}>(以下简称甲方)<</factor>>
<<factor party@Buyer>>买方:<{Buyer@name%String}>(以下简称乙方)<<factor>>
3)标的:一栋房屋
其房屋资产属性信息包括“房屋坐落”、“幢号”、“室号”、“套(间)数”、“建筑结构”、“总层数”、“建筑面积(平方)”和“用途”,在范例中将其分别定义为资产属性信息info下的特性,使用域标记进行标识。由于上述信息需要合约当事人进行填入,故均需要使用数源标记进行占位。对应标记结果如下:
其房屋权属信息包括房屋的土地使用权,同时合约当事人需要对土地使用权取得方式进行“出让”或“划拨”选择,选择结果将以变量的形式进行获取,标记结果如下:
在上述资产标记中,房屋资产属性信息info和房屋权属信息right均以嵌套形式标记在资产要素asset内,表示了对房屋资产House的所有标记。
4)合约条款:
(1)一般条款标注:以现实合同条款二为例
首先使用一般条款要素对整个条款进行标记。“在……日前”指对该条款前置条件的限制,包括时间方向介词为之前和基准时间,基准时间的数值确定需要使用数源标记用于双方当事人交互,并使用域标记对其进行声明。同时,现实合同希望当事人填写周期次数,作为执行动作的参数,故标记结果如下:
该条款的行为动作为“付清”,对应条款当事人为“乙方”,从语义判断条款涉及的权利义务为应当限制。同时,现实合同需要当事人规定付款方式,以数源标记进行占位,故对应标记结果如下:
<<property action@afford#duty=must#party=Buyer>>付清<</property>>,
付款方式:<{term1@paymentMethod}>
<</factor>>
该一般条款的前置条件与行为动作属性均以嵌套方式标记在要素genTerm中。
在该条款中,动作“付清”涉及到资产操作,在其所在伴随条件的陈述与该条款其他元素的陈述位置不同,故需要以上级标注方法对该条款的伴随动作进行标记。位置为“二、甲乙双方商定成交价格为人民币________元,(大写)_____佰_____拾_____万_____仟_____佰_____拾元整。”通过一般条款陈述可知该资产操作为转移,目标对象为甲方,所涉及资产为人民币,具体金额需要双方当事人进行协商,故以数源标记进行占位,下设大写金额语义与上述数源标记所指示元素意义相同,在合同文本标记语言CTML中不予以区分,统一用数源标记进行代替,故标记结果如下:
(2)违约条款标注:以现实合同条款五为例
首先,使用违约条款要素对整个条款进行标记。“未能够按期付款”指针对现实合同条款二(term1),标记结果如下:
在上述违约条款标记中,条款属性均以嵌套形式标记在违约条款要素breTerm内,表示了对违约条款term3的所有标记。
(3)仲裁条款标注:
在现实合同中,需要合同当事人规定某仲裁委员会作为仲裁机构,在标记中以数源标记对当事人输入处进行占位,条款未对何种争论进行限制,在标记中可进行缺省,标记结果如下:
5)附加信息:
在该合同中,需要对其在法律合同条款五中出现的“滞纳金”进行附加信息声明,标记结果如下:
6)合同订立:
合同订立需要对合同中出现的双方当事人约定订立进行标记,同时需要对当事人签名位置进行标记,签名处通过数源标记占位,以备之后的数据表提取,对应的标记结果如下:
三、合同文本标记语言CTML标注的法律合同文本
对现实合同的完整标记结果如下所示:
四、交换标记数据表EMD
合同文本标记语言CTML所撰写的合同范例包括文档类型说明、文档内容两部分,其中,文档内容指按照前述层级标注方法标注的合同文本,文档类型说明包含语言类型、具体文档类型、对应的交换标记数据表EMD。
具体示例如下:
JSON格式表示的交换标记数据表EMD采用层级结构对原法律合同中每一数源标记进行描述。
示例如下:
根据合同文本标记语言CTML标注后的文本合同,抽取其中用户待填写的交互变量,生成格式化的交互标注数据表EMD。在本实施例中,使用Json格式化形式标注各个交互变量的层级结构及相应参量约束,具体规则如下:
单个变量采用“‘索引’:{参量键:参量值}”的形式,以其唯一标识为索引,对象标志{}中包含上述对其定义的多个参量键值对,使用“,”进行分割。变量的层级结构使用多层索引形式表示,父级采用该层唯一标识为索引,且可嵌套,子层若为单个变量,则放入对象标志{}中;若为多个同级变量,将其置于数组标志[]中,并使用“,”分割。
1)卖方当事人需填写的姓名数源标记为<{Seller@name%String}>,此变量在合约签订前必须填写,签订过程中可以修改,但之后不可修改,且必须由卖方当事人填写,综上,使用交换标记数据表EMD规则表示为:
2)房屋资产中有多个变量需要进行交互,抽取房屋属性中房屋坐落、幢号,权属中使用权为例进行转化,其合同文本标记语言CTML表示形式如下:
其中,交互变量为同属于法律要素House下的三个变量,包括需要在签订前便确定下来的属性值<{House@location}>、<{House@blockNumber}>以及特征值为单选的accessMethod,对应数源标记为<{@accessMethod%Right#singleOption={transferred}}>、<{@accessMethod%Right#singleOption={allocation}}>,在交互标注数据表EMD中表示如下:
■如果value等于transferred,则意味着出让为真(选中状态),划拨为假;
■如果value等于allocation,则意味着出让为假,划拨为真(选中状态)。
3)在条款2中,交付截止日期为<{term2@houseDeadline%Date}>,此变量在合约签订前可以填写,签订过程中必须填写,但之后不可修改。综上,使用交换标记数据表EMD规则表示为:
对于文档中的其他交互变量,如以上规则需要逐一进行表示,合并形成交换标记数据表EMD。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种基于合同文本标记语言的法律合同交互式标注方法,其特征在于,所述方法包括:
1)用户选取法律合同文本中法律构成要素factor,以交互方式提示用户对所选法律构成要素factor的法律属性property、法律成分component及特征attribute进行指定或修订,提取用户选取的法律合同文本中法律要素意思解释;
2)建立合同文本标记语言CTML,将所述法律要素意思解释生成合同文本标记语言CTML表达的标记,按照标记类型,所述合同文本标记语言CTML包括语义标记和数源标记;
所述语义标记也称为可嵌套标记或复杂标记,用于对文档中法律构成要素、法律属性、法律成分进行标注;
所述数源标记,用于对文档中基本且不可分割词汇进行标识,所述基本且不可分割词汇被称为交互数据exchangedData,用于合约当事人进行宣称、填入或选择,可以在文档中任何地方使用数源标记;
所述语义标记采用层级语义标注方法,所述层级语义标注包括法律要素标注LFM、法律属性标注LPM、法律成分标注LCM以及辅助性标记,所述辅助性标记包括域标记;
3)添加所述语义标记和面向用户定制数据的数源标记到合同文本中,实现带有法律元素标记的合同文本生成。
2.根据权利要求1所述一种基于合同文本标记语言的法律合同交互式标注方法,其特征在于,所述方法还包括步骤4):构造交换标记数据表EMD,即采用可交换的表式结构提取、记录和设置合同文本标记语言CTML中已标注交互数据必要属性,并通过设定必要属性对合同文本中用户可定制数据进行约束与限定,实现合同语义与用户数据分离,为当事人之间的合同协商与执行的数据交互提供基础。
3.根据权利要求1所述一种基于合同文本标记语言的法律合同交互式标注方法,其特征在于,步骤2)中,所述法律要素标注LFM属于一级标注功能,用于为法律规定的合同法律构成要素提供提取、识别和要素形式化表示factorExpression,标注过程描述如下:
用户选择需标注法律构成要素factor的文本并指定该文本所属要素类别factorSet后,服务器生成该法律构成要素factor的要素标识factorID反馈给用户使用或修订;
服务器提示用户从所述需标注法律构成要素factor的文本中选择或输入所述需标注要素所具有的特征attribute及特征值value;
服务器将文本所属要素类别factorSet、要素标识factorID特征attribute及特征值value按照要素形式化表示factorExpression添加到所选择标注要素文本的外侧,实现法律要素的形式化表达和意思表示的规范化;
其中,所述要素类别factorSet包括:标题title、当事人party、资产asset、条款term、合同订立conclusion、附加信息addition;所述当事人分为个体当事人party、群体当事人group,所述条款分为一般条款genTerm、违约条款breTerm、仲裁条款arbiTerm。
4.根据权利要求1所述一种基于合同文本标记语言的法律合同交互式标注方法,其特征在于,步骤2)中,所述法律属性标注LPM属于二级标注功能,用于对法律构成要素factor下的法律属性property进行提取、识别和法律属性形式化表示propertyExpression,标注过程如下:
用户通过在所述法律要素标注LFM标注后的具有要素标识factorID的文本中选择需标注法律属性property的文本并指定该文本所属属性类别propertySet后,服务器生成该法律属性property的属性标识propertyID反馈给用户使用或修订;
服务器提示用户从文本中选择或输入所述需标注法律属性property所具有的特征attribute及其特征值value;
服务器将文本所属要素标识factorID、属性类别propertySet、属性标识propertyID、特征attribute及其特征值value按照法律属性形式化表示propertyExpression添加到所选标注属性文本的外侧;
其中,所述属性类别propertySet包括:信息info、权属right、行为action、前置条件preCondition、伴随条件adjCondition、后置条件postCondition、违反against、争议controversy、机构institution、签名signature。
5.根据权利要求1所述一种基于合同文本标记语言的法律合同交互式标注方法,其特征在于,步骤2)中,所述法律成分标注LCM属于三级标注功能,用于对目标法律构成要素、法律属性及法律成分下的法律成分提供嵌套式提取与识别功能并形成法律成分形式化表示componentExpression;标注过程如下:
用户选择在法律属性标注LPM标注后的具有属性标识propertyID的文本中选择需标注法律成分component的文本后,服务器将法律成分所属成分标注方法的类别反馈给用户并提示用户从中选择或输入所需标注法律成分component中应标注的特征attribute及特征值value;法律成分所属成分标注方法的可选类别包括时间表示标注功能、资产操作标注功能、资产表示标注功能;
服务器将文本所属法律成分component、特征attribute及其特征值value按照法律成分形式化表示componentExpression添加到所选标注属性文本的外侧。
6.根据权利要求1所述一种基于合同文本标记语言的法律合同交互式标注方法,其特征在于,步骤2)中,所述域标记属于辅助性标注功能,用于对描述法律构成要素或法律属性下所拥有的特性field及特征值value提供提取与识别功能,并形成域信息形式化表示fieldExpression;标注过程如下:
用户通过在所述法律要素标注LFM标注后具有要素标识factorID的文本或在所述法律属性标注LPM标注后具有属性标识propertyID的文本中选择需标注域信息的文本,服务器生成该需标注域信息的域标识fieldID反馈给用户使用或修订;
服务器提示用户选择或输入所述需标注域信息所应标注的特性的类型type、域值quantity及域值取值value、特性所属的要素标识factorID及属性类别propertySet;再将所述需标注域信息所应标注的特性的类型type、域值quantity及域值取值value、特性所属的要素标识factorID及属性类别propertySet按照域信息形式化表示fieldExpression添加到所选标注文本的外侧。
7.根据权利要求1或5所述一种基于合同文本标记语言的法律合同交互式标注方法,其特征在于,所述法律成分标注LCM包括时间表示、资产操作和资产表示的标注功能;
时间表示标注功能,是指对合同中时间信息提供提取和表示的能力,分为行为时间actionTime、时间谓词timePredicate、边界谓词rangePredicate三种标注功能;
资产操作标注功能,是指对合同中实现标的物在不同当事人之间的转移动作提供提取和表示的能力,分为存入动作deposit、取回动作withdraw、转移动作transfer三种标注功能;
资产表示标注功能,是指对合同中资产操作所涉及的资产信息提供提取和表示的能力。
8.根据权利要求7所述一种基于合同文本标记语言的法律合同交互式标注方法,其特征在于,
行为时间actionTime标注流程包括:用户在前置条件preCondition和后置条件postCondition标注的文本中选择当事人party完成目标动作action的行为时间表达文本,并将其嵌入到该前置条件preCondition和后置条件postCondition标注的文本中,服务器提示用户从行为时间表达文本中选择或输入应标注的目标动作action和执行动作当事人party,服务器反馈该用户时间限制limit的选择提示,服务器收到执行目标动作action的当事人和时间冠词后,将用户指定的目标动作action、执行动作当事人party、时间限制limit按照行为时间表示actionTimeExpression添加到所述行为时间表达文本的外侧;
时间谓词timePredicate标注流程包括:用户采用嵌套方式在前置条件preCondition和后置条件postCondition标注文本中选择表示目标时间与基准时间之间关系的时间谓词表达文本,服务器提示用户从时间谓词表达式文本中选择或输入应标注的基准时间baseTime、时间方向介词prep、目标时间targetTime、判断词judge,并将用户指定的基准时间baseTime、时间方向介词prep、目标时间targetTime、判断词judge按照时间谓词表示timePredicateExpression添加到所述时间谓词表达文本的外侧;
边界谓词rangePredicate标注流程包括:用户采用嵌套方式在前置条件preCondition和后置条件postCondition标注文本中选择表示基准时间前后设定范围的边界谓词表达文本,服务器提示用户从边界谓词表达式文本中选择或输入应标注的基准时间baseTime、时间方向介词prep、边界判定词within、时间范围boundary,并将用户指定的基准时间baseTime、时间方向介词prep、边界判定词within、时间范围boundary按照边界谓词表示rangePredicateExpression添加到所述边界谓词表达文本的外侧;
存入动作deposit标注流程包括:用户采用嵌套方式在伴随条件adjCondition标注文本中选择当事人主动存入资产的存入行为表达文本,服务器调用资产表示标注功能生成存入资产的资产表达式AssetExpression,再提示用户从所述存入行为表达文本中选择或输入应标注的价值要求condition,并将用户指定的资产表达式AssetExpression和标注的价值要求condition按照存入动作表示depositExpression添加到所选存入行为表达文本的外侧;
取回动作withdraw标注流程包括:用户采用嵌套方式在伴随条件adjCondition标注文本中选择当事人取回资产的取回行为表达文本,服务器调用资产表示标注功能生成取回资产的资产表达式AssetExpression,并将用户指定的资产表达式AssetExpression按照取回动作表示withdrawExpression添加到所选取回行为表达文本的外侧;
转移动作transfer标注流程包括:用户采用嵌套方式在伴随条件adjCondition标注文本中选择向目标当事人转移资产的转移行为表达文本,服务器调用资产表示标注功能生成转移资产的资产表达式AssetExpression,再提示用户从转移行为表达文本中选择或输入应标注的目标当事人target,并将用户指定的资产表达式AssetExpression和目标当事人target按照转移动作表示transferExpression添加到所选转移行为表达文本的外侧;
资产表示标注功能的标注流程包括:用户采用嵌套方式在资产操作标注功能中的行为表达文本中选择资产操作所涉及的资产信息的表达文本,服务器提示用户选择或输入应标注的资产标识assetID、被转移资产的权属类型assetRight、转移资产数量amount;并将用户指定的资产标识assetID、权属类型assetRight、转移资产数量amount按照资产表达式assetExpression添加到所选表达文本的外侧,其中,可供选择的权属类型assetRight包括所有权ownershipRight、使用权useRight、占有权possessRight、收益权usufructRight、处分权disposeRight。
9.根据权利要求2所述一种基于合同文本标记语言CTML的法律合同交互式标注方法,其特征在于,构造交换标记数据表EMD,是指从合同文本标记语言CTML标注合同文本中按照结构化表格形式提取和记录数源标记metadataExpression及数源标记特征信息的用户交互过程,包括数源标记生成和交换标记数据表EMD生成两个过程:
数源标记metadataExpression生成过程是指:用户选择需标注交互数据在文本中位置或选择需标注交互数据所在文本,并指定该交互数据所属类型type;服务器生成包含文本所在要素的要素标识factorID的交互数据标识exchangedDataID反馈给用户使用或修订,然后根据交互数据所属类型type提示用户选择、确认和设定该交互数据exchangedData的选择方式option,并将用户指定的交互数据标识exchangedDataID、交互数据所属类型type、选择方式option按照数源标记metadataExpression填入到用户指定位置或替代所选需标注交互数据所在的文本;
交换标记数据表EMD生成过程是指:采用遍历方式从已标注的合同文本中逐个提取数源标记,对每一个数源标记在交换标记数据表EMD中生成一个以该数源标记中交互数据标识exchangedDataID命名的记录,提示用户通过选择或编辑方式对记录中的交互数据必要属性进行确认、特指或限制,并将用户指定的交互数据必要属性写入到交换标记数据表EMD对应记录中;可供选择的交互数据必要属性包括:使用方法usage、来源标识ctmlID、法律合同文本转化为目标智能合约后的目标转化合约对应标识targetID、类型type、确值条件condition、交互过程中填写的交互数据值value。
10.根据权利要求9所述一种基于合同文本标记语言的法律合同交互式标注方法,其特征在于,所述数源标记必要属性中:
使用方法usage属性用于对交互数据的操作状态进行约束,约束的限定时段分为合约签订前、合约签订中、合约签订后三个阶段,每一阶段使用状态权限分为可读、可写两类,对可写权限的约束分为必须填写、可选填写两种;
确值条件condition用于对交互数据的值域范围限定、填写人约束条件进行约束,其中,若数源标记中含单选singleOption特征,则表明相应交互数据为单选项,并记录取值范围;若含多选multiOption特征,则表明相应交互数据为多选项,同时记录取值范围;若相应交互数据需由指定当事人填写,则记录相应当事人标识partyID;
对应标识targetID是指目标合约中所使用的变量名,其中,目标合约是指由被标注合约所转化的高级智能合约或智能合约。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110162638.5A CN112883687B (zh) | 2021-02-05 | 2021-02-05 | 一种基于合同文本标记语言的法律合同交互式标注方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110162638.5A CN112883687B (zh) | 2021-02-05 | 2021-02-05 | 一种基于合同文本标记语言的法律合同交互式标注方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112883687A true CN112883687A (zh) | 2021-06-01 |
CN112883687B CN112883687B (zh) | 2022-03-15 |
Family
ID=76055875
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110162638.5A Active CN112883687B (zh) | 2021-02-05 | 2021-02-05 | 一种基于合同文本标记语言的法律合同交互式标注方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112883687B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113255306A (zh) * | 2021-07-07 | 2021-08-13 | 明品云(北京)数据科技有限公司 | 保险合同辅助解读方法、***、电子设备及介质 |
CN113761044A (zh) * | 2021-08-30 | 2021-12-07 | 上海快确信息科技有限公司 | 一种将文本标注成表格的标注***方法 |
CN113761044B (zh) * | 2021-08-30 | 2024-08-02 | 北京快确信息科技有限公司 | 一种将文本标注成表格的标注***方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1659559A (zh) * | 2002-04-29 | 2005-08-24 | 康坦夹德控股股份有限公司 | 用于规定和处理合法表达的***和方法 |
CN103136317A (zh) * | 2011-11-29 | 2013-06-05 | 北京建龙重工集团有限公司 | 工程管理***工程合同在线审批信息化实现方法 |
US20180365201A1 (en) * | 2017-06-14 | 2018-12-20 | Clause, Inc. | System and method for compound data-driven contracts and documentation |
CN109801192A (zh) * | 2018-12-15 | 2019-05-24 | 深圳壹账通智能科技有限公司 | 电子合同签订方法、装置、计算机设备及存储介质 |
CN110020414A (zh) * | 2018-01-08 | 2019-07-16 | 优信拍(北京)信息科技有限公司 | 一种电子合同文本生成方法、*** |
CN110020424A (zh) * | 2019-01-04 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 合同信息的提取方法、装置和文本信息的提取方法 |
CN110688847A (zh) * | 2019-08-23 | 2020-01-14 | 上海市研发公共服务平台管理中心 | 技术合同判定方法、装置、计算机设备和存储介质 |
JP2020060811A (ja) * | 2018-10-04 | 2020-04-16 | Tis株式会社 | 情報処理装置、情報処理方法およびプログラム |
CN111417950A (zh) * | 2017-08-29 | 2020-07-14 | 雷克斯股份有限公司 | 用于提供自动文档填写功能的***和方法 |
TW202036439A (zh) * | 2019-03-19 | 2020-10-01 | 彰化商業銀行股份有限公司 | 基於區塊鏈的跨行交易失敗通知系統及其方法 |
CN111752574A (zh) * | 2020-05-08 | 2020-10-09 | 北京科技大学 | 一种法律合约的智能可执行合约构造与执行方法和*** |
-
2021
- 2021-02-05 CN CN202110162638.5A patent/CN112883687B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1659559A (zh) * | 2002-04-29 | 2005-08-24 | 康坦夹德控股股份有限公司 | 用于规定和处理合法表达的***和方法 |
CN103136317A (zh) * | 2011-11-29 | 2013-06-05 | 北京建龙重工集团有限公司 | 工程管理***工程合同在线审批信息化实现方法 |
US20180365201A1 (en) * | 2017-06-14 | 2018-12-20 | Clause, Inc. | System and method for compound data-driven contracts and documentation |
CN111417950A (zh) * | 2017-08-29 | 2020-07-14 | 雷克斯股份有限公司 | 用于提供自动文档填写功能的***和方法 |
CN110020414A (zh) * | 2018-01-08 | 2019-07-16 | 优信拍(北京)信息科技有限公司 | 一种电子合同文本生成方法、*** |
JP2020060811A (ja) * | 2018-10-04 | 2020-04-16 | Tis株式会社 | 情報処理装置、情報処理方法およびプログラム |
CN109801192A (zh) * | 2018-12-15 | 2019-05-24 | 深圳壹账通智能科技有限公司 | 电子合同签订方法、装置、计算机设备及存储介质 |
CN110020424A (zh) * | 2019-01-04 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 合同信息的提取方法、装置和文本信息的提取方法 |
TW202036439A (zh) * | 2019-03-19 | 2020-10-01 | 彰化商業銀行股份有限公司 | 基於區塊鏈的跨行交易失敗通知系統及其方法 |
CN110688847A (zh) * | 2019-08-23 | 2020-01-14 | 上海市研发公共服务平台管理中心 | 技术合同判定方法、装置、计算机设备和存储介质 |
CN111752574A (zh) * | 2020-05-08 | 2020-10-09 | 北京科技大学 | 一种法律合约的智能可执行合约构造与执行方法和*** |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113255306A (zh) * | 2021-07-07 | 2021-08-13 | 明品云(北京)数据科技有限公司 | 保险合同辅助解读方法、***、电子设备及介质 |
CN113255306B (zh) * | 2021-07-07 | 2021-11-19 | 明品云(北京)数据科技有限公司 | 保险合同辅助解读方法、***、电子设备及介质 |
CN113761044A (zh) * | 2021-08-30 | 2021-12-07 | 上海快确信息科技有限公司 | 一种将文本标注成表格的标注***方法 |
CN113761044B (zh) * | 2021-08-30 | 2024-08-02 | 北京快确信息科技有限公司 | 一种将文本标注成表格的标注***方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112883687B (zh) | 2022-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Prasad et al. | The Penn Discourse Treebank: An annotated corpus of discourse relations | |
Thornton et al. | Using shape expressions (ShEx) to share RDF data models and to guide curation with rigorous validation | |
Chitchyan et al. | Semantics-based composition for aspect-oriented requirements engineering | |
US9405532B1 (en) | Integrated cloud platform translation system | |
US20090063427A1 (en) | Communications System and Method | |
Hazard et al. | Wise contracts: smart contracts that work for people and machines | |
AU2016266031A1 (en) | Automated rules-based rights resolution | |
US20030046093A1 (en) | Rights management | |
JP2007157144A (ja) | データ要素のモデル化 | |
US10216733B2 (en) | Smart commenting software | |
Steen et al. | ODP enterprise viewpoint specification | |
EP3759656A1 (en) | System and method for a thing machine to perform models | |
Roegiest et al. | A dataset and an examination of identifying passages for due diligence | |
CN112883687B (zh) | 一种基于合同文本标记语言的法律合同交互式标注方法 | |
Candaş et al. | Automated identification of vagueness in the FIDIC Silver Book conditions of contract | |
Funaki et al. | A contract corpus for recognizing rights and obligations | |
CN113448592B (zh) | 一种基于合同文本标记语言的智能法律合约生成方法 | |
Gerber et al. | The conceptual framework for financial reporting as a domain ontology | |
An et al. | Translation strategy of legal terms with Chinese characteristics in Civil Code of the People’s Republic of China based on Skopos theory | |
Loddo et al. | Intersemiotic translation of contracts into digital environments | |
Hassan et al. | Automated approach for digitalizing scope of work requirements to support contract management | |
Qamar et al. | Unambiguous data modeling to ensure higher accuracy term binding to clinical terminologies | |
CN110796573A (zh) | 知识产权生命周期管理方法、***及存储介质 | |
Molina et al. | An MDE modeling framework for measurable goal‐oriented requirements | |
Zhou et al. | Auto-generation of class diagram from free-text functional specifications and domain ontology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |