CN112733517A - 需求模板符合性检查的方法、电子设备及存储介质 - Google Patents
需求模板符合性检查的方法、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112733517A CN112733517A CN202110038835.6A CN202110038835A CN112733517A CN 112733517 A CN112733517 A CN 112733517A CN 202110038835 A CN202110038835 A CN 202110038835A CN 112733517 A CN112733517 A CN 112733517A
- Authority
- CN
- China
- Prior art keywords
- template
- dependency
- requirement
- structure information
- entry
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本发明实施例涉及需求工程领域,公开了一种需求模板符合性检查的方法、电子设备及存储介质。本发明中需求模板符合性检查的方法,包括:获取需求语句的依存结构信息,所述依存结构信息包括所述需求语句中各词条的属性信息以及各所述词条之间语法依赖关系;比较所述依存结构信息与预设的需求模板中的依存模板结构信息,获取比较结果;将所述比较结果作为对所述需求语句进行需求模板符合性检查的检查结果。采用本实施例,使得可以准确地对需求文档进行需求模板符合性的检查,提高需求文档的质量。
Description
技术领域
本发明实施例涉及需求工程领域,特别涉及一种需求模板符合性检查的方法、电子设备及存储介质。
背景技术
自然语言是定义需求的普遍方式,自然语言一般易于理解,适用于任何领域的需求描述。但是,自然语言很容易造成歧义,影响需求双方的理解。在需求工程中引入需求模板,对需求文档进行需求模板符合性检查,可以减少自然语言中的歧义。需求模板是一种预定义的语言模式,定义了自然语言需求的格式,比如Rupp模板包括以下部分:(1)起始条件;(2)***名称;(3)情态动词;(4)***功能;(5)对象;(6)对象的详细信息。完全符合需求模板的需求文档可以被正常使用,因此对需求文档进行需求模板的符合性检查是一项重要的工作,有助于提高需求质量。而采用人工对需求文档进行需求模板的符合性检查十分耗费时间和人力,因此,自动对需求文件进行需求模板的符合性检查是十分必要的。
然而,目前对需求文档进行需求模板的符合性检查的自动化检测工具对需求文档的检查不准确。
发明内容
本发明实施方式的目的在于提供一种需求模板符合性检查的方法、电子设备及存储介质,使得可以准确地对需求文档进行需求模板符合性的检查,提高需求文档的质量。
为解决上述技术问题,本发明的实施方式提供了一种需求模板符合性检查的方法,包括:
本发明的实施方式还提供了一种需求模板符合性检查的方法,包括:获取需求语句的依存结构信息,所述依存结构信息包括所述需求语句中各词条的属性信息以及各所述词条之间语法依赖关系;比较所述依存结构信息与预设的需求模板中的依存模板结构信息,获取比较结果;将所述比较结果作为对所述需求语句进行需求模板符合性检查的检查结果。
本发明的实施方式还提供了一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的需求模板符合性检查的方法。
本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现上述的需求模板符合性检查的方法。
本申请实施例中,获取需求语句的依存结构信息,依存结构信息包括需求语句中各词条之间语法依赖关系,将依存结构信息和需求模板中的依存模板结构信息进行比较,获取比较结果作为对需求语句进行需求模板符合性检查的检查结果,由于无需依赖术语表对需求语句进行需求模板符合性的检查,使得不会因术语表不完整或不准确而导致对需求模板符合性检查不准确的问题,同时,由于依存结构信息包括各个词条之间形成的语法依赖关系和词条的属性信息,通过词条信息和语法依赖关系两个方面进行需求模板符合性检查,增加了检查的维度,提升了检查的准确度。
另外,在所述比较所述依存结构信息与预设的需求模板中的依存模板结构信息之前,所述方法还包括:根据所述依存模板结构信息对所述依存结构信息进行修正,获得修正后的依存结构信息。由于对依存结构信息进行了修正,使得该依存结构信息更加准确,通过修正后的依存结构信息进行需求模板符合性检查,提高了对需求文档进行需求模板符合性检查的准确性。
另外,根据所述依存模板结构信息对所述依存结构信息进行修正,获得修正后的依存结构信息,包括:获取所述依存模板结构信息中指定词槽对应的模板词条;从所述需求语句中查找到与所述模板词条对应的所述词条后,判断查找到的所述词条的属性信息与所述模板词条的属性信息是否相异,若是,则将所述词条的属性信息变更为所述模板词条的属性信息。在对词条进行词性标注时存在误差,根据指定词槽对应的模板词条对查找到词条进行修正,减少词性标注的误差,提高对词性标注的准确性。
另外,根据所述依存模板结构信息对所述依存结构信息进行修正,获得修正后的依存结构信息,包括:获取所述依存模板结构信息中指定的所述模板语法依赖关系;根据所述指定的模板语法依赖关系,在所述需求语句中的指定位置添加指定词条,并重新进行依存分析,生成新的所述依存结构信息。根据指定的模板语法依赖关系,在需求语句中添加指定词条,重新进行依存分析,减少依存分析的发送错误的情况,从而提高依存结构信息的准确性。
另外,获取需求文档;对所述需求文档进行分词处理,获得所述需求文档中各词条;对所述需求文档进行句子分割处理,获得所述需求文档中各所述需求语句;对所述词条进行词性标注作为所述词条的属性信息;根据所述词性标注和所述词条,对所述需求语句进行依存分析,生成所述需求语句中各个词条之间的模板语法依赖关系作为所述语法依赖关系。通过对需求文件进行处理,每个步骤中的结果作为下一个步骤的输入数据,可以形成自然语言处理管道,提高获取依存结构信息的速度和效率。
另外,所述方法还包括:获取预设的需求类别的模板语法格式信息;从所述模板语法格式信息中选取关键词槽,获取所述关键词槽之间的模板语法依赖关系以及所述关键词槽的属性信息作为所述依存模板结构信息。需求模板是基于需求类别确定,使得在不同情形下有不同需求模板,进而提高需求文档的质量。
另外,在比较所述依存结构信息与预设的需求模板中的依存模板结构信息,获取比较结果之前,所述方法还包括:获取所述需求语句中各词条的属性信息;根据所述词条的属性信息,判断是否存在情态动词,若是存在,则确定执行比较所述依存结构信息与预设的需求模板中的依存模板结构信息的步骤。在进行依存结构信息的比对之前,进行情态动词的判断,可以预先筛除不满足需求模板的需求语句,减少待检测需求语句的数量,提高对需求语句进行需求模板符合性检查的速度。
另外,在比较所述依存结构信息与预设的需求模板中的依存模板结构信息,获取比较结果之前,所述方法还包括:获取所述需求语句中各词条的属性信息;判断是否存在属于所述需求模板中指定的正常词条,若是存在,则确定执行比较所述依存结构信息与预设的需求模板中的依存模板结构信息的步骤。可以预先筛除不满足需求模板的需求语句,减少待检测需求语句的数量,提高对需求语句进行需求模板符合性检查的速度。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是根据本发明第一实施例提供的一种需求模板符合性检查的方法的流程图;
图2是根据本发明第二实施例提供的一种需求模板符合性检查的方法的流程图;
图3是根据本发明第二实施例提供的RUPP模板的语法格式示意图;
图4是根据本发明第二实施例提供的RUPP模板的语法格式信息示意图;
图5是根据本发明第二实施例提供的EARS模板的语法格式示意图;
图6是根据本发明第二实施例提供的EARS模板的语法格式信息示意图;
图7是根据本发明第三实施例提供的一种需求模板符合性检查的方法的流程图;
图8是根据本发明第三实施例提供的修正处理后该需求模板符合性检查的方法的实验结果示意图;
图9是根据本发明第三实施例提供的未修正处理后该需求模板符合性检查的方法的实验结果示意图;
图10是根据本发明第四实施例提供的一种电子设备的框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
以下各个实施例的划分是为了描述方便,不应对本发明的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。
发明人发现,将自然语言处理技术应用于需求模板符合检查中,可以帮助从业者从繁重的需求检查中解脱出来。自然语言处理的基本技术,如Tokenizer,SentenceSplitter,POS Tagger等,通过已经训练好的模型来对需求语句进行需求模板符合检查。
RQA工具提供了对模板的正确使用的验证功能。但是该工具依赖于需求的术语表,在需求不再变动时才开始构建术语表,在需求迭代变更时,维护数据表将会浪费大量成本,同时术语表在需求的整个开发过程中都是不完整的,因此,依赖于需求的术语表的自动化检测工具对于迭代过程中的需求文档的检测的作用不大。
另一种自动化检测工具是以文本分块和模式匹配技术实现需求模板符合性检查。在术语表缺失的情况下,对于Rupp模板的符合性检查起到了不错的结果。但是,对词性标注过程中容易出现错误而导致需求模板的符合性检查的不准确的问题。
本发明的第一实施方式涉及一种需求模板符合性检查的方法。应用于电子设备,其流程如图1所示:
步骤101:获取需求语句的依存结构信息,依存结构信息包括需求语句中各词条的属性信息以及各词条之间语法依赖关系。
步骤102:比较依存结构信息与预设的需求模板中的依存模板结构信息,获取比较结果。
步骤103:将比较结果作为对需求语句进行需求模板符合性检查的检查结果。
本申请实施例中,获取需求语句的依存结构信息,依存结构信息包括需求语句中各词条之间语法依赖关系,将依存结构信息和需求模板中的依存模板结构信息进行比较,获取比较结果作为对需求语句进行需求模板符合性检查的检查结果,由于无需依赖术语表对需求语句进行需求模板符合性的检查,使得不会因术语表不完整或不准确而导致对需求模板符合性检查不准确的问题,同时,由于依存结构信息包括各个词条之间形成的语法依赖关系和词条的属性信息,通过词条信息和语法依赖关系两个方面进行需求模板符合性检查,增加了检查的维度,提升了检查的准确度。
本发明的第二实施方式涉及一种需求模板符合性检查的方法。第二实施方式是对第一实施方式的详细介绍,其流程如图2所示。
步骤201:获取需求语句的依存结构信息,依存结构信息包括需求语句中各词条的属性信息以及各词条之间语法依赖关系。
在一个例子中,获取需求文档,对需求语句进行分词处理,获得需求文档中各词条;对需求文档进行句子分割处理,获得需求文档中各个需求语句;对词条进行词性标注作为词条的属性信息;根据词性标注和所述词条,对需求语句进行依存分析,生成需求语句中各个词条之间的模板语法依赖关系作为语法依赖关系。
具体地,需求文档通常为自然语言,可以通过自然语言处理技术对需求文档进行处理。为了快速对需求文档进行处理,可以构建自然语言处理管道,自然语言处理管道是一个多阶段的数据流***,其中一个组件的输出被作为另一个组件的输入。该自然语言处理管道的输入数据是需求文档,对该需求文档进行进行分词处理(tokenization),得到需求语句中各词条,得到的各词条记为T(t1,t2,t3,…,tn),对需求文档进行句子分割处理,得到多个需求语句,记为需求语句集合X(x1,x2,x3,…,xm),其中,x1……xm表示需求语句。分词处理是指按照特定需求,把需求语句切分成一个字符串序列,其中,该字符串序列中每个元素作为词条。词条包括需求语句中的符号和单词,符号如逗号、句号等。例如,需求语句:process A gets the data,经过tokenization处理后,该需求语句被划分为五部分,process——>A——>gets——>the——>data;每个部分有对应的token,如process的词条为t1,A的词条为t2,gets对应的词条为t3,the对应的词条为t4,data对应的词条为t5。在获得词条后,即可对每个词条进行词性标注,得到词性集合,记为P(p1,p2,p3,…,pn);词性标注(Pos Tagging)是自然语言处理的一项重要技术,它的任务是将标记化后的文本的每个token标注词性。在词性标注后,对需求语句进行依存分析,依存分析(DependencyParsing)是一项自然语言处理中的重要技术,依存分析是标记token之间的语法依赖关系,如标记某动词的主语是某名词。
在标注了词性之后,对需求语句进行依存分析可获取每个词条之间的语法依赖关系,记为集合R(r1_2,r2_3,r3_4,…,ri_j),ri_j表示ti与tj之间的依赖关系,ri_j表示为(ti,tj,relationx);依赖关系中为ti作为依赖关系中的核心项,tj为依赖关系中的从属项,relationx用于指示两个token之间的语法关系,从属项用于修饰核心项,例如,需求语句process Agets the data的词条分别为t1、t2、t3、t4和t5;t3的主语是t1(即A);即t1从属于t3;t3的宾语是t5,即t5从属于t3,可见,该t3不从属于其他的词条,经过该分析后确定语法结构为主谓宾结构,故t3为核心项,t1和t5为从属项;即该需求语句中存在t1从属于t3的依赖关系r3_1;以及存在t5从属于t3的依赖关系r3_5,其中,r3_5(t3,t5,obj),obj表示t3与t5之间的关系是宾语限定,即t3的宾语是t5。可以理解的是,在语法树中根节点与下一层的子节点组成依赖关系,根节点作为核心项,每一个子节点分别从属于该根节点,即在不同的依赖关系中,相同的单词可以为核心项也可以为从属项。
获得词条的词性信息作为该词条的属性信息,将该词条的属性信息和语法依赖关系作为该需求语句的依存结构信息。
需要说明的是,可以预先获取需求模板以及需求模板的依存模板结构信息,获取依存模板结构信息的过程如下:获取预设的需求类别的模板语法格式信息;从模板语法格式信息中选取关键词槽,获取关键词槽之间的模板语法依赖关系以及关键词槽的属性信息作为依存模板结构信息。
具体地,根据实际需要可以定义不同的需求类别,每个需求类别有各自对应的模板语法格式信息,例如,需求类别A的对应的模板语法格式信息可以采用RUPP模板的模板语法格式信息;RUPP模板的语法格式信息包括以下词槽:(1)起始条件;(2)***名称;(3)情态动词;(4)***功能;(5)对象;(6)对象的详细信息,RUPP模板的语法格式如图3中所示。可以根据该RUPP模板的语法格式信息,从该需求模板的语法格式信息中选取关键词槽,并获取关键词槽之间的模板语法依赖关系,例如,如图3所示,从左至右的第三个词槽和第四个词槽作为关键词槽,其中,可以根据图3中语法格式信息,可以将第四词槽作为语法树中的根节点,第四词槽的属性信息指示为***功能,第三词槽的属性信息为情态动词,即情态动词从属于***功能的动词,将该模板语法依赖关系以及关键词槽的属性信息作为依存模板结构信息。也可以如图3所示,将该语法格式信息中每个词槽均作为关键词槽,则可以生成如图4所示的模板语法依赖关系,该图4中设置根节点,根节点的名称为root_verb,该根节点可以是图3中的***功能的词槽;情态动词shall/will/should从属于根节点;图4中aux表示情态动词,advcl/advmod用于表示起始条件包括副词,虚线的连接表示该起始条件从属于根节点,nsubj表示名词主语,obl关系具有名词性功能,该功能可以被作为非核心参数或作为辅助语,即附加在动词,形容词或其他副词上的副词。图中虚线表示该关系可以去掉。
本示例中可以采用Stanford CoreNLP中提供的基于正则表达式的方式获取依存结构信息,将需求语句中词条token作为结点,构建各词条之间的语法依赖关系。例如,可以获取Rupp模板的依存模板结构信息和EARS模板的依存模板结构信息。Rupp模板和EARS模板各自的模板语法依赖关系可以如下描述:
Rupp:{$}=root:{pos:/VB.*/}=root_verb>nsubj{}>/.*obj/{}>aux{word:/shall|should|will/}:{}=root=={}=root_verb;
“{$}=root”表示根节点的名称为root,root与root_verb等同,{pos:/VB.*/}=root_verb>nsubj{}表示作为根的动词,该根的一个依赖关系的名称为nsubj,表示该根有个名词主语;“>aux{word:/shall|should|will/}”表示作为根的动词,该根的一个依赖关系的名称为aux,“aux”表示情态动词,即该根的从属项为情态动词,且情态动词为shall、should或will中任意一种。
EARS:{}>/nsubj.*/{}>aux{word:shall};表示主语为名词,且情态动词为shall的语法结构。还可以设定异常的语法结构,如主句的被动语态,从句出现在主句之后,其中,EARS模板的语法格式如图5所示。根据如图5所示的语法格式示信息,可以得到如图6所示的所示的EARS模板的模板语法依赖关系,其中,根节点的名称为root_verb,该根节点可以是图5中的***响应的词槽中提取;情态动词shall属于根节点;图6中aux表示情态动词,advcl/advmod用于表示起始条件包括副词,虚线的连接表示该起始条件从属于根节点,nsubj表示名词主语。
步骤202:获取需求语句中各词条的属性信息。
可以获取该需求语句中各词条的属性信息,词条的属性信息包括:该词条的词性信息,如该词条是名词、动词等信息。
步骤203:根据词条的属性信息,判断是否存在情态动词,若是存在,则确定执行步骤204,否则,执行步骤206,结束对该需求语句的需求模板符合性检查的流程。
具体地,不同需求类别的需求模板具有各自的语法格式信息,例如,若采用RUPP模板或EARS模板,可以获取该需求语句中各词条的属性信息,判断该需求语句中是否存在情态动词,若存在,则确定可以进一步执行步骤204,若不存在,表明该需求语句不符合需求模板,故可以结束对该需求语句的需求模板符合性检查的流程。
步骤204:比较依存结构信息与预设的需求模板中的依存模板结构信息,获取比较结果。
具体地,将获取的需求语句的依存结构信息与预设的依存模板结构信息进行比较,获取比较结果。语法依赖关系和各词条的属性信息可以形成语法树,模板语法依赖关系和各模板词条的属性信息可以形成模板语法树。依存结构信息与依存模板结构信息之间的比较,即为获取语法树与模板语法树之间相似度,可以采用语法树相似度计算的方式获取语法树与模板语法树之间的相似度,将该相似度作为比较结果。
步骤205:将比较结果作为对需求语句进行需求模板符合性检查的检查结果。
步骤206:结束对该需求语句的需求模板符合性检查的流程。
具体地,可以在结束流程之前,为该需求语句标记指示不符合模板的标记信息。并对下一个需求语句进行需求模板符合性检查,即返回执行步骤201。
需要说明的是,在另一个例子中,还可以在执行步骤204之前进行如下处理:
S11:获取需求语句中各词条的属性信息。
S12:判断是否存在属于需求模板中指定的正常词条,若是不存在,则确定执行步骤204。
具体地,指定的正常词条可以由人工预先设定,或者由电子设备根据语法格式信息进行设定,例如,如图3所示的RUPP模板的语法格式信息中,若第二词槽的正常词条包括:shall、should、will;第二词槽的异常词条可以为除shall、should、will之外的动词。若存在异常词条,则表明该需求语句不符合该RUPP模板,若不存在,则确定可以继续执行步骤204。本示例中,可以在步骤202之后依次执行步骤203、S12,也可以在步骤202之后依次执行S12、步骤203。
值得一提的是,预先判断该需求语句中是否存在情态动词和/或是否存在正常词条,可以实现对该需求语句进行初步检查,若该需求语句不存在情态动词或存在异常词条,则不符合需求模块;通过上述两种判断方式使得可以快速筛除不符合需求模板的需求语句,减少对需求语句进行需求模板符合性检查的步骤。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本发明第三实施方式涉及一种需求模板符合性检查的方法。本实施方式是对上述实施方式的进一步改进,本实施方式中在比较依存结构信息与预设的需求模板中的依存模板结构信息之前,根据依存模板结构信息对依存结构信息进行修正。其流程如图7所示。
步骤301:获取需求语句的依存结构信息,依存结构信息包括需求语句中各词条的属性信息以及各词条之间语法依赖关系。
步骤302:根据依存模板结构信息对依存结构信息进行修正,获得修正后的依存结构信息。
在一个例子中,获取依存模板结构信息中指定词槽对应的模板词条;从需求语句中查找到与模板词条对应的词条后,判断查找到的词条的属性信息与模板词条的属性信息是否相异,若是,则将词条的属性信息变更为模板词条的属性信息。
具体地,自然语言处理管道在对词条进行词性标注或进行依存分析的过程中存在误差,会导致出现错误的词性标注或者错误的依存分析。为了进一步提高需求语句的依存结构信息的准确性,可以预先对依存结构信息进行修正,提高后续获取的依存结构信息的准确性。
如图3所示的RUPP模板和如图5所示的EARS模板的语法格式信息示意图,可以确定该RUPP模板的依存模板结构信息以及EARS模板的依存模板结构信息,指定词槽对应的模板词条可以根据大数据预先获取,可以将错误概率大的词槽作为指定词槽,例如,指定词槽可以是RUPP模板中的情态动词之前的词槽或该情态动词之后的词槽,情态动词之前的词槽对应的模板词条的属性信息为名词,情态动词之后的词槽对应的模板词条的属性信息为动词。判断该依存结构信息中情态动词依赖的词条的属性信息是否为名词,若不是,则将查到的词条的属性信息更改为名词。若该依存结构信息中依赖于情态动词的词条的属性信息为名词,则将该词条的属性信息更改为动词。
值得一提的是,通过对词条的属性信息的修正,使得可以重新对该需求语句进行依存分析,以确保依存分析的准确性,即提高了依存结构信息的准确性。
在另一个例子中,获取依存模板结构信息中指定的模板语法依赖关系;根据指定的模板语法依赖关系,在需求语句中的指定位置添加指定词条,并重新进行依存分析,生成新的依存结构信息。
具体地,在依存分析时,为避免出现主语分析和宾语分析的错误,可以对需求语句进行进行修正,以提高主语分析和宾语分析的正确性。在英语语法中,出现主语分析错误的原因是错误地将从句的动词依赖于主句的主语,即将主句的主语作为从句动词的宾语,故,可以先识别主句和从句,在主句和从句之间添加逗号,再对添加了逗号的需求语句进行依存分析。
宾语分析错误是由于主句的宾语有一个分词引导状语从句,将主语的宾语作为分词的主语,故可以先识别主句和分词,在宾语和分词之间添加一个that is,再对添加了that is的需求语句进行依存分析,生成新的依存结构信息。
步骤303:比较依存结构信息与预设的需求模板中的依存模板结构信息,获取比较结果。
步骤304:将比较结果作为对需求语句进行需求模板符合性检查的检查结果。
本示例中步骤301、步骤303和步骤304与第一实施方式中的步骤101至步骤103大致相同,此处将不再进行赘述。
本示例中的需求模板符合性检查的方法提高了需求文档检测准确率。本示例中将该方法应用在电子设备中,该设备的编程环境为IDEA,运行环境为Core i5 CPU 3.00GHz,16GB内存,Windows 10Professional x64操作***。实验的数据集来四个需求文档集合。
在召回率及准确率实验中,对4个需求文档进行需求模板符合性检查后,得到结果如图8,图9所示的实验结果,图8为修正处理后的实验结果,图9为未修正处理的实验结果,图8和图9中,黑色柱状图表征准确率,线状柱状图表征召回率,白色空心柱状图表征F2-measure采用本示例中的方法,召回率达到了93%以上,且准确率达到95%以上。
值得一提的是,Rupp模板中存在<object>词槽,在模板语法依赖关系中作为宾语,对应词性是名词。但是在进行词性标注时易发生将名词错误的标注为动词的问题,依存分析也有可能把宾语解析为主语,导致识别<object>词槽的失败,受到错误的依存分析和错误的词性标注的影响较大,当对词性标注错误进行词性校正或对依存分析的错误进行需求语句的分割和加工后,其准确率大大提高,通过修正的方式也提高了对EARS模板检测的准确率。
本发明第四实施方式涉及一种电子设备,如图10所示,包括:至少一个处理器401;以及,与至少一个处理器401通信连接的存储器402;其中,存储器402存储有可被至少一个处理器401执行的指令,指令被至少一个处理器401执行,以使至少一个处理器401能够执行上述的需求模板符合性检查的方法。
其中,存储器402和处理器401采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器401和存储器402的各种电路链接在一起。总线还可以将诸如***设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器。
处理器负责管理总线和通常的处理,还可以提供各种功能,包括定时,***接口,电压调节、电源管理以及其他控制功能。而存储器可以被用于存储处理器在执行操作时所使用的数据。
本发明第五实施方式涉及一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现上述的需求模板符合性检查的方法。
本领域技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。
Claims (10)
1.一种需求模板符合性检查的方法,其特征在于,包括:
获取需求语句的依存结构信息,所述依存结构信息包括所述需求语句中各词条的属性信息以及各所述词条之间语法依赖关系;
比较所述依存结构信息与预设的需求模板中的依存模板结构信息,获取比较结果;
将所述比较结果作为对所述需求语句进行需求模板符合性检查的检查结果。
2.根据权利要求1所述的需求模板符合性检查的方法,其特征在于,在所述比较所述依存结构信息与预设的需求模板中的依存模板结构信息之前,所述方法还包括:
根据所述依存模板结构信息对所述依存结构信息进行修正,获得修正后的依存结构信息。
3.根据权利要求2所述的需求模板符合性检查的方法,其特征在于,所述根据所述依存模板结构信息对所述依存结构信息进行修正,获得修正后的依存结构信息,包括:
获取所述依存模板结构信息中指定词槽对应的模板词条;
从所述需求语句中查找到与所述模板词条对应的所述词条后,判断查找到的所述词条的属性信息与所述模板词条的属性信息是否相异,若是,则将所述词条的属性信息变更为所述模板词条的属性信息。
4.根据权利要求2所述的需求模板符合性检查的方法,其特征在于,所述根据所述依存模板结构信息对所述依存结构信息进行修正,获得修正后的依存结构信息,包括:
获取所述依存模板结构信息中指定的所述模板语法依赖关系;
根据所述指定的模板语法依赖关系,在所述需求语句中的指定位置添加指定词条,并重新进行依存分析,生成新的所述依存结构信息。
5.根据权利要求1-4中任一项所述的需求模板符合性检查的方法,其特征在于,所述获取需求语句的依存结构信息,包括:
获取需求文档;
对所述需求文档进行分词处理,获得所述需求文档中各词条;
对所述需求文档进行句子分割处理,获得所述需求文档中各所述需求语句;
对所述词条进行词性标注作为所述词条的属性信息;
根据所述词性标注和所述词条,对所述需求语句进行依存分析,生成所述需求语句中各个词条之间的模板语法依赖关系作为所述语法依赖关系。
6.根据权利要求1至4中任一项所述的需求模板符合性检查的方法,其特征在于,所述方法还包括:
获取预设的需求类别的模板语法格式信息;
从所述模板语法格式信息中选取关键词槽,获取所述关键词槽之间的模板语法依赖关系以及所述关键词槽的属性信息作为所述依存模板结构信息。
7.根据权利要求5所述的需求模板符合性检查的方法,其特征在于,在比较所述依存结构信息与预设的需求模板中的依存模板结构信息,获取比较结果之前,所述方法还包括:
获取所述需求语句中各词条的属性信息;
根据所述词条的属性信息,判断是否存在情态动词,若是存在,则确定执行比较所述依存结构信息与预设的需求模板中的依存模板结构信息的步骤。
8.根据权利要求5所述的需求模板符合性检查的方法,其特征在于,在比较所述依存结构信息与预设的需求模板中的依存模板结构信息,获取比较结果之前,所述方法还包括:
获取所述需求语句中各词条的属性信息;
判断是否存在属于所述需求模板中指定的正常词条,若是存在,则确定执行比较所述依存结构信息与预设的需求模板中的依存模板结构信息的步骤。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-8任一所述的需求模板符合性检查的方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的需求模板符合性检查的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110038835.6A CN112733517B (zh) | 2021-01-12 | 2021-01-12 | 需求模板符合性检查的方法、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110038835.6A CN112733517B (zh) | 2021-01-12 | 2021-01-12 | 需求模板符合性检查的方法、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112733517A true CN112733517A (zh) | 2021-04-30 |
CN112733517B CN112733517B (zh) | 2022-12-06 |
Family
ID=75591478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110038835.6A Active CN112733517B (zh) | 2021-01-12 | 2021-01-12 | 需求模板符合性检查的方法、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112733517B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113467755A (zh) * | 2021-07-12 | 2021-10-01 | 卡斯柯信号有限公司 | 需求符合性分析方法、***、电子设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105718256A (zh) * | 2014-12-18 | 2016-06-29 | 通用汽车环球科技运作有限责任公司 | 用于通过本体模型的比较进行一致性检查的方法和装置 |
CN109062892A (zh) * | 2018-07-10 | 2018-12-21 | 东北大学 | 一种基于Word2Vec的中文语句相似度计算方法 |
CN109271626A (zh) * | 2018-08-31 | 2019-01-25 | 北京工业大学 | 文本语义分析方法 |
CN109977228A (zh) * | 2019-03-21 | 2019-07-05 | 浙江大学 | 电网设备缺陷文本的信息辨识方法 |
CN111460787A (zh) * | 2020-03-27 | 2020-07-28 | 深圳价值在线信息科技股份有限公司 | 一种话题提取方法、装置、终端设备及存储介质 |
CN112084793A (zh) * | 2020-09-14 | 2020-12-15 | 深圳前海微众银行股份有限公司 | 基于依存句法的语义识别方法、设备和可读存储介质 |
CN112099764A (zh) * | 2020-08-13 | 2020-12-18 | 南京航空航天大学 | 基于形式化转换规则的航电领域需求的规范化方法 |
CN112101019A (zh) * | 2020-08-12 | 2020-12-18 | 南京航空航天大学 | 一种基于词性标注和组块分析的需求模板符合性检查优化方法 |
-
2021
- 2021-01-12 CN CN202110038835.6A patent/CN112733517B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105718256A (zh) * | 2014-12-18 | 2016-06-29 | 通用汽车环球科技运作有限责任公司 | 用于通过本体模型的比较进行一致性检查的方法和装置 |
CN109062892A (zh) * | 2018-07-10 | 2018-12-21 | 东北大学 | 一种基于Word2Vec的中文语句相似度计算方法 |
CN109271626A (zh) * | 2018-08-31 | 2019-01-25 | 北京工业大学 | 文本语义分析方法 |
CN109977228A (zh) * | 2019-03-21 | 2019-07-05 | 浙江大学 | 电网设备缺陷文本的信息辨识方法 |
CN111460787A (zh) * | 2020-03-27 | 2020-07-28 | 深圳价值在线信息科技股份有限公司 | 一种话题提取方法、装置、终端设备及存储介质 |
CN112101019A (zh) * | 2020-08-12 | 2020-12-18 | 南京航空航天大学 | 一种基于词性标注和组块分析的需求模板符合性检查优化方法 |
CN112099764A (zh) * | 2020-08-13 | 2020-12-18 | 南京航空航天大学 | 基于形式化转换规则的航电领域需求的规范化方法 |
CN112084793A (zh) * | 2020-09-14 | 2020-12-15 | 深圳前海微众银行股份有限公司 | 基于依存句法的语义识别方法、设备和可读存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113467755A (zh) * | 2021-07-12 | 2021-10-01 | 卡斯柯信号有限公司 | 需求符合性分析方法、***、电子设备及存储介质 |
CN113467755B (zh) * | 2021-07-12 | 2022-07-26 | 卡斯柯信号有限公司 | 需求符合性分析方法、***、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112733517B (zh) | 2022-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107247707B (zh) | 基于补全策略的企业关联关系信息提取方法和装置 | |
US7610191B2 (en) | Method for fast semi-automatic semantic annotation | |
CN111460787A (zh) | 一种话题提取方法、装置、终端设备及存储介质 | |
CN106844413B (zh) | 实体关系抽取的方法及装置 | |
US9122674B1 (en) | Use of annotations in statistical machine translation | |
US11657232B2 (en) | Source code compiler using natural language input | |
US20200356363A1 (en) | Methods and systems for automatically generating documentation for software | |
CN112699665B (zh) | 一种安全报告文本的三元组抽取方法、装置及电子设备 | |
EP4322009A1 (en) | Test case generation method, apparatus and device | |
US9336207B2 (en) | Measuring linguistic markers and linguistic noise of a machine-human translation supply chain | |
US20220414463A1 (en) | Automated troubleshooter | |
US11657151B2 (en) | System and method for detecting source code anomalies | |
CN111144100B (zh) | 一种问题文本识别方法、装置、电子设备及存储介质 | |
CN112579466A (zh) | 测试用例的生成方法、装置及计算机可读存储介质 | |
US20020103837A1 (en) | Method for handling requests for information in a natural language understanding system | |
CN112733517B (zh) | 需求模板符合性检查的方法、电子设备及存储介质 | |
CN110929514B (zh) | 文本校对方法、装置、计算机可读存储介质及电子设备 | |
US7389220B2 (en) | Correcting incomplete negation errors in French language text | |
CN114219438A (zh) | 基于rpa及ai的公文文件分发方法、装置、设备及介质 | |
CN112101019A (zh) | 一种基于词性标注和组块分析的需求模板符合性检查优化方法 | |
CN112698836B (zh) | 一种针对复杂用户评论的代码质量属性判断方法 | |
Truskinger et al. | Reconciling folksonomic tagging with taxa for bioacoustic annotations | |
CN116127016A (zh) | 基于自然语言处理的业务流程合规性检查方法、终端及平台 | |
Varadarajan et al. | Text-mining: Application development challenges | |
CN117371402A (zh) | 数据标准生成方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |