CN107291694A - 一种自动评阅作文的方法和装置、存储介质及终端 - Google Patents

一种自动评阅作文的方法和装置、存储介质及终端 Download PDF

Info

Publication number
CN107291694A
CN107291694A CN201710498079.9A CN201710498079A CN107291694A CN 107291694 A CN107291694 A CN 107291694A CN 201710498079 A CN201710498079 A CN 201710498079A CN 107291694 A CN107291694 A CN 107291694A
Authority
CN
China
Prior art keywords
composition
word
module
language analysis
topic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710498079.9A
Other languages
English (en)
Other versions
CN107291694B (zh
Inventor
张帆
马楠
陈冬晓
刘志山
阎鹏
邓澍军
郭常圳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ape Power Technology Co.,Ltd.
Original Assignee
Beijing Chalk Future Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Chalk Future Technology Co Ltd filed Critical Beijing Chalk Future Technology Co Ltd
Priority to CN201710498079.9A priority Critical patent/CN107291694B/zh
Publication of CN107291694A publication Critical patent/CN107291694A/zh
Application granted granted Critical
Publication of CN107291694B publication Critical patent/CN107291694B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers
    • G09B7/02Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种自动评阅作文的方法,包括:a1、加载目标作文及其对应的作文题目;a2、提取目标作文的文本主题以及所述作文题目的题目主题;a3、将所述文本主题与所述题目主题进行比对,并根据比对的结果加权生成分数。本发明提供的自动评阅作文的方法和装置、存储介质及终端,可以加载目标作文并自动进行语言分析、提取主题,从而实现自动、客观地评阅作文,节省了人力,提高了效率。本发明还公开了一种自动评阅作文的装置,以及存储介质及终端。

Description

一种自动评阅作文的方法和装置、存储介质及终端
技术领域
本发明涉及数据处理技术领域,特别涉及一种自动评阅作文的方法和装置、 存储介质及终端。
背景技术
语文教学是我国教育***中很重要的一门教育学科,通过语文教学可以学习 汉字,领悟中国博大精深的历史文化。特别是作文的训练,是对学生写作能力 的最好的检验。
现有的作文评阅中,大多依靠老师的主观评阅,人为因素较多。有时候当老 师要评阅大量的学生作文时,不可避免地会出现失误,进而不能客观地反映学 生的写作能力。
因此,需要一种可以自动、客观地评阅作文的方法及***,以节省人力,提 高效率,从而解决现有技术中存在的技术问题。
发明内容
有鉴于此,本发明提供了一种自动评阅作文的方法和装置、存储介质及终 端,以解决现有技术中存在的技术问题。
本发明公开了一种自动评阅作文的方法,包括:
a1、加载目标作文及其对应的作文题目;
a2、提取目标作文的文本主题以及所述作文题目的题目主题;
a3、将所述文本主题与所述题目主题进行比对,并根据比对的结果加权生 成分数。
在本发明的一个示意性的实施例中,所述提取目标作文的文本主题包括:
a21、将目标作文切分成多个词语;
a22、对切分为多个词语的所述目标作文进行语言分析;
a23、根据语言分析的结果提取该目标作文的文本主题;
所述提取作文题目的题目主题包括:
a24、将目标作文的作文题目切分成多个词语;
a25、对切分为多个词语的所述作文题目进行语言分析;
a26、根据语言分析的结果提取该作文题目的题目主题。
在本发明的一个示意性的实施例中,对目标作文或作文题目进行所述语言 分析包括:
b1、对每一语句中的每个词语的词性进行标注,其中,所述词性包括名词、 动词、形容词、代词、数词、量词、副词、介词、连词、助词、叹词、拟声词 中的一个或多个的组合;
b2、识别每一语句中的名词词语的名称类型并标注,其中,所述名称类型 包括人名、地名、机构名中的一个或多个的组合;
b3、对每一语句中的谓词的主语进行标注;
b4、根据每一语句中的词语间的关系,对该语句的语法进行标注;
b5、识别分词词语和词性之间的语义关联关系并标注。
在本发明的一个示意性的实施例中,步骤a23包括:
a231、根据目标作文中的标注结果,识别词语的相似度,对所述词语进行 聚类,然后根据所述聚类的结果对所述目标作文的文本主题进行一次提取;
a232、根据预存的文本规律,对目标作文的文本主题进行二次提取;
a233、根据两次提取的文本主题,加权得到所述目标作文的最终的文本主 题。
在本发明的一个示意性的实施例中,在步骤a2以后,还包括:
a4、识别所述目标作文的修辞手法;
a5、根据所述修辞手法对所述目标作文生成分数,并执行步骤a6;
在步骤a3后,还包括:
a6、将步骤a3生成的分数以及步骤a5生成的分数进行加权,得到所述目标 作文最终的分数。
本发明实施例还公开了一种自动评阅作文的装置,包括:
加载模块,加载目标作文及其对应的作文题目;
主题提取模块,提取目标作文的文本主题以及所述作文题目的题目主题;
主题比对模块,将所述文本主题与所述题目主题进行比对,并根据比对的 结果加权生成分数。
在本发明的一个示意性的实施例中,所述主题提取模块包括:
作文词语切分模块,所述作文词语切分模块将目标作文切分成多个词语;
第一语言分析模块,所述第一语言分析模块对切分为多个所述词语的所述 目标作文进行语言分析;
文本主题提取模块,所述文本主题提取模块根据语言分析的结果提取该目 标作文的文本主题;
所述主题提取模块还包括:
题目词语切分模块,所述题目词语切分模块将目标作文的作文题目切分成 多个词语;
第二语言分析模块,所述第二语言分析模块对切分为多个词语的所述作文 题目进行语言分析;
题目主题提取模块,所述题目主题提取模块根据语言分析的结果提取该作 文题目的题目主题。
在本发明的一个示意性的实施例中,所述第一语言分析模块对所述目标作 文进行语言分析,包括:
所述第一语言分析模块对每一语句中的每个词语的词性进行标注,其中, 所述词性包括名词、动词、形容词、代词、数词、量词、副词、介词、连词、 助词、叹词、拟声词中的一个或多个的组合;
所述第一语言分析模块识别每一语句中的名词词语的名称类型并标注,其 中,所述名称类型包括人名、地名、机构名中的一个或多个的组合;
所述第一语言分析模块对每一语句中的谓词的主语进行标注;
所述第一语言分析模块根据每一语句中的词语间的关系,对该语句的语法 进行标注;
所述第一语言分析模块识别分词词语和词性之间的语义关联关系并标注;
所述第二语言分析模块对所述作文题目进行语言分析,包括:
所述第二语言分析模块对每一语句中的每个词语的词性进行标注,其中, 所述词性包括名词、动词、形容词、代词、数词、量词、副词、介词、连词、 助词、叹词、拟声词中的一个或多个的组合;
所述第二语言分析模块识别每一语句中的名词词语的名称类型并标注,其 中,所述名称类型包括人名、地名、机构名中的一个或多个的组合;
所述第二语言分析模块对每一语句中的谓词的主语进行标注;
所述第二语言分析模块根据每一语句中的词语间的关系,对该语句的语法 进行标注;
所述第二语言分析模块识别分词词语和词性之间的语义关联关系并标注。
在本发明的一个示意性的实施例中,所述文本主题提取模块包括:
第一主题提取模块,所述第一主题提取模块根据目标作文中的标注结果, 识别词语的相似度,对所述词语进行聚类,然后根据所述聚类的结果对所述目 标作文的文本主题进行一次提取;
第二主题提取模块,所述第二主题提取模块根据预存的文本规律,对目标 作文的文本主题进行二次提取;
加权模块,根据两次提取的文本主题,加权得到所述目标作文的最终的文 本主题。
在本发明的一个示意性的实施例中,在所述主题提取模块后,还包括:
修辞手法识别模块,所述修辞手法识别模块识别所述目标作文的修辞手法;
修辞手法打分模块,所述修辞手法打分模块根据所述修辞手法对所述目标 作文生成分数;
最终分数生成模块,所述最终分数生成模块分别与所述修辞手法打分模块 以及所述主题比对模块连接,将所述主题比对模块生成的分数以及所述修辞手 法打分模块生成的分数进行加权,得到所述目标作文最终的分数。
本发明还公开了一种存储介质,存储有计算机指令,所述计算机指令被执 行时实现如上所述的自动评阅作文的方法。
本发明还公开了一种终端,包括处理器、以及存储器,所述存储器中存储 有计算机指令;在所述应用程序启动时,所述处理器读取所述计算机指令并实 现如上所述的自动评阅作文的方法。
本发明提供的自动评阅作文的方法和装置、存储介质及终端,可以加载目 标作文并自动进行语言分析、提取主题,从而实现自动、客观地评阅作文,节 省了人力,提高了效率。
附图说明
图1是本发明一实施例的自动评阅作文的方法流程示意图;
图2是本发明一实施例的自动评阅作文中提取目标作文的文本主题的方法 流程示意图;
图3是本发明一实施例的自动评阅作文中对目标作文进行语言分析的方法 流程示意图;
图4是本发明一实施例的自动评阅作文的方法中步骤a23的详细流程图;
图5是本发明一实施例的自动评阅作文的方法中提取作文题目的题目主题 的流程示意图;
图6是本发明一实施例的自动评阅作文的方法的另一详细流程图;
图7是本发明实施例的自动评阅作文的装置的示意图一;
图8是本发明实施例的自动评阅作文的装置的示意图二;
图9是本发明实施例的自动评阅作文的装置的示意图三;
图10是本发明实施例的自动评阅作文的装置的示意图四;
图11是本发明实施例的自动评阅作文的装置的示意图五。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述。
为了解决现有技术中存在的人工评阅作文的技术缺陷,本发明实施例公开 了一种自动评阅作文的方法,以可以自动、客观地评阅作文,从而节省人力, 提高效率。
为了实现上述目的,参见图1,本发明实施例公开的人工评阅作文的方法包 括以下步骤a1~a3:
a1、加载目标作文及其对应的作文题目。
在加载时,分别加载作文题目以及目标作文进行分析。需要说明的是,在 实际使用场景中,例如在一次考试中,作文题目只有一个,对应的目标作文有 很多。
a2、提取目标作文的文本主题以及所述作文题目的题目主题。
更为详尽地,参见图2,提取目标作文的文本主题包括步骤a21~a23:
a21、将目标作文切分成多个词语;
其中,需要解释的是,在汉语中,词语是承载语义最基本的单元。切分词 语也是本发明方法可以实现的基础。
例如:“我认为,身处寒门的明成就可以通过后天的努力来实现生命的价 值。”,本技术的分词结果是:“我/认为/,/身处寒门/的/明成/就/可以/通 过/后天/的/努力/来/实现/生命/的/价值/。”如果分词结果是“…身处寒 门/的/明/成就/可以/通过/…”因为“成就”也是一个常见的词,很可能出 现这样的分词结果。
如何避免切分词语时的歧义是一个难题。本发明运用大量积累的中学语文 作文语料和相应的作文主题素材,采用基于词典与词频统计相结合的方式,融 入知识理解的策略对输入的文章进行词语的切分,以保证词语切分的准确性。
a22、对切分为多个词语的所述目标作文进行语言分析。
更为详尽地,在本发明的一个实施方案中,参见图3,对目标作文进行语言 分析为对词语的分析,以及对词语之间关系的分析,具体包括步骤b1~b5:
b1、对每一语句中的每个词语的词性进行标注,其中,所述词性包括名词、 动词、形容词、代词、数词、量词、副词、介词、连词、助词、叹词、拟声词 中的一个或多个的组合;
b2、识别每一语句中的名词词语的名称类型并标注,其中,所述名称类型 包括人名、地名、机构名中的一个或多个的组合。
例如:“梁某某【人名】出生在平民家庭,家中兄妹五人,却只能靠父亲那 菲薄的工资来勉强度日。从他小学开始,家中决定去焦化厂【机构名】领取材 料回家加工。他每天要依靠那弱小的身子背着几十公斤重的材料往返家与工厂, 鸡叫前出发,鸡睡后归家,这样披星戴月,年复一年。但他的学习从来没有放 下过,以优异的成绩考取著名的英国【地名】布里斯托理工大学【机构名】。”
b3、对每一语句中的谓词的主语进行标注。
谓词,用来描述或判定客体性质、特征或者客体之间关系的词项,如时间、 地点、人物等,为后续的特征抽取提供帮助。例如“猫是动物”一句中的“是” 就是一个谓词,而“猫”是客体;“3大于2”中的“大于”是一个谓词。
b4、根据每一语句中的词语间的关系,对该语句的语法进行标注。
例如:识别句子中的主谓、动宾、并列等语法成分,并分析各个成分之间 的关系。
b5、识别分词词语和词性之间的语义关联关系并标注。
通过该关联关系,可以跨越句子表层句法结构束缚,直接获取深层的语义 信息。
a23、根据语言分析的结果提取该目标作文的文本主题。
更为具体地,参见图4,步骤a23包括:
a231、根据目标作文中的标注结果,识别词语的相似度,对所述词语进行 聚类,然后根据所述聚类的结果对所述目标作文的文本主题进行一次提取;
a232、根据预存的文本规律,对目标作文的文本主题进行二次提取;
a233、根据两次提取的文本主题,加权得到所述目标作文的最终的文本主 题。
可见,对目标作文的文本主题的一次提取和二次提取的维度不同:
一次提取是对目标作文的内部提取,依靠作文本身信息,通过度量作文中 词语之间的相似度,利用聚类的方法构建文本主题,并根据不同文本主题在文 章中的重要程度,抽取其中的关键词。这样便能够在一定程度上发现文章的文 本主题,并提取出与文本主题相关的关键词,提高关键词对文本主题的覆盖度。
二次提取是利用作文外部构建的模型,自动发现大量文本中的规律(是指训 练时候用了大量的中学生作文相关语料),从而可以自动发现文本主题,并将文 本主题相关的词语找出来。
更为详尽地,参见图5,提取作文题目的题目主题包括步骤a24~a26:
a24、将目标作文的作文题目切分成多个词语;
对于作文题目的词语切分,与目标作文的词语切分实质相同,在此便不再 赘述。
a25、对切分为多个词语的所述作文题目进行语言分析。
对于作文题目的语言分析,与前述对目标作文的语言分析实质相同,在此 便不再赘述。
a26、根据语言分析的结果提取该作文题目的题目主题。
对于作文题目的题目主题的提取,与前述对目标作文的文本主题的提取实 质相同,在此便不再赘述。
以下举例来进行说明。
例如,一篇作文题目有三位学生,项虹刻苦认真、努力学习,期中、期末 考试成绩全年级最优。倪宾在学习上表现一般,却是学生会的积极分子,在学 生会组织的活动中频频露面,展现才华,终于在学生会换届竞选中当选为学生 会***。明成家境不佳,他在努力学习、完成各项学习任务的同时,课余时间 都用在做小生意上,一年下来,不但不向家里要一分钱,还向家里寄3000元钱 补贴家用。
那么,本实施例会对该题目的题目主题进行抽取:项虹学生努力、刻苦、 成绩优秀;倪宾学生积极、有才华;明成学生家境贫寒、自力更生。
在对应的目标作文时,例如对于学生项虹,一次提取的文本主题为:刻苦 (70分)、成绩优秀(60分)、学生努力(50分);二次提取的文本主题为:学 习努力(30分)、XXX(20分),刻苦(5分),两次提取的结果加权后,对于项 虹,文本主题的评分标准为:学生努力(80分)、刻苦(75分)、成绩优秀(60 分)。
对应于其他学生的文本主题,提取方法类似,本实施例便不再一一列举。
a3、将所述文本主题与所述题目主题进行比对,并根据比对的结果加权生 成分数。
上述流程结束。
可选地,在评分时,考虑到作文的修辞手法可以增加文章的文采,还可以 加入对修辞手法的辨别,作为提高作文文采的一个加分项。
所以,参见图6,在步骤a2后,还包括:
a4、识别所述目标作文的修辞手法。
本实施例中,修辞手法包括常用的排比、比喻等。
例如,排比修辞手法的识别流程如下:
a41、提取候选排比句。目标作文经过分词、分句、词性标注等预处理之后, 从文章中抽出来,包括逗号、分号、句号、段落等排比;
a42、工整性检验。从排比的长度以及三个排比短句的整齐程度来考虑。
a43、排比标检验。排比标是排比句的一个显著特点,即三个排比句中有相 同的连续字符串。
a44、比喻标记。排比句中经常会伴随着比喻修辞手法,比喻修辞更能彰显 学生的作文风采。
a5、根据所述修辞手法对所述目标作文生成分数,并执行步骤a6;
在步骤a3后,还包括:
a6、将步骤a3生成的分数以及步骤a5生成的分数进行加权,得到所述目标 作文最终的分数。
本发明提供的自动评阅作文的方法,可以加载目标作文并自动进行语言分 析、提取主题,从而实现自动、客观地评阅作文,节省了人力,提高了效率。
下述为本实施例的自动评阅作文的装置的示意性方案。需要说明的是,该 自动评阅作文的装置的技术方案与上述自动评阅作文的方法的技术方案属于同 一构思,自动评阅作文的装置的技术方案未详细描述的细节内容,均可以参见 上述自动评阅作文的方法的技术方案的描述。
本发明实施例还提供了一种自动评阅作文的装置,参见图7,包括:
加载模块11,加载目标作文及其对应的作文题目;
主题提取模块12,提取目标作文的文本主题以及所述作文题目的题目主题;
主题比对模块13,将所述文本主题与所述题目主题进行比对,并根据比对 的结果加权生成分数。
可选地,在本发明的一个实施例中,参见图8,主题提取模块12包括:
作文词语切分模块121,所述作文词语切分模块121将目标作文切分成多个 词语;
第一语言分析模块122,所述第一语言分析模块122对切分为多个所述词语 的所述目标作文进行语言分析;
文本主题提取模块123,所述文本主题提取模块123根据语言分析的结果提 取该目标作文的文本主题;
可选地,在本发明的一个实施例中,参见图9,主题提取模块12还包括:
题目词语切分模块124,所述题目词语切分模块124将目标作文的作文题目 切分成多个词语;
第二语言分析模块125,所述第二语言分析模块125对切分为多个词语的所 述作文题目进行语言分析;
题目主题提取模块126,所述题目主题提取模块126根据语言分析的结果提 取该作文题目的题目主题。
可选地,第一语言分析模块122对目标作文进行语言分析,包括:
第一语言分析模块122对每一语句中的每个词语的词性进行标注,其中, 所述词性包括名词、动词、形容词、代词、数词、量词、副词、介词、连词、 助词、叹词、拟声词中的一个或多个的组合;
第一语言分析模块122识别每一语句中的名词词语的名称类型并标注,其 中,名称类型包括人名、地名、机构名中的一个或多个的组合;
第一语言分析模块122对每一语句中的谓词的主语进行标注;
第一语言分析模块122根据每一语句中的词语间的关系,对该语句的语法 进行标注;
第一语言分析模块122识别分词词语和词性之间的语义关联关系并标注。
第二语言分析模块125对所述作文题目进行语言分析,包括:
第二语言分析模块125对每一语句中的每个词语的词性进行标注,其中, 所述词性包括名词、动词、形容词、代词、数词、量词、副词、介词、连词、 助词、叹词、拟声词中的一个或多个的组合;
第二语言分析模块125识别每一语句中的名词词语的名称类型并标注,其 中,所述名称类型包括人名、地名、机构名中的一个或多个的组合;
第二语言分析模块125对每一语句中的谓词的主语进行标注;
第二语言分析模块125根据每一语句中的词语间的关系,对该语句的语法 进行标注;
第二语言分析模块125识别分词词语和词性之间的语义关联关系并标注。
可选地,参见图10,文本主题提取模块123包括:
第一主题提取模块1231,所述第一主题提取模块1231根据目标作文中的标 注结果,识别词语的相似度,对所述词语进行聚类,然后根据所述聚类的结果 对所述目标作文的文本主题进行一次提取;
第二主题提取模块1232,所述第二主题提取模块1232根据预存的文本规律, 对目标作文的文本主题进行二次提取;
加权模块1233,根据两次提取的文本主题,加权得到所述目标作文的最终 的文本主题。
另外,参见图11,在所述主题提取模块12后,还包括:
修辞手法识别模块14,所述修辞手法识别模块14识别所述目标作文的修辞 手法;
修辞手法打分模块15,所述修辞手法打分模块15根据所述修辞手法对所述 目标作文生成分数;
最终分数生成模块16,所述最终分数生成模块16分别与所述修辞手法打分 模块15以及所述主题比对模块13连接,将所述主题比对模块13生成的分数以 及所述修辞手法打分模块15生成的分数进行加权,得到所述目标作文最终的分 数。
本发明实施例还公开了一种终端,包括处理器、以及存储器,所述存储器 中存储有计算机指令;在所述应用程序启动时,所述处理器读取所述计算机指 令并实现如上所述的自动评阅作文的方法。
需要说明的是,所述终端可以为桌上型计算机、笔记本、掌上电脑及云端 服务器等计算设备。本领域技术人员可以理解的是,终端为用于接收数据并进 行处理后输出结构的设备。上述举例并非是对终端的限定,为在某些场合,终 端还可以包括输入输出设备、网络接入设备、总线等。
所述处理器可以为中央处理单元(Central Processing Unit,CPU),还可以是 其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电 路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列 (Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者 晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器 也可以是任何常规的处理器等,所述处理器是所述终端的控制中心,利用各种 接口和线路连接整个终端的各个部分。
所述存储器主要包括存储程序区和存储数据区,其中,存储程序区可存储 操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能 等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电 话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失 性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC), 安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)、至少一个磁盘存储器 件、闪存器件、或其他易失性固态存储器件。
本发明实施例还公开了一种存储介质,存储有计算机指令,所述计算机指 令被执行时实现如上所述的自动评阅作文的方法。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码 形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可 以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、 移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、 随机存取存储器(RAM,Random AccessMemory)、电载波信号、电信信号以及 软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司 法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区, 根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
上面结合附图对本发明优选的具体实施方式和实施例作了详细说明,但是 本发明并不限于上述实施方式和实施例,在本领域技术人员所具备的知识范围 内,还可以在不脱离本发明构思的前提下做出各种变化。

Claims (12)

1.一种自动评阅作文的方法,其特征在于,包括:
a1、加载目标作文及其对应的作文题目;
a2、提取目标作文的文本主题以及所述作文题目的题目主题;
a3、将所述文本主题与所述题目主题进行比对,并根据比对的结果加权生成分数。
2.根据权利要求1所述的自动评阅作文的方法,其特征在于,所述提取目标作文的文本主题包括:
a21、将目标作文切分成多个词语;
a22、对切分为多个词语的所述目标作文进行语言分析;
a23、根据语言分析的结果提取该目标作文的文本主题;
所述提取作文题目的题目主题包括:
a24、将目标作文的作文题目切分成多个词语;
a25、对切分为多个词语的所述作文题目进行语言分析;
a26、根据语言分析的结果提取该作文题目的题目主题。
3.根据权利要求2所述的自动评阅作文的方法,其特征在于,对目标作文或作文题目进行所述语言分析包括:
b1、对每一语句中的每个词语的词性进行标注,其中,所述词性包括名词、动词、形容词、代词、数词、量词、副词、介词、连词、助词、叹词、拟声词中的一个或多个的组合;
b2、识别每一语句中的名词词语的名称类型并标注,其中,所述名称类型包括人名、地名、机构名中的一个或多个的组合;
b3、对每一语句中的谓词的主语进行标注;
b4、根据每一语句中的词语间的关系,对该语句的语法进行标注;
b5、识别分词词语和词性之间的语义关联关系并标注。
4.根据权利要求3所述的自动评阅作文的方法,其特征在于,步骤a23包括:
a231、根据目标作文中的标注结果,识别词语的相似度,对所述词语进行聚类,然后根据所述聚类的结果对所述目标作文的文本主题进行一次提取;
a232、根据预存的文本规律,对目标作文的文本主题进行二次提取;
a233、根据两次提取的文本主题,加权得到所述目标作文的最终的文本主题。
5.根据权利要求1所述的自动评阅作文的方法,其特征在于,在步骤a2以后,还包括:
a4、识别所述目标作文的修辞手法;
a5、根据所述修辞手法对所述目标作文生成分数,并执行步骤a6;
在步骤a3后,还包括:
a6、将步骤a3生成的分数以及步骤a5生成的分数进行加权,得到所述目标作文最终的分数。
6.一种自动评阅作文的装置,其特征在于,包括:
加载模块,加载目标作文及其对应的作文题目;
主题提取模块,提取目标作文的文本主题以及所述作文题目的题目主题;
主题比对模块,将所述文本主题与所述题目主题进行比对,并根据比对的结果加权生成分数。
7.根据权利要求6所述的自动评阅作文的装置,其特征在于,所述主题提取模块包括:
作文词语切分模块,所述作文词语切分模块将目标作文切分成多个词语;
第一语言分析模块,所述第一语言分析模块对切分为多个所述词语的所述目标作文进行语言分析;
文本主题提取模块,所述文本主题提取模块根据语言分析的结果提取该目标作文的文本主题;
所述主题提取模块还包括:
题目词语切分模块,所述题目词语切分模块将目标作文的作文题目切分成多个词语;
第二语言分析模块,所述第二语言分析模块对切分为多个词语的所述作文题目进行语言分析;
题目主题提取模块,所述题目主题提取模块根据语言分析的结果提取该作文题目的题目主题。
8.根据权利要求7所述的自动评阅作文的装置,其特征在于,所述第一语言分析模块对所述目标作文进行语言分析,包括:
所述第一语言分析模块对每一语句中的每个词语的词性进行标注,其中,所述词性包括名词、动词、形容词、代词、数词、量词、副词、介词、连词、助词、叹词、拟声词中的一个或多个的组合;
所述第一语言分析模块识别每一语句中的名词词语的名称类型并标注,其中,所述名称类型包括人名、地名、机构名中的一个或多个的组合;
所述第一语言分析模块对每一语句中的谓词的主语进行标注;
所述第一语言分析模块根据每一语句中的词语间的关系,对该语句的语法进行标注;
所述第一语言分析模块识别分词词语和词性之间的语义关联关系并标注;
所述第二语言分析模块对所述作文题目进行语言分析,包括:
所述第二语言分析模块对每一语句中的每个词语的词性进行标注,其中,所述词性包括名词、动词、形容词、代词、数词、量词、副词、介词、连词、助词、叹词、拟声词中的一个或多个的组合;
所述第二语言分析模块识别每一语句中的名词词语的名称类型并标注,其中,所述名称类型包括人名、地名、机构名中的一个或多个的组合;
所述第二语言分析模块对每一语句中的谓词的主语进行标注;
所述第二语言分析模块根据每一语句中的词语间的关系,对该语句的语法进行标注;
所述第二语言分析模块识别分词词语和词性之间的语义关联关系并标注。
9.根据权利要求8所述的自动评阅作文的装置,其特征在于,所述文本主题提取模块包括:
第一主题提取模块,所述第一主题提取模块根据目标作文中的标注结果,识别词语的相似度,对所述词语进行聚类,然后根据所述聚类的结果对所述目标作文的文本主题进行一次提取;
第二主题提取模块,所述第二主题提取模块根据预存的文本规律,对目标作文的文本主题进行二次提取;
加权模块,根据两次提取的文本主题,加权得到所述目标作文的最终的文本主题。
10.根据权利要求6所述的自动评阅作文的装置,其特征在于,在所述主题提取模块后,还包括:
修辞手法识别模块,所述修辞手法识别模块识别所述目标作文的修辞手法;
修辞手法打分模块,所述修辞手法打分模块根据所述修辞手法对所述目标作文生成分数;
最终分数生成模块,所述最终分数生成模块分别与所述修辞手法打分模块以及所述主题比对模块连接,将所述主题比对模块生成的分数以及所述修辞手法打分模块生成的分数进行加权,得到所述目标作文最终的分数。
11.一种存储介质,其特征在于,存储有计算机指令,所述计算机指令被执行时实现如权利要求1-5任一项所述的自动评阅作文的方法。
12.一种终端,其特征在于,包括处理器、以及存储器,所述存储器中存储有计算机指令;
在所述应用程序启动时,所述处理器读取所述计算机指令并实现如权利要求1-5任一项所述的自动评阅作文的方法。
CN201710498079.9A 2017-06-27 2017-06-27 一种自动评阅作文的方法和装置、存储介质及终端 Active CN107291694B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710498079.9A CN107291694B (zh) 2017-06-27 2017-06-27 一种自动评阅作文的方法和装置、存储介质及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710498079.9A CN107291694B (zh) 2017-06-27 2017-06-27 一种自动评阅作文的方法和装置、存储介质及终端

Publications (2)

Publication Number Publication Date
CN107291694A true CN107291694A (zh) 2017-10-24
CN107291694B CN107291694B (zh) 2021-04-13

Family

ID=60098366

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710498079.9A Active CN107291694B (zh) 2017-06-27 2017-06-27 一种自动评阅作文的方法和装置、存储介质及终端

Country Status (1)

Country Link
CN (1) CN107291694B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107784109A (zh) * 2017-10-31 2018-03-09 浠绘旦 一种网络小说商业价值的评估方法及***
CN109190108A (zh) * 2018-07-20 2019-01-11 北京理琪教育科技有限公司 语文作文自动批改方法和***
CN109227564A (zh) * 2018-10-19 2019-01-18 南京工业大学 一种纸质作业自动批改机器人
CN109614624A (zh) * 2018-12-12 2019-04-12 广东小天才科技有限公司 一种英文语句的识别方法及电子设备
CN109903616A (zh) * 2019-04-08 2019-06-18 西安培华学院 一种辅助英语教学的交互式***与方法
CN110222344A (zh) * 2019-06-17 2019-09-10 上海元趣信息技术有限公司 一种针对小学生作文辅导的作文要素分析算法
CN110264792A (zh) * 2019-06-17 2019-09-20 上海元趣信息技术有限公司 一种针对小学生作文智能辅导***
CN110414006A (zh) * 2019-07-31 2019-11-05 京东方科技集团股份有限公司 文本的主题标注方法、装置、电子设备及存储介质
CN110598202A (zh) * 2019-06-20 2019-12-20 华中师范大学 一种小学语文作文排比句自动识别的方法
CN112528799A (zh) * 2020-12-02 2021-03-19 广州宏途教育网络科技有限公司 一种教学直播方法、装置、计算机设备和存储介质
CN112528628A (zh) * 2020-12-18 2021-03-19 北京一起教育科技有限责任公司 一种文本处理的方法、装置及电子设备
CN112527968A (zh) * 2020-12-22 2021-03-19 大唐融合通信股份有限公司 一种基于神经网络的作文评阅方法和***

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102279844A (zh) * 2011-08-31 2011-12-14 中国科学院自动化研究所 汉语作文自动测试方法及***
CN102779220A (zh) * 2011-05-10 2012-11-14 李德霞 英语试卷打分***
CN105183712A (zh) * 2015-08-27 2015-12-23 北京时代焦点国际教育咨询有限责任公司 一种用于对英语作文进行打分的方法以及装置
CN106126613A (zh) * 2016-06-22 2016-11-16 苏州大学 一种跑题作文确定方法及装置
CN106372056A (zh) * 2016-08-25 2017-02-01 久远谦长(北京)技术服务有限公司 一种基于自然语言的主题与关键词的提取方法和***
CN106502981A (zh) * 2016-10-09 2017-03-15 广西师范大学 基于词性、句法和词典的比喻修辞句自动分析与判定方法
US20170140659A1 (en) * 2015-11-14 2017-05-18 The King Abdulaziz City For Science And Technology Method and system for automatically scoring an essay using plurality of linguistic levels

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102779220A (zh) * 2011-05-10 2012-11-14 李德霞 英语试卷打分***
CN102279844A (zh) * 2011-08-31 2011-12-14 中国科学院自动化研究所 汉语作文自动测试方法及***
CN105183712A (zh) * 2015-08-27 2015-12-23 北京时代焦点国际教育咨询有限责任公司 一种用于对英语作文进行打分的方法以及装置
US20170140659A1 (en) * 2015-11-14 2017-05-18 The King Abdulaziz City For Science And Technology Method and system for automatically scoring an essay using plurality of linguistic levels
CN106126613A (zh) * 2016-06-22 2016-11-16 苏州大学 一种跑题作文确定方法及装置
CN106372056A (zh) * 2016-08-25 2017-02-01 久远谦长(北京)技术服务有限公司 一种基于自然语言的主题与关键词的提取方法和***
CN106502981A (zh) * 2016-10-09 2017-03-15 广西师范大学 基于词性、句法和词典的比喻修辞句自动分析与判定方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
YEN-YU CHEN 等: "An Unsupervised Automated Essay Scoring System", 《IEEE INTELLIGENT SYSTEMS》 *
刘明杨 等: "基于文采特征的高考作文自动评分", 《智能计算机与应用》 *
巩捷甫: "面向语文作文自动评阅的修辞手法识别***的设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
张云涛 等: "基于综合方法的文本主题句的自动抽取", 《上海交通大学学报》 *
柯育强: "大学英语作文自动评分***中文本聚类的应用", 《电子技术与软件工程》 *
蔡黎 等: "少数民族汉语考试作文自动评分的特征提取研究", 《第五届全国青年计算语言学研讨会》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107784109A (zh) * 2017-10-31 2018-03-09 浠绘旦 一种网络小说商业价值的评估方法及***
CN109190108A (zh) * 2018-07-20 2019-01-11 北京理琪教育科技有限公司 语文作文自动批改方法和***
CN109227564A (zh) * 2018-10-19 2019-01-18 南京工业大学 一种纸质作业自动批改机器人
CN109614624A (zh) * 2018-12-12 2019-04-12 广东小天才科技有限公司 一种英文语句的识别方法及电子设备
CN109903616A (zh) * 2019-04-08 2019-06-18 西安培华学院 一种辅助英语教学的交互式***与方法
CN110264792A (zh) * 2019-06-17 2019-09-20 上海元趣信息技术有限公司 一种针对小学生作文智能辅导***
CN110222344A (zh) * 2019-06-17 2019-09-10 上海元趣信息技术有限公司 一种针对小学生作文辅导的作文要素分析算法
CN110264792B (zh) * 2019-06-17 2021-11-09 上海元趣信息技术有限公司 一种针对小学生作文智能辅导***
CN110222344B (zh) * 2019-06-17 2022-09-23 上海元趣信息技术有限公司 一种针对小学生作文辅导的作文要素分析算法
CN110598202A (zh) * 2019-06-20 2019-12-20 华中师范大学 一种小学语文作文排比句自动识别的方法
CN110414006A (zh) * 2019-07-31 2019-11-05 京东方科技集团股份有限公司 文本的主题标注方法、装置、电子设备及存储介质
CN112528799A (zh) * 2020-12-02 2021-03-19 广州宏途教育网络科技有限公司 一种教学直播方法、装置、计算机设备和存储介质
CN112528628A (zh) * 2020-12-18 2021-03-19 北京一起教育科技有限责任公司 一种文本处理的方法、装置及电子设备
CN112528628B (zh) * 2020-12-18 2024-02-02 北京一起教育科技有限责任公司 一种文本处理的方法、装置及电子设备
CN112527968A (zh) * 2020-12-22 2021-03-19 大唐融合通信股份有限公司 一种基于神经网络的作文评阅方法和***

Also Published As

Publication number Publication date
CN107291694B (zh) 2021-04-13

Similar Documents

Publication Publication Date Title
CN107291694A (zh) 一种自动评阅作文的方法和装置、存储介质及终端
Blanchard et al. TOEFL11: A corpus of non‐native English
Biber et al. Corpus linguistics: Investigating language structure and use
Villalon et al. Concept map mining: A definition and a framework for its evaluation
Reynolds Insights from Russian second language readability classification: complexity-dependent training requirements, and feature evaluation of multiple categories
Volodina et al. SweLL on the rise: Swedish learner language corpus for European reference level studies
CN106649819B (zh) 一种提取实体词和上位词的方法及装置
Adebara et al. Towards afrocentric NLP for African languages: Where we are and where we can go
JPWO2005057524A1 (ja) 作文小論文の評価採点装置
CN111311459B (zh) 一种面向国际汉语教学的交互式出题方法及***
Burchardt et al. The German Language in the Digital Age
CN111914532A (zh) 一种中文作文评分方法
CN108280065A (zh) 一种外文文本评价方法及装置
Siewert et al. LSDC-a comprehensive dataset for low Saxon dialect classification
El Kah et al. Application of Arabic language processing in language learning
Volodina On two SweLL learner corpora–SweLL-pilot and SweLL-gold
Rybka The linguistic encoding of landscape in Lokono
Haokip Socio-Linguistic Situation in North-East India
CN112989068B (zh) 针对唐诗知识的知识图谱构建方法及唐诗知识问答***
Graedler NEST-a corpus in the brooding box
Khandait et al. Automatic question generation through word vector synchronization using lamma
Medrano Toward a Khipu Transcription" Insistence": a Corpus-Based Study of the Textos Andinos
Yan The construction and application of the corpus system in primary school English classroom: taking Hainan Province as an example
Appel Lexical bundles in university EAP exam writing samples: CAEL test essays
Robinson-Jones et al. Report on the West Frisian Language (Language Technology Support of Europe’s Languages in 2020/2021-European Language Equality project)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Units F01-03 and 05-10 on the 6th floor of No.1 Building, No.8 Courtyard, Guangshun South Street, Chaoyang District, Beijing

Applicant after: Beijing Ape Power Future Technology Co.,Ltd.

Address before: Room A116, Floor 2, 88 Xiangshan Road, Haidian District, Beijing

Applicant before: BEIJING FENBI WEILAI TECHNOLOGY CO.,LTD.

CB02 Change of applicant information
TA01 Transfer of patent application right

Effective date of registration: 20200506

Address after: 100102 unit F01, 5th floor and unit 04, F01, 6th floor, building 1, yard 8, Guangshun South Street, Chaoyang District, Beijing

Applicant after: Beijing ape force Education Technology Co.,Ltd.

Address before: Units F01-03 and 05-10 on the 6th floor of No.1 Building, No.8 Courtyard, Guangshun South Street, Chaoyang District, Beijing

Applicant before: Beijing Ape Power Future Technology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 100102 unit F01, 5th floor, building 1, yard 8, Guangshun South Street, Chaoyang District, Beijing

Patentee after: Beijing Ape Power Technology Co.,Ltd.

Address before: 100102 unit F01, 5th floor, building 1, yard 8, Guangshun South Street, Chaoyang District, Beijing

Patentee before: Beijing ape force Education Technology Co.,Ltd.

CP01 Change in the name or title of a patent holder