CN114547278A - 一种英语学习辅助方法及*** - Google Patents

一种英语学习辅助方法及*** Download PDF

Info

Publication number
CN114547278A
CN114547278A CN202210150091.1A CN202210150091A CN114547278A CN 114547278 A CN114547278 A CN 114547278A CN 202210150091 A CN202210150091 A CN 202210150091A CN 114547278 A CN114547278 A CN 114547278A
Authority
CN
China
Prior art keywords
user
grammar
vocabulary
words
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210150091.1A
Other languages
English (en)
Inventor
刘源
牛颖
蒋东辰
康家瑞
隗艳萍
孙艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Moyi Information Technology Co ltd
Original Assignee
Guangzhou Moyi Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Moyi Information Technology Co ltd filed Critical Guangzhou Moyi Information Technology Co ltd
Priority to CN202210150091.1A priority Critical patent/CN114547278A/zh
Publication of CN114547278A publication Critical patent/CN114547278A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/374Thesaurus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Strategic Management (AREA)
  • Mathematical Physics (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及一种英语学***。

Description

一种英语学习辅助方法及***
技术领域
本发明涉及英语学习智能辅助领域,具体涉及一种英语学习辅助方法及***。
背景技术
英语是当今世界上主要的通用语言之一,也是世界上最广泛使用的语言。我国的基础教育发展战略中,也把英语教育作为公民素质教育的重要组成部分,并将其摆在突出地位,英语能力已成为了一种必备的技能。
然而在英语学***的也各不相同,针对不同水平的英语学习者,如果使用相同的教学方式,那么就无法保证每个人都取得最好的学习效果,因此个性化的教学十分重要。同时随着互联网技术的发展,网络上涌现了大量的英语阅读材料,这为英语的学习提供了丰富的资源。如何充分发挥互联网的资源优势,从丰富的网络语料中有效提取适合学生个性化学习的英文文本,这已成为英语学习中一个亟待解决的问题。
为了满足这些需求,需要实现一个英语语言水平评估,英语知识和文本推荐***,从而为学***的发展。
现有的英语学习辅助***和方法大致可以分为两类:
第一类方法主要是基于文本词汇难度评估用户水平,进行文本推荐。该类方法通常是根据用户提供的作文或者可理解的阅读材料,提取文章中的所有词汇,然后根据单一的词汇统计特征(如频率等)对用户进行语言水平评估。该类方法一方面忽视了语法难度对阅读的影响;另一方面,以频率等统计特征作为词汇难度忽视了第二语言学习者并不存在充分语境的学习条件,往往不能反映语言学习者学习词汇的实际难度。因此,基于这类方法做出的能力评估及文本推荐常常出现对学习者不友好,真实学习难度差异巨大的情况。
第二类方法基于多种语言特征评估用户水平,进行文本推荐。该类方法通常选择大量的语言特征,如词汇频率,音节数,词性等多个维度,采用机器学***判断。第二,训练需要大量的标注集合,这对于语料库的构建和积累提出了巨大的挑战,故这类方法很难用于实际教学活动中。第三,众多维度特征有时互产生互相的干扰,与实际教学进度产生不一致,这会进一步降低这类方法的实用性。
同时,这两类方法在推荐文本时,通常是采用欧式距离计算文本相似度,选择与用户上传的文本难度最接近的阅读材料进行推荐。但是相似的文本不一定适合语言学***,最终向学习者推送包含下一阶段需要学习的词汇和语法的阅读文本。
综上所述,现有的方法都难以有效对针对第二语言学***评估,这使得基于第二语言学习的自动化推送十分困难。
发明内容
为了解决上述技术问题,本发明提供一种英语学习辅助方法及***。
本发明技术解决方案为:一种英语学习辅助方法,包括:
步骤S1:根据现有词典,构建词汇分级表;
步骤S2:根据英语教学大纲,构建语法分级表;
步骤S3:用户上传作文;根据所述作文,为所述用户创建用户词汇表,并结合所述词汇分级表,确定用户词汇等级;
步骤S4:根据所述作文,为所述用户创建用户语法表,结合所述语法分级表,确定用户语法等级;
步骤S5:根据所述用户词汇等级和所述用户语法等级,为所述用户推荐阅读内容。
本发明与现有技术相比,具有以下优点:
1、本发明公开了一种英语学***。
2、本发明选择基于专家编写的词典解释对词汇进行分级,更符合真实的词汇难度划分;在进行语法水平评估时,使用了英语教学大纲作为依据构建语法分级表,从而保证了语法评估结果更有权威性。
3、本发明在为用户进行内容推荐时,一方面,同时提供了词汇,语法和文章的推荐,从而保证了推送内容的全面性;另一方面,在推送文章时,不是挑选难度近似的文章,而是基于“i+1”理论,根据用户词汇和语法的发展水平,选择下一语言发展水平需要学***的发展。
附图说明
图1为本发明实施例中一种英语学习辅助方法的流程图;
图2为本发明实施例中构建词汇分级表的流程图;
图3为本发明实施例中词汇统计模块的流程图;
图4为本发明实施例中SIMPLICITY算法的流程图;
图5为本发明实施例中为用户创建用户词汇表的流程图;
图6为本发明实施例中确定用户词汇等级的流程图;
图7为本发明实施例中为用户创建用户语法表的流程图;
图8为本发明实施例中语法统计模块的流程图;
图9为本发明实施例中确定用户语法等级的流程图;
图10为本发明实施例中为用户推荐阅读内容的流程图;
图11为本发明实施例中一种英语学习辅助***的结构框图。
具体实施方式
本发明提供了一种英语学***。
为了使本发明的目的、技术方案及优点更加清楚,以下通过具体实施,并结合附图,对本发明进一步详细说明。
本发明提供的方法的核心思想是基于语言***,“1”表示略高于语言学***的语言知识。用户通过大量接触“i+1”水平的语言知识,用户的语言水平就可以从“i”过渡到“i+1”阶段;而如果学***,最终向用户适合当前学***的英文阅读文本。
为了方便理解下述实施例,对其中所使用的数据表及对应表名如下所列:
Figure BDA0003509938240000031
Figure BDA0003509938240000041
实施例一
如图1所示,本发明实施例提供的一种英语学习辅助方法,包括下述步骤:
步骤S1:根据现有词典,构建词汇分级表;
步骤S2:根据英语教学大纲,构建语法分级表;
步骤S3:用户上传作文;根据作文,为用户创建用户词汇表,并结合词汇分级表,确定用户词汇等级;
步骤S4:根据作文,为用户创建用户语法表,结合语法分级表,确定用户语法等级;
步骤S5:根据用户词汇等级和用户语法等级,为用户推荐阅读内容。
在英语词典中,每个英文单词都有对应的英语解释,词典的编纂者在编写这些解释时,一般会选用多个比“被解释词”更简单的“解释词”解释它。因此,可以根据词典中的“解释词”与“被解释词”相对难度关系进行排序。本发明实施例采用图的表示与算法构建词汇分级表,即:词典中的每一个单词都是该图中的一个节点;假设A、B表示词典中的两个单词,如果存在一词条A是“被解释词”、B是该词条中A的“解释词”,那么就可以在图中构建从A到B的边。根据下述两个假设条件,计算单词的难度:
1.数量假设:如果一个单词被很多其它单词解释,说明这个单词比较简单,也就是该词汇Simplicity值会相对较高(在图中,即被单词A解释的单词越多,A越简单)。
2.质量假设:如果一个单词被一个Simplicity值很高的单词解释,那么这个单词的Simplicity值也会相应地提高(在图中,即用于解释单词A的单词越简单,A也越简单)。
本发明实施例采用Simplicity表示单词的简单程度,Simplicity越小,单词难度越高。
如图2所示,在一个实施例中,上述步骤S1:根据现有词典,构建词汇分级表,具体包括:
步骤S101:选取一本词典,获取其中所有单词的所有的解释,组成词典语料库dictCorpus;其中,dictCorpus以Map结构存储所有所述单词及其对应的所有解释,每个元素形如<word,[sense1,sense2...]>;
步骤S102:初始化有向图G,令G为空,令item为dictCorpus的第一个元素;
步骤S103:令itemWord为item中的词汇,itemSenses为item中的所有解释;
步骤S104:令sense为itemSenses的第一个元素;
步骤S105:根据词汇统计模块,获取itemWord一条解释中的所有互异单词的原形,记为senseWords,其中,词汇统计模块,具体包括:
如图3所示,步骤S1051:将输入文本text按照空格和非单引号“’”的标点符号分割字符串,并将所有分割结果按分割次序存储在字符串链表strList中;
步骤S1052:按照字符串比对,统计strList中各互异字符串,存储到字符串链表diffStrList中,具体包括:
步骤S10521:通过查询模块ShortForm遍历strList中所有单词temp是否为若干单词的缩写:如果temp是某些单词的缩写,则将其进行拆分;
步骤S10522:从strList中移除temp,并将拆分后的两个单词加入strList中;
步骤S10523:统计strList中各互异字符串,存储到字符串链表diffStrList中;
步骤S1053:令str为diffStrList中的第一个字符串;
步骤S1054:如果str只有首字母大写,则将str的首字母变为小写;转步骤2.5;
步骤S1055:通过查询函数判断str是否为某一个单词的变形:如果str是某一个单词的变形,则将str变为其所对应的单词原形,转步骤S1056;否则,转步骤S1057;
步骤S1056:如果textWords没有str且str属于wordList,则将str存储到textWords中;
步骤S1057:如str不是diffStrList中最后一个元素,则将str后移一个元素,转步骤S1054;
步骤S106:分别以itemWord为弧尾节点,senseWords中的所有单词为弧头节点,把两个节点及有向边添加到G中;
步骤S107:如果sense不是itemSenses的最后一个元素,则sense后移一个元素,转步骤S105,否则转步骤S108;
步骤S108:如果item不是dictCorpus的最后一个元素,则item后移一个元素,转步骤S103,否则转步骤S109;
步骤S109:根据SIMPLICITY算法,获取按Simplicity值逆序排序,即难度从小到大的词汇表wordList,wordList每个元素为单词及其Simplicity值,其中,SIMPLICITY算法,具体包括:
如图4所示,步骤S1091:统计词典语料库中共计n个单词,并基于有向图G={V,E},其中,词典语料库中的所有单词构成节点集V,被解释词指向解释词的弧构成弧集E,将单词和节点用序号表示(1,2..i..n),计算第i个单词Simplicity值迭代计算公式(1)如下所示:
Figure BDA0003509938240000061
其中,xi表示节点i的Simplicity值,即单词i的简单程度;xj表示节点j的Simplicity值,即单词j的简单程度;kj out表示图中节点j的出度,即单词j的解释中“解释词”数量;xj除以kj out表示为:一个单词的解释中的解释词越多,这个单词越难,因为作为分母不能为0,所以一般取kj out=max(1,kjout);Aij表示节点j是否指向节点i,即单词i是否解释单词j,当存在节点j指向节点i的有向边时,Aij为1,否则为0;∑表示累加除了i节点以外所有其它节点的Aij×xj/kj out值;α和β为预设的参数;
步骤S1092:计算词典中所有单词的Simplicity值,用矩阵的形式可以表示为公式(2):
x=αAD-1x+β1 (2)
其中,x为各节点Simplicity值的列向量(x1,x2,..xn)T,1为列向量(1,1,1...)T,A为元素值为Aij的邻接矩阵,D是元素为Djj=max(1,kj out)对角矩阵,D-1对角线上是1/kj out
步骤S1093:使用迭代算法求解Simplicity值,首先给每个单词赋予相同的Simplicity值,然后根据公式(2)不断迭代计算x,当计算前后的x的各分量的总误差绝对值小于阈值时迭代结束;
步骤S110:把wordList每P个单词归为一级,存储到词汇分级表leveledWords[i]中,并把P个单词的平均Simplicity值记作这一级单词的难度存储到LW[i]。
在一个实施例中,上述步骤S2:根据英语教学大纲,构建语法分级表,具体包括:
步骤S201:构建一个具有M个等级的语法分级表,将语法点存储到语法分级表leveledGrammars,其中leveledGrammars[i]表示等级为i的语法点列表,i∈[1,M];
步骤S202:将英语教学大纲中所有的语法点存储到outlineGrammars中。
如图5所示,在一个实施例中,上述步骤S3中用户上传作文;根据作文,为用户创建用户词汇表,具体包括:
步骤S301:令texts为用户一次上传的所有作文;
步骤S302:令text为texts的第一篇作文;
步骤S303:将text传给词汇统计模块,获取textWords;
步骤S304:把textWords中所有没有出现在用户词汇表userWords中的单词,添加到userWords中;
步骤S305:如果text不是texts的最后一篇作文,则令text为texts下一篇作文,转步骤S303。
根据用户已掌握的所有单词userWords,结合词汇分级表leveledWords,对用户的词汇能力进行等级判定。假设用户的词汇水平,由其掌握的词汇中难度排在前α的词汇决定(α可取10%至30%)。因此,可以通过计算这些词汇的难度平均值averageValue,对比leveledWords中各级单词的难度值LW[i],确定用户的词汇等级。其中i为1至N的自然数,以WORDSEVALUATE(userWords)表示对用户词汇userWords的词汇等级判定。
如图6所示,在一个实施例中,上述步骤S3中确定用户词汇等级,具体包括:
步骤S311:使用快速排序算法,按照Simplicity值对userWords从小到大排序;
步骤S312:将总Simplicity值total初始化为0,即total=0,选取用来计算词汇难度的单词数量num=LENGTH(userWords)×α,num向下取整数,LENGTH方法用来获取userWords的单词数量;
步骤S313:令pr为userWords第一个单词的Simplicity值;
步骤S314:令total=total+pr;
步骤S315:如pr不是userWords中第num个元素的Simplicity值,则将pr后移一个元素,转步骤S314;否则,转步骤S316;
步骤S316:用户词汇平均Simplicity值averageValue=total/num;
步骤S317:令i=1;
步骤S318:如果averageValue<LW[i]且i<N+1,则i=i+1,转步骤S318;否则,转步骤S319;
步骤S319:如果i<N+1,则用户的词汇等级userWordGrade=i;否则userWordGrade=N。
如图7所示,在一个实施例中,上述步骤S4中根据作文,为用户创建用户语法表,具体包括:
步骤S401:令texts为用户一次上传的所有作文;
步骤S402:令text为texts的第一篇作文;
步骤S403:将text传给语法统计模块,获取textGrammars,其中,语法统计模块,具体包括:
如图8所示,步骤S4031:令textGrammars为Set数据结构,初始为空;
步骤S4032:令text为用户的第一篇作文;
步骤S4033:令sentence是text的第一个句子;
步骤S4034:使用StanfordParser的parse方法处理sentence,得到语法解析树,其中包含了sentence中的所有词性和句法英文标签labels;
步骤S4035:令label为labels的第一个标签;
步骤S4036:判断label是否属于英语教学大纲outlineGrammars,如果属于则把将label添加到textGrammars中;否则转步骤S4037;
步骤S4037:如果label不是labels的最后一个标签,则令label为labels的下一个,转步骤S4036;否则转步骤S4038;
步骤S4038:当sentence不是text的最后一个句子时,令sentence为text的下一个句子,转步骤S4034;否则转步骤S4039;
步骤S4039:当text不是用户的最后一篇作文时,令text为该用户的下一篇作文,转步骤S4033;否则,退出本模块;
步骤S404:把textGrammars中所有没有出现在用户语法表userGrammars中的语法,添加到userGrammars中;
步骤S405:如果text不是texts的最后一篇作文,则令text为texts下一篇作文,转步骤S403;否则,将userGrammars存储到数据库。
根据用户已掌握的所有语法点userGrammars,结合英语教学大纲构建的语法分级表leveledGrammars,对用户的语法能力进行等级判定。假设用户掌握的语法userWords中,包含了leveledWords中多个等级中的语法,则把最大的等级值判定为用户的语法等级。以GRAMMARSEVALUATE(userGrammars)表示对用户语法userGrammars的语法等级判定。
如图9所示,在一个实施例中,上述步骤S4中确定用户语法等级,具体包括:
步骤S411:令grammar为userGrammars的第一个语法;
步骤S412:获取用户语法等级userGrammarGrade=max{1,GRADE(grammar)},其中GRADE(grammar)可以根据语法grammar得到其在leveledWords中的等级;
步骤S413:如果grammar不是userGrammars的最后一个语法,则grammar后移,转步骤S412;否则,返回用户语法等级userGrammarGrade。
根据用户词汇等级和语法等级,向用户推送多篇文章及推送文章中用户未习得词汇和语法的解释和例句。语言学家认为,用户自主理解一段内容,至少要已知这段话里90%-95%的词汇。因此,结合“i+1”理论,考虑从包含大量文章的语料库CorpusA中筛选出最多包含γ(可取1%-10%之间数值,本发明实施例取3%-5%)用户未掌握且属于“i+1”(i为用户词汇等级)等级词汇的K篇文章(K可取任意正整数,本发明实施例取5-10中数值)。同时,为了让用户在学习词汇的同时,学习到新的语法结构,该文章中同时要包含k个“j+1”(这里的j为用户语法等级)等级中用户未掌握的语法(本发明实施例k取1-3)。然后把这些文章推送给用户,同时从词汇语料库CorpusB和语法语料库CorpusC中提供文章中新词汇和语法的解释和例句辅助用户学习,其中CorpusA,CorpusB和CorpusC假设已有,其中CorpusA中包含大量的文章,CorpusB中存储了英文中所有的词汇以及词汇的解释和例句,CorpusC中存储了英文中所有的语法以及解释和例句。
如图10所示,在一个实施例中,上述步骤S5:根据用户词汇等级和用户语法等级,为用户推荐阅读内容,具体包括:
步骤S501:令tempContents初始为空;
步骤S502:令text为词典语料库中的第一篇文章;
步骤S503:利用词汇统计模块得到text中的所有词汇words,利用语法统计模块得到text中的所有语法grammars;
步骤S504:numWord=LENGTH(words),numGrammar=LENGTH(grammars);
步骤S505:
i=WORDSEVALUATE(userWords)j=GRAMMARSEVALUATE(userGrammars);
步骤S506:如果words至少有(1-γ)*numWord个单词不属于userWrods记为newWords,其中,γ为预设的参数,而且words中剩余的单词属于leveledWords[i]或者leveledWords[i+1];而且grammars中至多存在k个语法点不属于userGrammars记为newGrammars,其中,k为预设的参数,且属于leveledGrammars[j]或者leveledGrammars[j+1],则把[text,newWords,newGrammars]添加到tempContents中,转至步骤S507;否则,转至步骤S507;
步骤S507:如果text不是词典语料库的最后一篇文章,则text后移,转步骤S503,否则转步骤S508;
步骤S508:如果LENGTH(tempContents)<=K,则令recommendContents等于tempContents;否则,截取tempContents前K个元素,其中,K为预设的参数,赋值为recommendContents;
步骤S509:推送recommendContents中的text,并根据text中对应的newWords和newGrammars,从对应的词汇语料库CorpusB和语法语料库CorpusC提取解释和例句进行推送。
本发明公开了一种英语学***。本发明选择基于专家编写的词典解释对词汇进行分级,更符合真实的词汇难度划分;在进行语法水平评估时,使用了英语教学大纲作为依据构建语法分级表,从而保证了语法评估结果更有权威性。本发明在为用户进行内容推荐时,一方面,同时提供了词汇,语法和文章的推荐,从而保证了推送内容的全面性;另一方面,在推送文章时,不是挑选难度近似的文章,而是基于“i+1”理论,根据用户词汇和语法的发展水平,选择下一语言发展水平需要学***的发展。
实施例二
如图6所示,本发明实施例提供了一种英语学习辅助***,包括下述模块:
构建词汇分级表模块61,用于根据现有词典,构建词汇分级表;
构建词汇分级表模块62,用于根据英语教学大纲,构建语法分级表;
确定用户词汇等级模块63,用于用户上传作文;根据作文,为用户创建用户词汇表,并结合词汇分级表,确定用户词汇等级;
确定用户语法等级64,用于根据作文,为用户创建用户语法表,结合语法分级表,确定用户语法等级;
推荐阅读内容模块65,用于根据用户词汇等级和用户语法等级,为用户推荐阅读内容。
提供以上实施例仅仅是为了描述本发明的目的,而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改,均应涵盖在本发明的范围之内。

Claims (13)

1.一种英语学习辅助方法,其特征在于,包括:
步骤S1:根据现有词典,构建词汇分级表;
步骤S2:根据英语教学大纲,构建语法分级表;
步骤S3:用户上传作文;根据所述作文,为所述用户创建用户词汇表,并结合所述词汇分级表,确定用户词汇等级;
步骤S4:根据所述作文,为所述用户创建用户语法表,结合所述语法分级表,确定用户语法等级;
步骤S5:根据所述用户词汇等级和所述用户语法等级,为所述用户推荐阅读内容。
2.根据权利要求1所述的英语学习辅助方法,其特征在于,所述步骤S1:根据现有词典,构建词汇分级表,具体包括:
步骤S101:选取一本词典,获取其中所有单词的所有的解释,组成词典语料库dictCorpus;其中,dictCorpus以Map结构存储所有所述单词及其对应的所有解释,每个元素形如<word,[sense1,sense2...]>;
步骤S102:初始化有向图G,令G为空,令item为dictCorpus的第一个元素;
步骤S103:令itemWord为item中的词汇,itemSenses为item中的所有解释;
步骤S104:令sense为itemSenses的第一个元素;
步骤S105:根据词汇统计模块,获取itemWord一条解释中的所有互异单词的原形,记为senseWords;
步骤S106:分别以itemWord为弧尾节点,senseWords中的所有单词为弧头节点,把两个节点及有向边添加到有向图图G中;
步骤S107:如果sense不是itemSenses的最后一个元素,则sense后移一个元素,转步骤S105,否则转步骤S108;
步骤S108:如果item不是dictCorpus的最后一个元素,则item后移一个元素,转步骤S103,否则转步骤S109;
步骤S109:根据SIMPLICITY算法,获取按Simplicity值逆序排序,即难度从小到大的词汇表wordList,wordList每个元素为单词及其Simplicity值;
步骤S110:把wordList每P个单词归为一级,存储到词汇分级表leveledWords[i]中,并把P个单词的平均Simplicity值记作这一级单词的难度存储到LW[i]。
3.根据权利要求2所述的英语学习辅助方法,其特征在于,所述步骤S105中词汇统计模块,具体包括:
步骤S1051:将输入文本text按照空格和非单引号“’”的标点符号分割字符串,并将所有分割结果按分割次序存储在字符串链表strList中;
步骤S1052:按照字符串比对,统计strList中各互异字符串,存储到字符串链表diffStrList中;
步骤S1053:令str为diffStrList中的第一个字符串;
步骤S1054:如果str只有首字母大写,则将str的首字母变为小写,转步骤S1055;
步骤S1055:通过查询函数判断str是否为某一个单词的变形:如果str是某一个单词的变形,则将str变为其所对应的单词原形,转步骤S1056;否则,转步骤S1057;
步骤S1056:如果textWords没有str且str属于wordList,则将str存储到textWords中;
步骤S1057:如str不是diffStrList中最后一个元素,则将str后移一个元素,转步骤S1054。
4.根据权利要求3所述的英语学习辅助方法,其特征在于,所述步骤S1052:按照字符串比对,统计strList中各互异字符串,存储到字符串链表diffStrList中,具体包括:
步骤S10521:通过查询模块ShortForm遍历strList中所有单词temp是否为若干单词的缩写:如果temp是某些单词的缩写,则将其进行拆分;
步骤S10522:从strList中移除temp,并将拆分后的两个单词加入strList中;
步骤S10523:统计strList中各互异字符串,存储到字符串链表diffStrList中。
5.根据权利要求2所述的英语学习辅助方法,其特征在于,所述步骤S109:所述SIMPLICITY算法,具体包括:
步骤S1091:统计所述词典语料库中共计n个单词,并基于有向图G={V,E},其中,所述词典语料库中的所有单词构成节点集V,被解释词指向解释词的弧构成弧集E,将所述单词和节点用序号表示(1,2..i..n),计算第i个单词Simplicity值迭代计算公式(1)如下所示:
Figure FDA0003509938230000021
其中,xi表示节点i的Simplicity值,即单词i的简单程度;xj表示节点j的Simplicity值,即单词j的简单程度;kj out表示图中节点j的出度,即单词j的解释中“解释词”数量;xj除以kj out表示为:一个单词的解释中的解释词越多,这个单词越难,因为作为分母不能为0,所以一般取kj out=max(1,kjout);Aij表示节点j是否指向节点i,即单词i是否解释单词j,当存在节点j指向节点i的有向边时,Aij为1,否则为0;∑表示累加除了i节点以外所有其它节点的Aij×xj/kj out值;α和β为预设的参数;
步骤S1092:计算所述词典中所有单词的Simplicity值,用矩阵的形式可以表示为公式(2):
χ=αAD-1χ+β1 (2)
其中,x为各节点Simplicity值的列向量(x1,x2,..xn)T,1为列向量(1,1,1...)T,A为元素值为Aij的邻接矩阵,D是元素为Djj=max(1,kj out)对角矩阵,D-1对角线上是1/kj out
步骤S1093:使用迭代算法求解Simplicity值,首先给每个单词赋予相同的Simplicity值,然后根据公式(2)不断迭代计算x,当计算前后的x的各分量的总误差绝对值小于阈值时迭代结束。
6.根据权利要求1所述的英语学习辅助方法,其特征在于,所述步骤S2:根据英语教学大纲,构建语法分级表,具体包括:
步骤S201:构建一个具有M个等级的语法分级表,将语法点存储到所述语法分级表leveledGrammars,其中leveledGrammars[i]表示等级为i的语法点列表,i∈[1,M];
步骤S202:将所述英语教学大纲中所有的语法点存储到outlineGrammars中。
7.根据权利要求1所述的英语学习辅助方法,其特征在于,所述步骤S3中用户上传作文;根据所述作文,为所述用户创建用户词汇表,具体包括:
步骤S301:令texts为所述用户一次上传的所有作文;
步骤S302:令text为texts的第一篇作文;
步骤S303:将text传给所述词汇统计模块,获取textWords;
步骤S304:把textWords中所有没有出现在所述用户词汇表userWords中的单词,添加到userWords中;
步骤S305:如果text不是texts的最后一篇作文,则令text为texts下一篇作文,转步骤S303。
8.根据权利要求1所述的英语学习辅助方法,其特征在于,所述步骤S3中确定用户词汇等级,具体包括:
步骤S311:使用快速排序算法,按照Simplicity值对userWords从小到大排序;
步骤S312:将总Simplicity值total初始化为0,即total=0,选取用来计算词汇难度的单词数量num=LENGTH(userWords)×α,num向下取整数,LENGTH方法用来获取userWords的单词数量;
步骤S313:令pr为userWords第一个单词的Simplicity值;
步骤S314:令total=total+pr;
步骤S315:如pr不是userWords中第num个元素的Simplicity值,则将pr后移一个元素,转步骤S314;否则,转步骤S316;
步骤S316:用户词汇平均Simplicity值averageValue=total/num;
步骤S317:令i=1;
步骤S318:如果averageValue<LW[i]且i<N+1,则i=i+1,转步骤S318;否则,转步骤S319;
步骤S319:如果i<N+1,则用户的词汇等级userWordGrade=i;否则userWordGrade=N。
9.根据权利要求1所述的英语学习辅助方法,其特征在于,所述步骤S4中根据所述作文,为所述用户创建用户语法表,具体包括:
步骤S401:令texts为所述用户一次上传的所有作文;
步骤S402:令text为texts的第一篇作文;
步骤S403:将text传给语法统计模块,获取textGrammars;
步骤S404:把textGrammars中所有没有出现在所述用户语法表userGrammars中的语法,添加到userGrammars中;
步骤S405:如果text不是texts的最后一篇作文,则令text为texts下一篇作文,转步骤S403;否则,将userGrammars存储到数据库。
10.根据权利要求9所述的英语学习辅助方法,其特征在于,所述步骤S403中所述语法统计模块,具体包括:
步骤S4031:令textGrammars为Set数据结构,初始为空;
步骤S4032:令text为用户的第一篇作文;
步骤S4033:令sentence是text的第一个句子;
步骤S4034:使用Stanford Parser的parse方法处理sentence,得到语法解析树,其中包含了sentence中的所有词性和句法英文标签labels;
步骤S4035:令label为labels的第一个标签;
步骤S4036:判断label是否属于所述英语教学大纲outlineGrammars,如果属于则把将label添加到textGrammars中;否则转步骤S4037;
步骤S4037:如果label不是labels的最后一个标签,则令label为labels的下一个,转步骤S4036;否则转步骤S4038;
步骤S4038:当sentence不是text的最后一个句子时,令sentence为text的下一个句子,转步骤S4034;否则转步骤S4039;
步骤S4039:当text不是用户的最后一篇作文时,令text为该用户的下一篇作文,转步骤S4033;否则,退出本模块。
11.根据权利要求1所述的英语学习辅助方法,其特征在于,所述步骤S4中确定用户语法等级,具体包括:
步骤S411:令grammar为userGrammars的第一个语法;
步骤S412:获取用户语法等级userGrammarGrade=max{1,GRADE(grammar)},其中GRADE(grammar)可以根据语法grammar得到其在leveledWords中的等级;
步骤S413:如果grammar不是userGrammars的最后一个语法,则grammar后移,转步骤S412;否则,返回所述用户语法等级userGrammarGrade。
12.根据权利要求1所述的英语学习辅助方法,其特征在于,所述步骤S5:根据所述用户词汇等级和所述用户语法等级,为所述用户推荐阅读内容,具体包括:
步骤S501:令tempContents初始为空;
步骤S502:令text为所述词典语料库中的第一篇文章;
步骤S503:利用所述词汇统计模块得到text中的所有词汇words,利用所述语法统计模块得到text中的所有语法grammars;
步骤S504:numWord=LENGTH(words),numGrammar=LENGTH(grammars);
步骤S505:
i=WORDSEVALUATE(userWords),j=GRAMMARSEVALUATE(userGrammars);
步骤S506:如果words至少有(1-γ)*numWord个单词不属于userWrods记为newWords,其中,γ为预设的参数,而且words中剩余的单词属于leveledWords[i]或者leveledWords[i+1];而且grammars中至多存在k个语法点不属于userGrammars记为newGrammars,其中,k为预设的参数,且属于leveledGrammars[j]或者leveledGrammars[j+1],则把[text,newWords,newGrammars]添加到tempContents中,转至步骤S507;否则,转至步骤S507;
步骤S507:如果text不是所述词典语料库的最后一篇文章,则text后移,转步骤S503,否则转步骤S508;
步骤S508:如果LENGTH(tempContents)<=K,则令recommendContents等于tempContents;否则,截取tempContents前K个元素,其中,K为预设的参数,赋值为recommendContents;
步骤S509:推送recommendContents中的text,并根据text中对应的newWords和newGrammars,从对应的词汇语料库和语法语料库提取解释和例句进行推送。
13.一种英语学习辅助***,其特征在于,包括下述模块:
构建词汇分级表模块,用于根据现有词典,构建词汇分级表;
构建词汇分级表模块,用于根据英语教学大纲,构建语法分级表;
确定用户词汇等级模块,用于用户上传作文;根据所述作文,为所述用户创建用户词汇表,并结合所述词汇分级表,确定用户词汇等级;
确定用户语法等级,用于根据所述作文,为所述用户创建用户语法表,结合所述语法分级表,确定用户语法等级;
推荐阅读内容模块,用于根据所述用户词汇等级和所述用户语法等级,为所述用户推荐阅读内容。
CN202210150091.1A 2022-02-18 2022-02-18 一种英语学习辅助方法及*** Pending CN114547278A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210150091.1A CN114547278A (zh) 2022-02-18 2022-02-18 一种英语学习辅助方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210150091.1A CN114547278A (zh) 2022-02-18 2022-02-18 一种英语学习辅助方法及***

Publications (1)

Publication Number Publication Date
CN114547278A true CN114547278A (zh) 2022-05-27

Family

ID=81674946

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210150091.1A Pending CN114547278A (zh) 2022-02-18 2022-02-18 一种英语学习辅助方法及***

Country Status (1)

Country Link
CN (1) CN114547278A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116259199A (zh) * 2023-05-11 2023-06-13 南京汉卫教育科技有限公司 基于大数据语音交互的语言自主学习***

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116259199A (zh) * 2023-05-11 2023-06-13 南京汉卫教育科技有限公司 基于大数据语音交互的语言自主学习***

Similar Documents

Publication Publication Date Title
CN108363743B (zh) 一种智能问题生成方法、装置和计算机可读存储介质
CN109902298B (zh) 一种自适应学***估测方法
CN108763326B (zh) 一种基于特征多样化的卷积神经网络的情感分析模型构建方法
CN111709242B (zh) 一种基于命名实体识别的中文标点符号添加方法
CN107818164A (zh) 一种智能问答方法及其***
CN110276069B (zh) 一种中国盲文错误自动检测方法、***及存储介质
CN109829159A (zh) 一种古汉语文本的一体化自动词法分析方法及***
CN110851599A (zh) 一种中文作文自动评分方法及教辅***
CN109145304B (zh) 一种基于字的中文观点要素情感分析方法
CN112308370B (zh) 一种基于Transformer的面向思政课程的主观题自动评分方法
CN109033085B (zh) 中文分词***及中文文本的分词方法
CN114756681B (zh) 一种基于多注意力融合的评教文本细粒度建议挖掘方法
CN113468887A (zh) 基于边界与片段分类的学者信息关系抽取方法和***
CN110851601A (zh) 基于分层注意力机制的跨领域情感分类***及方法
CN113704416A (zh) 词义消歧方法、装置、电子设备及计算机可读存储介质
CN107748744A (zh) 一种勾勒框知识库的建立方法及装置
CN111694927A (zh) 一种基于改进词移距离算法的文档自动评阅方法
CN112132536A (zh) 一种岗位推荐方法、***、计算机设备及存储介质
CN111695358A (zh) 生成词向量的方法、装置、计算机存储介质和电子设备
CN110222338A (zh) 一种机构名实体识别方法
CN115034208A (zh) 一种基于bert的中文asr输出文本修复方法及***
CN116070602A (zh) 一种pdf文档智能标注与抽取方法
CN114780723B (zh) 基于向导网络文本分类的画像生成方法、***和介质
CN116821377A (zh) 基于知识图谱和大模型的小学语文自动评测***
CN114547278A (zh) 一种英语学习辅助方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination