CN103151042B - 全自动口语评测管理与评分***及其评分方法 - Google Patents
全自动口语评测管理与评分***及其评分方法 Download PDFInfo
- Publication number
- CN103151042B CN103151042B CN201310034371.7A CN201310034371A CN103151042B CN 103151042 B CN103151042 B CN 103151042B CN 201310034371 A CN201310034371 A CN 201310034371A CN 103151042 B CN103151042 B CN 103151042B
- Authority
- CN
- China
- Prior art keywords
- feature
- examinee
- model
- answer
- recognition result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Machine Translation (AREA)
Abstract
本发明涉及计算机辅助教育领域,提供一种全自动口语评测管理与评分***,其包括依次连接的客户端、落地服务器以及网络服务器,所述考生作答结果包括朗读题的口语测评结果以及自发性口语表述题的口语测评结果中的一种,所述落地服务器还包括评分装置,该评分装置包括识别模块和评分模块,所述识别模块包括声学子模块、语言子模块以及识别子模块;所述评分模块包括特征提取子模块和评分子模块。本发明还提供一种全自动口语评测管理与评分方法。本发明的全自动口语评测管理与评分***及其评分方法可以完全由计算机自动控制考生的准备答题时间和作答时间,无需人工干预,并且比人工计时更为准确,进一步确保了评测的公平性。
Description
技术领域
本发明涉及计算机辅助教育领域,尤其涉及一种全自动口语评测管理与评分***及其评分方法。
背景技术
随着我国英语教学的普及,哑巴英语的问题也越来越严重,因此英语口语的教学与评测也日益受到重视。英语的口语评测已经在我国多个省市开展起来,其中广东省已经把英语口语评测纳入到了普通高考的必考范围。由于口语评测方式与内容的特殊性,目前英语口语的评分主要还是通过人工判分的方式来解决。人工评分有着很多很难克服的缺点:
老师与学生面对面口语评测缺乏公平性与准确性。不同老师针对同一考生的评分很难保证完全一致,同一老师针对不同考生的评分标准也很难保证完全一致,这一切都将极大的降低评测的公平性。本***制定一套大家都认可的公正统一的机器自动评分标准,从而可避免因人工音素而造成的评分差异,确保了评测的公平性。
人工评分口语评测评分效率十分低下。本发明设计的一套全自动全自动口语评测管理与评分***,以机器评分代替人工评分,从评测试卷的分发,到评测的开始和结束,到考生答案音频的保存,再到自动评分全部是由机器自动完成的,评分效率大大提高。
传统的口语评测组织管理十分复杂。传统的人对人口语评测由于采用面试的形式,需要大量经过专业培训的口语考官;与此同时,每场评测只能对几名学生进行考评,如果要对全年级甚至全校学***、安全、高效的英语口语水平评测,并可极大地节约人力物力,还可避免因为分批次评测而带来的泄题风险。
传统口语评测需要人工控制评测开始和结束的时间,每次更换题目,甚至每道小题都需要重新计时,非常麻烦。
发明内容
本发明为解决上述技术问题,提供一种无需人工干预、计时更为准确且一步确保评测公平性的全自动口语评测管理与评分***,其包括依次连接的客户端、落地服务器以及网络服务器,其中,网络服务器主要负责评测结果的整理、收集以及试卷的分发,落地服务器主要负责机器自动评分,客户端主要负责评测,试卷从网络服务器通过落地服务器分发到客户端,考生作答结果从客户端通过落地服务器上传到网络服务器,所述考生作答结果包括朗读题的口语测评结果以及自发性口语表述题的口语测评结果中的一种,所述落地服务器还包括评分装置,该评分装置包括识别模块和评分模块,所述识别模块包括声学子模块、语言子模块以及识别子模块,所述声学子模块提取考生作答音频的声学特征得到声学模型,所述语言子模块根据题目信息及训练文本得到语言模型,所述识别子模块通过声学模型和语言模型对考生作答音频进行解码得到识别结果;所述评分模块包括特征提取子模块和评分子模块,所述特征提取子模块用于提取所述识别结果中的语流综合特征,所述语流综合特征包括口语测评中发音准确度方向的特征、流利度方向的特征以及文本语义相似度方向的特征,所述评分子模块对语流综合特征进行评分训练,得到评分模型,并依据评分模型对识别结果进行评分。
优选地,所述发音准确度方向的特征通过以下步骤获得:
针对考生作答音频进行解码识别,得到识别结果;
将识别结果与正确文本进行强制对齐,计算每个音素的强制对齐得分;
构建单音素解码模型并解码每个音素,计算每个音素的最大似然得分;
利用强制对齐得分与最大似然得分的差值得到发音准确度方向的特征。
优选地,所述流利度方向的特征包括语速特征以及短时停顿时长特征,所述语速特征通过以下步骤获得:
针对考生作答音频进行解码识别,得到识别结果;
根据识别结果统计出语音识别结果中每个音素对应的帧数;
利用音素总个数与所有音素的持续时间的比值得到语速特征;
所述短时停顿时长特征通过以下步骤获得:
针对考生作答音频进行解码识别,得到识别结果;
根据识别结果统计出语音识别结果中每个音素对应的帧数和音频总的帧数;
利用所有音素短时停顿的时长的总和与总的发音时长的比值得到短时停顿时长特征。
优选地,所述文本语义相似度方向的特征包括语义相关度特征以及语法结构相似度特征。
优选地,所述语义相关度特征包括以下步骤:
针对考生作答音频进行解码识别,得到识别结果;
计算识别结果中的每一个单词和标准答案中每一个单词的语义相似度得分;
计算识别结果中的每一个单词和标准答案中每一个句子的语义相似度得分;
计算识别结果中每一个单词和标准答案中每一个句子中的语义相似度得分最大值或者平均值作为单词与句子之间的相似度得分;
计算考生答案和标准答案之间的相似度得分。
优选地,所述语法结构相似度特征包括以下步骤:
针对考生作答音频进行解码识别,得到识别结果;
分别为识别结果的每一个句子建立语法顺序矢量;
分别求出识别结果中的每一个句子和标准答案中的每一个句子的语法结构相似度得分,取识别结果中每一个句子语法结构相似度得分最大值作为这个句子的语法结构相似度得分;
通过对识别结果中每一个句子语法结构相似度得分加权平均计算考生答案和标准答案之间的语法结构相似度特征。
优选地,网络服务器包括调度模块,用于在落地服务器与网络服务器之间调度评测信息;采用联网评测模式,使得分布在不同地点的考场之间落地服务器的通信由所述网络服务器调度模块统一调度管理。
优选地,所述***包含三种不同权限的角色:考生、教师和管理员,考生主要负责评测与作答;教师主要负责制卷、发布评测、管理评测、检查评测结果以及评分工作,评分方面采用***评分和老师评分相结合的方法;管理员主要负责评测的管理以及试卷分发的时间掌控。
优选地,对于角色扮演题可以利用每道小题已经给出的参***作为文本语义相似度分析的参考文本,进而扩展出其它参***;对于复述题可以利用音频内容的转写文本作为文本语义相似度分析的参考文本,进而扩展出其它参***。
本发明另外提供一种全自动口语评测管理与评分方法,其包括如下几个步骤:
A0、选取若干考生进行如步骤A1~A5所述的过程,然后将所述语流综合特征与老师评分结合进行自动评分模型训练,形成评分模型;
A1、收集考生作答音频;
A2、提取考生作答音频的声学特征得到声学模型,并根据题目信息及训练文本得到语言模型;
A3、根据建立的声学模型和语言模型对考生作答音频进行解码得到识别结果;
A4、提取识别结果中的语流综合特征,所述语流综合特征包括口语测评中发音准确度方向的特征、流利度方向的特征以及文本语义相似度方向的特征;
A5、根据语流综合特征形成的评分模型进行自动评分。
本发明的全自动口语评测管理与评分***及其评分方法:在传统的朗读题口语测评基础上增加了文本语义相似度方向的特征,从而可以针对自发性口语表述进行测评;设计了独特的云端评测***架构,确保评测高效进行,同时充分利用了整个***的资源,大大提升了组织口语评测效率,节约了大量的人力物力;可以在大范围同时组织口语评测,满足了省市范围内甚至全国范围内同时组织口语评测的需求;口语评测的形式也将更加多元化,对考生口语水平的考察更为全面公正。
附图说明
图1为本发明一实施例全自动口语评测管理与评分方法流程示意图;
图2为本发明一实施例全自动口语评测管理与评分***架构示意图;
图3为本发明一实施例语义相关度特征提取流程示意图;
图4为本发明另一实施例语义相关度特征提取流程示意图;
图5为本发明一实施例语法结构相似度特征提取流程图。
具体实施方式
下面将结合附图以及具体实施例来对本发明作进一步详细说明。
实施例:
本发明提供一种全自动口语评测管理与评分***,其包括依次连接的客户端、落地服务器以及网络服务器,其中,网络服务器主要负责评测结果的整理、收集以及试卷的分发,落地服务器主要负责机器自动评分,客户端主要负责评测,试卷从网络服务器通过落地服务器分发到客户端,考生作答结果从客户端通过落地服务器上传到网络服务器,所述考生作答结果包括朗读题的口语测评结果以及自发性口语表述题的口语测评结果中的一种,所述落地服务器还包括评分装置,该评分装置包括识别模块和评分模块,所述识别模块包括声学子模块、语言子模块以及识别子模块,所述声学子模块提取考生作答音频的声学特征得到声学模型,所述语言子模块根据题目信息及训练文本得到语言模型,所述识别子模块通过声学模型和语言模型对考生作答音频进行解码得到识别结果;所述评分模块包括特征提取子模块和评分子模块,所述特征提取子模块用于提取所述识别结果中的语流综合特征,所述语流综合特征包括口语测评中发音准确度方向的特征、流利度方向的特征以及文本语义相似度方向的特征,所述评分子模块对语流综合特征进行评分训练,得到评分模型,并依据评分模型对识别结果进行评分。
如图1所示,为本发明一实施例全自动口语评测管理与评分方法流程示意图,其包括如下几个步骤:
A0、选取若干考生进行如步骤A1~A5所述的过程,然后将所述语流综合特征与老师评分结合进行自动评分模型训练,形成评分模型;
A1、收集考生作答音频;
A2、提取考生作答音频的声学特征得到声学模型,并根据题目信息及训练文本得到语言模型;
A3、根据建立的声学模型和语言模型对考生作答音频进行解码得到识别结果;
A4、提取识别结果中的语流综合特征;
A5、根据语流综合特征形成的评分模型进行自动评分。
在上述实施例中,所述语言模型包括话题相关文本、书面相关文本以及口语风格文本的一种或多种。所谓的话题相关文本是指确定一个话题,标准答案可以给考生看到或者不给考生看到,在评测时由考生根据话题以及标准答案形成的文本;所谓的书面相关文本是指考生按照标准答案形成的语音文本;所谓口语风格文本是指没有参考任何标准答案,完全由考生自由发挥形成的语音文本,所述老师评分是指聘请专业的老师对考生作答音频进行评分,实行双评,即以两位评卷老师给出成绩的平均分为该考生的最终成绩,如果两位评卷老师给出的成绩相差3分以上,采取三评方式。
如图2所示,为本发明一实施例全自动口语评测管理与评分***架构示意图,其主要分为以下三大部分:
客户端:电脑、平板电脑、高端智能手机均可以作为本发明的客户端,客户端必须具备独立的音频视频播放功能和独立的音频输入设备。所述客户端包括评测模块以及发布模块,所述评测模块用于考生进行口语评测,包括试题发布、评测、收卷等,并处理和传输考生作答音频至落地服务器,对于考生作答音频,评测模块还设有初处理模块用于对考生作答音频的格式转换与特征提取。评测结束后,考生的评测成绩也将通过发布模块发布在客户端上。
落地服务器:落地服务器指的是安装在考场的高性能计算机,落地服务器包括通讯模块、采集模块以及评分模块,所述通讯模块用于将接收于网络服务器的评测信息传输给客户端,其在特定时间提供试卷给客户端并控制评测时间,所述采集模块用于从客户端收集考生作答音频,所述评分模块用于对考生答卷进行识别、解码、评分,评分完成后将评测结果通过通讯模块及时反馈回客户端。根据考场规模和计算任务量,落地服务器可以选择多台高性能计算机组建计算机集群的形式,以便加快评分与解码的速度。
网络服务器:网络服务器主要负责集中控制分散在各个考场的落地服务器,其包括调度模块、分析模块以及查询模块,网络服务器包括调度模块,用于在落地服务器与网络服务器之间调度评测信息;采用联网评测模式,使得分布在不同地点的考场之间落地服务器的通信由所述网络服务器调度模块统一调度管理,统一将试卷分发给各个落地服务器并控制其评测开始和结束的时间,这样做的目的是便于在大范围同时组织口语评测,这样每组织一次评测,就无需提前为每个考生准备一份考卷,网络服务器会将考卷分发给各个落地服务器,落地服务器会将考卷再分发给每个客户端,极大地降低了泄题的风险;所述分析模块用于评测结束后对考生作答信息以及其得分情况做集中的分析与处理,将考生总分、单项得分与排名等信息统计出来,所述查询模块用于老师和学生们随时查询考生总分、单项得分与排名等信息。
所述***包含三种不同权限的角色:考生、教师和管理员,考生主要负责评测与作答;教师主要负责制卷、发布评测、管理评测、检查评测结果以及评分工作,评分方面采用***评分和老师评分相结合的方法;管理员主要负责评测的管理、试卷分发的时间掌控以及整体评测***的维护。
本实施例中评分装置所述识别模块采用基于大规模连续语音识别的解码***,声学模型采用基于隐马尔科夫模型的声学模型,语言模型采用的是基于N元文法的语言模型。多遍解码时,由于未知考生作答内容所以采用直接解码、基于最大线性似然回归的非监督性自适应、二次解码等处理。另外解码时会采用多编解码技术以提高识别率。解码完成后,通过评分模块从识别结果中提取需要的语流综合特征,训练评分模型,最后根据评分模型对新来的音频进行机器自动评分。
本实施例全自动口语评测管理与评分***的核心算法采用基于模式识别的机器学习方法,所述基于模式识别的机器学习采用线性回归方法、基于事例推理的学习、关联规则学习、神经网络或者支持向量机中的一种。
上述实施例中所述发音准确度方向的特征通过以下步骤获得:
针对考生作答音频进行解码识别,得到识别结果;
将识别结果与正确文本进行强制对齐,计算每个音素的强制对齐得分;
构建单音素解码模型并解码每个音素,计算每个音素的最大似然得分;
利用强制对齐得分与最大似然得分的差值得到发音准确度方向的特征。
所述发音准确度方向的特征具体实施例:
用O表示语音学的声学特征,p表示语音学所对应的发音音素,Q表示所有的音素集合。则给定声学特征O的前提下,音素p的后验概率为:
PP=P(p|o)=P(o|p)P(p)/∑q∈QP(Q|q)P(q)
为了方便计算,做出如下假设:所有的音素都是等概率出现的,既有P(p)=P(q),并且分母中的求和可以用最大估计值,这样就得到了发音准确度的定义:
GOP(p)=log(P(o|p)/MAXq∈QP(o|q))。
特征提取:发音准确度可以通过以下公式得到
GOP=SFA-SPL。
上述实施例中所述流利度方向的特征包括语速特征以及短时停顿时长特征,所述语速特征通过以下步骤获得:
针对考生作答音频进行解码识别,得到识别结果;
根据识别结果统计出语音识别结果中每个音素对应的帧数;
利用音素总个数与所有音素的持续时间的比值得到语速特征;
所述短时停顿时长特征通过以下步骤获得:
针对考生作答音频进行解码识别,得到识别结果;
根据识别结果统计出语音识别结果中每个音素对应的帧数和音频总的帧数;
利用所有音素短时停顿的时长的总和与总的发音时长的比值得到短时停顿时长特征。
关于所述语速特征具体实施例:
在第二语言学***,对于初学者尤其如此。用TS表示所有的音素的持续时间,NP表示音素总个数,则有:
ROS=NP/TS。
关于所述短时停顿特征具体实施例:
语音中词与词之间的短时停顿也反映了发音流利度。一般来说,停顿时间越长,对应的流利度也越差。用DSP代表停顿时占总长的比重,T代表总的发音时常,Ti代表第i个停顿的时常,NSP代表短时停顿的总个数,则有:
上述实施例中所述文本语义相似度方向的特征包括语义相关度特征以及语法结构相似度特征。
所述语义相关度特征包括以下步骤:
针对考生作答音频进行解码识别,得到识别结果;
计算识别结果中的每一个单词和标准答案中每一个单词的语义相似度得分;
计算识别结果中的每一个单词和标准答案中每一个句子的语义相似度得分;
计算识别结果中每一个单词和标准答案中每一个句子中的语义相似度得分最大值作为单词与句子之间的相似度得分;
计算考生答案和标准答案之间的相似度得分。
所述语义相似度特征还可以通过以下步骤获得:
针对考生作答音频进行解码识别,得到识别结果;
计算识别结果中的每一个单词和标准答案中每一个单词的语义相似度得分;
计算识别结果中的每一个单词和标准答案中每一个句子的语义相似度得分;
计算识别结果中每一个单词和标准答案中每一个句子语义相似度得分平均值作为单词与句子之间的相似度得分;
计算考生答案和标准答案之间的相似度得分。
所述语法结构相似度特征包括以下步骤:
针对考生作答音频进行解码识别,得到识别结果;
分别为识别结果的每一个句子建立语法顺序矢量;
分别求出识别结果中的每一个句子和标准答案中的每一个句子的语法结构相似度得分,取识别结果中每一个句子语法结构相似度得分最大值作为这个句子的语法结构相似度得分;
通过对识别结果中每一个句子语法结构相似度得分加权平均计算考生答案和标准答案之间的语法结构相似度特征。
所述语义相关度特征具体实施例:
如图3所示,为本发明一实施例语义相关度特征提取流程图,语义相关度能够极大的反应考生答案和标准答案之间的语义相关程度,一般来讲两句话的语义相关度越高,考生的答案也就越接近标准答案。词与词之间的语义相似度可以通过词网络(WordNet)来计算,WordNet是一个覆盖范围宽广的英语词汇语义网。名词、动词、形容词和副词各自被组织成一个同义词的网络,每个同义词集合都代表一个基本的语义概念,并且这些集合之间也由各种关系连接(一个多义词将出现在它的每个意思的同义词集合中)。以扩展语义覆盖的方法来计算两个单词之间的语义相似度为例,例如我们要计算英语中drawing和decal的语义相似度,首先我们要通过WordNet来获得两个单词的语义:
drawing:paperthatisspeciallypreparedforuseindrafting。
decal:theartoftransferringdesignsfromspeciallypreparedpapertoawoodorglassormetalsurface。
两个单词的语义中共有三个单词的语义覆盖,其中paper为一元词我们积1分,而speciallyprepared为一个二元词组我们积4分,drawing和decal之间的语义相似度为5分。这样我们就形成了一个打分机制:
1)两个单词之间的语义中出现一个一元词我们积一分,出现一个n元词组我们积n的平方分,因为出现一个n连词的概率要远远比同时出现n个一元词的概率低。通常在WordNet中每个单词都会包含多种语义。
用ω,ω'分别表示两个单词S(ω)表示单词ω在词网络中所有语义,ci表示单词ω在词网络中的第i个语义,在计算两个单词的相似度时取两个单词间相似度得分最大值的两个单词间的语义。
SCORElesk(ω,ω')=MAXci∈s(ω')cj∈s(ω′)rel(cicj)。
有了词与词之间的语义相似度后,就可以计算词与句子之间的相似度得分了,取单词与句子里单词之间的相似的得分平均值作为单词与句子之间的相似度得分,用|U|表示句子U里的单词的个数。
最后就可以计算考生答案U和标准答案P之间的相似度得分了,用uniq(U)表示考生答案的去重单词数,则U与P之间的相似度得分为:
如图4所示,为本发明另一实施例语义相关度特征提取流程图,语义相关度能够极大的反应考生答案和标准答案之间的语义相关程度,一般来讲两句话的语义相关度越高,考生的答案也就越接近标准答案。用ω,ω'分别表示两个单词S(ω)表示单词ω在词网络中所有语义,ci表示单词ω在词网络中的第i个语义,在计算两个单词的相似度时取两个单词间相似度得分最大值的两个单词间的语义。
有了词与词之间的语义相似度后,就可以计算词与句子之间的相似度得分了。取单词与句子里单词之间的相似的得分最大值作为单词与句子之间的相似度得分,用U表示句子。
SCOREW(ω,U)=maxωi∈uSCORE(ω,ωi)。
最后就可以计算考生答案U和标准答案P之间的相似度得分了。
所述语法结构相似度特征具体实施例:
如图5所示,为本发明一实施例语法结构相似度特征提取流程图。
考虑以下两个句子:
T1:ω1ω2ω3ω4ω5ω6ω7ω8ω9。
T2:ω1ω2ω3ω9ω5ω6ω7ω8ω4。
句子T1和T2所包含的单词是一样的,如果单纯的通过两句话中所包含的单词进行语义相似度分析,那么得出的结果将是T1与T2两句话所表达的语意是完全一样的。两个句子的词序是不一样的,这里将提出一种通过词序进行句法结构相似度分析的方案,我们对T1和T2中每一个单词都进行重新编号,比如T1中dog的编号是4,over的编号是6。定义句子T1与T2语法顺序矢量为r1和r2则有:
r1=(123456789)
r2=(123956784)
那么句子T1与T2的语法结构相似度可以通过以下公式进行计算:
实际情况中T1与T2的所包含的单词并不一定是完全一样的,这里需要定义一个句子之间的单词对应规则。
如果在T2中的一个词ωi也包含在T1当中,我们将该单词在句子T1中第一次出现的编号作为它在T2中的编号。否则,我们就要在T1中寻找与ωi语义最接近的词
如果ωi和的相似度超过预先设定的阈值,那么ωi在T1中的编号就设为在T2中的编号。
如果前两种搜索都失败了,那么ωi的编号就设为0。
根据以上规则,我们可以提取得到语法结构相似度特征。
利用公式分别求出识别结果中的每句话和标准答案中的每句话的语法结构相似度,取识别结果中每句话语法结构相似度最大值作为其语法结构相似度。
最终考生答案识别结果和标准答案之间的语法结构相似度SREC可以表示为
其中M为每个考生识别结果的句子数,REC代表识别结果,REF代表参***。
得到了以上语流综合特征之后我们需要调整特征权重使评分模型效果最好,可以基于期望最大化算法进行特征权重优化。
在以上任一实施例中,针对客观性试题没有固定参***的问题,我们提出了一种基于文本语义相似度分析的答案扩展方案:对于角色扮演题可以利用每道小题已经给出的参***作为文本语义相似度分析的参考文本,进而扩展出其它参***;对于复述题可以利用音频内容的转写文本作为文本语义相似度分析的参考文本,进而扩展出其它参***,考生不一定完全按参***进行作答,所以不能进行强制对齐。解码过程包括行初次解码,说话人自适应及二次解码识别;二次解码识别完成以后从识别结果中提取语流综合特征。然后将语流综合特征与老师评分进行评分模型训练,得到评分模型,进行自动评分。
本发明的全自动口语评测管理与评分***无需预知考生作答文本,考生可以根据话题内容进行自发性口语表述,评分前只需知道考生作答话题相关文本即可评分;相对于传统朗读题口语测评,本发明不但能够进行朗读题的口语测评,还可以进行自发性口语表述题的口语测评;评分更加全面公正,可以在考生自发性表述的情况下考察考生的发音准确度与流利度,更能反映考生实际的口语水平;考生作答文本不再受到限制,自动评分评测题型也将不再仅限于朗读题,这样就可以考察考生在自发性口语表述的情况下对语言的理解、运用与表达能力;语流综合特征中增加了语义相关度特征以及语法结构相似度特征,这样既能考察考生口语运用的语义相关性,又能考察考生口语的语法水平,设计了独特的云端评测***架构,确保评测高效进行,同时充分利用了整个***的资源,大大提升了组织口语评测效率,节约了大量的人力物力;可以在大范围同时组织口语评测,满足了省市范围内甚至全国范围内同时组织口语评测的需求;口语评测的形式也将更加多元化,对考生口语水平的考察更为全面公正。
可以理解的是,对于本领域的普通技术人员来说,可以根据本发明的技术构思做出其他各种相应的改变与变形,而所有这些改变与变形都应属于本发明权利要求的保护范围。
Claims (5)
1.一种全自动口语评测管理与评分***,其包括依次连接的客户端、落地服务器以及网络服务器,其中,网络服务器主要负责评测结果的整理、收集以及试卷的分发,落地服务器主要负责机器自动评分,客户端主要负责评测,试卷从网络服务器通过落地服务器分发到客户端,考生作答结果从客户端通过落地服务器上传到网络服务器,所述考生作答结果包括朗读题的口语测评结果以及自发性口语表述题的口语测评结果中的一种,其特征在于:所述落地服务器还包括评分装置,该评分装置包括识别模块和评分模块,所述识别模块包括声学子模块、语言子模块以及识别子模块,所述声学子模块提取考生作答音频的声学特征得到声学模型,所述语言子模块根据题目信息及训练文本得到语言模型,所述识别子模块通过声学模型和语言模型对考生作答音频进行解码得到识别结果;所述评分模块包括特征提取子模块和评分子模块,所述特征提取子模块用于提取所述识别结果中的语流综合特征,所述语流综合特征包括口语测评中发音准确度方向的特征、流利度方向的特征以及文本语义相似度方向的特征,所述文本语义相似度方向的特征包括语义相关度特征以及语法结构相似度特征;
所述特征提取子模块用于提取所述语义相关度特征,包括:计算识别结果中的每一个单词和标准答案中每一个单词的语义相似度得分;计算识别结果中的每一个单词和标准答案中每一个句子的语义相似度得分;计算识别结果中每一个单词和标准答案中每一个句子中的语义相似度得分最大值或者平均值作为单词与句子之间的相似度得分;计算考生答案和标准答案之间的相似度得分;
所述特征提取子模块用于提取所述语法结构相似度特征,包括:分别为识别结果的每一个句子建立语法顺序矢量;分别求出识别结果中的每一个句子和标准答案中的每一个句子的语法结构相似度得分,取识别结果中每一个句子语法结构相似度得分最大值作为这个句子的语法结构相似度得分;通过对识别结果中每一个句子语法结构相似度得分加权平均计算考生答案和标准答案之间的语法结构相似度特征;
所述识别模块采用基于大规模连续语音识别的解码***,所述声学模型采用基于隐马尔科夫模型,所述语言模型采用基于元文法的语言模型,在进行解码时采用基于多遍解码技术,所述多遍解码包括直接解码、基于最大线性似然回归的非监督性自适应及二次解码;所述评分子模块对语流综合特征进行评分训练,得到评分模型,并依据评分模型对识别结果进行评分。
2.如权利要求1所述的全自动口语评测管理与评分***,其特征在于:所述特征提取子模块还用于提取所述发音准确度方向的特征,包括:
将识别结果与正确文本进行强制对齐,计算每个音素的强制对齐得分;
构建单音素解码模型并解码每个音素,计算每个音素的最大似然得分;
利用强制对齐得分与最大似然得分的差值得到发音准确度方向的特征。
3.如权利要求1所述的全自动口语评测管理与评分***,其特征在于:网络服务器包括调度模块,用于在落地服务器与网络服务器之间调度评测信息;采用联网评测模式,使得分布在不同地点的考场之间落地服务器的通信由所述网络服务器调度模块统一调度管理。
4.如权利要求1所述的全自动口语评测管理与评分***,其特征在于:所述***包含三种不同权限的角色:考生、教师和管理员,考生主要负责评测与作答;教师主要负责制卷、发布评测、管理评测、检查评测结果以及评分工作,评分方面采用***评分和老师评分相结合的方法;管理员主要负责评测的管理以及试卷分发的时间掌控。
5.一种全自动口语评测管理与评分方法,其特征在于:其包括如下几个步骤:
A0、选取若干考生进行如步骤A1~A5所述的过程,然后将语流综合特征与老师评分结合进行自动评分模型训练,形成评分模型;
A1、收集考生作答音频;
A2、提取考生作答音频的声学特征得到声学模型,并根据题目信息及训练文本得到语言模型;
A3、根据建立的声学模型和语言模型对考生作答音频进行解码得到识别结果;
A4、提取识别结果中的语流综合特征,所述语流综合特征包括口语测评中发音准确度方向的特征、流利度方向的特征以及文本语义相似度方向的特征;所述文本语义相似度方向的特征包括语义相关度特征以及语法结构相似度特征;
获取所述语义相关度特征包括以下步骤:针对考生作答音频进行解码识别,得到识别结果;计算识别结果中的每一个单词和标准答案中每一个单词的语义相似度得分;计算识别结果中的每一个单词和标准答案中每一个句子的语义相似度得分;计算识别结果中每一个单词和标准答案中每一个句子中的语义相似度得分最大值或者平均值作为单词与句子之间的相似度得分;计算考生答案和标准答案之间的相似度得分;
获取所述语法结构相似度特征包括以下步骤:针对考生作答音频进行解码识别,得到识别结果;分别为识别结果的每一个句子建立语法顺序矢量;分别求出识别结果中的每一个句子和标准答案中的每一个句子的语法结构相似度得分,取识别结果中每一个句子语法结构相似度得分最大值作为这个句子的语法结构相似度得分;通过对识别结果中每一个句子语法结构相似度得分加权平均计算考生答案和标准答案之间的语法结构相似度特征;
采用基于大规模连续语音识别的解码***进行解码识别,所述声学模型采用基于隐马尔科夫模型,所述语言模型采用基于元文法的语言模型,在进行解码时采用基于多遍解码技术,所述多遍解码包括直接解码、基于最大线性似然回归的非监督性自适应及二次解码;
A5、根据语流综合特征形成的评分模型进行自动评分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310034371.7A CN103151042B (zh) | 2013-01-23 | 2013-01-29 | 全自动口语评测管理与评分***及其评分方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013100276765 | 2013-01-23 | ||
CN201310027676 | 2013-01-23 | ||
CN201310027676.5 | 2013-01-23 | ||
CN201310034371.7A CN103151042B (zh) | 2013-01-23 | 2013-01-29 | 全自动口语评测管理与评分***及其评分方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103151042A CN103151042A (zh) | 2013-06-12 |
CN103151042B true CN103151042B (zh) | 2016-02-24 |
Family
ID=48549064
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310034371.7A Active CN103151042B (zh) | 2013-01-23 | 2013-01-29 | 全自动口语评测管理与评分***及其评分方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103151042B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106782603A (zh) * | 2016-12-22 | 2017-05-31 | 上海语知义信息技术有限公司 | 智能语音评测方法及*** |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104347071B (zh) * | 2013-08-02 | 2020-02-07 | 科大讯飞股份有限公司 | 生成口语考试参***的方法及*** |
CN103761975B (zh) * | 2014-01-07 | 2017-05-17 | 苏州驰声信息科技有限公司 | 一种口语评测方法及装置 |
CN103985392A (zh) * | 2014-04-16 | 2014-08-13 | 柳超 | 音素级的低功耗的口语评价与缺陷诊断方法 |
CN103985391A (zh) * | 2014-04-16 | 2014-08-13 | 柳超 | 无需标准读音的音素级的低功耗口语评价及缺陷诊断方法 |
CN104505089B (zh) * | 2014-12-17 | 2018-05-18 | 福建网龙计算机网络信息技术有限公司 | 口语纠错方法及设备 |
CN106156905A (zh) * | 2015-03-25 | 2016-11-23 | 肖圣林 | 移动互联学习平台 |
CN104810017B (zh) * | 2015-04-08 | 2018-07-17 | 广东外语外贸大学 | 基于语义分析的口语评测方法和*** |
CN105632488A (zh) * | 2016-02-23 | 2016-06-01 | 深圳市海云天教育测评有限公司 | 一种语音测评的方法及装置 |
CN108010513B (zh) * | 2016-10-28 | 2021-05-14 | 北京回龙观医院 | 语音处理方法及设备 |
CN108154735A (zh) * | 2016-12-06 | 2018-06-12 | 爱天教育科技(北京)有限公司 | 英语口语测评方法及装置 |
CN106847263B (zh) * | 2017-01-13 | 2020-09-11 | 科大讯飞股份有限公司 | 演讲水平评价方法和装置及*** |
CN106652622B (zh) * | 2017-02-07 | 2019-09-17 | 广东小天才科技有限公司 | 一种课文训练方法和装置 |
CN107316255A (zh) * | 2017-04-07 | 2017-11-03 | 苏州清睿教育科技股份有限公司 | 一种高效率的穿梭在线比赛的比赛方法 |
CN109686383B (zh) * | 2017-10-18 | 2021-03-23 | 腾讯科技(深圳)有限公司 | 一种语音分析方法、装置及存储介质 |
CN109785698B (zh) * | 2017-11-13 | 2021-11-23 | 上海流利说信息技术有限公司 | 用于口语水平评测的方法、装置、电子设备以及介质 |
CN108090047B (zh) * | 2018-01-10 | 2022-05-24 | 华南师范大学 | 一种文本相似度的确定方法及设备 |
CN108363687A (zh) * | 2018-01-16 | 2018-08-03 | 深圳市脑洞科技有限公司 | 主观题评分及其模型的构建方法、电子设备及存储介质 |
CN108428382A (zh) * | 2018-02-14 | 2018-08-21 | 广东外语外贸大学 | 一种口语复述评分方法及*** |
CN108447504A (zh) * | 2018-03-20 | 2018-08-24 | 校宝在线(杭州)科技股份有限公司 | 一种基于脑电波的口语评测方法 |
CN108766415B (zh) * | 2018-05-22 | 2020-11-24 | 清华大学 | 一种语音测评方法 |
CN108831212B (zh) * | 2018-06-28 | 2020-10-23 | 深圳语易教育科技有限公司 | 一种口语教学辅助装置及方法 |
WO2020033922A1 (en) * | 2018-08-10 | 2020-02-13 | Actively Learn, Inc. | Short answer grade prediction |
CN109036464B (zh) * | 2018-09-17 | 2022-02-22 | 腾讯科技(深圳)有限公司 | 发音检错方法、装置、设备及存储介质 |
CN109256152A (zh) * | 2018-11-08 | 2019-01-22 | 上海起作业信息科技有限公司 | 语音评分方法及装置、电子设备、存储介质 |
CN109523194B (zh) * | 2018-12-14 | 2021-06-01 | 深圳市小柠檬教育科技有限公司 | 汉语阅读能力测评方法、装置及可读存储介质 |
CN109410984B (zh) * | 2018-12-20 | 2022-12-27 | 广东小天才科技有限公司 | 一种朗读评分的方法及电子设备 |
CN109829155B (zh) * | 2019-01-18 | 2024-03-22 | 平安科技(深圳)有限公司 | 关键词的确定方法、自动评分方法、装置、设备及介质 |
CN109858877A (zh) * | 2019-01-22 | 2019-06-07 | 北京五岳鑫信息技术股份有限公司 | 一种试题录入方法及装置 |
CN109545243B (zh) * | 2019-01-23 | 2022-09-02 | 北京猎户星空科技有限公司 | 发音质量评价方法、装置、电子设备及存储介质 |
CN110085256B (zh) * | 2019-03-21 | 2021-11-19 | 视联动力信息技术股份有限公司 | 信息处理方法和装置 |
CN109830230B (zh) * | 2019-03-27 | 2020-09-01 | 深圳平安综合金融服务有限公司上海分公司 | 一种基于自我学习算法的数据标注方法及装置 |
CN110164422A (zh) * | 2019-04-03 | 2019-08-23 | 苏州驰声信息科技有限公司 | 一种口语考试的多维度评估方法及装置 |
CN109979256A (zh) * | 2019-04-24 | 2019-07-05 | 上海乂学教育科技有限公司 | 英语语音教学*** |
CN110491369A (zh) * | 2019-07-24 | 2019-11-22 | 北京大米科技有限公司 | 口语等级的评估方法、装置、存储介质及电子设备 |
CN110570838B (zh) * | 2019-08-02 | 2022-06-07 | 北京葡萄智学科技有限公司 | 语音流处理方法和装置 |
CN110797010A (zh) * | 2019-10-31 | 2020-02-14 | 腾讯科技(深圳)有限公司 | 基于人工智能的问答评分方法、装置、设备及存储介质 |
CN111047932A (zh) * | 2020-01-02 | 2020-04-21 | 上海健坤教育科技有限公司 | 一种语音交互式教学*** |
CN111383495A (zh) * | 2020-03-04 | 2020-07-07 | 苏州驰声信息科技有限公司 | 一种用于口语教学的课中讲解***、方法、装置及介质 |
CN111599234A (zh) * | 2020-05-19 | 2020-08-28 | 黑龙江工业学院 | 一种基于声音识别的英语口语朗读自动评分*** |
CN112767932A (zh) * | 2020-12-11 | 2021-05-07 | 北京百家科技集团有限公司 | 语音测评***、方法、装置、设备及计算机可读存储介质 |
CN112951207B (zh) * | 2021-02-10 | 2022-01-07 | 网易有道信息技术(北京)有限公司 | 口语评测方法、装置及相关产品 |
CN112992184B (zh) * | 2021-04-20 | 2021-09-10 | 北京世纪好未来教育科技有限公司 | 一种发音评测方法、装置、电子设备和存储介质 |
CN113626768A (zh) * | 2021-08-12 | 2021-11-09 | 上海好学网络科技有限公司 | 口语考试的多评分多智能评分合分方法 |
CN115497455B (zh) * | 2022-11-21 | 2023-05-05 | 山东山大鸥玛软件股份有限公司 | 一种英语口语考试语音智能评测方法、***及装置 |
CN118035711B (zh) * | 2024-04-11 | 2024-06-14 | 国家计算机网络与信息安全管理中心江苏分中心 | 一种针对大模型内容安全能力的评测方法及*** |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101246685A (zh) * | 2008-03-17 | 2008-08-20 | 清华大学 | 计算机辅助语言学习***中的发音质量评价方法 |
CN101393103A (zh) * | 2008-10-31 | 2009-03-25 | 中国科学院力学研究所 | 水合物微观渗流实验装置 |
CN101551947A (zh) * | 2008-06-11 | 2009-10-07 | 俞凯 | 辅助口语语言学习的计算机*** |
CN101740024A (zh) * | 2008-11-19 | 2010-06-16 | 中国科学院自动化研究所 | 基于广义流利的口语流利度自动评估方法 |
CN102034475A (zh) * | 2010-12-08 | 2011-04-27 | 中国科学院自动化研究所 | 一种运用计算机对开放式短对话进行交互式评分的方法 |
CN102509483A (zh) * | 2011-10-31 | 2012-06-20 | 苏州思必驰信息科技有限公司 | 一种口语考试的分布式自动评分***及其方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8775184B2 (en) * | 2009-01-16 | 2014-07-08 | International Business Machines Corporation | Evaluating spoken skills |
-
2013
- 2013-01-29 CN CN201310034371.7A patent/CN103151042B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101246685A (zh) * | 2008-03-17 | 2008-08-20 | 清华大学 | 计算机辅助语言学习***中的发音质量评价方法 |
CN101551947A (zh) * | 2008-06-11 | 2009-10-07 | 俞凯 | 辅助口语语言学习的计算机*** |
CN101393103A (zh) * | 2008-10-31 | 2009-03-25 | 中国科学院力学研究所 | 水合物微观渗流实验装置 |
CN101740024A (zh) * | 2008-11-19 | 2010-06-16 | 中国科学院自动化研究所 | 基于广义流利的口语流利度自动评估方法 |
CN102034475A (zh) * | 2010-12-08 | 2011-04-27 | 中国科学院自动化研究所 | 一种运用计算机对开放式短对话进行交互式评分的方法 |
CN102509483A (zh) * | 2011-10-31 | 2012-06-20 | 苏州思必驰信息科技有限公司 | 一种口语考试的分布式自动评分***及其方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106782603A (zh) * | 2016-12-22 | 2017-05-31 | 上海语知义信息技术有限公司 | 智能语音评测方法及*** |
CN106782603B (zh) * | 2016-12-22 | 2020-08-11 | 云知声(上海)智能科技有限公司 | 智能语音评测方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN103151042A (zh) | 2013-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103151042B (zh) | 全自动口语评测管理与评分***及其评分方法 | |
CN105741831B (zh) | 一种基于语法分析的口语评测方法和*** | |
CN101740024B (zh) | 基于广义流利的口语流利度自动评估方法 | |
CN101739867B (zh) | 运用计算机对口语翻译质量进行评分的方法 | |
CN109785698B (zh) | 用于口语水平评测的方法、装置、电子设备以及介质 | |
CN103065626B (zh) | 英语口语考试***中的朗读题自动评分方法和设备 | |
CN101751919B (zh) | 一种汉语口语重音自动检测方法 | |
CN103559892B (zh) | 口语评测方法及*** | |
CN103594087B (zh) | 提高口语评测性能的方法及*** | |
CN105845134A (zh) | 自由朗读题型的口语评测方法及*** | |
CN103559894A (zh) | 口语评测方法及*** | |
CN104464423A (zh) | 一种口语考试评测的校标优化方法及*** | |
CN109697988B (zh) | 一种语音评价方法及装置 | |
Delais-Roussarie et al. | Learner corpora and prosody: From the COREIL corpus to principles on data collection and corpus design | |
CN109658918A (zh) | 一种智能英语口语复述题评分方法和*** | |
KR100995847B1 (ko) | 인터넷상에서의 소리분석 기반 어학 학습방법 및 시스템 | |
CN110598041A (zh) | 一种FlACS实时分析方法与装置 | |
CN113205729A (zh) | 一种面向外国留学生的演讲评测方法、装置及*** | |
CN110010123A (zh) | 英语音标发音学习评价***及方法 | |
Wang et al. | LAIX Corpus of Chinese Learner English: Towards a Benchmark for L2 English ASR. | |
Zechner et al. | Using automatic speech recognition to assess the reading proficiency of a diverse sample of middle school students | |
CN115116474A (zh) | 口语评分模型训练方法、评分方法、装置及电子设备 | |
CN114241835A (zh) | 一种学生口语质量评测方法和设备 | |
Jing et al. | The speech evaluation method of English phoneme mobile learning system | |
CN111599234A (zh) | 一种基于声音识别的英语口语朗读自动评分*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |