CN109523194B

CN109523194B - 汉语阅读能力测评方法、装置及可读存储介质

Info

Publication number: CN109523194B
Application number: CN201811534230.0A
Authority: CN
Inventors: 吕蓥
Original assignee: Shenzhen Xiaoningmeng Education Technology Co ltd
Current assignee: Shenzhen Happy Nemo Culture Technology Co ltd
Priority date: 2018-12-14
Filing date: 2018-12-14
Publication date: 2021-06-01
Anticipated expiration: 2038-12-14
Also published as: CN109523194A

Abstract

本发明提供一种汉语阅读能力测评方法，包括：获取用户的用户信息，在测评题库中调用所述用户信息对应的初始测试题组，以供用户进行测试；根据测试结果计算用户的初始能力值，获取所述初始能力值对应的测评试卷，将所述测评试卷发送至用户所在终端，供用户进行测评，其中，所述测评试卷包括连续文本及非连续文本的多种题型的测试题组；基于项目反应理论利用预设的高阶题组模型计算用户解答所述测评试卷的阅读能力值。本发明还提供一种汉语阅读能力测评装置及可读存储介质。本发明实现了实现了根据连续文本及非连续文本的多种题型的测试试卷对用户进行测试，通过高阶题组模型对用户解答测试试卷的项目反应进行测评，本发明题型具有多样性，能够更准确、全面的考察用户的汉语阅读能力。

Description

汉语阅读能力测评方法、装置及可读存储介质

技术领域

本发明涉及基于互联网的教育领域，尤其涉及一种汉语阅读能力测评方法、装置及可读存储介质。

背景技术

目前，汉语阅读能力测评的方式采用了计算机自适应技术，但是并没有充分发挥移动设备音、画等多媒体技术特点，并且还停留在传统测量学层面，只涉及对二级计分题型(代表性题型为选择题和判断题)进行测评，而单纯的选择题和判断题对于学生的汉语阅读能力考察不到位，不足以满足汉语阅读能力测评的复杂性。因此，目前的汉语阅读能力测评的方法题型单一，不能准确考察学生的汉语阅读能力。

发明内容

本发明的主要目的在于提供一种汉语阅读能力测评方法、装置及可读存储介质，旨在解决目前的汉语阅读能力测评的方法题型单一，不能准确考察学生的汉语阅读能力的技术问题。

为实现上述目的，本发明提供一种汉语阅读能力测评方法，所述汉语阅读能力测评方法包括以下步骤：

获取用户的用户信息，在测评题库中调用所述用户信息对应的初始测试题组，以供用户进行测试；

根据测试结果计算用户的初始能力值，获取所述初始能力值对应的测评试卷，将所述测评试卷发送至用户所在终端，供用户进行测评，其中，所述测评试卷包括连续文本及非连续文本的多种题型的测试题组；

基于项目反应理论利用预设的高阶题组模型计算用户解答所述测评试卷的阅读能力值。

可选地，所述根据测试结果计算用户的初始能力值，获取所述初始能力值对应的测评试卷的步骤包括：

获取用户对所述初始测试题组的项目反应，根据预设的高阶题组模型对所述项目反应进行测评，以得到用户的初始能力值，并确定所述初始能力值是否满足所述初始测试题组对应的项目特征条件；

若所述初始能力值满足所述项目特征条件，则获取所述初始能力值对应的测评试卷；

若所述初始能力值不满足所述项目特征条件，则在测评题库中查找所述初始能力值对应的能力测试题组，并将所述能力测试题组更新为初始测试题组，基于所述能力测试题组更新所述项目特征条件，执行获取用户对所述初始测试题组的项目反应的步骤，直到所述初始能力值与更新后项目特征条件匹配，或者，完成最高级题目组的测试。

可选地，所述基于项目反应理论利用预设的高阶题组模型计算用户解答所述测评试卷的阅读能力值的步骤包括：

获取用户对所述测评试卷中标准题的标准题项目反应，并获取所述标准题项目反应对的第一标签的第一特征数据；

将所述第一特征数据输入到高阶题组模型，通过所述高阶题组模型得到所述阅读能力值。

可选地，所述将所述第一特征数据输入到高阶题组模型，通过所述高阶题组模型得到所述阅读能力值的步骤包括：

获取用户对测评试卷中主观题的主观题项目反应，根据预设的高阶题组模型提取所述主观题项目反应中的关键词；

将所述关键词与预设关键词进行匹配，根据匹配结果获取所述关键词对应的第二标签的第二特征数据；

将所述第一特征数据及所述第二特征数据输入到高阶题组模型，通过所述高阶题组模型得到所述阅读能力值。

可选地，所述将所述第一特征数据及所述第二特征数据输入到高阶题组模型，通过所述高阶题组模型得到所述阅读能力值的步骤包括：

获取用户对所述测评试卷中朗读测试题的朗读项目反应中的语音数据，并对所述语音数据进行音频解析；

根据解析结果获取对应的第三标签的第三特征数据，将所述第一特征数据、第二特征数据及所述第三特征数据输入到高阶题组模型，通过所述高阶题组模型得到所述阅读能力值。

可选地，所获取用户对所述初始测试题组的项目反应，根据预设的高阶题组模型对所述项目反应进行测评，以得到用户的初始能力值，并确定所述初始能力值是否满足所述初始测试题组对应的项目特征条件的步骤之后，所述汉语阅读能力测评方法的步骤还包括：

若所述初始能力值满足所述项目特征条件，则检测用户解答所述初始题组的时长是否小于所述预设时长；

若用户解答所述初始题组的时长小于预设时长，则在测评题库中的预备题库中查找与所述初始题组同级别的测试题组，并补充预设数量的与所述初始题组同级别的测试题组至所述初始题组中，以使所述初始测试题目组达到题量标准。

可选地，所述获取用户的用户信息，在测评题库中调用所述用户信息对应的初始测试题组，以供用户进行测试的步骤之前，所述汉语阅读能力测评方法还包括：

根据测试对象群体的实验性测试结果制定能力值基准量尺，并建立语料库；

将所有测试题的题目参数通过等值转换法转换至统一量尺，其中，所述测试题根据建立的语料库进行编写而成；

对所述测试题进行影子测试及软件分析，淘汰平衡性数据异常的题目或题目组，以得到测评题库；

对所述测评题库进行商用检测，以得到商用检测后的测评题库。

可选地，所述建立语料库的步骤包括：

获取汉语的阅读能力维度及考察点，并根据所述阅读能力维度、考察点、测试题目的文本篇幅、文本体裁类型、生字覆盖率进行阅读能力定级，得到文本分级标准；

基于所述文本分级标准确定出题文本的难度级别，以得到语料库。

此外，为实现上述目的，本发明还提供一种装置，所述装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的汉语阅读能力测评程序，所述程序被所述处理器执行时实现如上所述的汉语阅读能力测评方法的步骤。

此外，为实现上述目的，本发明还提供一种可读存储介质，所述可读存储介质上存储有汉语阅读能力测评程序，所述汉语阅读能力测评程序被处理器执行时实现如上所述的汉语阅读能力测评方法的步骤。

本发明提供一种汉语阅读能力测评方法、装置及可读存储介质，本发明通过获取用户的用户信息，在测评题库中调用所述用户信息对应的初始测试题组，以供用户进行测试，然后根据测试结果计算用户的初始能力值，获取所述初始能力值对应的测评试卷，将所述测评试卷发送至用户所在终端，供用户进行测评，其中，所述测评试卷包括连续文本及非连续文本的多种题型的测试题组，最后基于项目反应理论利用预设的高阶题组模型计算用户解答所述测评试卷的阅读能力值；实现了根据连续文本及非连续文本的多种题型的测试试卷对用户进行测试，通过高阶题组模型对用户解答测试试卷的项目反应进行测评，本发明题型具有多样性，能够更准确、全面的考察用户的汉语阅读能力。

附图说明

图1为本发明各实施例涉及的汉语阅读能力测评装置的硬件结构示意图；

图2为本发明汉语阅读能力测评方法第一实施例的流程示意图；

图3为本发明汉语阅读能力测评方法第二实施例的流程示意图；

图4为本发明汉语阅读能力测评方法第三实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示，图1是本发明实施例方案涉及的硬件运行环境的汉语阅读能力测评装置的结构示意图。该汉语阅读能力测评装置可以包括：处理器1001，例如CPU，通信总线1002、业主接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。业主接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选地业主接口1003还可以包括标准的有线接口(例如用于连接有线键盘、有线鼠标等)、无线接口(例如用于连接无线键盘、无线鼠标)。网络接口1004可选的可以包括标准的有线接口(用于连接有线网络)、无线接口(如WI-FI接口、蓝牙接口、红外线接口等，用于连接无线网络)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatilememory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的汉语阅读能力测评装置结构并不构成对汉语阅读能力测评装置的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种可读存储介质的存储器1005中可以包括操作***、网络通信模块、业主接口模块以及汉语阅读能力测评程序。其中，操作***是管理和控制汉语阅读能力测评装置与软件资源的程序，支持网络通信模块、业主接口模块、汉语阅读能力测评程序以及其他程序或软件的运行；网络通信模块用于管理和控制网络接口1002；业主接口模块用于管理和控制业主接口1003。

在图1所示的汉语阅读能力测评装置中，所述汉语阅读能力测评装置通过处理器1001调用存储器1005中存储的汉语阅读能力测评程序，并执行以下步骤：

进一步地，所述根据测试结果计算用户的初始能力值，获取所述初始能力值对应的测评试卷的步骤包括：

进一步地，所述基于项目反应理论利用预设的高阶题组模型计算用户解答所述测评试卷的阅读能力值的步骤包括：

进一步地，所述将所述第一特征数据输入到高阶题组模型，通过所述高阶题组模型得到所述阅读能力值的步骤包括：

进一步地，所述将所述第一特征数据及所述第二特征数据输入到高阶题组模型，通过所述高阶题组模型得到所述阅读能力值的步骤包括：

进一步地，所获取用户对所述初始测试题组的项目反应，根据预设的高阶题组模型对所述项目反应进行测评，以得到用户的初始能力值，并确定所述初始能力值是否满足所述初始测试题组对应的项目特征条件的步骤之后，所述汉语阅读能力测评方法的步骤还包括：

进一步地，所述获取用户的用户信息，在测评题库中调用所述用户信息对应的初始测试题组，以供用户进行测试的步骤之前，所述汉语阅读能力测评方法还包括：

进一步地，所述建立语料库的步骤包括：

基于上述汉语阅读能力测评装置的硬件结构，提出本发明汉语阅读能力测评方法各个实施例。

本发明实施例提供了一种汉语阅读能力测评方法，应用于汉语阅读能力测评***。

参照图2，图2为本发明汉语阅读能力测评方法第一实施例的流程示意图，该汉语阅读能力测评方法包括以下步骤：

步骤S10，获取用户的用户信息，在测评题库中调用所述用户信息对应的初始测试题组，以供用户进行测试；

在本实施例中，用户可以在终端进行注册登录进入汉语阅读能力测评***，其中，终端包括移动终端(例如，手机、平板等)及PC(例如，电脑等)，用户在进行注册过程中需要输入用户信息，根据用户信息进行注册，注册生成账号及登录密码，用户利用账号及登录密码登录后***将获取用户的用户信息，该用户信息包括用户年龄、性别、姓名、国籍、学年(例如，初三下学期、初二上学期等)等。

测评题库中包括不同用户信息对应的测试题组，例如，不同年龄对应不同的测试题组，不同学年对应的不同题组等，其中，多种题型可以是选择题、判断题、连线题、填空题、问答题、朗读题，从而通过多种题型准确对用户的汉语阅读能力进行测评。在测评题库中查找用户信息对应的初始测试题组，该初始测试题组用于测评用户的初始能力值，其中，初始测试题组中可以包括连续文本及非连续文本的多种题型的测试题，当然，测试题组中可以只存在选择题，初始测试题只设置选择题的优点在于能够快速对用户的初始能力值进行测评，从而再根据初始能力值对应的测评试卷对用户进行最终阅读能力值测评。

步骤S20，根据测试结果计算用户的初始能力值，获取所述初始能力值对应的测评试卷，将所述测评试卷发送至用户所在终端，供用户进行测评，其中，所述测评试卷包括连续文本及非连续文本的多种题型的测试题组；

在本实施例中，测试结果是指用户对初始测试题组的项目反应，例如，用户在选择题中每选择一个选项，该用户选择的选项为用户对应的一个项目反应。根据用的测试结果计算用户的初始能力值，并在测试题库中获取该初始能力值对应的测评试卷，该测评试卷用于对用户的阅读能力值最终的测评，并根据最终测评结果生成阅读能力报告。

其中，该测试试卷包括连续文本及非连续文本的多种题型的测试题，连续文本包括童话、故事、诗歌、记叙文、散文等体裁，非连续文本包括图表、表格、清单等体裁，并且，不同用户信息对应不同的体裁，参照下表，下表为不同年级对应的连续文本及非连续文本。

表1

进一步地，用户的每次测评后的测评结果及测评记录都将保存在***数据库中，用户若再次进行测评，***将检测到用户曾进行过测评，则将调取最近期的被测的能力值作为本次测评的测试能力值，并对照基准量尺选择对应的初始题目组，或者，调取预设次数的测评中的能力值，计算预设次数测评的能力值的平均值，将该平均值作为本次测评的测试能力值，并对照基准量尺选择对应的初始题目组。当然，若***没有检测到用户信息，并且没有检测到该用户的测评记录，则直接确定该用户的此次测评的能力值为一级(即200C以下)，下面对能力值进行说明：

能力值可以用C表示，分析人教版、部编版等教材及教辅基础上，参考PISA测评体系自主研发汉语阅读难度C值***(C代表汉语阅读能力，也代表汉语图书阅读难度，C值理论的范围是0～1500，针对义务教育阶段学生的情况，本发明针对中小学生阅读能力在实际操作中定为200～1300。随着C值的增长，则对应的被测对象的汉语阅读能力值呈增幂关系。)，对义务教育阶段中小学生的汉语阅读能力的评级、维度极其对应关系进行了划分。

步骤21，获取用户对所述初始测试题组的项目反应，根据预设的高阶题组模型对所述项目反应进行测评，以得到用户的初始能力值，并确定所述初始能力值是否满足所述初始测试题组对应的项目特征条件；

在本实施例中，用户在答题界面进行答题，获取用户解答初始测试题组中各测试题的项目反应，并将所述项目反应对应的测评数据输入到高阶题组模型中，利用高阶题组模型计算用户的初始能力值，并确定初始能力值是否满足该初始测试题组的项目特征条件，其中，是否满足该项目特条件包括初始能力值是否达到预设阈值，或者初始能力值是否与预设的项目特征曲线匹配，若初始能力值达到预设阈值，或者初始能力值与项目特征曲线不匹配，则***判定初始能力值不满足项目特征条件，若初始能力值没有达到预设阈值，或者初始能力值与项目特征曲线匹配，则***判定初始能力值满足项目特征条件，本实施例对项目特征条件不作具体限定，该项目特征条件可以由技术人员根据不同的实际需求进行设置，例如，确定初始能力值是否满足项目特征条件还可以是确定初始能力值是否在一定的预设范围之内。

步骤S22，若所述初始能力值满足所述项目特征条件，则获取所述初始能力值对应的测评试卷；

步骤S23，基于项目反应理论利用预设的高阶题组模型计算用户解答所述测评试卷的阅读能力值。

在本实施例中，***若检测到初始能力值满足项目特征条件，则在测试题库中查找并调取该初始能力值对应的测评试卷给用户进行测评。

进一步地，***若检测到初始能力值不满足项目特征条件，则说明用户的汉语阅读能力需要更高等级等级测试题组的进行测试，则将在测评题库中查找该初始能力值对应的能力测试题组，供用户进行答题，获取用户解答该能力测试题组的项目反应，并获取高阶题组模型输出的该能力测试题组的项目反应的能力值，并判断该能力值是否满足项目特征条件，依次类推，直到用户所做的题组对应的能力值满足该题组对应的项目特征条件，或者，完成最高级题组的测试。

其中，利用高阶题组模型进行迭代运算，将用户解答题目后的项目反应对应的数据输入高阶题组模型，首先检测初始能力值是满足预设的项目特征条件，若初始能力值不满足项目特征条件，则查找该初始能力值对应的能力测试题组，并将该能力测试题组更新为初始能力题组，同时将根据能力测试题组更新项目特征条件，例如，以项目特征条件为是否达到预设阈值进行说明，该预设阈值为该能力测试题组对应的预设阈值，即该预设阈值将随测试题组的更新进行相应的变化，根据基准量尺可以确定不同测试题组的预设阈值，即不同的测试题组对应不同的预设阈值，由此进行迭代运算，直到计算得到的最后的初始能力值小于预设阈值，或者完成最高级题组的测评。

步骤S20之后，还包括：

步骤S30，基于项目反应理论利用预设的高阶题组模型计算用户解答所述测评试卷的阅读能力值。

在本实施例中，现有的汉语阅读能力测评方法中多利用的三参数逻辑模型，该模型对该模型对二级计分题型(代表性题型为选择题和判断题)适配较好，但是对于多级积分题(如连线题、填空题、问答题等主观题适配不佳)，并且，对于其它模型而言，TRM(TestRequirement Manual试验要求手册)与狭义多维项目反应模型(SMIRM)都是广义多维项目反应模型(GMIRM)的一种特例,其差异在于两者在满足广义局部独立性假设时所需控制的潜因素不同，认为将SMIRM与TRM进行融合以实现在题组中对多种被试能力同时测量也是未来题组测验发展的方向之一。在已发表的文献中,仅有高阶题组模型(HTM)尝试性地将SMIRM与TRM进行结合,实现了在题组中对有层阶关系的被试能力的测量。然而，本发明采用MCMC算法实现了对HTM的参数估计，HTM相对于其它模型具有以下优势：(1)HTM的参数返真性较好；(2)当测量层阶潜质的测验存在题组效应而未采用HTM时，会出现存在偏差的参数估计，因素负荷与一阶潜质的测验误差也均会被低估等。

具体地，所述基于项目反应理论利用预设的高阶题组模型计算用户解答所述测评试卷的阅读能力值的步骤包括：

步骤S31，获取用户对所述测评试卷中标准题的标准题项目反应，并获取所述标准题项目反应对的第一标签的第一特征数据；

步骤S32，将所述第一特征数据输入到高阶题组模型，通过所述高阶题组模型得到所述阅读能力值。

在本实施例中，本实施例基于项目反应原理对用户解答测试题的测试结果进行测评，测试题组中包括标准题，该标准题包括选择题(多项选择题、单项选择题)、判断题、连线题等，用户解答标准题的每个解答结果代表用户的一种项目反应，例如，选择题中A、B、C、D中，各个选项对应的项目反应不同，在判断题中选择正确或者错误对应的项目反应不同。

其中，在设计项目反应对应的标签时，对文本类型、能力维度、分值设计等做成不同的标签，通过获取用户在解答标准题的项目反应，并获取项目反应对应的第一标签，提取第一标签的第一特征数据，该第一特征数据包括文本字数、语法特点、文本长度等，将第一特征参数输入到高阶题组模型，通过高阶题组模型计算用户的阅读能力值。

步骤S33，获取用户对测评试卷中主观题的主观题项目反应，根据预设的高阶题组模型提取所述主观题项目反应的关键词；

步骤S34，将所述关键词与预设关键词进行匹配，根据匹配结果获取所述关键词对应的第二标签的第二特征数据；

步骤S35，将所述第一特征数据及所述第二特征数据输入到高阶题组模型，通过所述高阶题组模型得到所述阅读能力值。

在本实施例中，该主观题包括填空题、问答题等，由于汉语的词法灵活，同样的意思可以用不同的文字描述，所以，主观题的特点是具有灵活性，没有唯一的答案，所以，需要利用预设的高阶题组模型获取用户解答主观题的主观题项目反应中的关键词，并将关键词与预设关键词库进行匹配，从而计算匹配率，并获取该关键词对应对应的第二标签的第二特征数据，该第二特征数据包括文本字数、语法特点、文本长度等，并将用户解答测试试卷所有的项目反应对应的特征数据输入到预设的高阶题组模型，即将第一特征数据及第二特征数据输入到预设的高阶模型中，通过高阶题组模型计算用户的阅读能力值。进一步地，也可以将计算得到的匹配率添加至第二特征数据，将匹配率也作为计算用户的阅读能力值的参数。

步骤S36，获取用户对所述测评试卷中朗读测试题的朗读项目反应中的语音数据，并对所述语音数据进行音频解析；

步骤S37，根据解析结果获取对应的第三标签的第三特征数据，将所述第一特征数据、第二特征数据及所述第三特征数据输入到高阶题组模型，通过所述高阶题组模型得到所述阅读能力值。

在本实施例中，***中还包括朗读测评模块，用于对用户阅读的朗读能力进行测评，获取朗读朗读测试题的语音数据，对该语音数据进行音频解析，并根据解析结果获取对应的第三标签的第三特征数据，将用户解答测评试卷的项目反应对应的特征数据输入至高阶题组模型，本实施例中将第一特征数据、第二特征数据及第三特征数据输入至高阶题组模型，通过高阶题组模型计算用户的阅读能力值。本实施例对语音数据的音频解析为现有的音频解析方法，在此不做赘述。值得注意的是，本实施例需要获取语音数据中的语音参数，语音参数包括朗读流程度、发音准确度等，对朗读的过程中对朗读流畅度、发音正确/错误等语音参数进行解析，得出评价分值，融入总的评价体系。

本实施例提出的汉语阅读能力测评方法，通过获取用户的用户信息，在测评题库中调用所述用户信息对应的初始测试题组，以供用户进行测试，然后根据测试结果计算用户的初始能力值，获取所述初始能力值对应的测评试卷，将所述测评试卷发送至用户所在终端，供用户进行测评，其中，所述测评试卷包括连续文本及非连续文本的多种题型的测试题组，最后基于项目反应理论利用预设的高阶题组模型计算用户解答所述测评试卷的阅读能力值；实现了根据连续文本及非连续文本的多种题型的测试试卷对用户进行测试，通过高阶题组模型对用户解答测试试卷的项目反应进行测评，本发明题型具有多样性，能够更准确、全面的考察用户的汉语阅读能力。

基于第一实施例，提出本发明汉语阅读能力测评方法的第二实施例，参照图3，本实施例中，步骤S21之后，还包括：

步骤S24，若所述初始能力值满足所述项目特征条件，则检测用户解答所述初始题组的时长是否小于所述预设时长；

步骤S25，若用户解答所述初始题组的时长小于预设时长，则在测评题库中的预备题库中查找与所述初始题组同级别的测试题组，并补充预设数量的与所述初始题组同级别的测试题组至所述初始题组中，以使所述初始测试题目组达到题量标准。

在本实施例中，因为非建制学习环境或者互联网测试环境等难以维持足够的强制力，通常从教育心理学来讲15分钟为一个精神集中时段，一旦超过45分钟注意力就难以集中了，所以，用户做题时间不能超过1个小时，甚至超过45分钟，就发现用户集中度有严重的下降。因此，在编写题目时需要控制一定的题量(例如，题量不少于40)，测评题库中每个难度等级的题组对应的题量可以是一定的。用户在测试时，若检测到用户答题的时长已超过预设时间时，则自动进行交卷，当然，用户也可以提前进行交卷。

进一步地，***若检测到初始能力值满足项目特征条件，则检测用户解答初始题组的时长是否小于预设时长，若用户解答题目的速度较快，则解答完初始题组中设定的一定题量的题目所有时长小于预设时长，则在测评题库中的预备题库中查找与初始题组相同级别的测试题组，并在预备题库中抽取预设数量的测试题组至初始题组中，以使初始测试题目组达到题量标准，用户继续答题，从而更准确的对用户阅读能力进行测评。

本实施例提出的汉语阅读能力测评方法，通过若所述初始能力值满足所述项目特征条件，则检测用户解答所述初始题组的时长是否小于所述预设时长，然后若用户解答所述初始题组的时长小于预设时长，则在测评题库中的预备题库中查找与所述初始题组同级别的测试题组，并补充预设数量的与所述初始题组同级别的测试题组至所述初始题组中，以使所述初始测试题目组达到题量标准；实现了在用户解答初始题组的时长小于预设时长时补充题目到初始题组中，进而灵活适配题组中的题量，更能准确对用户阅读能力进行测评。

基于第二实施例，提出本发明汉语阅读能力测评方法的第三实施例，参照图4，本实施例中，步骤S10之前，还包括：

步骤S40，根据测试对象群体的实验性测试结果制定能力值基准量尺，并建立语料库；

在本实施例中，测试对象群体可以是不同年龄段、不同年级的学生群体，该基准量尺用于测量用户阅读能力强弱，不同的基准量尺对应不同难度等级的测试题目，基准量尺是基于项目反应理论进行构建，对题目难度和学生能力的客观和等距的量尺，技术人员可以根据实际情况确定最初是的基准量尺，将基准量尺作为高阶模型的参数，然而将实验性测试的数据放入高阶模型中进行训练，通过模型中的预设算法调整基准量尺。

其中，所述建立语料库包括以下步骤：

步骤S41，获取汉语的阅读能力维度及考察点，并根据所述阅读能力维度、考察点、测试题目的文本篇幅、文本体裁类型、生字覆盖率进行阅读能力定级，得到文本分级标准；

步骤S42，基于所述文本分级标准确定出题文本的难度级别，以得到语料库。

在本实施例中，依据《义务教育语文课程标准》，参考SOLO分类理论、布鲁姆教育目标分类理论，将阅读能力分为辨识及检索信息、理解及解释文本、反思及评价文本3个维度。每个维度对应6个等级，各个等级有不同的考察点。各等级考察点相互衔接、循序渐进，细致地考察学生对不同维度、不同考察点的掌握情况，具体如下表所示，下表为能力维度表汉语阅读能力的评级、维度及其对应关系描述。

表2

另外，根据测试题目的文本篇幅(或字数)、文本体裁类型、生字覆盖率，其中，参照第一实施例中的表1，连续文本包括童话、故事、诗歌、记叙文、散文等体裁，非连续文本包括图表、表格、清单等体裁。生字覆盖率也是确定文本难度的标准，可以设立一个生字表，生字表中不同难度等级或者不同年级对应不同的生字，根据这些因素制定文本分级标准。

由于文本包括连续文本及非连续文本，则需要对连续文本及非连续文本制定难度等级，可以通过线下统计数据的方式制定非连续文本的难度等级，从而得到包括连续文本及非连续文本的语料库。

步骤S40之后，还包括：

步骤S50，将所有测试题的题目参数通过等值转换法转换至统一量尺，其中，所述测试题根据建立的语料库进行编写而成；

在本实施例中，题目参数包括字数的篇幅、生字词数量及比例、语法复杂程度，在设计试题目的时候，根据语料库进行编写测试题的题目，并根据***语文能力表、线下采样测试制定标准，通过等值转化法将题目参数转化到基准量尺上，从而转化为同一量尺，用于区分阅读能力的等级或者题目难度等级。例如，在对标准题的设计时，每个选项可以是一句话，根据汉语语法的规则进行字词句法的解析，然后根据解析结果添加标签，制定标准，设定最初的基准量尺，将测试数据导入高阶题模型进行机器学习，从而调整基准量尺，将各个测试题的题目参数通过等值转换法转换成统一量尺。

步骤S60，对所述测试题进行影子测试及软件分析，淘汰平衡性数据异常的题目和/或题目组，以得到测评题库。

在本实施例中，对编写的测试题进行影子测试及SAS软件分析，其目的是为了淘汰平衡性数据异常的题目和/或题目组，以得到测评题库；

步骤S70，对所述测评题库进行商用检测，以得到商用检测后的测评题库。

在本实施例中，在设计测评题库时，可以保证测评题库中各题组的题量大于预设题量，***将检测各题组的题量是否小于预设题量，若各题组的题量小于预设题量，***将补充同级别的题目至题组中去，若大于，则将检测图库中各题目是否存在敏感字段，具体地，将各测试题的文本与预设的敏感词库中的词进匹配，确定各测试题中是否存在与敏感词库中匹配的词，若存在，则在对应的题组中删除存在敏感字段的测试题，以完成商业检测。

本实施例提出的汉语阅读能力测评方法，通过根据测试对象群体的实验性测试结果制定能力值基准量尺，并建立语料库然后，将所有测试题的题目参数通过等值转换法转换至统一量尺，其中，所述测试题根据建立的语料库进行编写而成，接着对所述测试题进行影子测试及软件分析，淘汰平衡性数据异常的题目或题目组，以得到测评题库，最后对所述测评题库进行商用检测，以得到商用检测后的测评题库；实现了建立了非连续文本及连续文本的测评题库，进而保证了题库中题型的多样性。

进一步地，本发明还提供一种汉语阅读能力测评装置，所述汉语阅读能力测评装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的汉语阅读能力测评程序，所述汉语阅读能力测评程序被所述处理器执行时所被执行时所实现的方法可参照本发明汉语阅读能力测评方法的各个实施例，此处不再赘述。

进一步地，此外，本发明实施例还提出一种计算机可读存储介质。

本发明计算机可读存储介质上存储有汉语阅读能力测评程序，所述汉语阅读能力测评程序执行时实现如上所述的身份认证方法的步骤。

其中，在所述处理器上运行的汉语阅读能力测评程序被执行时所实现的方法可参照本发明汉语阅读能力测评方法各个实施例，此处不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者***不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者***所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者***中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种汉语阅读能力测评方法，其特征在于，所述汉语阅读能力测评方法包括以下步骤：

基于项目反应理论利用预设的高阶题组模型计算用户解答所述测评试卷的阅读能力值；

所述根据测试结果计算用户的初始能力值，获取所述初始能力值对应的测评试卷的步骤包括：

若所述初始能力值不满足所述项目特征条件，则在测评题库中查找所述初始能力值对应的能力测试题组，并将所述能力测试题组更新为初始测试题组，基于所述能力测试题组更新所述项目特征条件，执行获取用户对所述初始测试题组的项目反应的步骤，直到所述初始能力值与更新后项目特征条件匹配，或者，完成最高级题目组的测试；

所获取用户对所述初始测试题组的项目反应，根据预设的高阶题组模型对所述项目反应进行测评，以得到用户的初始能力值，并确定所述初始能力值是否满足所述初始测试题组对应的项目特征条件的步骤之后，所述汉语阅读能力测评方法的步骤还包括：

2.如权利要求1所述的汉语阅读能力测评方法，其特征在于，所述基于项目反应理论利用预设的高阶题组模型计算用户解答所述测评试卷的阅读能力值的步骤包括：

3.如权利要求2所述的汉语阅读能力测评方法，其特征在于，所述将所述第一特征数据输入到高阶题组模型，通过所述高阶题组模型得到所述阅读能力值的步骤包括：

4.如权利要求3所述的汉语阅读能力测评方法，其特征在于，所述将所述第一特征数据及所述第二特征数据输入到高阶题组模型，通过所述高阶题组模型得到所述阅读能力值的步骤包括：

5.如权利要求1所述的汉语阅读能力测评方法，其特征在于，所述获取用户的用户信息，在测评题库中调用所述用户信息对应的初始测试题组，以供用户进行测试的步骤之前，所述汉语阅读能力测评方法还包括：

6.如权利要求5所述的汉语阅读能力测评方法，其特征在于，所述建立语料库的步骤包括：

7.一种汉语阅读能力测评装置，其特征在于，所述汉语阅读能力测评装置包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的汉语阅读能力测评程序，其中所述汉语阅读能力测评程序被所述处理器执行时，实现如权利要求1至6中任一项所述的汉语阅读能力测评方法的步骤。

8.一种可读存储介质，其特征在于，所述可读存储介质上存储有汉语阅读能力测评程序，其中所述汉语阅读能力测评程序被处理器执行时，实现如权利要求1至6中任一项所述的汉语阅读能力测评方法的步骤。