CN112925901A - 一种辅助在线问卷评估的评估资源推荐方法及其应用 - Google Patents
一种辅助在线问卷评估的评估资源推荐方法及其应用 Download PDFInfo
- Publication number
- CN112925901A CN112925901A CN202110310227.6A CN202110310227A CN112925901A CN 112925901 A CN112925901 A CN 112925901A CN 202110310227 A CN202110310227 A CN 202110310227A CN 112925901 A CN112925901 A CN 112925901A
- Authority
- CN
- China
- Prior art keywords
- evaluation
- resource
- index
- model
- questionnaire
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/374—Thesaurus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/383—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Library & Information Science (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种辅助在线问卷评估的评估资源推荐方法及其应用。该方法包括步骤:预先分别定义问卷、评价指标体系和评估资源数据的语义表达模型;创建资源推荐处理过程对象,资源推荐处理过程对象包括网络问卷解析模型、评价指标结构化处理模型、评估资源语料库组织模型和评估资源指标信息提取模型,资源推荐处理过程对象间通过映射关系链表实现属性关联;将文本表达的问卷、评价指标体系和评估资源数据转换为语义表达模型表达的结构化标准数据;将结构化标准数据输入到评估资源指标信息提取模型,获取评估推荐数据立方体。本发明能够实现教育信息化发展水平在线评估问卷填写和处理过程中网络资源数据的精准推荐和协同分析。
Description
技术领域
本发明涉及一种信息处理技术领域,更具体地,具体涉及一种辅助在线问卷评估的评估资源推荐方法及其应用。
背景技术
评估资源推荐可以应用在在线问卷评估的问卷调研或对问卷数据清洗中。例如,当给被调研人员发送调研问卷时,可能存在调研者不确定选项而随意填写或者偏好填写正面数据的情况,为避免这种情况,可以在被调研者填写问卷时,推荐该问卷主题相关的历史数据统计、相关媒体数据等评估资源给被调研者,以帮助被调研者更客观地填写数据。还例如,在完成问卷数据收集后,需要进行异常数据清洗,提供评估资源推荐可以帮助快速识别异常数据。
评估资源推荐可以应用在多个领域,特别是教育信息化领域。随着教育信息化的不断发展,累积了大量不同来源、不同类型、不同形式的教育信息化在线数据,为教育信息化发展水平的评估提供了多元化的信息渠道,也为当前主流的在线评估问卷调研形式提供了多样化的数据支撑。
然而,由于当前采集的教育信息化评估资源种类繁多、数据庞杂,利用传统的数据库查询方式很难从海量的评估资源数据中提取出与评估问卷主题相关的评估资源信息。
发明内容
针对现有技术的至少一个缺陷或改进需求,本发明提供了一种辅助在线问卷评估的评估资源推荐方法及其应用,能够实现教育信息化发展水平在线评估问卷填写和处理过程中网络资源数据的精准推荐和协同分析。
为实现上述目的,按照本发明的第一方面,提供了一种辅助在线问卷评估的评估资源推荐方法,包括:
预先分别定义问卷、评价指标体系和评估资源数据的语义表达模型;
创建资源推荐处理过程对象,资源推荐处理过程对象包括网络问卷解析模型、评价指标结构化处理模型、评估资源语料库组织模型和评估资源指标信息提取模型,资源推荐处理过程对象间通过映射关系链表实现属性关联;
分别利用网络问卷解析模型、评价指标结构化处理模型、评估资源语料库组织模型将文本表达的问卷、评价指标体系和评估资源数据转换为语义表达模型表达的结构化标准数据;
将结构化标准数据输入到评估资源指标信息提取模型,获取评估推荐数据立方体。
优选的,所述网络问卷解析模型至少包括属性:问卷关联指标体系、答题区关联指标项和待评估机构名称;
所述评价指标结构化处理模型至少包括属性:指标体系编号、指标项编号、指标体系维度、指标项关键词;
所述评估资源语料库组织模型至少包括属性:资源主题范围、语料关键词和评估资源适用范围;
所述评估资源指标信息提取模型至少包括属性:待评估机构名称、待提取指标项、资源主题范围、资源时空范围和资源关键词。
优选的,所述资源推荐处理过程对象间通过映射关系链表实现属性关联包括步骤:
将网络问卷解析模型的属性问卷关联指标体系同评价指标结构化处理模型的属性指标体系编号关联,将网络问卷解析模型的属性答题区关联指标项同评价指标结构化处理模型的属性指标项编号关联;
将评价指标结构化处理模型的属性指标体系维度同评估资源语料库组织模型的属性资源主题范围关联,将评价指标结构化处理模型的属性指标项关键词同评估资源语料库组织模型的属性语料关键词属性关联;
将评估资源指标信息提取模型的属性待评估机构名称同网络问卷解析模型的属性待评估机构名称关联,将评估资源指标信息提取模型的属性待提取指标项同网络问卷解析模型的属性答题区关联指标项关联;
将评估资源指标信息提取模型的属性资源主题范围同评估资源语料库组织模型的属性评估资源适用范围关联,将评估资源指标信息提取模型的属性资源主题范围和资源时空范围同评估资源语料库组织模型的属性评估资源适用主题范围和时空范围关联,将评估资源指标信息提取模型的属性资源关键词同评估资源语料库组织模型的属性语料关键词关联。
优选的,所述评估资源指标信息提取模型用于实现步骤;
从结构化标准数据中获取评估问卷关键词、评价指标关键词、评估资源语料和检索查询条件;
根据评估问卷关键词和评价指标关键词生成包括评估领域词典;
利用评估领域词典计算评估资源语料和检索查询条件的相似度,根据相似度生成评估资源推荐列表;
从评估资源推荐列表中提取指标推荐数据,构建指标推荐数据立方体,指标推荐数据立方体支持预定义语义框架的查询。
优选的,所述评估领域词典包括指标体系领域词典、学校信息词典、停用词词典和同义词词典。
优选的,所述利用评估领域词典计算评估资源语料和检索查询条件的相似度包括步骤:
利用评估领域词典对评估资源语料进行分词处理,获得评估资源语料的关键词集合,构建评估资源语料的评估资源语料特征矩阵,记为矩阵A;
对矩阵A进行奇异值分解和聚类计算,获得具有评估资源关键词语义概念聚类关系的矩阵,记为矩阵Ak;
将检索查询条件转换为与矩阵Ak具有相同空间的特征向量,记为向量qk;
计算矩阵Ak和向量qk的相似度。
优选的,矩阵A的表示为:
其中,i为评估资源语料关键词的索引值,j为评估资源语料的索引值,ai,j的取值为0或非0的整数,0表示索引值为i的评估资源语料关键词不在索引值为“j”评估资源语料中,非0整数表示索引值为i的评估资源语料关键词在索引值为“j”的评估资源语料中出现的次数,n表示所有评估资源语料的语料个数,m表示所有评估资源语料中去重的评估资源语料关键词个数。
按照本发明的第二方面,提供了一种辅助在线问卷评估的评估资源推荐***,包括:
预定义模块,用于预先分别定义问卷、评价指标体系和评估资源数据的语义表达模型;
创建资源推荐处理过程对象构建模块,用于创建资源推荐处理过程对象,资源推荐处理过程对象包括网络问卷解析模型、评价指标结构化处理模型、评估资源语料库组织模型和评估资源指标信息提取模型,资源推荐处理过程对象间通过映射关系链表实现属性关联;
数据结构化处理模块,用于分别利用网络问卷解析模型、评价指标结构化处理模型、评估资源语料库组织模型将文本表达的问卷、评价指标体系和评估资源数据转换为语义表达模型表达的结构化标准数据;
执行模块,用于将结构化标准数据输入到评估资源指标信息提取模型,获取评估推荐数据立方体。
按照本发明的第三方面,提供了一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求任一项所述的方法的步骤。
按照本发明的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项方法。
总体而言,本发明与现有技术相比,具有有益效果:能够实现教育信息化发展水平在线评估问卷填写和处理过程中网络资源数据的精准推荐和协同分析。优选地,通过对教育信息化评估资源进行预定义语义框架的数据汇聚,利用潜在语义分析模型将采集到的评估资源语料进行隐式语义关系聚类,并利用余弦距离将复杂多样的评估资源数据同网络问卷评估指标进行语义概念相似性计算,获取同网络问卷评估指标具有内容相似度的评估资源推荐列表,并围绕评估资源类型、评估资源适用时空范围、评估资源适用主题范围等多个预定义语义框架维度构建网络问卷评估指标推荐资源数据立方体,辅助教育信息化发展水平在线评估问卷填写和处理过程中网络资源数据的精准推荐和协同分析。
附图说明
图1是本发明实施例的辅助在线问卷评估的评估资源推荐方法流程图;
图2是本发明实施例的预先定义语义表达模型的流程图;
图3是本发明实施例的资源推荐处理过程对象间的映射关系链表构建流程图;
图4是本发明实施例的指标推荐数据立方体生成流程图;
图5是本发明实施例的辅助在线问卷评估的资源推荐应用效果示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
本发明实施例的辅助在线问卷评估的评估资源推荐方法特别适用于教育信息化领域,但是不限于教育信息化领域,也可以应用在其他任何进行在线问卷评估的领域。
如图1所示,以教育信息化领域为例,本发明实施例的辅助在线问卷评估的评估资源推荐方法包括步骤:
(1)预先分别定义问卷、评价指标体系和评估资源数据的语义表达模型。
建立支持资源推荐的网络问卷数据信息的语义表达模型。网络评估问卷语义描述主要包括问卷基本信息、问卷填写对象基础信息和问卷题目信息。问卷基本信息包含问卷标题、问卷简介、问卷关键词和问卷关联指标体系等。问卷填写对象基础信息包含用户名、机构名称、机构类型、联系方式等。问卷题目信息包含题目数量和题目对象信息,题目对象信息是组成问卷常规题型的核心数据,包含题目编号、题目类型、题干和答题区域等;答题区域作为评估资源推荐的载体,其语义描述包含答题区域数量和答题区域对象信息,其中答题区域对象信息包含答题区域编号、答题区域坐标、答题区域约束和答题区关联指标项等关键信息。不同语义层级用不同语义标识表示,“Ln”表示第n级语义信息,例如“L1”表示一级语义信息,“L2”表示二级语义信息等。网络评估问卷数据的语义转换规则如表1所示。
表1网络评估问卷数据信息的语义转换规则
如图2所示,步骤(1)包括步骤:
(11)建立支持资源推荐的评价指标体系数据信息的语义转换模型。评价指标体系语义描述主要包括指标体系维度、指标体系索引深度和指标项对象信息。指标项对象信息包含指标项编号、指标项层级、指标项名称、指标项说明、指标项摘要、指标项关键词等。评价指标体系数据信息的语义转换规则如表2所示。
表2评价指标体系数据信息的语义转换规则
编号 | 语义描述 | 英文描述 | 语义标识 | 语义层级 |
2 | 评价指标体系 | Index System | IS | L1 |
2.1 | 指标体系维度 | IndexDimension | IS.dimen | L2 |
2.2 | 指标体系索引深度 | IndexSystemDepth | IS.depth | L2 |
2.3 | 指标项对象信息 | IndexItemInfo | IS.item | L2 |
2.3.1 | 指标项编号 | Index ItemID | IS.item.id | L3 |
2.3.2 | 指标项层级 | IndexItemLevel | IS.item.level | L3 |
2.3.3 | 指标项名称 | Index Item Name | IS.item.name | L3 |
2.3.4 | 指标项说明 | Index Item Description | IS.item.description | L3 |
2.3.5 | 指标项摘要 | Index Item Summary | IS.item.summary | L3 |
2.3.6 | 指标项关键词 | Index ItemKeyword | IS.item.keyword | L3 |
-- | -- | -- | -- | -- |
(12)建立支持资源推荐的评估资源数据信息的语义转换模型。评估资源语义描述主要包括评估资源类型、适用范围和资源对象数据。评估资源类型包含资源站点类型(例如官方资源、学校自建资源、媒体资源、科研资源等)和资源内容类型(例如教育信息化政策文件、学校信息化发展基础信息、统计数据、分析报告等)。评估资源适用范围包含评估资源适用的时空范围(例如评估资源数据具有数据有效性的空间范围和时间范围)和主题范围(例如基础设施、教育资源、教学应用、管理服务、保障机制等教育信息化发展水平评估的主题维度)。资源对象数据包含语料数据、语料摘要、语料关键词等。评估资源数据信息的语义转换规则如所表3示。
表3评估资源数据信息的语义转换规则
编号 | 语义描述 | 英文描述 | 语义标识 | 语义层级 |
3 | 评估资源 | Evaluation Resource | ER | L1 |
3.1 | 资源类型 | Resource Type | ER.type | L2 |
3.1.1 | 资源站点类型 | Resource Site Type | ER.Type.site | L3 |
3.2.2 | 资源内容类型 | Resource Content Type | ER.Type.content | L3 |
3.2 | 适用范围 | Application Range | ER.range | L2 |
3.2.1 | 时空范围 | Spatial Range | ER.range.spatial | L3 |
3.3.2 | 主题范围 | Temporal Range | ER.range.temporal | L3 |
3.3 | 资源对象数据 | Resource Corpus Infor | ER.corpus | L2 |
3.3.1 | 语料数据 | CorpusData | ER.corpus.text | L3 |
3.3.2 | 语料摘要 | Corpus Summary | ER.corpus.summary | L3 |
3.3.3 | 语料关键词 | CorpusKeyWord | ER.corpus.keyword | L3 |
-- | -- | -- | -- | -- |
(13)采集教育信息化发展水平在线评估的网络问卷、评价指标体系和评估资源数据,根据网络问卷、评价指标体系和评估资源数据的语义转换模型,将网络问卷、评价指标体系和评估资源数据转换为带预定义语义标签的结构化标准数据。根据(11)、(12)、(13)所述语义转换模型,建立不同层级语义信息之间的结构关系,建立评估问卷对象、问卷基本信息、问卷填写对象基础信息和问卷题目信息之间的关联关系,建立评价指标体系对象、指标项编号、指标项层级、指标项名称、指标项说明、指标项摘要、指标项关键词之间的关联关系,建立评估资源对象、资源类型、适用范围、资源对象数据之间的关联关系。
(2)创建资源推荐处理过程对象,资源推荐处理过程对象间通过映射关系链表实现属性关联,资源推荐处理过程对象包括网络问卷解析模型、评价指标结构化处理模型、评估资源语料库组织模型、评估资源指标信息提取模型。
如图3所示,创建资源推荐处理过程对象及其属性并构建资源推荐处理过程对象映射关系链表具体实现过程为:
(21)创建资源推荐处理过程对象,资源推荐处理过程对象包括网络问卷解析模型、评价指标结构化处理模型、评估资源语料库组织模型和评估资源指标信息提取模型。
网络问卷解析模型基于网络评估问卷的语义模型对问卷进行数据解析和数据提取,传统评估问卷数据由简单的文本信息组合表达,通过对评估问卷进行预定义语义信息的增强表达,支持更加丰富的问卷信息操作能力,通过语义信息增强表达为推荐资源列表与问卷的交互操作提供语义标签定位,例如用户在鼠标光标定位到问卷某答题区域时,可以通过语义标签获取答题区关联指标项,结合问卷填写对象基础信息中机构名称信息,便可以获取同该机构名称和指标项相关的评估资源信息列表。评价指标结构化处理模型基于当前的教育信息化评价指标体系,结合预定义的教育信息化领域关键词库,将基于自然语言描述的评价指标体系转化为指标项由关键词序列表达的树状结构,通过将指标项的文本描述压缩为一系列具有语法结构的关键词集合,进而支持基于评估指标关键词/关键词组合的评估资源信息的精准/模糊查询。评估资源语料库组织模型通过导入并提取教育信息化评估领域相关的文本信息,从评估资源数据主题、评估指标、评估资源适用时空范围、评估资源关键词等多个维度构建评估资源语料数据库。评估资源指标信息提取模型基于评估问卷填写对象信息和待填写答题区域所关联的评估指标自适应提取并推荐指标相关的评估资源文本信息列表。资源推荐处理过程对象的定义如表4所示。
表4资源推荐处理过程对象
编号 | 对象名称 | 对象定义 | 说明 |
1 | 网络问卷解析模型 | QNModel | 用于解析网络问卷数据 |
2 | 评价指标结构化处理模型 | ISModel | 用于构建评价指标由关键词序列表达的树状结构 |
3 | 评估资源语料库组织模型 | ERModel | 用于构建评估资源语料数据库 |
4 | 评估资源指标信息提取模型 | ExtractModel | 提取并推荐指标相关的评估资源文本信息 |
(22)创建资源推荐处理过程对象属性。网络问卷解析模型对象属性可以包括问卷标题、问卷简介、问卷关键词、问卷关联指标体系、机构名称、机构类型、题干、答题区域坐标、答题区域约束、答题区关联指标项等,具体语义信息可以参考步骤(11)。评价指标结构化处理模型对象属性可以包括指标体系编号、指标体系维度、指标体系索引深度、指标项编号、指标项层级、指标项名称、指标项说明、指标项摘要、指标项关键词等,具体语义信息可以参考步骤(12)。评估资源语料库组织模型对象属性可以包括资源站点类型、资源内容类型、资源适用时空范围、主题范围、资源对象语料数据、语料摘要、语料关键词等,具体语义信息可以参考步骤(13)。评估资源指标信息提取模型对象属性可以包括待评估机构名称、待提取指标项、资源主题范围、资源时空范围、资源内容类型、资源关键词等。
(23)构建资源推荐处理过程对象之间的映射关系链表。网络问卷解析模型对象属性问卷关联指标体系和答题区关联指标项分别同评价指标结构化处理模型对象属性指标体系编号和指标项编号属性关联,通过映射关系实现评估问卷同指标体系的解绑和灵活关联。评价指标结构化处理模型对象属性指标体系维度和指标项关键词同评估资源语料库组织模型对象属性资源主题范围和语料关键词属性关联,通过映射关系实现评估资源语料库资源分类信息和关键词标签信息的统一管理。评估资源指标信息提取模型对象属性待评估机构名称、待提取指标项同网络问卷解析模型对象属性机构名称和答题区关联指标项关联,评估资源指标信息提取模型对象属性资源主题范围、资源时空范围、资源关键词等同评估资源语料库组织模型对象属性评估资源适用主题范围、时空范围、语料关键词属性关联。
(3)分别利用网络问卷解析模型、评价指标结构化处理模型、评估资源语料库组织模型将文本表达的问卷、评价指标体系和评估资源数据转换为语义表达模型表达的结构化标准数据。
采集教育信息化发展水平在线评估的网络问卷、评价指标体系和评估资源数据,将网络问卷、评价指标体系和评估资源数据转换为带预定义语义标签的结构化标准数据,结构化标准数据的格式如步骤(1)(2)所述,这里不再赘述。
(4)将结构化标准数据输入到评估资源指标信息提取模型,获取评估推荐数据立方体。
评估推荐数据在界面上的显示可以如图5所示。例如当用户在填写填空题的第2题时,可能不太确定该数值,可以通过上述步骤,从结构化标准数据中提取评估推荐数据,显示在界面右侧,以供问卷填写人参考。
如图4所示,在线评估资源信息提取与指标推荐数据立方体生成的具体实现过程为:
(41)从结构化标准数据中获取评估问卷关键词、评价指标关键词、评估资源语料和检索查询条件。
具体地,通过上述资源推荐处理过程对象及映射关系链表来获取上述信息。
(42)将评估问卷关键词和评价指标关键词输入到领域词典构建模型,生成教育信息化评估领域词典。优选的,包括指标体系领域词典、学校信息词典、停用词词典和同义词词典等。其中,指标体系词典和学校信息词典用于提高教育信息化领域专有名词的识别率和分词的准确率。同义词词典用于词语消歧,降低文本分词生成的特征值向量的误差。停用词词典用于剔除评估资源文本中的无效信息。
(43)利用评估领域词典计算评估资源语料和检索查询条件的相似度,根据相似度生成评估资源推荐列表。
优选的,步骤(43)包括步骤:
(431)将所述关系链表中的评估资源语料数据库导入评估资源特征矩阵构建模型,构建评估资源语料特征矩阵。
基于步骤(42)所述生成的教育信息化评估领域词典,利用jieba工具对评估资源数据信息进行分词处理。引入指标体系词典和学校信息词典,利用分词工具对评估资源文本进行分词。引入停用词词典,将无效的文本信息从分词向量中剔除。引入同义词词典,将词语含义相近的文本进行同义词替换,降低特征值向量的误差。最后生成评估资源的关键词集合。
进一步地,将评估资源的关键词集合导入评估资源特征矩阵构建模型,基于doc2bow算法构建各评估资源语料文本特征向量,构建评估资源语料与教育信息化评估领域词典语料关键词之间的特征稀疏矩阵“A”:
针对“ai,j”,“i”为语料关键词的索引值,“j”为评估资源语料的索引值。“ai,j”的取值为0或非0的整数,0表示索引值为“i”的语料关键词不在索引值为“j”评估资源语料中,非0整数表示索引值为“i”的语料关键词在索引值为“j”的评估资源语料中出现的次数。针对“am,n”,“n”表示评估资源语料库中的语料个数,“m”表示评估资源语料库中去重的语料关键词个数。
(432)将所述关系链表中的评估资源语料特征稀疏矩阵输入潜在语义分析模型(简称“LSA”),对评估资源语料特征矩阵进行奇异值分解和聚类计算。
对评估资源特征稀疏矩阵“A”进行tfidf处理(tfidf是对评估资源关键词在评估资源语料库中的权重计算),计算各评估语料资源中语料关键词的tfidf值,生成矩阵“A”的tfidf矩阵“tfidf[A]”。
进一步地,利用LSA模型将矩阵“tfidf[A]”按照“tfidf[A]=U∑VT”的形式进行奇异值分解。进行奇异值分解后生成的三个矩阵分别是奇异值对角矩阵“Σ”,正交矩阵“U”和“V”。其中“U”由左奇异向量组成,反映评估资源关键词的语义概念特性,“V”由右奇异向量“dj”组成,反映评估资源语料的语义概念特性。
进一步地,选取前k个奇异值,构建奇异值矩阵“Σk”及其对应的矩阵“Uk”和“Vk”,其中k是满足奇异值变化函数曲线切线斜率最大的坐标值,最后利用“Uk”、“Vk”和“Σk”逆向生成具有评估资源关键词语义概念聚类关系的矩阵“Ak”(矩阵“Ak”计算公式为),实现评估资源同义关键词的语义概念聚类。
(433)将所述关系链表中的网络问卷填写对象基础信息和答题区域对象信息导入评估资源检索模型,查询与答题区域所关联评估指标内容相关的评估资源信息。
将网络问卷填写对象基础信息中的机构名称和答题区域对象中的关联评估指标信息导入doc2bow算法,构建查询条件与教育信息化评估领域词典语料关键词之间的特征向量将特征向量“dj+1”与矩阵“A”进行合并生成“A'”,对矩阵“A'”进行tfidf处理,从A'中提取出第“j+1”列数据生成“q”。利用转化公式将“q”转化生成“qk”。其中是上述奇异值矩阵的“Σk”逆矩阵,是上述“Uk”的转置矩阵。
(444)利用余弦相似度计算公式计算向量“qk”和矩阵“Ak”中各评估资源语料特征向量的余弦距离,根据余弦距离筛选具有内容相似度的评估资源推荐列表。
(44)将检索获取的评估资源推荐列表和评估问卷答题区域关联的指标信息输入到指标信息过滤模型,按照预定义的指标数据提取规则,提取评估资源中的指标信息,构建评估指标推荐数据立方体,推荐数据立方体包括评估资源类型、评估资源适用时空范围、评估资源适用主题范围等属性信息,支持预定义语义框架的过滤查询。
本发明实施例的一种辅助在线问卷评估的评估资源推荐***,包括:
预定义模块,用于预先分别定义问卷、评价指标体系和评估资源数据的语义表达模型;
创建资源推荐处理过程对象构建模块,用于创建资源推荐处理过程对象,资源推荐处理过程对象包括网络问卷解析模型、评价指标结构化处理模型、评估资源语料库组织模型和评估资源指标信息提取模型,所述资源推荐处理过程对象间通过映射关系链表实现属性关联;
数据结构化处理模块,用于分别利用网络问卷解析模型、评价指标结构化处理模型、评估资源语料库组织模型将文本表达的问卷、评价指标体系和评估资源数据转换为语义表达模型表达的结构化标准数据;
执行模块,用于将结构化标准数据输入到评估资源指标信息提取模型,获取评估推荐数据立方体。
评估资源推荐***的实现原理、技术效果与上述评估资源推荐方法类似,此处不再赘述。
本实施例还提供了一种电子设备,其包括至少一个处理器、以及至少一个存储器,其中,存储器中存储有计算机程序,当计算机程序被处理器执行时,使得处理器执行实施例一中评估资源推荐方法的步骤,具体步骤参见方法实施例,此处不再赘述;本实施例中,处理器和存储器的类型不作具体限制,例如:处理器可以是微处理器、数字信息处理器、片上可编程逻辑***等;存储器可以是易失性存储器、非易失性存储器或者它们的组合等。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行以实现上述任一评估资源推荐方法实施例的技术方案。其实现原理、技术效果与上述方法类似,此处不再赘述。
必须说明的是,上述任一实施例中,方法并不必然按照序号顺序依次执行,只要从执行逻辑中不能推定必然按某一顺序执行,则意味着可以以其他任何可能的顺序执行。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种辅助在线问卷评估的评估资源推荐方法,其特征在于,包括:
预先分别定义问卷、评价指标体系和评估资源数据的语义表达模型;
创建资源推荐处理过程对象,资源推荐处理过程对象包括网络问卷解析模型、评价指标结构化处理模型、评估资源语料库组织模型和评估资源指标信息提取模型,资源推荐处理过程对象间通过映射关系链表实现属性关联;
分别利用网络问卷解析模型、评价指标结构化处理模型、评估资源语料库组织模型将文本表达的问卷、评价指标体系和评估资源数据转换为语义表达模型表达的结构化标准数据;
将结构化标准数据输入到评估资源指标信息提取模型,获取评估推荐数据立方体。
2.如权利要求1所述的一种辅助在线问卷评估的评估资源推荐方法,其特征在于,
所述网络问卷解析模型至少包括属性:问卷关联指标体系、答题区关联指标项和待评估机构名称;
所述评价指标结构化处理模型至少包括属性:指标体系编号、指标项编号、指标体系维度、指标项关键词;
所述评估资源语料库组织模型至少包括属性:资源主题范围、语料关键词和评估资源适用范围;
所述评估资源指标信息提取模型至少包括属性:待评估机构名称、待提取指标项、资源主题范围、资源时空范围和资源关键词。
3.如权利要求2所述的一种辅助在线问卷评估的评估资源推荐方法,其特征在于,所述资源推荐处理过程对象间通过映射关系链表实现属性关联包括步骤:
将网络问卷解析模型的属性问卷关联指标体系同评价指标结构化处理模型的属性指标体系编号关联,将网络问卷解析模型的属性答题区关联指标项同评价指标结构化处理模型的属性指标项编号关联;
将评价指标结构化处理模型的属性指标体系维度同评估资源语料库组织模型的属性资源主题范围关联,将评价指标结构化处理模型的属性指标项关键词同评估资源语料库组织模型的属性语料关键词属性关联;
将评估资源指标信息提取模型的属性待评估机构名称同网络问卷解析模型的属性待评估机构名称关联,将评估资源指标信息提取模型的属性待提取指标项同网络问卷解析模型的属性答题区关联指标项关联;
将评估资源指标信息提取模型的属性资源主题范围同评估资源语料库组织模型的属性评估资源适用范围关联,将评估资源指标信息提取模型的属性资源主题范围和资源时空范围同评估资源语料库组织模型的属性评估资源适用主题范围和时空范围关联,将评估资源指标信息提取模型的属性资源关键词同评估资源语料库组织模型的属性语料关键词关联。
4.如权利要求1所述的一种辅助在线问卷评估的评估资源推荐方法,其特征在于,所述评估资源指标信息提取模型用于实现步骤;
从结构化标准数据中获取评估问卷关键词、评价指标关键词、评估资源语料和检索查询条件;
根据评估问卷关键词和评价指标关键词生成包括评估领域词典;
利用评估领域词典计算评估资源语料和检索查询条件的相似度,根据相似度生成评估资源推荐列表;
从评估资源推荐列表中提取指标推荐数据,构建指标推荐数据立方体,指标推荐数据立方体支持预定义语义框架的查询。
5.如权利要求4所述的一种辅助在线问卷评估的评估资源推荐方法,其特征在于,所述评估领域词典包括指标体系领域词典、学校信息词典、停用词词典和同义词词典。
6.如权利要求4所述的一种辅助在线问卷评估的评估资源推荐方法,其特征在于,所述利用评估领域词典计算评估资源语料和检索查询条件的相似度包括步骤:
利用评估领域词典对评估资源语料进行分词处理,获得评估资源语料的关键词集合,构建评估资源语料的评估资源语料特征矩阵,记为矩阵A;
对矩阵A进行奇异值分解和聚类计算,获得具有评估资源关键词语义概念聚类关系的矩阵,记为矩阵Ak;
将检索查询条件转换为与矩阵Ak具有相同空间的特征向量,记为向量qk;
计算矩阵Ak和向量qk的相似度。
8.一种辅助在线问卷评估的评估资源推荐***,其特征在于,包括:
预定义模块,用于预先分别定义问卷、评价指标体系和评估资源数据的语义表达模型;
创建资源推荐处理过程对象构建模块,用于创建资源推荐处理过程对象,资源推荐处理过程对象包括网络问卷解析模型、评价指标结构化处理模型、评估资源语料库组织模型和评估资源指标信息提取模型,资源推荐处理过程对象间通过映射关系链表实现属性关联;
数据结构化处理模块,用于分别利用网络问卷解析模型、评价指标结构化处理模型、评估资源语料库组织模型将文本表达的问卷、评价指标体系和评估资源数据转换为语义表达模型表达的结构化标准数据;
执行模块,用于将结构化标准数据输入到评估资源指标信息提取模型,获取评估推荐数据立方体。
9.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.如权利要求所述的一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110310227.6A CN112925901B (zh) | 2021-03-23 | 2021-03-23 | 一种辅助在线问卷评估的评估资源推荐方法及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110310227.6A CN112925901B (zh) | 2021-03-23 | 2021-03-23 | 一种辅助在线问卷评估的评估资源推荐方法及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112925901A true CN112925901A (zh) | 2021-06-08 |
CN112925901B CN112925901B (zh) | 2022-07-19 |
Family
ID=76175688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110310227.6A Active CN112925901B (zh) | 2021-03-23 | 2021-03-23 | 一种辅助在线问卷评估的评估资源推荐方法及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112925901B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114564626A (zh) * | 2021-12-23 | 2022-05-31 | 中国电子科技集团公司第二十九研究所 | 一种过滤电子侦察专项态势的方法及存储介质 |
CN116307792A (zh) * | 2022-10-12 | 2023-06-23 | 广州市阿尔法软件信息技术有限公司 | 一种面向城市体检主题场景的评估方法及装置 |
CN116415047A (zh) * | 2023-06-09 | 2023-07-11 | 湖南师范大学 | 一种基于国家形象资源推荐的资源筛选方法及*** |
CN116823406A (zh) * | 2023-08-24 | 2023-09-29 | 国品优选(北京)品牌管理有限公司 | 一种基于大数据的营养素片推荐方法及*** |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090100094A1 (en) * | 2007-10-15 | 2009-04-16 | Xavier Verdaguer | Recommendation system and method for multimedia content |
CN103049528A (zh) * | 2012-12-24 | 2013-04-17 | 北京信息科技大学 | 基于用户兴趣向量的个性化网页搜索排序方法 |
CN106844787A (zh) * | 2017-03-16 | 2017-06-13 | 四川大学 | 一种为汽车行业寻找目标用户并匹配目标产品的推荐方法 |
CN110610002A (zh) * | 2019-08-12 | 2019-12-24 | 华中师范大学 | 一种问卷信息处理方法、装置、计算机设备及存储介质 |
US20190392541A1 (en) * | 2018-06-20 | 2019-12-26 | Dataco Gmbh | Method and system for generating reports |
CN110866180A (zh) * | 2019-10-12 | 2020-03-06 | 平安国际智慧城市科技股份有限公司 | 资源推荐方法、服务器及存储介质 |
CN111079387A (zh) * | 2019-11-29 | 2020-04-28 | 华中师范大学 | 一种问卷自动化生成方法、装置、计算机设备及存储介质 |
CN111192176A (zh) * | 2019-12-30 | 2020-05-22 | 华中师范大学 | 一种支持教育信息化评估的在线数据采集方法及装置 |
CN111966913A (zh) * | 2020-10-21 | 2020-11-20 | 拼说说(深圳)网络科技有限公司 | 一种教育资源推荐处理方法、装置及计算机设备 |
-
2021
- 2021-03-23 CN CN202110310227.6A patent/CN112925901B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090100094A1 (en) * | 2007-10-15 | 2009-04-16 | Xavier Verdaguer | Recommendation system and method for multimedia content |
CN103049528A (zh) * | 2012-12-24 | 2013-04-17 | 北京信息科技大学 | 基于用户兴趣向量的个性化网页搜索排序方法 |
CN106844787A (zh) * | 2017-03-16 | 2017-06-13 | 四川大学 | 一种为汽车行业寻找目标用户并匹配目标产品的推荐方法 |
US20190392541A1 (en) * | 2018-06-20 | 2019-12-26 | Dataco Gmbh | Method and system for generating reports |
CN110610002A (zh) * | 2019-08-12 | 2019-12-24 | 华中师范大学 | 一种问卷信息处理方法、装置、计算机设备及存储介质 |
CN110866180A (zh) * | 2019-10-12 | 2020-03-06 | 平安国际智慧城市科技股份有限公司 | 资源推荐方法、服务器及存储介质 |
CN111079387A (zh) * | 2019-11-29 | 2020-04-28 | 华中师范大学 | 一种问卷自动化生成方法、装置、计算机设备及存储介质 |
CN111192176A (zh) * | 2019-12-30 | 2020-05-22 | 华中师范大学 | 一种支持教育信息化评估的在线数据采集方法及装置 |
CN111966913A (zh) * | 2020-10-21 | 2020-11-20 | 拼说说(深圳)网络科技有限公司 | 一种教育资源推荐处理方法、装置及计算机设备 |
Non-Patent Citations (1)
Title |
---|
王凯: "融合SNS的区域教育信息化水平评估***设计与实现", 《中国优秀硕士论文电子期刊网》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114564626A (zh) * | 2021-12-23 | 2022-05-31 | 中国电子科技集团公司第二十九研究所 | 一种过滤电子侦察专项态势的方法及存储介质 |
CN114564626B (zh) * | 2021-12-23 | 2023-04-21 | 中国电子科技集团公司第二十九研究所 | 一种过滤电子侦察专项态势的方法及存储介质 |
CN116307792A (zh) * | 2022-10-12 | 2023-06-23 | 广州市阿尔法软件信息技术有限公司 | 一种面向城市体检主题场景的评估方法及装置 |
CN116307792B (zh) * | 2022-10-12 | 2024-03-12 | 广州市阿尔法软件信息技术有限公司 | 一种面向城市体检主题场景的评估方法及装置 |
CN116415047A (zh) * | 2023-06-09 | 2023-07-11 | 湖南师范大学 | 一种基于国家形象资源推荐的资源筛选方法及*** |
CN116415047B (zh) * | 2023-06-09 | 2023-08-18 | 湖南师范大学 | 一种基于国家形象资源推荐的资源筛选方法及*** |
CN116823406A (zh) * | 2023-08-24 | 2023-09-29 | 国品优选(北京)品牌管理有限公司 | 一种基于大数据的营养素片推荐方法及*** |
CN116823406B (zh) * | 2023-08-24 | 2023-11-14 | 国品优选(北京)品牌管理有限公司 | 一种基于大数据的营养素片推荐方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN112925901B (zh) | 2022-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109189942B (zh) | 一种专利数据知识图谱的构建方法及装置 | |
CN112925901B (zh) | 一种辅助在线问卷评估的评估资源推荐方法及其应用 | |
CN107122413B (zh) | 一种基于图模型的关键词提取方法及装置 | |
Lerman et al. | Using the structure of web sites for automatic segmentation of tables | |
Zubrinic et al. | The automatic creation of concept maps from documents written using morphologically rich languages | |
CN107180045B (zh) | 一种互联网文本蕴含地理实体关系的抽取方法 | |
CN102955848B (zh) | 一种基于语义的三维模型检索***和方法 | |
US20100241639A1 (en) | Apparatus and methods for concept-centric information extraction | |
CN106156272A (zh) | 一种基于多源语义分析的信息检索方法 | |
Shigarov | Table understanding using a rule engine | |
CN108319583B (zh) | 从中文语料库提取知识的方法与*** | |
Sarkhel et al. | Visual segmentation for information extraction from heterogeneous visually rich documents | |
CN105608166A (zh) | 一种标签提取方法及装置 | |
CN114997288A (zh) | 一种设计资源关联方法 | |
Sarkhel et al. | Improving information extraction from visually rich documents using visual span representations | |
Im et al. | Confirmatory aspect-level opinion mining processes for tourism and hospitality research: a proposal of DiSSBUS | |
Su et al. | Understanding query interfaces by statistical parsing | |
Al-Sultany et al. | Enriching tweets for topic modeling via linking to the wikipedia | |
Phan et al. | Automated data extraction from the web with conditional models | |
ElGindy et al. | Capturing place semantics on the geosocial web | |
CN110930189A (zh) | 基于用户行为的个性化营销方法 | |
Dai | Construction of English and American literature corpus based on machine learning algorithm | |
Wanderley et al. | Knowledge discovery in task-oriented dialogue | |
Jing | Searching for economic effects of user specified events based on topic modelling and event reference | |
Gajderowicz | Using decision trees for inductively driven semantic integration and ontology matching |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |