CN112650948B - 教育信息化评估的信息网构建方法、***及应用 - Google Patents
教育信息化评估的信息网构建方法、***及应用 Download PDFInfo
- Publication number
- CN112650948B CN112650948B CN202011626651.3A CN202011626651A CN112650948B CN 112650948 B CN112650948 B CN 112650948B CN 202011626651 A CN202011626651 A CN 202011626651A CN 112650948 B CN112650948 B CN 112650948B
- Authority
- CN
- China
- Prior art keywords
- user
- resource
- evaluation
- objects
- users
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 157
- 238000010276 construction Methods 0.000 title claims description 10
- 239000013598 vector Substances 0.000 claims abstract description 70
- 238000013507 mapping Methods 0.000 claims abstract description 63
- 238000000034 method Methods 0.000 claims abstract description 45
- 238000012854 evaluation process Methods 0.000 claims abstract description 28
- 230000006399 behavior Effects 0.000 claims description 126
- 238000004364 calculation method Methods 0.000 claims description 38
- 230000011273 social behavior Effects 0.000 claims description 33
- 230000003993 interaction Effects 0.000 claims description 18
- 230000002452 interceptive effect Effects 0.000 claims description 16
- 230000008520 organization Effects 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 8
- 238000011161 development Methods 0.000 abstract description 10
- 230000008569 process Effects 0.000 abstract description 8
- 238000004458 analytical method Methods 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000012550 audit Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 230000003997 social interaction Effects 0.000 description 3
- 230000003542 behavioural effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000000969 carrier Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- Educational Technology (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种教育信息化评估的信息网构建方法、***及应用。该方法包括步骤:采集区域教育信息化评估过程的评估资源信息、用户信息和行为信息;创建资源对象、用户对象和行为对象及对象间的映射关系链表;根据资源对象、用户对象和行为对象以及映射关系链表,计算用户的兴趣特征向量,根据用户的兴趣特征向量获取用户的潜在推荐评估资源,根据资源对象、用户对象和行为对象以及映射关系链表,计算潜在推荐评估资源的特征向量,根据用户的兴趣特征向量和潜在推荐评估资源的特征向量两者间的相似度进行评估资源推送。本发明能够实现区域教育信息化发展水平评估过程中评估资源的互联互通和高效利用。
Description
技术领域
本发明属于信息处理技术领域,更具体地,涉及一种教育信息化评估的信息网构建方法、***及应用。
背景技术
区域教育信息化发展水平评估工作为推进我国的教育信息化发展发挥了重大作用。目前在区域教育信息化评估的各个环节中,大量评估资源的信息传输采用邮件、即时通讯软件、电话等传统途径,信息传输低效且难以统一管理。大量的评估过程性资源数据,如政策文件、分析报告、评估方法、调研访谈数据等以不同的形式、载体分散存储于评估活动的各个环节、不同用户端,形式多样且体量巨大。评估过程性资源数据对于教育信息化发展过程中学校信息化建设、专家研究、地方***门信息化政策制定有着重要的参考价值,但现阶段由于缺乏有效的评估资源信息全局组织和传输渠道,使得海量的、离散存储的评估资源价值没有得到充分体现,难以满足海量评估资源数据服务的个性化需求。
发明内容
针对现有技术的至少一个缺陷或改进需求,本发明提供了一种教育信息化评估的信息网构建方法、***及应用,能够实现区域教育信息化发展水平评估过程中评估资源的互联互通和高效利用。
为实现上述目的,按照本发明的第一方面,提供了一种教育信息化评估的信息网构建方法,包括:
采集区域教育信息化评估过程的评估资源信息、用户信息和行为信息,并转换为结构化标准数据;
根据结构化标准数据创建资源对象、用户对象和行为对象,资源对象用来描述评估资源信息,用户对象用来描述用户信息,行为对象用来描述用户与用户之间的社交行为以及用户与资源之间所产生的交互行为,根据用户与用户之间的社交行为创建用户对象到行为对象再到用户对象的映射关系链表,根据用户与资源之间的社交行为创建用户对象到行为对象再到资源对象的映射关系链表;
根据资源对象、用户对象和行为对象以及映射关系链表,计算用户的兴趣特征向量,根据用户的兴趣特征向量获取用户的潜在推荐评估资源,根据资源对象、用户对象和行为对象以及映射关系链表,计算潜在推荐评估资源的特征向量,根据用户的兴趣特征向量和潜在推荐评估资源的特征向量两者间的相似度进行评估资源推送。
优选的,所述资源对象包括计算资源对象和数据资源对象,计算资源对象用于描述评估过程中的评估指标体系和评估计算模型,数据资源对象用于描述评估过程中的测评数据;用户对象包括机构用户对象和个人用户对象,机构用户对象用于描述评估过程中的机构用户,个人用户对象用于描述评估过程中的个人用户;行为对象包括社交行为对象和交互行为对象,社交行为对象用来描述用户与用户之间的社交行为,交互行为对象用于描述用户与资源之间所产生的交互行为。
优选的,用户对象到行为对象再到用户对象的映射关系包括单向映射关系和双向映射关系两类。
优选的,所述构建用户兴趣特征向量模型来计算用户的兴趣特征向量包括步骤:
根据资源对象、用户对象和行为对象以及映射关系链表,构建用户集合U={u1,u2,u3,…um},m为用户总数量,构建标签集合T={t1,t2,t3,…tn},n为标签总数量,确定用户i(1≤i≤m)使用标签j(1≤j≤n)的次数kij,则用户i的原始兴趣向量模型为
标签j对于用户i的刻画度Pij的计算公式为:
其中,ni表示用户i使用标签集合中所有标签的总次数;
标签j对用户i与其他用户间的区分度Dij的计算公式:
其中,nj代表用户集合中使用了标签j的用户总数;
标签j对用户i的权重Wij公式:
Wij=Pij*Dij
优选的,构建用户集合、构建标签集合和确定用户i使用标签j(1≤j≤n)的次数kij的方法包括步骤:
预先定义从用户对象、资源对象、行为对象以及映射关系链表中提取标签以及确定每个用户对每个标签的兴趣度的计算方法,然后根据预定义的方法以及创建的用户对象、资源对象、行为对象以及映射关系链表,构建用户集合、标签集合和确定用户i使用标签j(1≤j≤n)的次数kij。
优选的,根据用户的兴趣特征向量获取用户的潜在推荐评估资源:
计算用户i1与其他任意用户i2的兴趣特征向量的相似度;
确定与用户i1的兴趣特征向量的相似度最接近的前预设个数的用户集合;
根据资源对象、用户对象和行为对象以及映射关系链表,获取前预设个数的用户集合的集合感兴趣的资源,作为潜在推荐评估资源的集合R={r1,r2,…rl},l为潜在推荐评估资源的数量。
优选的,所述计算潜在推荐评估资源的特征向量包括步骤:
根据资源对象、用户对象和行为对象以及映射关系链表,确定潜在推荐评估资源o(1≤o≤l)中存在标签j的数量koj;
任意标签j对任意潜在推荐评估资源o的刻画度Poj的计算公式为:
其中,no表示潜在推荐评估资源o所有标签的总数量;
标签j对潜在推荐评估资源o与其他潜在推荐评估资源间的区分度Doj的计算公式为:
其中,n'j代表潜在推荐评估资源集合中存在标签j的潜在推荐评估资源的数量。
标签j对潜在推荐评估资源o的权重公式为:
Voj=Poj*Doj
优选的,所述构建评估资源用户影响力模型包括步骤:。
按照本发明的第二方面,提供了一种教育信息化评估的信息网构建***,包括:
数据采集处理模块,用于采集区域教育信息化评估过程的评估资源信息、用户信息和行为信息,并转换为结构化标准数据;
数据关系构建模块,根据结构化标准数据创建资源对象、用户对象和行为对象,资源对象用来描述评估资源信息,用户对象用来描述用户信息,行为对象用来描述用户与用户之间的社交行为以及用户与资源之间所产生的交互行为,根据用户与用户之间的社交行为创建用户对象到行为对象再到用户对象的映射关系链表,根据用户与资源之间的社交行为创建用户对象到行为对象再到资源对象的映射关系链表;
执行模块,用于根据资源对象、用户对象和行为对象以及映射关系链表,计算用户的兴趣特征向量,根据用户的兴趣特征向量获取用户的潜在推荐评估资源,根据资源对象、用户对象和行为对象以及映射关系链表,计算潜在推荐评估资源的特征向量,根据用户的兴趣特征向量和潜在推荐评估资源的特征向量两者间的相似度进行评估资源推送。
按照本发明的第三方面,提供了一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的方法的步骤。
按照本发明的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项方法。
总体而言,本发明与现有技术相比,具有有益效果:通过对区域教育信息化发展水平评估过程中评估资源信息要素“用户-行为-资源”的有效整合和评估资源信息传播链路的重构,构建有利于评估资源互联互通的信息网,打通区域教育信息化评估各环节间资源流通渠道,丰富评估用户对多源异构评估资源数据及评估用户之间的信息交互操作能力,有效提升评估资源利用效率,并基于用户和资源特征标签的相似度计算实现评估资源的个性化推送;另外还通过对评估资源的影响力指数计算支撑高质量评估资源数据聚类,为有效提升区域教育信息化发展水平评估服务质量提供技术支撑。
附图说明
图1是本发明实施例的信息网构建方法的流程示意图;
图2是本发明实施例的评估过程数据采集与结构化处理流程图;
图3是本发明实施例的评估资源对象映射关系链表创建流程图;
图4是本申请实施例提供的评估资源推荐模型构建流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
图1给出本发明一种区域教育信息化发展水平评估资源信息网构建方法,包括以下步骤:
(1)采集区域教育信息化发展水平评估过程的资源信息、用户信息和行为信息,并转换为带预定义语义标签的结构化标准数据。
如图2所示,区域教育信息化发展水平评估过程的资源信息、用户信息和行为信息采集与结构化处理的具体实现过程为:
(11)建立资源的语义描述规则。教育信息化评估过程资源信息(ResourceInformation,语义标识“RI”)包括数据资源(Data Resource,语义标识“DR”)和计算资源(Calculation Resource,语义标识“CR”)两大类。数据资源包括统计分析报告、科研文献、政策文件和其他网络资源等。计算资源包括教育信息化评估指标体系、评估计算模型等。评估资源语义描述规则如表1所示。
表1评估资源语义描述规则
(12)建立用户的语义描述规则。区域教育信息化发展水平评估用户信息(UserInfo,语义标识“UI”)包括机构用户(Organization User,语义标识“OU”)和个人用户(Personal User,语义标识“PU”)两大类,机构用户包括但不限于教育管理部门、学校机构和媒体机构等,个人用户包括但不限于教师、学生、专家、信息管理员和访客等。评估用户语义描述规则如表2所示:
表2评估用户语义描述规则
(13)建立行为的语义描述规则。教育信息化评估过程中的行为(ActivityInformation,语义标识“AI”)包括用户与资源之间的交互行为和用户与用户之间的社交行为。教育信息化评估过程中的行为数据包括用户与用户之间所产生的社交行为数据、用户与资源之间所产生的交互行为数据,以及用户行为数据统计和资源交互统计数据。评估行为语义描述规则如表3所示。
表3评估行为语义描述规则
其中,用户与用户之间的社交行为数据包括但不限于互动信息、共享资源信息等。用户与资源之间的交互行为数据包括但不限于用户对资源进行搜索、访问、收藏、创建、下载和推荐行为等。用户行为统计数据包括但不限于用户关注、资源访问/收藏/创建/下载/推荐/审核行为等。资源交互统计数据包括但不限于交互资源总量、资源类别、资源访问热度、资源推荐指数等交互统计信息。
(2)根据结构化标准数据创建资源对象、用户对象和行为对象,资源对象用来描述评估资源信息,用户对象用来描述用户信息,行为对象用来描述用户与用户之间的社交行为以及用户与资源之间所产生的交互行为,根据用户与用户之间的社交行为创建用户对象到行为对象再到用户对象的映射关系链表,根据用户与资源之间的社交行为创建用户对象到行为对象再到资源对象的映射关系链表,实现评估资源、评估用户和评估行为信息的关联组织。
如图3所示,创建评估资源信息网资源对象、用户对象和行为对象及其属性并构建对象映射关系链表具体实现过程为:
(21)创建评估资源信息网资源对象、用户对象和行为对象。基于步骤(1)所述的语义规则,将教育信息化评估过程中的资源信息、用户角色信息、基于用户和用户之间的社交行为以及用户与资源之间的交互行为产生的数据信息进行对象化处理,构建基于资源、用户和行为的三大对象数据模型。资源对象包括计算资源对象和数据资源对象,计算资源对象用于描述评估过程中的评估指标体系和评估计算模型,数据资源对象用于描述评估过程中的测评数据;用户对象包括机构用户对象和个人用户对象,机构用户对象用于描述评估过程中的机构用户,个人用户对象用于描述评估过程中的个人用户;行为对象包括社交行为对象和交互行为对象,社交行为对象用来描述用户与用户之间的社交行为,交互行为对象用于描述用户与资源之间所产生的交互行为。
(22)创建评估资源信息网对象属性。基于步骤(11)所述的资源对象语义描述规则,创建资源对象属性。资源对象包含资源基本属性、数据资源属性、计算资源属性和资源扩展属性。资源基本属性包括资源标识等共性属性;数据资源属性包括资源类型、数据来源、适用范围等;计算资源属性包括计算类别、算法名称、算法应用等;资源扩展属性包括资源热度和资源推荐指数等。资源对象的属性定义如表4所示:
表4资源对象属性定义
基于步骤(12)所述的用户对象语义描述规则,创建用户对象属性。用户对象属性不仅包括用户标识、用户名称、所属地区、联系方式等基本属性外,还包括用户和用户以及用户和资源之间交互所需的扩展属性,例如用户关注列表、收藏列表、发布信息和影响力指数排行信息等。用户对象的属性定义如表5所示。
表5用户对象属性定义
基于步骤(13)所述的行为对象语义描述规则,创建行为对象属性。行为对象的基本属性包括行为标识和行为类别等。行为对象的属性定义如表6所示。
表6行为对象属性定义
属性名称 | 属性定义 | 属性值说明 |
行为标识 | AI.activityID | 用户操作或资源交互行为标识 |
行为类别 | AI.Operational | 包括关注、访问、收藏、创建、下载、推荐、审核等操作行为 |
(23)创建评估资源信息网对象间的映射关系链表。基于步骤(22)所属的行为对象属性,建立用户与用户以及用户与资源之间的映射关系。针对“用户-用户之间的社交行为”,构建“用户标识-行为标识-用户标识”之间的映射关系,例如“用户A关注用户B,用户C关注用户B,用户B和用户D互相关注”,则需要建立用户A和用户B、用户C和用户B之间“关注”行为的单向映射关系,同时需要建立用户B和用户D之间“互相关注”行为的双向映射关系,而且“关注/互相关注”这类“用户-用户之间的社交行为”,也可作为分析用户在评估资源信息网中用户特征相似性的一个考量参数,即用户A和用户C同时关注用户B,一定程度上表明用户A和用户C在评估资源信息的关注度上存在一定的相似性,而用户B和用户D的互相关注,一定程度上表明用户B和用户D在评估资源信息的关注度上存在一定的主题相似性或/和补充性,可以支撑评估资源信息的推理挖掘。针对“用户-资源之间的交互行为”,构建“用户标识-行为标识-资源标识”之间的映射关系,例如“用户A收藏资源1,用户B收藏资源1”,则需要建立用户A和资源1、用户B和资源1之间“收藏”行为的单向映射关系,而且“收藏”这一“用户-资源之间的交互行为”,也可作为分析用户在评估资源信息网中用户的资源需求相似性的一个考量参数,即用户A和用户B同时收藏资源1,一定程度上表明用户A和用户B在评估资源的诉求上存在一定的相似性。
(3)根据资源对象、用户对象和行为对象以及映射关系链表,计算用户的兴趣特征向量,根据用户的兴趣特征向量获取用户的潜在推荐评估资源,根据资源对象、用户对象和行为对象以及映射关系链表,计算潜在推荐评估资源的特征向量,根据用户的兴趣特征向量和潜在推荐评估资源的特征向量两者间的相似度进行评估资源推送。
如图4所示,根据区域教育信息化评估过程对象间的映射关系链表实现基于特征标签相似度的评估资源协同推荐,推送评估资源数据的具体实现过程为:
(31)构建评估用户兴趣特征向量模型。根据资源对象、用户对象和行为对象以及映射关系链表,构建用户集合、标签集合以及用户集合、标签集合间的关联关系。
鉴于“用户-资源之间的交互”和“用户-用户之间的社交”一定程度上反应了用户对评估资源的需求特质,即评估用户对评估资源的兴趣特征,因此根据应用需要将“用户-资源之间的交互”和“用户-用户之间的社交”、以及评估用户对象属性和资源对象属性的特征进行标注处理。即可根据特征分析应用需要预先定义从用户对象及其属性、资源对象及其属性、行为对象及其属性以及映射关系链表中提取标签以及确定每个用户对每个标签的兴趣度的计算方法,然后根据预定义的方法基于步骤(2)处理好的数据构建用户结合、标签集合和每个用户对每个标签的兴趣度。
例如可以预定义将用户对象属性中的所属地区作为一个标签,预定义根据用户对象属性中的所属地区确定兴趣度的计算方法,假设用户对象属性中的所属地区的属性值为“A”,则可以提取标签“A”,并根据预定义的方法确定该用户对于标签“A”的兴趣度。
还例如,可以预定义将用户对象操作的资源对象名称作为一个标签,预定义根据用户对象、资源对象、行为对象和映射关系链表确定兴趣度的计算方法,例如不同的操作行为可以分值不同,假设用户对象关注的资源对象为“B”,则可以提取标签“B”,并根据预定义的方法确定该用户对于标签“B”的兴趣度。
具体的,兴趣度可用用户i(1≤i≤m)使用标签j(1≤j≤n)的次数kij来表征。即根据特征分析应用需要选定用户对象、资源对象的部分属性信息、以及“用户-资源”和“用户-用户”之间的部分行为属性信息,构建参与特征分析的用户、资源以及行为的属性标签全集,人工标注的参与特征分析的“用户-资源之间的交互”和“用户-用户之间的社交”的行为属性标签所反映的行为频次信息(例如关注、访问、收藏、创建、下载、推荐、审核等)等可以通过计算机自动统计,人工标注的参与特征分析的用户对象和资源对象的属性标签(例如用户的兴趣主题、专业领域关键词等,以及资源的内容主题、内容所属学段、内容所属学科等)可以通过计算机自动采集,进而获取包含用户属性、资源属性和行为属性的特征标签全集,通过评估用户和评估资源的特征标签的相似性分析,进而得到具有特征标签相似性的评估资源。
根据用户对每个标签的兴趣度计算用户的兴趣特征向量。优选采用以下方式实现。
将经过上述处理得到的特征标签集合记为T={t1,t2,t3,…tn},n为标签的种类数,将用户集合记为U={u1,u2,u3,…um},m为用户数量,将用户i(1≤i≤m)使用标签j(1≤j≤n)的次数记为kij,如表7所示。
表7用户-标签关联关系表
进一步地,基于用户原始兴趣向量模型,引入TF-IDF模型,对关联关系表中用户对标签的兴趣度的值进行规范化处理。首先定义标签对用户的计算公式W=P*D,其中W为标签对用户的权重,P代表标签对于用户的刻画度,D代表标签对于用户之间的区分度。
标签j对于任意用户i的刻画度P的计算公式为:
其中,kij代表用户i在使用标签j的次数,ni表示用户i共使用所有标签的次数(此处的计算结果值越大,标签对该用户的刻画程度越好)。
标签j对用户i与其他用户间的区分度D的计算公式:
其中m即参与区域教育信息化发展水平评估资源信息网社会化标注的用户总数,nj代表用户集合中使用了标签j的用户数(此处的值越大,表示除了用户i,几乎无人使用该标签,则标签j对用户i与其他用户的区分度越强)。
标签j对用户i的权重公式:
Wij=Pij*Dij
(32)采用上述方法计算用户i1与其他任意用户i2的兴趣特征向量的相似度,构建k近邻评估用户集合。用户i1与其他任意用户i2采用上述步骤(31)的方法计算得到。上述方法优选基于用户兴趣向量模型进行余弦相似度计算,用户i1与其他任意用户i2的兴趣特征向量的相似度余弦计算公式为:
进一步地,基于top-k算法,提取同用户i1兴趣度最相近的前k个用户的集合,k可为预设值:CUi={u1,u2,…uk}。
(33)构建潜在推荐评估资源特征向量模型。通过人工标注参与特征分析的“用户-资源之间交互”的行为属性标签,将会统计用户有过交互行为(例如关注、访问、收藏、创建、下载、推荐、审核等)的资源集合。根据(32)获取的用户i兴趣度最相近的前k个用户集合,将用户i的k近邻用户所交互操作过的资源进行整理,这些资源便构成了用户i潜在待推荐资源集合。基于最近邻用户的资源标签,建立潜在推荐资源集合R={r1,r2,…rl},l为资源个数。预先定义根据用户对象、资源对象、行为对象以及映射关系链表确定每个资源每个标签的数量的计算方法,然后根据创建的资源对象、用户对象和行为对象以、映射关系链表以及预先定义的方法,确定潜在推荐评估资源o(1≤o≤l)中存在标签j的数量koj,构建资源与标签之间的关联关系,如表8所示。
表8资源-标签关联关系表
进一步地,进行资源向量模型的转化,即推荐评估资源o(1≤o≤l)中存在标签j的数量koj计算潜在推荐评估资源的特征向量。
优选采用以下实现方式。
定义标签对资源的权重计算公式V=P*D,V即标签对资源的权重值,P代表标签对于资源的刻画程度,D代表资源间的区分度。
任意标签j对任意潜在推荐评估资源o的刻画度Poj的计算公式为:
其中no表示潜在推荐评估资源o所有标签的总数量(此处的计算结果值越大,表明标签对该资源的刻画程度越好)。
标签j对潜在推荐评估资源o与其他潜在推荐评估资源间的区分度Doj的计算公式为:
其中n'j代表潜在推荐评估资源集合中存在标签j的潜在推荐评估资源的数量(此处的值越大,表示标签j对资源i与其他资源间的区分度越强)。
标签j对潜在推荐评估资源o的权重公式为:
Voj=Poj*Doj
(34)计算评估资源推荐结果列表。基于余弦相似度算法,将用户i的兴趣特征向量模型与潜在推荐资源集合中的资源特征向量模型进行相似度计算计算,基于top-k算法,得到推送给用户i的推荐评估资源。
本发明实施例的一种教育信息化评估的信息网构建***,包括:
数据采集处理模块,用于采集区域教育信息化评估过程的评估资源信息、用户信息和行为信息,并转换为结构化标准数据;
数据关系构建模块,根据结构化标准数据创建资源对象、用户对象和行为对象,资源对象用来描述评估资源信息,用户对象用来描述用户信息,行为对象用来描述用户与用户之间的社交行为以及用户与资源之间所产生的交互行为,根据用户与用户之间的社交行为创建用户对象到行为对象再到用户对象的映射关系链表,根据用户与资源之间的社交行为创建用户对象到行为对象再到资源对象的映射关系链表;
执行模块,用于根据资源对象、用户对象和行为对象以及映射关系链表,计算用户的兴趣特征向量,根据用户的兴趣特征向量获取用户的潜在推荐评估资源,根据资源对象、用户对象和行为对象以及映射关系链表,计算潜在推荐评估资源的特征向量,根据用户的兴趣特征向量和潜在推荐评估资源的特征向量两者间的相似度进行评估资源推送。
***与上述方法的实现原理及效果相同,此处不再赘述。
本实施例还提供了一种电子设备,其包括至少一个处理器、以及至少一个存储器,其中,存储器中存储有计算机程序,当计算机程序被处理器执行时,使得处理器执行方法实施例的步骤,具体步骤参见方法实施例,此处不再赘述;本实施例中,处理器和存储器的类型不作具体限制,例如:处理器可以是微处理器、数字信息处理器、片上可编程逻辑***等;存储器可以是易失性存储器、非易失性存储器或者它们的组合等。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行以实现上述任一方法实施例的技术方案。其实现原理、技术效果与上述方法类似,此处不再赘述。
必须说明的是,上述任一实施例中,方法并不必然按照序号顺序依次执行,只要从执行逻辑中不能推定必然按某一顺序执行,则意味着可以以其他任何可能的顺序执行。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种教育信息化评估的信息网构建方法,其特征在于,包括:
采集区域教育信息化评估过程的评估资源信息、用户信息和行为信息,并转换为结构化标准数据;
根据结构化标准数据创建资源对象、用户对象和行为对象,资源对象用来描述评估资源信息,用户对象用来描述用户信息,行为对象用来描述用户与用户之间的社交行为以及用户与资源之间所产生的交互行为,根据用户与用户之间的社交行为创建用户对象到行为对象再到用户对象的映射关系链表,根据用户与资源之间的社交行为创建用户对象到行为对象再到资源对象的映射关系链表;
根据资源对象、用户对象、行为对象以及映射关系链表,计算用户的兴趣特征向量,根据用户的兴趣特征向量获取用户的潜在推荐评估资源,根据资源对象、用户对象、行为对象以及映射关系链表,计算潜在推荐评估资源的特征向量,根据用户的兴趣特征向量和潜在推荐评估资源的特征向量两者间的相似度进行评估资源推送;
所述计算用户的兴趣特征向量包括步骤:
根据资源对象、用户对象和行为对象以及映射关系链表,构建用户集合U={u1,u2,u3,…um},m为用户总数量,构建标签集合T={t1,t2,t3,…tn},n为标签总数量,确定用户i(1≤i≤m)使用标签j(1≤j≤n)的次数kij,则用户i的原始兴趣向量模型为
标签j对于用户i的刻画度Pij的计算公式为:
其中,ni表示用户i使用标签集合中所有标签的总次数;
标签j对用户i与其他用户间的区分度Dij的计算公式:
其中,nj代表用户集合中使用了标签j的用户总数;
标签j对用户i的权重Wij公式:
Wij=Pij*Dij
构建用户集合、构建标签集合和确定用户i使用标签j(1≤j≤n)的次数kij的方法包括步骤:
预先定义从用户对象、资源对象、行为对象以及映射关系链表中提取标签以及确定每个用户对每个标签的兴趣度的计算方法,然后根据预定义的方法以及创建的用户对象、资源对象、行为对象以及映射关系链表,构建用户集合、标签集合和确定用户i使用标签j(1≤j≤n)的次数kij;
所述计算潜在推荐评估资源的特征向量包括步骤:
根据资源对象、用户对象和行为对象以及映射关系链表,确定潜在推荐评估资源o(1≤o≤l)中存在标签j的数量koj;
任意标签j对任意潜在推荐评估资源o的刻画度Poj的计算公式为:
其中,no表示潜在推荐评估资源o所有标签的总数量;
标签j对潜在推荐评估资源o与其他潜在推荐评估资源间的区分度Doj的计算公式为:
其中,n'j代表潜在推荐评估资源集合中存在标签j的潜在推荐评估资源的数量;
标签j对潜在推荐评估资源o的权重公式为:
Voj=Poj*Doj
2.如权利要求1所述的一种教育信息化评估的信息网构建方法,其特征在于,所述资源对象包括计算资源对象和数据资源对象,计算资源对象用于描述评估过程中的评估指标体系和评估计算模型,数据资源对象用于描述评估过程中的测评数据;用户对象包括机构用户对象和个人用户对象,机构用户对象用于描述评估过程中的机构用户,个人用户对象用于描述评估过程中的个人用户;行为对象包括社交行为对象和交互行为对象,社交行为对象用来描述用户与用户之间的社交行为,交互行为对象用于描述用户与资源之间所产生的交互行为。
3.如权利要求1所述的一种教育信息化评估的信息网构建方法,其特征在于,用户对象到行为对象再到用户对象的映射关系包括单向映射关系和双向映射关系两类。
4.如权利要求1所述的一种教育信息化评估的信息网构建方法,其特征在于,所述根据用户的兴趣特征向量获取用户的潜在推荐评估资源:
计算用户i1与其他任意用户i2的兴趣特征向量的相似度;
确定与用户i1的兴趣特征向量的相似度最接近的前预设个数的用户集合;
根据资源对象、用户对象和行为对象以及映射关系链表,获取与前预设个数的用户集合的用户产生交互的资源,作为潜在推荐评估资源的集合R={r1,r2,…rl},l为潜在推荐评估资源的数量。
5.一种教育信息化评估的信息网构建***,其特征在于,包括:
数据采集处理模块,用于采集区域教育信息化评估过程的评估资源信息、用户信息和行为信息,并转换为结构化标准数据;
数据关系构建模块,根据结构化标准数据创建资源对象、用户对象和行为对象,资源对象用来描述评估资源信息,用户对象用来描述用户信息,行为对象用来描述用户与用户之间的社交行为以及用户与资源之间所产生的交互行为,根据用户与用户之间的社交行为创建用户对象到行为对象再到用户对象的映射关系链表,根据用户与资源之间的社交行为创建用户对象到行为对象再到资源对象的映射关系链表;
执行模块,用于根据资源对象、用户对象和行为对象以及映射关系链表,计算用户的兴趣特征向量,根据用户的兴趣特征向量获取用户的潜在推荐评估资源,根据资源对象、用户对象和行为对象以及映射关系链表,计算潜在推荐评估资源的特征向量,根据用户的兴趣特征向量和潜在推荐评估资源的特征向量两者间的相似度进行评估资源推送;
所述计算用户的兴趣特征向量包括步骤:
根据资源对象、用户对象和行为对象以及映射关系链表,构建用户集合U={u1,u2,u3,…um},m为用户总数量,构建标签集合T={t1,t2,t3,…tn},n为标签总数量,确定用户i(1≤i≤m)使用标签j(1≤j≤n)的次数kij,则用户i的原始兴趣向量模型为
标签j对于用户i的刻画度Pij的计算公式为:
其中,ni表示用户i使用标签集合中所有标签的总次数;
标签j对用户i与其他用户间的区分度Dij的计算公式:
其中,nj代表用户集合中使用了标签j的用户总数;
标签j对用户i的权重Wij公式:
Wij=Pij*Dij
构建用户集合、构建标签集合和确定用户i使用标签j(1≤j≤n)的次数kij的方法包括步骤:
预先定义从用户对象、资源对象、行为对象以及映射关系链表中提取标签以及确定每个用户对每个标签的兴趣度的计算方法,然后根据预定义的方法以及创建的用户对象、资源对象、行为对象以及映射关系链表,构建用户集合、标签集合和确定用户i使用标签j(1≤j≤n)的次数kij;
所述计算潜在推荐评估资源的特征向量包括步骤:
根据资源对象、用户对象和行为对象以及映射关系链表,确定潜在推荐评估资源o(1≤o≤l)中存在标签j的数量koj;
任意标签j对任意潜在推荐评估资源o的刻画度Poj的计算公式为:
其中,no表示潜在推荐评估资源o所有标签的总数量;
标签j对潜在推荐评估资源o与其他潜在推荐评估资源间的区分度Doj的计算公式为:
其中,n'j代表潜在推荐评估资源集合中存在标签j的潜在推荐评估资源的数量;
标签j对潜在推荐评估资源o的权重公式为:
Voj=Poj*Doj
6.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述的方法的步骤。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011626651.3A CN112650948B (zh) | 2020-12-30 | 2020-12-30 | 教育信息化评估的信息网构建方法、***及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011626651.3A CN112650948B (zh) | 2020-12-30 | 2020-12-30 | 教育信息化评估的信息网构建方法、***及应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112650948A CN112650948A (zh) | 2021-04-13 |
CN112650948B true CN112650948B (zh) | 2022-04-29 |
Family
ID=75367335
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011626651.3A Active CN112650948B (zh) | 2020-12-30 | 2020-12-30 | 教育信息化评估的信息网构建方法、***及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112650948B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113256190B (zh) * | 2021-07-15 | 2021-10-29 | 腾讯科技(深圳)有限公司 | 资源召回方法及装置 |
CN113538108A (zh) * | 2021-07-27 | 2021-10-22 | 北京沃东天骏信息技术有限公司 | 一种资源信息确定方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108256119A (zh) * | 2018-02-14 | 2018-07-06 | 北京方正阿帕比技术有限公司 | 一种资源推荐模型的构建方法及基于该模型的资源推荐方法 |
CN110866180A (zh) * | 2019-10-12 | 2020-03-06 | 平安国际智慧城市科技股份有限公司 | 资源推荐方法、服务器及存储介质 |
CN110929161A (zh) * | 2019-12-02 | 2020-03-27 | 南京莱斯网信技术研究院有限公司 | 一种面向大规模用户的个性化教学资源推荐方法 |
CN111192176A (zh) * | 2019-12-30 | 2020-05-22 | 华中师范大学 | 一种支持教育信息化评估的在线数据采集方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106980629A (zh) * | 2016-01-19 | 2017-07-25 | 华为技术有限公司 | 一种网络资源推荐方法及计算机设备 |
-
2020
- 2020-12-30 CN CN202011626651.3A patent/CN112650948B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108256119A (zh) * | 2018-02-14 | 2018-07-06 | 北京方正阿帕比技术有限公司 | 一种资源推荐模型的构建方法及基于该模型的资源推荐方法 |
CN110866180A (zh) * | 2019-10-12 | 2020-03-06 | 平安国际智慧城市科技股份有限公司 | 资源推荐方法、服务器及存储介质 |
CN110929161A (zh) * | 2019-12-02 | 2020-03-27 | 南京莱斯网信技术研究院有限公司 | 一种面向大规模用户的个性化教学资源推荐方法 |
CN111192176A (zh) * | 2019-12-30 | 2020-05-22 | 华中师范大学 | 一种支持教育信息化评估的在线数据采集方法及装置 |
Non-Patent Citations (1)
Title |
---|
基础教育信息化应用指数及区域差异分析;尉小荣等;《电化教育研究》;20200301;正文第114-119页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112650948A (zh) | 2021-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kühl et al. | Supporting customer-oriented marketing with artificial intelligence: automatically quantifying customer needs from social media | |
Abbas et al. | A cloud based health insurance plan recommendation system: A user centered approach | |
Kasper et al. | A social network analysis of primate groups | |
Fernández-García et al. | A recommender system for component-based applications using machine learning techniques | |
Fernandez et al. | Proximity dimensions and scientific collaboration among academic institutions in Europe: The closer, the better? | |
Gardner | Price's equation made clear | |
Yuan et al. | Building prediction models with grouped data: A case study on the prediction of turnover intention | |
CN112650948B (zh) | 教育信息化评估的信息网构建方法、***及应用 | |
Weiss et al. | Measuring the complexity of social associations using mixture models | |
CN103279515A (zh) | 基于微群的推荐方法及微群推荐装置 | |
Atzmueller et al. | MinerLSD: efficient mining of local patterns on attributed networks | |
Nawroth et al. | Towards cloud-based knowledge capturing based on natural language processing | |
Rai et al. | Using open source intelligence as a tool for reliable web searching | |
Kasemsap | Mastering big data in the digital age | |
Karaboğa et al. | The rise of big data in communication sciences: a bibliometric mapping of the literature | |
Androutsopoulou et al. | Policy informatics in the social media era: Analyzing opinions for policy making | |
Chen et al. | Using data mining to provide recommendation service | |
Lai et al. | A meta-analysis of knowledge sharing in virtual communities: the moderating effect of membership types | |
Papagiannidis et al. | Social media in supply chains and logistics: Contemporary trends and themes | |
Souza et al. | Knowledge Management System and Financial Performance: how this relation has been measured? | |
Papoutsoglou et al. | Mining DEV for social and technical insights about software development | |
Reuter et al. | End-user development and social big data–towards tailorable situation assessment with social media | |
Ranjan et al. | Intelligent Sentiments Information Systems Using Fuzzy Logic | |
Sennaike et al. | Towards intelligent open data platforms: Discovering relatedness in datasets | |
Oliveira et al. | Epistheme: a scientific knowledge management environment in the SpeCS collaborative framework |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |