CN115859964B - 基于教育云平台的教育资源共享方法及*** - Google Patents
基于教育云平台的教育资源共享方法及*** Download PDFInfo
- Publication number
- CN115859964B CN115859964B CN202310121978.2A CN202310121978A CN115859964B CN 115859964 B CN115859964 B CN 115859964B CN 202310121978 A CN202310121978 A CN 202310121978A CN 115859964 B CN115859964 B CN 115859964B
- Authority
- CN
- China
- Prior art keywords
- resource
- educational
- data set
- cloud platform
- template
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于教育云平台的教育资源共享方法及***,属于教育技术领域,解决了现有方法无法对包含多元素的复杂资源进行精准识别,增加了资源共享难度的问题,方法包括:获取服务云平台资源数据集;识别服务资源数据集,基于预训练的资源提取模型提取资源内容;获取识别后资源内容,获取降噪后的资源内容,以降噪后的资源内容为输入,执行资源提取模型,生成模板创建指令,创建通用资源模板;本申请通过识别服务资源数据集,然后基于预训练的资源提取模型提取资源内容中资源摘要、资源全局语义、资源元素种类以及资源关键词分别进行识别,实现了对多元素非标准资源进行精准识别,提高了基于教育云平台的教育资源共享效率。
Description
技术领域
本发明属于教育技术领域,具体涉及基于教育云平台的教育资源共享方法及***。
背景技术
教育资源共享是指基于网络的资源分享,是众多教育资源的生产者将自己产生或者收集的教育资源通过共享给其他人。现有教育资源共享技术大多局限于个人与个人之间,不同个人之间的共享方法可能存在不同,资源能够有效传播覆盖的范围较小,导致资源的共享效率和有效利用率较低。
现阶段,对教育资源提取方法的精度较低,在处理包含图片、表格、边框线等多元素的复杂资源时,难以准确划分出各元素显示区域,存在较多的边界重合区域,增加了教育资源的识别难度,使得识别结果出现较大误差。
同时,经检索,中国专利CN109859550A公开了一种教育云平台,包括资源管理模块、在线教育模块、信息发布模块、家校互动模块、名校/名师在线模块、教学管理模块、大数据统计分析模块、精准推送模块和云教育终端;学校和资源管理机构将校本资源上传教育云平台,通过有线电视网络将教学资源信息推送至云教育终端;教育云平台承载了资源管理、在线教育、资讯发布、家校互动、教师培训、教学管理、名师在线等应用;但是该方法无法对包含多元素的复杂资源进行精准识别,同样增加了资源共享难度,使得共享结果出现较大误差。基于此,我们提出了基于教育云平台的教育资源共享方法及***。
发明内容
本发明的目的在于针对现有技术的不足之处,提供基于教育云平台的教育资源共享方法及***,解决了现有方法无法对包含多元素的复杂资源进行精准识别,增加了资源共享难度,使得共享结果出现较大误差的问题。
现阶段,对教育资源提取方法的精度较低,在处理包含图片、表格、边框线等多元素的复杂资源时,难以准确划分出各元素显示区域,存在较多的边界重合区域,增加了教育资源的识别难度,使得识别结果出现较大误差,具体而言,所述基于教育云平台的教育资源共享方法包括:获取服务云平台资源数据集;识别服务资源数据集,基于预训练的资源提取模型提取资源内容;获取识别后资源内容,筛除无效干扰内容,获取降噪后的资源内容,以降噪后的资源内容为输入,执行资源提取模型,生成模板创建指令;响应资源提取模型指令,创建通用资源模板,导出通用资源模板。本申请通过识别服务资源数据集,然后基于预训练的资源提取模型提取资源内容中资源摘要、资源全局语义、资源元素种类以及资源关键词分别进行识别,实现了对多元素非标准资源进行精准识别,提高了基于教育云平台的教育资源共享效率。
本发明是这样实现的,基于教育云平台的教育资源共享方法,所述基于教育云平台的教育资源共享方法包括:
获取服务云平台资源数据集,其中,服务资源数据集包括资源摘要、资源全局语义、资源元素种类以及资源关键词;
识别服务资源数据集,基于预训练的资源提取模型提取资源内容,其中,提取的资源内容包括资源摘要、资源全局语义、资源元素种类以及资源关键词;
获取识别后资源内容,筛除无效干扰内容,获取降噪后的资源内容,以降噪后的资源内容为输入,执行资源提取模型,生成模板创建指令;
响应资源提取模型指令,创建通用资源模板,导出通用资源模板。
优选地,所述获取服务云平台资源数据集的方法,具体包括:
获取待识别多类型资源集,执行待识别多类型资源集读写指令;
识别多类型资源集的字段和页地址,基于字段和页地址判断资源集的写入方式;
确定资源集的写入方式,遍历整个资源集的页地址,并标记单次遍历记录,生成主机解析数据,打包发送解析数据。
优选地,所述资源提取模型的构建方法,具体包括:
获取公开的标准资源数据集,其中标准资源数据集按6:4分为训练集和测试集;
基于跨元素资源共享服务平台接收标准资源数据集,将标准资源数据集划分成单元集合合适的数据集并对其进行数据增强;
构建网络模型并重新设计训练阶段的损失函数,构建网络模型中使用darknet53作为主干特征提取网络,经过残差块后获取到7个尺度的特征层,在特征层5、6、7后面加入有监督的注意力结构得到新的3个特征层;然后将新的第7个特征层卷积后上采样与第6个特征层融合,将融合后的第6个特征层卷积后上采样与第5个特征层融合;最后将三个特征层经过卷积层后得到3个尺度的检测结果。
优选地,所述基于预训练的资源提取模型提取资源内容的方法,具体包括:
基于摘要提取算法提取资源摘要;
获取资源摘要提取结果,通过全局语义提取模型识别资源全局语义,生成含有资源摘要、全局语义的初步识别报告;
解析初步识别报告,提取资源关键词,获取资源关键词识别结果,得到中间识别报告。
优选地,所述基于摘要提取算法提取资源摘要的方法,具体包括:
提取待识别资源数据集;
逐步分解资源数据集,得到分段、分句的资源集;
通过jieba分词工具对句子进行分词,得到句子的分词结果;
通过TextRank算法计算分词排名度,获得排名靠前的分词,作为资源摘要。
优选地,所述提取资源关键词的方法,具体包括:
获取资源全文解析结果,利用jieba对资源分词和词性标注,过滤掉停用词,保留指定词性的名词、动词、形容词;
加载GloVe词嵌入模型,将所有保留下的词转换成词向量;
基于词向量优先级确定模型对词向量进行队列排名,并通过词向量优先级确定模型利用权重信息对词向量进行加权求和,作为资源的关键词特征信息。
优选地,所述响应资源提取模型指令,创建通用资源模板的方法,具体包括:
导入标准资源模板;
调用虚拟环境用插件,读取所述标准资源模板,以将虚拟环境用插件转为执行程序创造通用资源模板;
调整通用资源模板,以标准数据为输入,执行多次通用资源模板训练,经过多次训练后,得到最终通用资源模板。
一种基于所述基于教育云平台的教育资源共享方法的基于教育云平台的教育资源共享***,所述基于教育云平台的教育资源共享***包括:
资源数据集获取模块,用于获取服务云平台资源数据集,其中,服务资源数据集包括资源摘要、资源全局语义、资源元素种类以及资源关键词;
数据集识别模块,识别服务资源数据集,基于预训练的资源提取模型提取资源内容,其中,提取的资源内容包括资源摘要、资源全局语义、资源元素种类以及资源关键词;
资源降噪模块,用于获取识别后资源内容,筛除无效干扰内容,获取降噪后的资源内容,以降噪后的资源内容为输入,执行资源提取模型,生成模板创建指令;
资源模板导出单元,响应资源提取模型指令,创建通用资源模板,导出通用资源模板。
优选地,所述资源数据集获取模块包括:
读写指令执行单元,用于获取待识别多类型资源集,执行待识别多类型资源集读写指令;
写入方式判断单元,用于识别多类型资源集的字段和页地址,基于字段和页地址判断资源集的写入方式;
解析数据生成单元,用于确定资源集的写入方式,遍历整个资源集的页地址,并标记单次遍历记录,生成主机解析数据,打包发送解析数据。
与现有技术相比,本申请实施例主要有以下有益效果:
本申请通过识别服务资源数据集,然后基于预训练的资源提取模型提取资源内容中资源摘要、资源全局语义、资源元素种类以及资源关键词分别进行识别,实现了对多元素非标准资源进行精准识别,提高了基于教育云平台的教育资源共享效率。
附图说明
图1是本发明提供的基于教育云平台的教育资源共享方法的结构示意图。
图2是本发明提供的获取服务云平台资源数据集方法的实现流程示意图。
图3是本发明提供的资源提取模型构建方法的实现流程示意图。
图4是本发明提供的基于预训练的资源提取模型提取资源内容方法的实现流程示意图。
图5是本发明提供的基于摘要提取算法提取资源摘要方法的实现流程示意图。
图6是本发明提供的提取资源关键词方法的实现流程示意图。
图7是本发明提供的响应资源提取模型指令,创建通用资源模板方法的实现流程示意图。
图8是本发明提供的基于教育云平台的教育资源共享***的结构示意图。
图9是本发明提供的资源数据集获取模块的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
现阶段,对教育资源提取方法的精度较低,在处理包含图片、表格、边框线等多元素的复杂资源时,难以准确划分出各元素显示区域,存在较多的边界重合区域,增加了教育资源的识别难度,使得识别结果出现较大误差,具体而言,所述基于教育云平台的教育资源共享方法包括:获取服务云平台资源数据集;识别服务资源数据集,基于预训练的资源提取模型提取资源内容;获取识别后资源内容,筛除无效干扰内容,获取降噪后的资源内容,以降噪后的资源内容为输入,执行资源提取模型,生成模板创建指令;响应资源提取模型指令,创建通用资源模板,导出通用资源模板。本申请通过识别服务资源数据集,然后基于预训练的资源提取模型提取资源内容中资源摘要、资源全局语义、资源元素种类以及资源关键词分别进行识别,实现了对多元素非标准资源进行精准识别,提高了基于教育云平台的教育资源共享效率。
本发明实施例提供了基于教育云平台的教育资源共享方法,如图1所示,示出了基于教育云平台的教育资源共享方法的实现流程示意图,所述基于教育云平台的教育资源共享方法,具体包括:
步骤S10,获取服务云平台资源数据集,其中,服务资源数据集包括资源摘要、资源全局语义、资源元素种类以及资源关键词;
步骤S20,识别服务资源数据集,基于预训练的资源提取模型提取资源内容,其中,提取的资源内容包括资源摘要、资源全局语义、资源元素种类以及资源关键词;
步骤S30,获取识别后资源内容,筛除无效干扰内容,获取降噪后的资源内容,以降噪后的资源内容为输入,执行资源提取模型,生成模板创建指令;
步骤S40,响应资源提取模型指令,创建通用资源模板,导出通用资源模板。
在本实施例中,本申请通过识别服务资源数据集,然后基于预训练的资源提取模型提取资源内容中资源摘要、资源全局语义、资源元素种类以及资源关键词分别进行识别,实现了对多元素非标准资源进行精准识别,提高了基于教育云平台的教育资源共享效率。
本发明实施例提供了获取服务云平台资源数据集的方法,如图2所示,示出了获取服务云平台资源数据集方法的实现流程示意图,所述获取服务云平台资源数据集的方法,具体包括:
步骤S101,获取待识别多类型资源集,执行待识别多类型资源集读写指令;
步骤S102,识别多类型资源集的字段和页地址,基于字段和页地址判断资源集的写入方式;
步骤S103,确定资源集的写入方式,遍历整个资源集的页地址,并标记单次遍历记录,生成主机解析数据,打包发送解析数据。
在本实施例中,在对资源进行读写操作时,需要提供字段和页(page)地址,但是考虑到要进行大规模验证读写操作时,每次手动输入字段和页(page)地址会浪费大量的时间,并有可能重复使用之前用过的地址,造成识别内容效率降低,因此,本申请中基于字段和页地址判断资源集的写入方式,然后确定资源集的写入方式,能够显著提高资源读写识别效率。
本发明实施例提供了资源提取模型的构建方法,如图3所示,示出了资源提取模型构建方法的实现流程示意图,所述资源提取模型的构建方法,具体包括:
步骤S201,获取公开的标准资源数据集,其中标准资源数据集按6:4分为训练集和测试集;
步骤S202,基于跨元素资源共享服务平台接收标准资源数据集,将标准资源数据集划分成单元集合合适的数据集并对其进行数据增强;
步骤S203,构建网络模型并重新设计训练阶段的损失函数,构建网络模型中使用darknet53作为主干特征提取网络,经过残差块后获取到7个尺度的特征层,在特征层5、6、7后面加入有监督的注意力结构得到新的3个特征层;然后将新的第7个特征层卷积后上采样与第6个特征层融合,将融合后的第6个特征层卷积后上采样与第5个特征层融合;最后将三个特征层经过卷积层后得到3个尺度的检测结果。
本发明实施例提供了基于预训练的资源提取模型提取资源内容的方法,如图4所示,示出了基于预训练的资源提取模型提取资源内容方法的实现流程示意图,所述基于预训练的资源提取模型提取资源内容的方法,具体包括:
步骤S301,基于摘要提取算法提取资源摘要;
步骤S302,获取资源摘要提取结果,通过全局语义提取模型识别资源全局语义,生成含有资源摘要、全局语义的初步识别报告;
步骤S303,解析初步识别报告,提取资源关键词,获取资源关键词识别结果,得到中间识别报告。
本发明实施例提供了基于摘要提取算法提取资源摘要的方法,如图5所示,示出了基于摘要提取算法提取资源摘要方法的实现流程示意图,所述基于摘要提取算法提取资源摘要的方法,具体包括:
步骤S401,提取待识别资源数据集;
步骤S402,逐步分解资源数据集,得到分段、分句的资源集;
步骤S403,通过jieba分词工具对句子进行分词,得到句子的分词结果;
步骤S404,通过TextRank算法计算分词排名度,获得排名靠前的分词,作为资源摘要。
在本实施例中,通过TextRank算法计算分词排名度时,分词相似度的计算公式(1)为:
(1);其中,Px和Py分别代表整个资源中句子x集合和y集合的权重,其中,Px和Py分别通过句子在x集合和y集合中出现的频次b*∂获得,其中∂为权重系数,为0.25。
本发明实施例提供了提取资源关键词的方法,如图6所示,示出了提取资源关键词方法的实现流程示意图,所述提取资源关键词的方法,具体包括:
步骤S501,获取资源全文解析结果,利用jieba对资源分词和词性标注,过滤掉停用词,保留指定词性的名词、动词、形容词;
步骤S502,加载GloVe词嵌入模型,将所有保留下的词转换成词向量;
步骤S503,基于词向量优先级确定模型对词向量进行队列排名,并通过词向量优先级确定模型利用权重信息对词向量进行加权求和,作为资源的关键词特征信息。
示例性的,对有效的样本数据的资源摘要、参数元素、资源关键词进行融合,得到第一融合元素集合,去除对资源摘要、参数元素、资源关键词关联的噪声数据,得到第二融合元素集合,分别确定参数元素在第一融合元素以及第二融合元素中的权重值,得到多元素权重值数据库。
本发明实施例提供了响应资源提取模型指令,创建通用资源模板的方法,如图7所示,示出了响应资源提取模型指令,创建通用资源模板方法的实现流程示意图,所述响应资源提取模型指令,创建通用资源模板的方法,具体包括:
步骤S601,导入标准资源模板;
步骤S602,调用虚拟环境用插件,读取所述标准资源模板,以将虚拟环境用插件转为执行程序创造通用资源模板;
步骤S603,调整通用资源模板,以标准数据为输入,执行多次通用资源模板训练,经过多次训练后,得到最终通用资源模板。
示例性的,本申请中,还需要对通用资源模板进行处理,处理方法为获取最终通用资源模板,对最终通用资源模板进行归一化处理;然后提取最终通用资源模板中参数元素,判断所提取的参数元素所述对应的值是否大于预设阈值,若于预设阈值,则保留最终通用资源模板数据,若否,判定参数元素为无效参数元素。
本发明实施例提供了基于教育云平台的教育资源共享***,如图8所示,示出了基于教育云平台的教育资源共享***的结构示意图,所述基于教育云平台的教育资源共享***,具体包括:
资源数据集获取模块100,用于获取服务云平台资源数据集,其中,服务资源数据集包括资源摘要、资源全局语义、资源元素种类以及资源关键词;
数据集识别模块200,识别服务资源数据集,基于预训练的资源提取模型提取资源内容,其中,提取的资源内容包括资源摘要、资源全局语义、资源元素种类以及资源关键词;
资源降噪模块300,用于获取识别后资源内容,筛除无效干扰内容,获取降噪后的资源内容,以降噪后的资源内容为输入,执行资源提取模型,生成模板创建指令。
资源模板导出单元400,响应资源提取模型指令,创建通用资源模板,导出通用资源模板。
在本实施例中,本发明提供了基于教育云平台的教育资源共享方法,本申请通过识别服务资源数据集,然后基于预训练的资源提取模型提取资源内容中资源摘要、资源全局语义、资源元素种类以及资源关键词分别进行识别,实现了对多元素非标准资源进行精准识别,提高了基于教育云平台的教育资源共享效率。
本发明实施例提供了资源数据集获取模块100,如图9所示,示出了资源数据集获取模块100的结构示意图,所述资源数据集获取模块100,具体包括:
读写指令执行单元110,用于获取待识别多类型资源集,执行待识别多类型资源集读写指令;
写入方式判断单元120,用于识别多类型资源集的字段和页地址,基于字段和页地址判断资源集的写入方式;
解析数据生成单元130,用于确定资源集的写入方式,遍历整个资源集的页地址,并标记单次遍历记录,生成主机解析数据,打包发送解析数据。
本发明实施例的另一方面,还提供了一种基于教育云平台的教育资源共享装置,基于教育云平台的教育资源共享装置包括存储器和处理器,该存储器中存储有计算机程序,该计算机程序被该处理器执行时实现上述任意一项实施例的方法,其中,所述基于教育云平台的教育资源共享方法包括:
获取服务云平台资源数据集,其中,服务资源数据集包括资源摘要、资源全局语义、资源元素种类以及资源关键词;
识别服务资源数据集,基于预训练的资源提取模型提取资源内容,其中,提取的资源内容包括资源摘要、资源全局语义、资源元素种类以及资源关键词;
获取识别后资源内容,筛除无效干扰内容,获取降噪后的资源内容,以降噪后的资源内容为输入,执行资源提取模型,生成模板创建指令;
响应资源提取模型指令,创建通用资源模板,导出通用资源模板。
在本申请中,存储器作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的基于教育云平台的教育资源共享方法对应的程序指令/模块。存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储资源监控方法的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至本地模块。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器通过运行存储在存储器中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例的基于教育云平台的教育资源共享方法。
最后需要说明的是,本文的计算机可读存储介质(例如,存储器)可以是易失性存储器或非易失性存储器,或者可以包括易失性存储器和非易失性存储器两者。作为例子而非限制性的,非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)或快闪存储器。易失性存储器可以包括随机存取存储器(RAM),该RAM可以充当外部高速缓存存储器。作为例子而非限制性的,RAM可以以多种形式获得,比如同步RAM(DRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据速率SDRAM(DDRSDRAM)、增强SDRAM(ESDRAM)、同步链路DRAM(SLDRAM)、以及直接Rambus RAM(DRRAM)。所公开的方面的存储设备意在包括但不限于这些和其它合适类型的存储器。
结合这里的公开所描述的各种示例性逻辑块、模块和电路可以利用被设计成用于执行这里功能的下列部件来实现或执行:通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。通用处理器可以是微处理器,但是可替换地,处理器可以是任何传统处理器、控制器、微控制器或状态机。处理器也可以被实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、一个或多个微处理器结合DSP和/或任何其它这种配置。
综上所述,本发明提供了基于教育云平台的教育资源共享方法及***,本申请通过识别服务资源数据集,然后基于预训练的资源提取模型提取资源内容中资源摘要、资源全局语义、资源元素种类以及资源关键词分别进行识别,实现了对多元素非标准资源进行精准识别,提高了基于教育云平台的教育资源共享效率。
需要说明的是,对于前述的各实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可能采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,涉及的动作和模块并不一定是本发明所必须的。
本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其他的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或通信连接可以是通过一些接口,装置或单元之间的间接耦合或通信连接,可以是电信或者其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上实施例仅用以说明本发明的技术方案,而非对发明的保护范围进行限制。显然,所描述的实施例仅仅是本发明部分实施例,而不是全部实施例。基于这些实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明所要保护的范围。尽管参照上述实施例对本发明进行了详细的说明,本领域普通技术人员依然可以在不冲突的情况下,不作出创造性劳动对本发明各实施例中的特征根据情况相互组合、增删或作其他调整,从而得到不同的、本质未脱离本发明的构思的其他技术方案,这些技术方案也同样属于本发明所要保护的范围。
Claims (6)
1.基于教育云平台的教育资源共享方法,其特征在于,所述基于教育云平台的教育资源共享方法包括:
获取服务云平台资源数据集,其中,服务资源数据集包括资源摘要、资源全局语义、资源元素种类以及资源关键词;
识别服务资源数据集,基于预训练的资源提取模型提取资源内容,其中,提取的资源内容包括资源摘要、资源全局语义、资源元素种类以及资源关键词;
获取识别后资源内容,筛除无效干扰内容,获取降噪后的资源内容,以降噪后的资源内容为输入,执行资源提取模型,生成模板创建指令;
响应资源提取模型指令,创建通用资源模板,导出通用资源模板;
所述基于预训练的资源提取模型提取资源内容的方法,具体包括:
基于摘要提取算法提取资源摘要;
获取资源摘要提取结果,通过全局语义提取模型识别资源全局语义,生成含有资源摘要、全局语义的初步识别报告;
解析初步识别报告,提取资源关键词,获取资源关键词识别结果,得到中间识别报告;
所述基于摘要提取算法提取资源摘要的方法,具体包括:
提取待识别资源数据集;
逐步分解资源数据集,得到分段、分句的资源集;
通过jieba分词工具对句子进行分词,得到句子的分词结果;
通过TextRank算法计算分词排名度,获得排名靠前的分词,作为资源摘要;
通过TextRank算法计算分词排名度时,分词相似度的计算公式(1)为:
(1)
其中,Px和Py分别代表整个资源中句子x集合和y集合的权重,其中,Px和Py分别通过句子在x集合和y集合中出现的频次b*获得,其中为权重系数,为0.25;
所述响应资源提取模型指令,创建通用资源模板的方法,具体包括:
导入标准资源模板;
调用虚拟环境用插件,读取所述标准资源模板,以将虚拟环境用插件转为执行程序创造通用资源模板;
调整通用资源模板,以标准数据为输入,执行多次通用资源模板训练,经过多次训练后,得到最终通用资源模板;
所述提取资源关键词的方法,具体包括:
获取资源全文解析结果,利用jieba对资源分词和词性标注,过滤掉停用词,保留指定词性的名词、动词、形容词;
加载GloVe词嵌入模型,将所有保留下的词转换成词向量;
基于词向量优先级确定模型对词向量进行队列排名,并通过词向量优先级确定模型利用权重信息对词向量进行加权求和,作为资源的关键词特征信息。
2.如权利要求1所述的基于教育云平台的教育资源共享方法,其特征在于:所述资源提取模型的构建方法,具体包括:
获取公开的标准资源数据集,其中标准资源数据集按6:4分为训练集和测试集;
基于跨元素资源共享服务平台接收标准资源数据集,将标准资源数据集划分成单元集合合适的数据集并对其进行数据增强;
构建网络模型并重新设计训练阶段的损失函数,构建网络模型中使用darknet53作为主干特征提取网络,经过残差块后获取到7个尺度的特征层,在特征层5、6、7后面加入有监督的注意力结构得到新的3个特征层;然后将新的第7个特征层卷积后上采样与第6个特征层融合,将融合后的第6个特征层卷积后上采样与第5个特征层融合;最后将三个特征层经过卷积层后得到3个尺度的检测结果。
3.如权利要求2所述的基于教育云平台的教育资源共享方法,其特征在于:所述获取服务云平台资源数据集的方法,具体包括:
获取待识别多类型资源集,执行待识别多类型资源集读写指令;
识别多类型资源集的字段和页地址,基于字段和页地址判断资源集的写入方式;
确定资源集的写入方式,遍历整个资源集的页地址,并标记单次遍历记录,生成主机解析数据,打包发送解析数据。
4.一种基于权利要求1-3任一所述基于教育云平台的教育资源共享方法的基于教育云平台的教育资源共享***,其特征在于:所述基于教育云平台的教育资源共享***包括:
资源数据集获取模块,用于获取服务云平台资源数据集,其中,服务资源数据集包括资源摘要、资源全局语义、资源元素种类以及资源关键词;
数据集识别模块,识别服务资源数据集,基于预训练的资源提取模型提取资源内容,其中,提取的资源内容包括资源摘要、资源全局语义、资源元素种类以及资源关键词;
资源降噪模块,用于获取识别后资源内容,筛除无效干扰内容,获取降噪后的资源内容,以降噪后的资源内容为输入,执行资源提取模型,生成模板创建指令;
资源模板导出单元,响应资源提取模型指令,创建通用资源模板,导出通用资源模板。
5.如权利要求4所述的基于教育云平台的教育资源共享***,其特征在于:所述资源数据集获取模块包括:
读写指令执行单元,用于获取待识别多类型资源集,执行待识别多类型资源集读写指令。
6.如权利要求5所述的基于教育云平台的教育资源共享***,其特征在于:所述资源数据集获取模块还包括:
写入方式判断单元,用于识别多类型资源集的字段和页地址,基于字段和页地址判断资源集的写入方式;
解析数据生成单元,用于确定资源集的写入方式,遍历整个资源集的页地址,并标记单次遍历记录,生成主机解析数据,打包发送解析数据。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211483258 | 2022-11-24 | ||
CN2022114832582 | 2022-11-24 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115859964A CN115859964A (zh) | 2023-03-28 |
CN115859964B true CN115859964B (zh) | 2023-04-28 |
Family
ID=85658183
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310121978.2A Active CN115859964B (zh) | 2022-11-24 | 2023-02-16 | 基于教育云平台的教育资源共享方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115859964B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105488025A (zh) * | 2015-11-24 | 2016-04-13 | 小米科技有限责任公司 | 模板构建方法和装置、信息识别方法和装置 |
CN112883175A (zh) * | 2021-02-10 | 2021-06-01 | 武汉大学 | 结合预训练模型及模板生成的气象服务交互方法及*** |
CN113128237A (zh) * | 2021-04-09 | 2021-07-16 | 青岛海大新星软件咨询有限公司 | 一种服务资源的语义表征模型构建方法 |
CN113961685A (zh) * | 2021-07-13 | 2022-01-21 | 北京金山数字娱乐科技有限公司 | 信息抽取方法及装置 |
CN114328865A (zh) * | 2021-12-14 | 2022-04-12 | 南京航空航天大学 | 一种改进的TextRank多特征融合教育资源关键词提取方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021205362A1 (en) * | 2020-04-08 | 2021-10-14 | Docebo Spa a Socio Unico | Method and system for automated generation and editing of educational and training materials |
CN111767394A (zh) * | 2020-06-24 | 2020-10-13 | 中国工商银行股份有限公司 | 一种基于人工智能专家***的摘要提取方法及装置 |
CN112667800A (zh) * | 2020-12-21 | 2021-04-16 | 深圳壹账通智能科技有限公司 | 关键词生成方法、装置、电子设备及计算机存储介质 |
CN112836519A (zh) * | 2021-02-08 | 2021-05-25 | 网易(杭州)网络有限公司 | 文本生成模型的训练方法、文本生成方法及装置 |
CN113420542B (zh) * | 2021-06-23 | 2023-04-18 | 平安科技(深圳)有限公司 | 对话生成方法、装置、电子设备及存储介质 |
CN115186665B (zh) * | 2022-09-15 | 2023-02-21 | 北京智谱华章科技有限公司 | 一种基于语义的无监督学术关键词提取方法及设备 |
-
2023
- 2023-02-16 CN CN202310121978.2A patent/CN115859964B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105488025A (zh) * | 2015-11-24 | 2016-04-13 | 小米科技有限责任公司 | 模板构建方法和装置、信息识别方法和装置 |
CN112883175A (zh) * | 2021-02-10 | 2021-06-01 | 武汉大学 | 结合预训练模型及模板生成的气象服务交互方法及*** |
CN113128237A (zh) * | 2021-04-09 | 2021-07-16 | 青岛海大新星软件咨询有限公司 | 一种服务资源的语义表征模型构建方法 |
CN113961685A (zh) * | 2021-07-13 | 2022-01-21 | 北京金山数字娱乐科技有限公司 | 信息抽取方法及装置 |
CN114328865A (zh) * | 2021-12-14 | 2022-04-12 | 南京航空航天大学 | 一种改进的TextRank多特征融合教育资源关键词提取方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115859964A (zh) | 2023-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11227118B2 (en) | Methods, devices, and systems for constructing intelligent knowledge base | |
US20180247405A1 (en) | Automatic detection and semantic description of lesions using a convolutional neural network | |
CN108053545B (zh) | 证件验真方法和装置、服务器、存储介质 | |
WO2021134524A1 (zh) | 数据处理方法、装置、电子设备和存储介质 | |
CN110674317A (zh) | 一种基于图神经网络的实体链接方法及装置 | |
CN112287069B (zh) | 基于语音语义的信息检索方法、装置及计算机设备 | |
CN111723870B (zh) | 基于人工智能的数据集获取方法、装置、设备和介质 | |
CN111324810A (zh) | 一种信息过滤方法、装置及电子设备 | |
CN113986864A (zh) | 日志数据处理方法、装置、电子设备及存储介质 | |
CN114547257B (zh) | 类案匹配方法、装置、计算机设备及存储介质 | |
CN109271624B (zh) | 一种目标词确定方法、装置及存储介质 | |
CN114429635A (zh) | 书本管理方法 | |
CN116663525A (zh) | 一种文档审核方法、装置、设备及存储介质 | |
CN111460224B (zh) | 评论数据的质量标注方法、装置、设备及存储介质 | |
CN115859964B (zh) | 基于教育云平台的教育资源共享方法及*** | |
CN116561298A (zh) | 基于人工智能的标题生成方法、装置、设备及存储介质 | |
CN115858776A (zh) | 一种变体文本分类识别方法、***、存储介质和电子设备 | |
CN110276001B (zh) | 盘点页识别方法、装置、计算设备和介质 | |
CN114579876A (zh) | 虚假信息检测方法、装置、设备及介质 | |
CN114048742A (zh) | 文本信息的知识实体和关系抽取方法及文本质量评估方法 | |
CN117788842B (zh) | 图像检索方法及相关装置 | |
CN112328787B (zh) | 文本分类模型训练方法、装置、终端设备及存储介质 | |
CN117708350B (zh) | 企业政策的信息关联方法、装置及电子设备 | |
CN115828023B (zh) | 一种通过机器模型识别网络内容敏感度的方法及*** | |
CN117744634A (zh) | 一种业务敏感数据词库构建方法、装置、介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |