CN105095443A - 一种基于超级画板的信息增值方法及装置 - Google Patents

一种基于超级画板的信息增值方法及装置 Download PDF

Info

Publication number
CN105095443A
CN105095443A CN201510439813.5A CN201510439813A CN105095443A CN 105095443 A CN105095443 A CN 105095443A CN 201510439813 A CN201510439813 A CN 201510439813A CN 105095443 A CN105095443 A CN 105095443A
Authority
CN
China
Prior art keywords
works
information
file
function
sketchpad
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510439813.5A
Other languages
English (en)
Inventor
刘海亮
杨艾琳
苏航
马超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Research Institute of Sun Yat Sen University
Original Assignee
Shenzhen Research Institute of Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Research Institute of Sun Yat Sen University filed Critical Shenzhen Research Institute of Sun Yat Sen University
Priority to CN201510439813.5A priority Critical patent/CN105095443A/zh
Publication of CN105095443A publication Critical patent/CN105095443A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于超级画板的信息增值方法及装置,旨在解决用户不能分析作品背后使用的超级画板函数以及函数使用频度多少的问题以及学生作品只可以每次通过用户手动点击浏览,浏览速度慢,获得作品信息量少,获得的作品信息不能固化存储的问题,能够整合超级画板的学生作品资源,为用户提供精确的作品信息分析。其实现的主要过程如下:第一步,从超级画板函数文档中提取图形函数信息,存储在函数文件中;第二步,对超级画板的学生作品进行自动化点击,获取学生作品的网页文件,页面截图,自动点击视频;第三步,将超级画板的数据信息存储至数据库中;第四步,根据第三步中生成的每个学生作品对应的content.txt文件,进行分词和统计词频处理,生成正排索引文件index.txt;第五步,对得到每个学生作品的正排索引文件index.txt,采用哈希算法和拉链法来建立倒排索引;第六步,根据用户输入的检索关键词,计算作品权重并按照权重的高低得到需要展示的作品名集合;第七步,通过网页展示作品信息。

Description

一种基于超级画板的信息增值方法及装置
技术领域
本发明涉及信息检索和计算机软件自动化领域,具体地,涉及一种基于超级画板的信息增值方法及装置。
背景技术
近几年来,随着教育越来越受到重视,超级画板也在教师和学生中越来越流行起来。超级画板是一种图形教学软件,可以通过超级画板中的作图功能,画出中小学,高中等相关教科书中的图形,图形的呈现方式既可以是二维的,也可以是三维的。所画出的图形不仅绚烂多彩,形象生动,更能激发学生的想象力,让学生在学习数学、几何图形等相关知识的过程中充分调动他们的积极性,产生良好的学习效果。超级画板软件需要老师或其他用户做出自己的学生作品,然后通过超级画板软件向学生展示已经做好的学生作品。但用户制作学生作品的过程中,往往需要自己从头开始制作,对已经制作好的网上的其他学生作品不能借鉴参考,也不能了解其他学生作品的详细信息,只能看到表面的图形,对于学生作品的信息内容和操作展示不能充分了解,也不能迅速搜索到自己感兴趣的学生作品,用户获取学生作品信息很不方便。
传统了解学生作品信息的方法,是单纯地查看超级画板的库函数和直接点击学生作品,虽然能够了解超级画板各个函数的使用方法,但是这种方式是脱离了具体的学生作品来描述各个超级画板函数的作用,用户不能了解自己感兴趣的学生作品中到底使用了何种超级画板函数,从而无法借鉴现有好的学生作品的制作方法,也无法查看到学生作品中的某些关键页面的信息,对于自己想要了解的函数信息,不知道哪些学生作品中包含这些函数,无法迅速检索到自己感兴趣的学生作品。
一种获取增值信息的方法、终端及***,主要是通过用户输入当前所在位置,然后根据位置计算导航路线,再根据导航路线寻找行政区域,最后展示该行政区域相关的路径增值信息。这种方法虽然能够将位置信息与最后的增值信息做关联展示,但是需要依赖多层之间的级联查找,耗时时间较长,用户交互性不高,各个级联查找之间有一定的不确定性,经过多层查找后,不确定性变高,查询出的增值信息可能与用户真正想要获得的增值信息不符。
在现有技术中,传统了解超级画板学生作品的传统方法往往是用户自己点击学生信息上的按钮,或者动画,观看图形的动画或者演示,来了解学生作品信息。但是对于学生作品背后使用了哪些超级画板函数,学生作品中有哪些关键页面信息往往不能了解,因此在制作自己的学生作品时也不能进行借鉴。并且对于作品不能进行自动化演示的观看,需要手动逐个点击按钮,面对众多作品需要查看和浏览时,此种传统方法操作繁琐且复杂,而且获取的作品信息量非常少。另外一些获取增值信息的方法是通过多层之间的级联查找,一旦查找层次过深,由于各层次之间的不确定性,导致获得的增值信息往往与用户初始想要获得的信息不相符合。
发明内容
本技术发明针对上述问题,能够整合超级画板的学生作品资源,为用户提供精确的作品信息分析,具有帮助用户在制作学生作品时能够参考多种学生作品,了解其他学生作品的制作方法,避免重复劳动的优点。使用户能够不需要手动点击作品就可以直接观看作品的操作流程和动态演示,了解作品的关键页面信息。解决学生作品只可以每次通过用户手动点击浏览,浏览速度慢,获得作品信息量少,获得的作品信息不能固化存储的问题。通过作品检索展现用户感兴趣的作品,迅速检索得到作品相关内容,解决用户不能分析作品背后使用的超级画板函数以及函数使用频度多少的问题,极大地简化用户操作,提高获取作品信息的宽度与深度,增加作品与用户之间的互动性。通过让作品检索关键词与作品相直接关联的方式,解决多层级联查找带来的最终查找的增值信息与用户想要获得的增值信息符合度不高的问题。
为解决上述的技术问题,本发明采用的方案如下:
第一步,从超级画板函数文档中提取图形函数信息,存储在函数文件中;
第二步,对超级画板的学生作品进行自动化点击,获取学生作品的网页文件,页面截图,自动点击视频;
第三步,将超级画板的数据信息存储至数据库中;
第四步,根据第三步中生成的每个学生作品对应的content.txt文件,进行分词和统计词频处理,生成正排索引文件index.txt;
第五步,对得到每个学生作品的正排索引文件index.txt,采用哈希算法和拉链法来建立倒排索引;
第六步,根据用户输入的检索关键词,计算作品权重并按照权重的高低得到需要展示的作品名集合;
第七步,网页展示作品信息。
有益效果
本技术发明带来的有益效果:
本技术发明能够整合超级画板的学生作品资源,为用户提供精确的作品信息分析,具有帮助用户在制作学生作品时能够参考多种学生作品,了解其他学生作品的制作方法,避免重复劳动的优点。使用户能够不需要手动点击作品就可以直接观看作品的操作流程和动态演示,了解作品的关键页面信息。解决学生作品只可以每次通过用户手动点击浏览,浏览速度慢,获得作品信息量少,获得的作品信息不能固化存储的问题。通过作品检索展现用户感兴趣的作品,迅速检索得到作品相关内容,解决用户不能分析作品背后使用的超级画板函数以及函数使用频度多少的问题,极大地简化用户操作,提高获取作品信息的宽度与深度,增加作品与用户的互动性。
附图说明
附图1是本技术发明提供的一种基于超级画板的信息增值方法的流程示意图;
附图2是本技术发明提供的一种基于超级画板的信息增值装置的结构示意图。
具体的实施方式
为使本技术发明的目的、技术方案和优点更加清楚,下面将结合本技术发明的附图,对本技术发明的技术实施方案进行清楚地、完整地描述。
附图1是本技术发明提供的一种基于超级画板信息增值方法的流程示意图,如图1所示,所述方法包括:
S1:从超级画板函数文档中提取图形函数信息,存储在函数文件中。
具体而言步骤S1可以具体细分为以下步骤,下面做进一步阐述:
S11:拷贝超级画板库函数中的所有图形函数到graphical_functin.txt中,拷贝超级画板库函数中的所有标准数学函数到standard_function.txt中,并在graphical_function.txt文件的末尾追加”######”作为文件结束符。
所述图形函数至多包含4个内容,格式如下:(函数名,作用,参数说明,例)。
S12:读取grapical_function.txt文件,如果没有遇到文件结束符,继续执行步骤S13;否则执行步骤S18。
S13:如果遇到非空行,则将非空行加入到函数内容数组contentArray中;否则,执行步骤S14。
S14:取出contentArray中第一行内容作为函数的函数名function_name,取出contentArray中第二行内容作为函数的作用function_effect。
S15:如果第三行是以“参数说明”出现在该行的行首,则遍历function中剩余每行内容,如果当前行的行首不是”例”,则将当前行加入到参数说明数组param_list中,如果当前行的行首是”例”,则将从这行开始,一直到结束contentArray中所有行内容,加入到例子数组example_list中;否则执行步骤S16。
S16:第三行是以”例”出现在行首,则将当前行到contentArray数组中末尾的所有行内容,加入到例子数组example_list中。
S17:拼接param_list中的所有内容得到函数参数说明function_param,拼接example_list中所有内容得到函数例子function_example,再将函数名function_name,函数作用function_effect,函数参数说明function_param,函数例子:function_example拼接在一起得到一个函数完整的内容function,并将function加入到函数数组function_list中,转步骤S12。
S18:图形函数文件全部处理结束,遍历函数数组function_list中所有函数内容,写入文件graphical_function_out.txt中,退出。
S2:对超级画板的学生作品进行自动化点击,获取学生作品的网页文件,页面截图,自动点击视频。
具体而言S2又细分为以下步骤,下面做进一步阐述:
S21:配置超级画板的按钮位置信息,将超级画板学生作品的当前页面保存为网页文件
S22:根据学生作品对应的网页文件提取学生作品中所有的按钮位置信息
S23:用AutoScriptWriter获取实际点击学生作品的按钮位置,并与从相对应作品的网页文件提取的按钮位置做比较,计算出按钮点击的偏移值。
S24:配置录制视频所需的Snagit软件按钮位置信息
S25:根据对步骤S24中获得的录制视频所需的按钮位置信息,对每个学生作品的自动化操作进行视频的录制,在每次点击按钮的实际按钮坐标一定时间后,对当前作品页面进行截图。
上述实际按钮坐标是由按钮位置信息文件中的坐标加上步骤S23中计算出的按钮点击偏移值。
S3:将超级画板和学生作品的数据信息存储至数据库中。
具体而言,步骤S3又可以细分为以下步骤,下面做进一步阐述
S31:读取graphical_function_out.txt文件和sandard_function.txt文件中的函数信息,将函数信息存储至数据库的函数表function中
S32:遍历学生作品目录,如果当前学生作品没有遍历结束,则执行步骤S33;否则执行步骤S37。
S33:读取当前学生作品的网页文件,从中提取出函数信息和文本信息。将文本信息作为学生作品的介绍,将函数信息和文本信息作为整个学生作品的内容。
提取出网页文件中的超级画板函数信息,文本信息,写入到文件content.txt中。
S34:对步骤S33中提取出的函数信息和文本信息,先统计词频,再提取关键词。读取name.txt文件中的作品名。
S35:对学生作品的视频文件,提取出视频的关键帧以及关键帧在视频中对应的时间点,计算出视频的总时长。
S36:将上述步骤得到的,作品名称,作品介绍,作品内容,关键词,词频,学生作品页面的截图,视频总时长,视频关键帧,视频关键帧时间点等信息存储至数据库中。
S37:所有学生作品的数据信息全部处理完毕,退出
S4:根据步骤S3中生成的每个学生作品对应的content.txt文件,进行分词和统计词频处理,生成正排索引文件index.txt。
具体而言,步骤S4又可以细分为以下步骤,下面做进一步阐述:
S41:遍历学生作品目录,如果当前学生作品没有被处理,则执行步骤S42;否则,执行步骤S48。
S42:对当前学生作品的content.txt文件,使用分词器NLPIR对content.txt进行分词处理,得到分词后的文件split.txt
S43:读取split.txt文件内容,如果文件没有读取完毕,则执行步骤S44;否则,执行步骤S47。
S44:设置关键词到关键词出现位置数组的映射为wordToCount,对当前读取的一行内容以空格作为切分,对于切分后的一行内容,每次读取一个关键词。如果该关键词没有出现在映射wordToCount中,就在wordToCount中加入该关键词的映射,计算该关键词出现的位置并将该位置加入到该关键词出现的位置数组中;否则,执行步骤S45。
S45:该关键词已经出现过,就更新以该关键词为键的关键字位置数组,在关键词位置数组中追加该关键字目前位置。
S46:继续读取下一行内容,并转步骤S43
S47:当前学生作品的content.txt文件全部读取结束,计算出split.txt文件中该学生作品总关键词个数iTotalWords。遍历wordToCount映射,对每个关键词及其信息按照如下格式组织成成正排索引:
学生作品名称#学生作品文件名#总单词个数#关键词#出现次数#出现位置
将该学生作品的所有正排索引信息写入到文件index.txt中,转步骤S41。
S48:所有学生作品的全部被处理过,退出。
S5:对步骤S4中得到每个学生作品的正排索引文件index.txt,采用哈希算法和拉链法来建立倒排索引。
具体而言,步骤S5又可以细分为以下步骤,下面做进一步阐述
S51:初始化哈希表和加密表,建立关键词节点链表数组keyNodeArray
S52:遍历正排索引文件集合,如果当前正排索引文件没有被处理,则执行步骤S52;否则,执行步骤S58。
S53:读取当前学生作品的正排索引文件,如果文件没有读取完毕,则执行步骤S53;否则,执行步骤S57。
S54:读取当前行内容,对内容进行切分得到:作品名称,作品文档名,总单词个数,关键词名,关键词出现次数,关键词位置。并将上述信息封装为DocNode结构体。
所述文档节点DocNode是:
数据形式为:作品名称,作品文档名,作品文档总单词个数,关键词在该作品中出现次数,关键词在该作品中出现位置,指向下一个文档节点的指针,组织上述信息形成如下节点结构:
S55:计算关键词对应的哈希值,判断哈希表中该哈希值对应的关键词结点链表是否存在,如果存在,就采用头插法将步骤S54中的DocNode***到该关键词节点链表中使其成为关键词节点链表中第一个文档节点,并更新关键词节点中关键词总出现次数和包含该关键词的作品个数;否则,执行步骤S56。
所述关键词节点KeyNode是:
数据形式为:关键词名,关键词总出现次数,关键词在哈希表中的位置,包含关键词的作品个数,指向下一个文档节点的指针。组织上述信息形成如下节点结构。
S56:关键词结点链表不存在,此时先根据关键字计算出哈希值,然后判断当前哈希表中该哈希值对应的关键词节点链表是否已经存在,如果不存在,那么就继续顺延查找下一个哈希表空位,直到找到一个空位,记该空位位置为pos,然后新建一个关键词节点KeyNode作为关键词节点链表的首节点,使关键词节点指向步骤S54中的文档节点DocNode,使keyNodeArray第pos个元素为KeyNode。
S57:当前正排索引文件处理结束,转S52。
S58:所有正排索引文件处理完成,遍历关键词节点链表数组keyNodeArray,对于每一个关键词节点链表,遍历得到从关键词节点KeyNode开始一直到链表尾部的倒排索引,将倒排索引写入到倒排索引文件invert_index.txt中。至此,倒排索引文件生成,结束处理。
所述倒排索引结构如下:
S6:根据用户输入的检索关键词,计算作品权重并按照权重的高低得到需要展示的作品名集合。
具体而言步骤S6可以细分为以下步骤,下面做进一步阐述:
S61:对用户输入的检索关键词集合进行分词,去噪处理。
S62:根据步骤S58中已经构建好的倒排索引文件invert_index.txt,读取倒排索引文件中的的每一个关键词,构成<关键词,{倒排索引文件名,该关键词在倒排索引文件名中的行号}>的映射,组合所有关键词的映射得到词典映射表。
S63:若用户输入的关键词集合在词典映射表中,则进行布尔过滤,筛选出同时包含用户输入的去噪后的所有关键词的作品集合。
S64:对筛选出的作品集合则按照公式(1),(2),(3)计算包含关键词的作品的tf-idf权重值。
上述公式所述:
k1,k2,…kn表示用户输入的第一个关键词,第二个关键词,…,第n个关键词。j表示作品文档编号。tfi,j表示作品文档dj中关键词ki出现的次数,idfi表示关键词ki的逆文档频率。
ni,j表示关键词ki在文档dj出现的次数,Σknk,j表示文档dj中所有关键词的个数。|D|表示所有作品文档个数,|i:ki∈dj|表示包含关键词ki的作品文档个数。
S65:将计算后权重值按照从大到小排序,按照该顺序将符合要求的作品名集合productionNameList进行返回。
S7:网页展示作品信息。
具体而言,步骤S7又可以细分为以下步骤
S71:遍历步骤S65得到的作品集合productionNameList,在数据库中查询出作品信息,得到作品集合productionList。
S72:遍历作品集合productionList,如果作品没有遍历结束,执行步骤S73;否则,执行步骤S75。
S73:对每个作品production,将作品的首张页面截图,作品名称,作品介绍,作品关键词组织为作品概览页面进行展示;将作品的视频文件,视频关键帧,作品的页面截图,作品名称,作品介绍,关键字组织为作品详细页面,并在作品概览页面中的首张页面截图被点击时,加载和展示作品详细页面。
S74:在作品关键词展示框中,利用ajax技术提供作品关键词检索功能,可以展示该作品中包含关键词的详细内容信息。转步骤S72。
S75:所有作品展示结束,结束处理。
以上内容对本技术发明一种基于超级画板的信息增值方法进行了详细说明,本技术发明还提供一种基于超级画板的信息增值装置。
参照附图2,附图2为技术发明实施例提供的一种基于超级画板的信息增值装置的结构示意图,该装置包括:
函数预处理模块:用于读取超级画板库函数文档,将非格式化的函数信息转换为格式化函数信息,并将格式化函数信息写入函数文件中,将生成的函数文件发送给入库模块。
自动化点击模块:通过保存作品为网页文件,读取网页文件提取按钮坐标信息,计算按钮偏移值,配置录制视频所需按钮信息,来进行自动化点击学生作品,并将点击操作录制成视频文件,进行作品页面的自动截图。将网页文件,页面截图,视频信息发送给入库模块。所述保存的作品信息和超级画板信息包括但不局限于上述信息。
入库模块:接收来自于函数预处理模块的函数文件和自动化点击模块发送的网页文件,页面截图,视频,对视频提取关键帧,对网页文件提取作品内容,生成关键词,统计词频,生成作品名,将以上信息全部存储至数据库中,生成作品内容文件发送给索引构建模块。
索引构建模块:接收入库模块发送的作品内容文件,对作品内容文件进行分词,生成正排索引文件。读取多个正排索引文件,采用哈希算法和拉链法生成倒排索引文件,并将倒排索引文件发送给检索模块。所述构建倒排索引的方式不局限于上述提到的方式。
检索模块:接收用户的检索请求,根据检索关键字在索引构建模块生成的倒排索引文件中查找符合要求的作品集合,利用tf-idf算法计算作品的权重,按照权重从高到低次序返回符合要求的作品名集合。所述计算作品权重的方法并不局限于上述方法。
展示模块:获取检索模块计算得到的作品名集合,根据作品名在数据库中查找到作品的详细信息,按照一定的展示方式在网页端进行作品的展示。
以上结合附图详细描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种变型和修改,这样的变型和修改均落入所附权利要求所限定的范围内。

Claims (9)

1.一种基于超级画板的信息增值方法,其特征在于,所述方法如下步骤:
S1、从超级画板函数文档中提取图形函数信息,存储在函数文件中;
S2、对超级画板的学生作品进行自动化点击,获取学生作品的网页文件,页面截图,自动点击视频;
S3、将超级画板的数据信息存储至数据库中;
S4、根据步骤S3中生成的每个学生作品对应的content.txt文件,进行分词和统计词频处理,生成正排索引文件index.txt;
S5、对步骤S4中得到每个学生作品的正排索引文件index.txt,采用哈希算法和拉链法来建立倒排索引;
S6、根据用户输入的检索关键词,计算作品权重并按照权重的高低得到需要展示的作品名集合;
S7、网页展示作品信息。
2.根据权利要求1所述的基于超级画板的信息增值方法,其特征在于,所述步骤S1具体包括:
读取超级画板库函数文档,将非格式化的函数信息转换为格式化函数信息,并将格式化函数信息写入函数文件中,将生成的函数文件。
3.根据权利要求1所述的基于超级画板的信息增值方法,其特征在于,所述步骤S2具体包括:
通过保存作品为网页文件,读取网页文件提取按钮坐标信息,计算按钮偏移值,配置录制视频所需按钮信息,来进行自动化点击学生作品,并将点击操作录制成视频文件,进行作品页面的自动截图。生成网页文件,页面截图,视频信息。
4.根据权利要求1所述的基于超级画板的信息增值方法,其特征在于,所述步骤S3具体包括:
A、读取graphical_function_out.txt文件和sandard_function.txt文件中的函数信息,将函数信息存储至数据库的函数表function中
B、遍历学生作品目录,如果当前学生作品没有遍历结束,则执行步骤C;否则执行步骤G。
C、读取当前学生作品的网页文件,从中提取出函数信息和文本信息。将文本信息作为学生作品的介绍,将函数信息和文本信息作为整个学生作品的内容。
提取出网页文件中的超级画板函数信息,文本信息,写入到文件content.txt中。
D、对步骤C中提取出的函数信息和文本信息,先统计词频,再提取关键词。读取name.txt文件中的作品名。
E、对学生作品的视频文件,提取出视频的关键帧以及关键帧在视频中对应的时间点,计算出视频的总时长。
F、将上述步骤得到的,作品名称,作品介绍,作品内容,关键词,词频,学生作品页面的截图,视频总时长,视频关键帧,视频关键帧时间点等信息存储至数据库中。
G、所有学生作品的数据信息全部处理完毕,退出。
5.根据权利要求1所述的基于超级画板的信息增值方法,其特征在于,所述步骤S4具体包括:
根据生成的作品内容文件,对作品内容文件进行分词,按照正排索引的格式,生成正排索引文件。
6.根据权利要求1所述的基于超级画板的信息增值方法,其特征在于,所述步骤S5具体包括:
第一步,初始化哈希表和加密表,建立关键词节点链表数组keyNodeArray;
第二步,遍历正排索引文件集合,对当前学生作品的正排索引文件,读该文件中每行内容,对内容进行切分得到:作品名称,作品文档名,总单词个数,关键词名,关键词出现次数,关键词位置。并将上述信息封装为DocNode结构体;
第三步,计算关键词对应的哈希值,判断哈希表中该哈希值对应的关键词结点链表是否存在,如果存在,就采用头插法将上述DocNode结点***到该关键词节点链表中使其成为关键词节点链表中第一个文档节点,并更新关键词节点中关键词总出现次数和包含该关键词的作品个数;否则,转第四步;
第四步,关键词结点链表不存在,此时先根据关键字计算出哈希值,然后判断当前哈希表中该哈希值对应的关键词节点链表是否已经存在,如果不存在,那么就继续顺延查找下一个哈希表空位,直到找到一个空位,记该空位位置为pos,然后新建一个关键词节点KeyNode作为关键词节点链表的首节点,使关键词节点指向上述DocNode结点,使keyNodeArray第pos个元素为KeyNode;
第五步,所有正排索引文件处理完成,遍历关键词节点链表数组keyNodeArray,对于每一个关键词节点链表,遍历得到从关键词节点KeyNode开始一直到链表尾部的倒排索引,将倒排索引写入到倒排索引文件invert_index.txt中。至此,倒排索引文件生成,结束处理。
7.根据权利要求1所述的基于超级画板的信息增值方法,其特征在于,所述步骤S6具体包括:
接收用户的检索请求,根据检索关键字在倒排索引文件中查找符合要求的作品集合,利用tf-idf算法计算作品的权重,按照权重从高到低次序返回符合要求的作品名集合。
8.根据权利要求1所述的基于超级画板的信息增值方法,其特征在于,所述步骤S7具体包括:
获取计算得到的作品名集合,根据作品名在数据库中查找到作品的详细信息,按照一定的展示方式在网页端进行作品的展示。
9.基于超级画板的信息增值装置,其特征在于,所述装置包括:
函数预处理模块:用于读取超级画板库函数文档,将非格式化的函数信息转换为格式化函数信息,并将格式化函数信息写入函数文件中,将生成的函数文件发送给入库模块。
自动化点击模块:通过保存作品为网页文件,读取网页文件提取按钮坐标信息,计算按钮偏移值,配置录制视频所需按钮信息,来进行自动化点击学生作品,并将点击操作录制成视频文件,进行作品页面的自动截图。将网页文件,页面截图,视频信息发送给入库模块。
入库模块:接收来自于函数预处理模块的函数文件和自动化点击模块发送的网页文件,页面截图,视频,对视频提取关键帧,对网页文件提取作品内容,生成关键词,统计词频,生成作品名,将以上信息全部存储至数据库中,生成作品内容文件发送给索引构建模块。
索引构建模块:接收入库模块发送的作品内容文件,对作品内容文件进行分词,生成正排索引文件。读取多个正排索引文件,采用哈希算法和拉链法生成倒排索引文件,并将倒排索引文件发送给检索模块。
检索模块:接收用户的检索请求,根据检索关键字在索引构建模块生成的倒排索引文件中查找符合要求的作品集合,利用tf-idf算法计算作品的权重,按照权重从高到低次序返回符合要求的作品名集合。
展示模块:获取检索模块计算得到的作品名集合,根据作品名在数据库中查找到作品的详细信息,按照一定的展示方式在网页端进行作品的展示。
CN201510439813.5A 2015-07-23 2015-07-23 一种基于超级画板的信息增值方法及装置 Pending CN105095443A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510439813.5A CN105095443A (zh) 2015-07-23 2015-07-23 一种基于超级画板的信息增值方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510439813.5A CN105095443A (zh) 2015-07-23 2015-07-23 一种基于超级画板的信息增值方法及装置

Publications (1)

Publication Number Publication Date
CN105095443A true CN105095443A (zh) 2015-11-25

Family

ID=54575880

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510439813.5A Pending CN105095443A (zh) 2015-07-23 2015-07-23 一种基于超级画板的信息增值方法及装置

Country Status (1)

Country Link
CN (1) CN105095443A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105824956A (zh) * 2016-03-30 2016-08-03 南京邮电大学 一种基于链表结构的倒排索引模型及其构建方法
CN113094590A (zh) * 2021-05-07 2021-07-09 董祥宇 一种法律条文精准推荐***
CN113779324A (zh) * 2021-11-15 2021-12-10 西安热工研究院有限公司 一种交叉参考同步处理方法、***、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101958058A (zh) * 2010-08-20 2011-01-26 华中师范大学 一种数字化课堂教学***
CN102044173A (zh) * 2009-10-13 2011-05-04 华中师范大学 软性电子白板***
CN103279583A (zh) * 2013-06-28 2013-09-04 百视通新媒体股份有限公司 基于电子画板的实时搜索方法及***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102044173A (zh) * 2009-10-13 2011-05-04 华中师范大学 软性电子白板***
CN101958058A (zh) * 2010-08-20 2011-01-26 华中师范大学 一种数字化课堂教学***
CN103279583A (zh) * 2013-06-28 2013-09-04 百视通新媒体股份有限公司 基于电子画板的实时搜索方法及***

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105824956A (zh) * 2016-03-30 2016-08-03 南京邮电大学 一种基于链表结构的倒排索引模型及其构建方法
CN113094590A (zh) * 2021-05-07 2021-07-09 董祥宇 一种法律条文精准推荐***
CN113779324A (zh) * 2021-11-15 2021-12-10 西安热工研究院有限公司 一种交叉参考同步处理方法、***、设备及介质

Similar Documents

Publication Publication Date Title
CN107679661B (zh) 一种基于知识图谱的个性化旅游路线规划方法
Makri et al. Information for inspiration: Understanding architects' information seeking and use behaviors to inform design
KR100849420B1 (ko) 이미지 기반 검색 시스템 및 방법
US7885913B2 (en) Distributed collaborative knowledge generation system wherein students perform queries using a dynamic knowledge database and retrieved subsets of data are shared with multiple users on the web
KR102244298B1 (ko) 의미를 기반으로 웹 페이지 접근 기록을 구조화하는 장치 및 방법
Deal Visualizing digital collections
Dang et al. MOOC-KG: A MOOC knowledge graph for cross-platform online learning resources
CN105005616A (zh) 基于文本图片特征交互扩充的文本图解方法及***
CN112287168A (zh) 用于生成视频的方法和装置
KR20180096341A (ko) 소셜 플랫폼상에서 mooc와 플립드러닝을 지원하는 온톨로지 기반 교육 콘텐츠 소셜 큐레이터 구현 시스템 및 그 방법
CN105138357A (zh) 一种移动应用操作助手的实现方法及其装置
CN104376114A (zh) 一种搜索结果展示方法及装置
CN107256266A (zh) 一种查询内容展示方法及其***
CN105095443A (zh) 一种基于超级画板的信息增值方法及装置
CN108900917A (zh) 一种面向知识结构的在线教学视频播放***及方法
CN108614872A (zh) 课程内容展示方法及装置
CN110110218A (zh) 一种身份关联方法及终端
Christel Supporting video library exploratory search: when storyboards are not enough
WO2020211397A1 (zh) 课件页面的显示及页面集的构造方法、装置、设备和介质
TW200923860A (en) Interactive learning system
Yu et al. High Speed capture, retrieval and rendering of segment-based annotations on 3D Museum objects
EP3365814A1 (en) Computer-implemented method for the generation of zoomable hierarchical texts starting from an original electronic text
Liu et al. Improving NASA’s Earth Satellite and Model Data Discoverability for Interdisciplinary Research, Applications, and Education
CN114416890B (zh) 异构知识点一体化表示、存储、检索、生成及交互方法
Ismail et al. 2D visualization of terms and documents in Malay language

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20151125