CN110765278A

CN110765278A - 一种查找相似习题的方法、计算机设备及存储介质

Info

Publication number: CN110765278A
Application number: CN201911015184.8A
Authority: CN
Inventors: 陈羽通; 徐育聪
Original assignee: Shenzhen Xiaoranhai Technology Co Ltd
Current assignee: Shenzhen Xiaoranhai Technology Co Ltd
Priority date: 2019-10-24
Filing date: 2019-10-24
Publication date: 2020-02-07
Anticipated expiration: 2039-10-24
Also published as: CN110765278B

Abstract

本发明涉及一种查找相似习题的方法、计算机设备及存储介质，该方法中包括：S1：接收习题的文本信息；S2：提取该习题对应的知识点集合；提取易错点集合；S4：从知识点谱图中查找出关联度大于关联度阈值且难度差值小于难度阈值的所有知识点；S5：根据学习情况向量，提取出学习情况小于学习情况阈值的所有知识点，将其组成待筛选知识点集合；S6：判断待筛选知识点集合是否为空，如果是，调整相关阈值，返回S4；否则，进入S7；S7：从题库中查找出与待筛选知识点集合相似度最高的习题作为该习题的相似习题。本发明可以根据用户的当前学习情况，定制学习路径，因材施教。

Description

一种查找相似习题的方法、计算机设备及存储介质

技术领域

本发明涉及学习资料查找领域，尤其涉及一种查找相似习题的方法、计算机设备及存储介质。

背景技术

现在行业上已经存在的针对孩子整理错题的学习工具，智能手机APP，错题打印机或者其它辅助学习的智能设备，只是实现了用户通过拍照，对学习资料进行数字化的整理，或者通过一个传统的热敏打印机将学习资料打印出来，便于日后规整学习，是各类学习工具在学生整理错题或者整理其它学习资料的场景上的简单应用。

学生整理错题的过程，其实是需要透过本道错题，梳理题目背后所涉及到的知识点，学生的错题原因，这类考点一般存在哪些陷阱，学生遇到类似题目时需要注意哪些事项等，现有的方案只解决了帮助用户更高效的整理，而并没有透过学生整理学习资料的过程当中，分析学习资料背后所包含的知识要点，并结合各个不同的学生的学情状况(即对各个知识要点的掌握情况)，准确匹配出适合本学生当前学习状态下适合的补充学习资料，也就是帮助学生用户准确的找到本道题所关联的可以进行举一反三评测训练的相似题。

发明内容

为了解决上述问题，本发明提出了一种查找相似习题的方法、计算机设备及存储介质。

具体方案如下：

一种查找相似习题的方法，包括以下步骤：

S1：接收习题的文本信息；

S2：通过习题的文本信息提取该习题对应的知识点集合；

S3：接收用户从该习题对应的知识点集合中提取出的所有易错知识点信息，将其组成易错点集合；

S4：根据知识点谱图中每个知识点的难度和每两个知识点之间的关联度，从知识点谱图中查找出该习题对应的知识点集合中每个知识点对应的关联度大于关联度阈值且难度差值小于难度阈值的所有知识点；

S5：根据记录该用户针对所有知识点的学习情况的学习情况向量，提取出步骤S4查找的所有知识点中学习情况小于学习情况阈值的所有知识点，将其组成待筛选知识点集合；

S6：判断待筛选知识点集合是否为空，如果是，调整关联度阈值、难度阈值和学习情况阈值中的一个或多个，返回S4；否则，进入S7；

S7：根据待筛选知识点集合从题库中查找出与待筛选知识点集合相似度最高的习题作为该习题的相似习题。

进一步的，所述知识点谱图包括多个知识点的难度和每两个知识点之间的关联度；

通过难度向量V表示知识点的难度，V＝v₁,v₂,…,v_n，元素v_m表示知识点m，v_m的值为知识点m的难度，m∈[1,n]，n表示知识点谱图中包含的知识点的个数；

通过关联度矩阵P表示知识点之间的关联度，其大小为n×n，关联度矩阵P中的元素p_ij表示知识点i与知识点j之间的关联度。

进一步的，按一定的时间间隔，根据该时间间隔内接收到的所有习题包含的知识点集合和易错点集合，对难度向量V和关联度矩阵P进行更新。

进一步的，难度向量V的更新方法为：设定该时间间隔内接受到的习题的数量为T，针对T个习题包含的所有知识点，计算其中的每个知识点在T个习题对应的T个知识点集合中出现的次数S₁，和在T个习题对应的T个易错点集合中出现的次数S₂，和识点谱图对应的难度向量V中包含的该知识点对应的值根据S₁和S₂的大小进行更新。

进一步的，关联度矩阵P的更新方法为：设定该时间间隔内接受到的习题的数量为T，针对关联度矩阵P每一个元素p_ij，计算T个习题对应的T个知识点集合中：包含知识点i的知识点集合的个数S₃，包含知识点j的知识点集合的个数S₄，同时包含知识点i和知识点j的知识点集合的数目S₅，该元素p_ij的值根据为S₃、S₄和S₅的大小进行更新。

进一步的，按一定的时间间隔，根据该时间间隔内接收到的所有习题包含的知识点集合和易错点集合，对学习情况向量R进行更新，更新方法为：设定该时间间隔内接受到的习题的数量为T，针对学习情况向量R中的每一个元素R_k，其对应的知识点为k，计算T个习题对应的T个知识点集合中包含知识点k的知识点集合的个数S₆，和T个易错点集合中包含知识点k的易错点集合的个数S₇，当S₆＝0时，将该元素R_k的值更新为设定的中间值，否则，该元素R_k的值根据S₆和S₇的大小进行更新。

进一步的，提取习题对应的知识点集合中的知识点通过算法提取和人工提取两种方式结合进行提取。

进一步的，所述人工提取为：调取标准知识点列表，用户从其中选择与习题相关的知识点。

进一步的，所述人工提取为：查找是否存在其他用户建立的该习题对应的知识点集合，如果存在，调取该知识点集合，用户从其中选择知识点；否则，根据该习题所处的学科和年级信息查找知识点，将查找到的知识点按照关联性从高到低的顺序进行显示，用户从显示的知识点中选择。

进一步的，调取的其他用户建立的该习题对应的知识点集合中的知识点根据其被引用次数、点赞次数和评论中的一者或多者进行排序后显示，用户从显示的知识点中选择。

进一步的，所述人工提取为：查找不到其他用户建立的该习题对应的知识点集合时，根据算法提取得到的知识点所对应的学科和年级信息，从其他用户建立的知识点集合中查找与该学科和年级信息的相似度最高的知识点，将查找到的知识点按照相似度从高到低的顺序进行显示，用户从显示的知识点中选择。

进一步的，所述人工提取为：用户手动创建该习题对应的知识点。

进一步的，手动创建的知识点由学科、年级、章、节、标题和知识点描述中的任意一项或多项组成。

进一步的，还包括：

S8：根据接收到的相似习题的答案，判断答案是否正确，如果是，则易错点集合为空，否则，接收用户从该习题对应的知识点集合中提取出的所有易错知识点信息，将其组成易错点集合；

S9：根据该相似习题的知识点集合和易错点集合，更新学习情况向量，返回S4。

一种查找相似习题的计算机设备，包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现本发明实施例上述的方法的步骤。

一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现本发明实施例上述的方法的步骤。

本发明采用如上技术方案，具有以下有益效果：

(1)解决了现有方法中存在的仅仅对学习资料的简单整理，并没有结合学习资料本身的信息做深度分析的问题，能够帮助用户找到合适的补充学习资料。

(2)充分利用了所有用户上传的习题资料作为大数据，利用这些大数据刻画出了一幅所有知识点之间关联关系的完整图谱，使得各个知识点之间不再是相互孤立的信息，而是存在清晰的关联关系，通过这样的关联关系，能够更准确的找到不同习题之间的关联程度。

(3)充分利用了每一个用户所上传的所有习题资料作为大数据，并结合知识点图谱的数据，从而刻画出每个用户的学习情况画像，清晰的掌握了不同的学生对各个知识点的掌握情况，并根据这个学习情况画像，帮助学生过滤掉当前已经掌握的很好的知识点习题，同时也过滤掉对当前学生而言太过于超前的知识点习题，而只推送适合当前学生学习情况的学习资料，起到定制学习路径，因材施教的效果。

(4)充分利用所有用户上传的习题资料作为大数据，并且结合学生对各个知识点的掌握情况的比例统计，从而给每个知识点推测出一个难度系数，从而能够达到对不同的知识点按难度系数进行归类的目的，并且以此为依据，为用户筛选出当前最适合每一个学生的习题资料。

(5)采用了一套闭环的***，用户在整理习题资料的过程当中，自动采集所需要的数据，包括涉及的知识点，出错的知识点等信息，并利用这些信息，通过算法描绘出知识点图谱以及用户学习情况画像等。

(6)采用知识点为基本的数据单元，把学生的学习过程数据化，从而能够通过算法对数据进行计算，达到为学生用户精准推荐适宜的学习资料的目的。

附图说明

图1所示为本发明实施例一的流程图。

图2所示为该实施例中知识点谱图的示意图。

具体实施方式

为进一步说明各实施例，本发明提供有附图。这些附图为本发明揭露内容的一部分，其主要用以说明实施例，并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容，本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点。

现结合附图和具体实施方式对本发明进一步说明。

实施例一：

本发明实施例提供了一种查找相似习题的方法，如图1所示，包括以下步骤：

步骤1、接收习题的文本信息。

步骤1可以通过以下三种方式实现：

1.接受习题的图片，将图片转换为文本信息。

将图片转换为文本信息可以采用常用的方法，如OCR算法，在此不做限制。该实施例中采用的OCR算法为通过第三方开放平台提供的算法(如百度AI开放平台)，通过调用第三方开放平台所提供的OCR接口，将图片中包含的文本信息提取出来，实现将图片转换为文本信息的目的。

2.如用户手机自带OCR功能，也可以通过手机拍完习题图片后，将其直接转换为文本信息，然后直接接受用户发送来的文本信息即可。

3.用户可以直接手动输入该习题的文本信息。

4.用户可以通过语音输入该习题的文本信息。

步骤2、通过习题的文本信息提取习题对应的(即涉及到的)所有知识点，组成知识点集合。

所述习题对应的知识点的提取，可以采用多种方式，如算法提取、人工提取、算法提取与人工提取结合。

所述算法提取可以采用第三方开放平台提供的API接口，如阿凡提的开放接口，或者作业帮的开放接口等现有的算法。

由于各个算法的成熟度各有差异，而且算法所输出的结果在某些时候并没有办法保障足够的准确度，因此，仅仅通过算法提取往往准确性不够高，因此，该实施例中采用算法提取与人工提取相结合的方式进行提取。

所述人工提取的方法包括但不限于以下几种：

(1)调取标准知识点列表，用户从标准知识点列表中选择与习题相关的知识点。

所述标准知识点列表为预先存储的教材大纲中规定的标准知识点的列表。

(2)查找是否存在其他用户建立的该习题(与上述习题相同的题目相同的习题)对应的知识点集合，如果存在，调取该知识点集合，用户从其中选择知识点。

优选的，调取的知识点集合中的知识点根据其被引用次数、点赞次数和评论中等项目中的一者或多者进行排序后显示，用户从显示的知识点中选择。

进一步的，如果存在多个用户建立的该习题的多个知识点集合时，将多个知识点集合合并为一个知识点集合，按照合并后的知识点集合中每个知识点出现的次数的由多到少的顺序进行显示，如将出现次数最多的知识点排在最前面，将出现次数最少的知识点排在最后面，用户从显示的知识点中进行选择。

如果不存在其他用户建立的该习题对应的知识点集合，则根据该习题所处的学科和年级信息查找知识点，将查找到的知识点按照关联性从高到低的顺序进行显示，用户从显示的知识点中选择。

如果不存在其他用户建立的该习题对应的知识点集合时，也可以根据算法提取得到的知识点所对应的学科和年级信息，从其他用户建立的知识点集合中查找与该学科和年级信息的相似度最高的知识点，将查找到的知识点按照相似度从高到低的顺序进行显示，用户从显示的知识点中选择。

(3)用户手动创建该习题对应的知识点。

手动创建的知识点由学科、年级、章、节、标题和知识点等描述中的任意一项或多项组成。

需要说明的是，用户手动创建的知识点也可以作为其他用户检索相同习题或者相似题型时查找到的知识点。

步骤3、接收用户从该习题对应的知识点集合中提取出的所有易错知识点信息，将其组成易错点集合。

用户根据该用户自身掌握情况从知识点集合中提取出其容易出错的知识点，根据用户提取的容易出错的知识点组成易错点集合。

步骤4、根据知识点谱图中每个知识点的难度和每两个知识点之间的关联度，从知识点谱图中查找出该习题对应的知识点集合中每个知识点对应的关联度大于关联度阈值且难度差值小于难度阈值的所有知识点。

如图2所示，为该实施例中的知识点谱图，其中每个知识点对应一个矩形框，矩形框的尺寸大小表示该知识点的难度，矩形框的面积越大表示对应的知识点的难度越高，反之亦然。两个矩形框之间的连线表示对应的两个知识点之间有关联，连线线条的粗细表示关联度的强弱，两个矩形框之间的连线越粗表示对应的两个知识点之间的关联度越强，反之亦然。

因此，该实施例中所述知识点谱图包括n个知识点的难度和每两个知识点之间的关联度；

通过难度向量V表示知识点的难度，V＝v₁,v₂,…,v_n，元素v_m表示知识点m，v_m的值为知识点m的难度，m∈[1,n]，n表示知识点谱图中包含的知识点的个数。v_m∈[0,1]，越接近1表示难度越大。

通过关联度矩阵P表示知识点之间的关联度，其大小为n×n，关联度矩阵P中的元素p_ij表示知识点i与知识点j之间的关联度。p_ij∈[0,1]，越接近1表示关联度越高。

由于随着接收到的习题的数目随着时间逐渐增加，因此，用户对知识点的掌握情况不断变换，相应的知识点的难度和知识点之间的关联度也会随之变换，因此需定期对知识点谱图进行更新，该实施例中设定按一定的时间间隔，根据该时间间隔内接收到的所有习题包含的知识点集合和易错点集合，对难度向量V和关联度矩阵P进行更新。其中：

难度向量V的更新方法为：设定该时间间隔内接受到的习题的数量为T，针对T个习题包含的所有知识点，计算其中的每个知识点在T个习题对应的T个知识点集合中出现的次数S₁，和在T个习题对应的T个易错点集合中出现的次数S₂，将知识点谱图对应的难度向量V中包含的该知识点对应的值更新为S₂/S₁。

关联度矩阵P的更新方法为：设定该时间间隔内接受到的习题的数量为T，针对关联度矩阵P每一个元素p_ij，计算T个习题对应的T个知识点集合中：包含知识点i的知识点集合的个数S₃，包含知识点j的知识点集合的个数S₄，同时包含知识点i和知识点j的知识点集合的数目S₅，将该元素p_ij的值更新为(S₅/S₃+S₅/S₄)/2。

所述关联度阈值和难度阈值本领域技术人员根据经验进行设定和调整，该实施例中优选设置关联度阈值为0.7，难度阈值为0.3。

步骤5、根据记录该用户针对所有知识点的学习情况的学习情况向量，提取出步骤S4查找的所有知识点中学习情况小于学习情况阈值的所有知识点，将其组成待筛选知识点集合。

所述学习情况向量R用于记录该用户针对所有知识点的学习情况，其中的每一个元素R_k对应一个知识点k，该元素R_k的值表示学习情况，取值范围为R_k∈[0,1]，越接近1表示学习情况越好。

由于随着接收到的习题的数目随着时间逐渐增加，因此，用户对知识点的学习情况不断变换，相应的知识点的学习情况也会随之变换，因此需定期对学习情况向量R进行更新。

该实施例中设定按一定的时间间隔，根据该时间间隔内接收到的所有习题包含的知识点集合和易错点集合，对学习情况向量R进行更新，更新方法为：

设定该时间间隔内接受到的习题的数量为T，针对学习情况向量R中的每一个元素R_k，其对应的知识点为k，计算T个习题对应的T个知识点集合中包含知识点k的知识点集合的个数S₆，和T个易错点集合中包含知识点k的易错点集合的个数S₇，当S₆＝0时，将该元素R_k的值更新为设定的中间值，否则，将该元素R_k的值更新为Pi＝1-S₇/S₆。

所述学习情况阈值和中间值本领域技术人员根据经验进行设定和调整，该实施例中优选设置学习情况阈值为0.7，中间值为0.5。

步骤6、判断待筛选知识点集合是否为空，如果是，调整关联度阈值、难度阈值和学习情况阈值中的一个或多个，返回步骤4；否则，进入步骤7。

所述调整为根据经验在取值范围内进行相应的调整。

步骤7、根据待筛选知识点集合从题库中查找出与待筛选知识点集合相似度最高的习题作为该习题的相似习题，将相似习题发送至用户。

所述相似度计算可以为计算待筛选知识点集合中各知识点和题库中的习题对应的知识点集合中的各知识点之间的相似度。具体的相似度计算方法采用现有的算法即可，在此不做限制。

如果相似度最高的习题为多道时，从其中任选一道作为相似习题。

通过步骤1～7，完成了通过一道习题提取出其相似的习题的过程，当用户需要获取多道相似习题时，还需进行以下步骤：

步骤8、根据接收到的相似习题的答案，判断答案是否正确，如果是，则易错点集合为空，否则，接收用户从该习题对应的知识点集合中提取出的所有易错知识点信息，将其组成易错点集合。

用户在接收到相似习题后，对其进行解答，解答完成后发送或输入答案。

步骤9、根据该相似习题的知识点集合和易错点集合，更新学习情况向量R，返回S4。

该相似习题由于为题库中存储的习题，因此，题库中还存储有该习题对应的知识点集合。

学习情况向量R的更新方法与步骤S5中的更新方法相同。

通过步骤1～9，可以不断循环的根据习题和学习情况从提取出题库中的相应的相似习题，方便用户对习题中的未掌握的知识点进行掌握。

需要说明的是上述难度向量V、关联度矩阵P和学习情况向量R中各元素得值的更新公式只是本实施例中的一种优选实施例，本领域技术人员可以根据其内包含的参数对公式进行简单的变化，在此不做限制。

本发明实施例一具有以下有益效果：

实施例二：

本发明还提供一种查找相似习题的计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现本发明实施例一的上述方法实施例中的步骤。

进一步地，作为一个可执行方案，所述查找相似习题的计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。

进一步地，作为一个可执行方案，所称处理器可以是中央处理单元(CentralProcessing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital SignalProcessor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，所述处理器是所述查找相似习题的计算机设备的控制中心，利用各种接口和线路连接整个查找相似习题的计算机设备的各个部分。

所述存储器可用于存储所述计算机程序和/或模块，所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块，以及调用存储在存储器内的数据，实现所述查找相似习题的计算机设备的各种功能。所述存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序；存储数据区可存储根据手机的使用所创建的数据等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

本发明还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现本发明实施例上述方法的步骤。

所述查找相似习题的计算机设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)以及软件分发介质等。

尽管结合优选实施方案具体展示和介绍了本发明，但所属领域的技术人员应该明白，在不脱离所附权利要求书所限定的本发明的精神和范围内，在形式上和细节上可以对本发明做出各种变化，均为本发明的保护范围。

Claims

1.一种查找相似习题的方法，其特征在于，包括以下步骤：

S1：接收习题的文本信息；

S2：通过习题的文本信息提取该习题对应的知识点集合；

2.根据权利要求1所述的查找相似习题的方法，其特征在于：所述知识点谱图包括多个知识点的难度和每两个知识点之间的关联度；

3.根据权利要求2所述的查找相似习题的方法，其特征在于：按一定的时间间隔，根据该时间间隔内接收到的所有习题包含的知识点集合和易错点集合，对难度向量V和关联度矩阵P进行更新。

4.根据权利要求3所述的查找相似习题的方法，其特征在于：难度向量V的更新方法为：设定该时间间隔内接受到的习题的数量为T，针对T个习题包含的所有知识点，计算其中的每个知识点在T个习题对应的T个知识点集合中出现的次数S₁，和在T个习题对应的T个易错点集合中出现的次数S₂，和识点谱图对应的难度向量V中包含的该知识点对应的值根据S₁和S₂的大小进行更新。

5.根据权利要求3所述的查找相似习题的方法，其特征在于：关联度矩阵P的更新方法为：设定该时间间隔内接受到的习题的数量为T，针对关联度矩阵P每一个元素p_ij，计算T个习题对应的T个知识点集合中：包含知识点i的知识点集合的个数S₃，包含知识点j的知识点集合的个数S₄，同时包含知识点i和知识点j的知识点集合的数目S₅，该元素p_ij的值根据为S₃、S₄和S₅的大小进行更新。

6.根据权利要求1所述的查找相似习题的方法，其特征在于：按一定的时间间隔，根据该时间间隔内接收到的所有习题包含的知识点集合和易错点集合，对学习情况向量R进行更新，更新方法为：设定该时间间隔内接受到的习题的数量为T，针对学习情况向量R中的每一个元素R_k，其对应的知识点为k，计算T个习题对应的T个知识点集合中包含知识点k的知识点集合的个数S₆，和T个易错点集合中包含知识点k的易错点集合的个数S₇，当S₆＝0时，将该元素R_k的值更新为设定的中间值，否则，该元素R_k的值根据S₆和S₇的大小进行更新。

7.根据权利要求1所述的查找相似习题的方法，其特征在于：提取习题对应的知识点集合中的知识点通过算法提取和人工提取两种方式结合进行提取。

8.根据权利要求7所述的查找相似习题的方法，其特征在于：所述人工提取为：调取标准知识点列表，用户从其中选择与习题相关的知识点。

9.根据权利要求7所述的查找相似习题的方法，其特征在于：所述人工提取为：查找是否存在其他用户建立的该习题对应的知识点集合，如果存在，调取该知识点集合，用户从其中选择知识点；否则，根据该习题所处的学科和年级信息查找知识点，将查找到的知识点按照关联性从高到低的顺序进行显示，用户从显示的知识点中选择。

10.根据权利要求9所述的查找相似习题的方法，其特征在于：调取的其他用户建立的该习题对应的知识点集合中的知识点根据其被引用次数、点赞次数和评论中的一者或多者进行排序后显示，用户从显示的知识点中选择。

11.根据权利要求7所述的查找相似习题的方法，其特征在于：所述人工提取为：查找不到其他用户建立的该习题对应的知识点集合时，根据算法提取得到的知识点所对应的学科和年级信息，从其他用户建立的知识点集合中查找与该学科和年级信息的相似度最高的知识点，将查找到的知识点按照相似度从高到低的顺序进行显示，用户从显示的知识点中选择。

12.根据权利要求7所述的查找相似习题的方法，其特征在于：所述人工提取为：用户手动创建该习题对应的知识点。

13.根据权利要求12所述的查找相似习题的方法，其特征在于：手动创建的知识点由学科、年级、章、节、标题和知识点描述中的任意一项或多项组成。

14.根据权利要求1所述的查找相似习题的方法，其特征在于：还包括：

15.一种查找相似习题的计算机设备，其特征在于：包括处理器、存储器以及存储在所述存储器中并在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1～14中任一所述方法的步骤。

16.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1～14中任一所述方法的步骤。