CN112307158A - 一种信息检索方法、装置、设备及介质 - Google Patents

一种信息检索方法、装置、设备及介质 Download PDF

Info

Publication number
CN112307158A
CN112307158A CN201910816832.3A CN201910816832A CN112307158A CN 112307158 A CN112307158 A CN 112307158A CN 201910816832 A CN201910816832 A CN 201910816832A CN 112307158 A CN112307158 A CN 112307158A
Authority
CN
China
Prior art keywords
page
title
topic
retrieval
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910816832.3A
Other languages
English (en)
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN201910816832.3A priority Critical patent/CN112307158A/zh
Publication of CN112307158A publication Critical patent/CN112307158A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers
    • G09B7/02Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Graphics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开实施例公开了一种信息检索方法、装置、设备及介质。其中,方法包括:获取包含有目标检索题目的题目页面的图片,其中,所述题目页面是所述目标检索题目所在书籍页面的完整页面或部分页面,所述部分页面中包含用于提取题目页面特征的页面区域;提取所述图片中的所述题目页面的特征;根据所述特征向目标数据库中检索并获取与所述题目页面相匹配的标准页面信息,其中所述标准页面信息中包括所述目标检索题目和所述目标检索题目的答案信息。本公开实施例解决了以单一题目作为检索对象在检索过程中数据匹配量大导致获取目标题目效率低的问题,实现了减少检索过程中进行数据匹配的数据量,提高获取目标检索题目的速度以及识别准确率。

Description

一种信息检索方法、装置、设备及介质
技术领域
本公开实施例涉及互联网技术,尤其涉及一种信息检索方法、装置、设备及介质。
背景技术
目前,在教育领域有很多的教学应用和题目查找等学习助手类应用,此类应用程序通常都具有拍照答疑功能,当用户(例如,学生、学生家长)遇到不会做的题目或者做完之后不确定答案是否正确的题目,拿着智能终端对不会做或不确定答案的题目轻松一拍,将拍摄的题目图片通过网络上传到应用服务器,接着通过应用服务器上关联的搜题***就可以从对应的题库中搜到解题过程和最终的答案,方便了用户的学习。
但是,现有技术中,每次进行题目检索时,用户拍照上传的仅是目标检索题目和手写答案,服务器通过用户上传的照片提取题干部分进行逐条分析,并根据分析的题干向数据库中逐题匹配,以获取目标答案,但是此种方式识别效率低。因为在题库中,类似的题目会有很多,可能会检索出很多与目标检索题目相比仅改变了数字和/或参数名称的题目,那么,需要服务器进一步提取目标检索题目的特征与初步检索出的多个题目进行进一步的匹配,所以,目标检索题目的识别效率较低,且检索出的题目的答案与正确答案有一定的偏差。
公开内容
本公开提供一种信息检索方法、装置、设备及介质,以实现提高目标检索题目的检索速度以及识别准确率。
第一方面,本公开实施例提供了一种信息检索方法,该方法包括:
获取包含有目标检索题目的题目页面的图片,其中,所述题目页面是所述目标检索题目所在书籍页面的完整页面或部分页面,所述部分页面中包含用于提取题目页面特征的页面区域;
提取所述图片中的所述题目页面的特征;
根据所述特征向目标数据库中检索并获取与所述题目页面相匹配的标准页面信息,其中所述标准页面信息中包括所述目标检索题目和所述目标检索题目的答案信息。
第二方面,本公开实施例还提供了一种信息检索装置,该装置包括:
图片获取模块,用于获取包含有目标检索题目的题目页面的图片,其中,所述题目页面是所述目标检索题目所在书籍页面的完整页面或部分页面,所述部分页面中包含用于提取题目页面特征的页面区域;
特征提取模块,用于提取所述图片中的所述题目页面的特征;
信息检索模块,用于根据所述特征向目标数据库中检索并获取与所述题目页面相匹配的标准页面信息,其中所述标准页面信息中包括所述目标检索题目和所述目标检索题目的答案信息。
第三方面,本公开实施例还提供了一种终端设备,该终端包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本公开任一实施例所述的信息检索方法。
第四方面,本公开实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开任一实施例所述的信息检索方法。
本公开实施例通过获取包含有目标检索题目的题目页面的图片,将图片中题目页面整体作为检索的对象,提取题目页面的特征,并向数据库检索与题目页面匹配的标准页面信息,解决了以单一题目作为检索对象在检索过程中数据匹配量大导致获取目标题目效率低的问题,实现了减少检索过程中进行数据匹配的数据量,提高获取目标检索题目的速度以及识别准确率。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1是本公开实施例一中的信息检索方法的流程图;
图2是本公开实施例二中的信息检索方法的流程图;
图3是本公开实施例三中的信息检索装置的结构示意图;
图4是本公开实施例四中的终端设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
实施例一
图1示出了本公开实施例一提供的一种信息检索方法的流程图,本公开实施例可适用于在网络中查找题目并确定题目答案是否正确的情况,该方法可以由信息检索装置实现,具体可通过终端设备中的软件和/或硬件来实施。
如图1所示,本公开实施例中提供的信息检索方法,包括如下步骤:
S110、获取包含有目标检索题目的题目页面的图片,其中,所述题目页面是所述目标检索题目所在书籍页面的完整页面或部分页面,所述部分页面中包含用于提取题目页面特征的页面区域。
具体的,包含有目标检索题目的题目页面的图片是用户需要检索某一道题目,确定该题目的答案时拍摄并上传到终端的图片,其中,终端可以是移动终端或是服务器。
题目页面即为用户的拍摄对象,也是在检索目标检索题目是的检索对象,是目标检索题目所在书籍页面的完整页面或部分页面。其中,书籍是指含有题目的练习册、课本或是试卷等具有完整页面的书籍。若拍摄的图片中是目标检索题目所在书籍的部分页面,是指用户在拍摄时没有将整个页面拍摄完整,但图片中不仅仅只包含目标检索题目,还包括其他能够表示出题目页面特征的区域,例如,用户拍照时,仅拍了包括目标检索题目的上半页或下半页,除了目标检索题目外,还包括其他的题目、页眉、页脚或水印等可提取出的页面特征。
S120、提取所述图片中的所述题目页面的特征。
具体的,题目页面的特征包括页面布局、页面文字行间距、页面文字字体、页面水印标识、页面的页眉标识、页面的页脚标识和题目页面中相邻题目内容中至少一个。在识别题目页面特征时,可以通过OCR(Optical Character Recognition,光学字符识别)方法来识别题目页面的内容。
其中,页面布局可以是在一个题目页面中,各个题目位置的布局,如填空题、选择题及应用题的位置特征,题目区域和答题区域的分布特征等。文字行间距是指页面中每一行文字间的距离,每一行文字间的距离并不一定相同,若两行文字间设置有答题区域或是图案等内容相应的文字间距就会变大。页面水印标识、页面的页眉标识或页面的页脚标识中通常会显示有习题册的名称、页码或是出版社等信息,如一本中考的模拟题册中,页眉或页脚位置会显示三年中考五年模拟及页码等信息,这些特征都可以将减检索的范围缩小。同样的,题目页面中相邻题目内容也可以作为一个页面的特征,在不同的习题书籍页面中,相邻题目的内容相同的几率也是相对较小的,因此,可以缩小检索的范围。
在一种实时方式中,为了便于更好地提取出题目页面的特征,还可以在提取所述图片中的所述题目页面的特征之前,对所述图片进行预处理操作,所述预处理操作包括对所述图片进行压缩、透视、旋转、裁切、矫正、框出题目及识别文本笔体中至少一项操作。
S130、根据所述特征向目标数据库中检索并获取与所述题目页面相匹配的标准页面信息,其中所述标准页面信息中包括所述目标检索题目和所述目标检索题目的答案信息。
其中,数据库是预先建立的一个数据库,该数据库中包含有大量的书籍的完整页面,各页面中包含有相应的题目。通过在图片中提取出的特征即可去数据库中匹配相应的标准页面。例如,提取出的图片特征为页眉中的文字标识,包含有题册的名称及页码,那么便可以很快的检索到与题目页面相匹配的标准页面。而无需将目标检索题目的题干信息,与题库中的大量题目去一一匹配。
本公开实施例提供的一种信息检索方法,通过获取包含有目标检索题目的题目页面的图片,将图片中题目页面整体作为检索的对象,提取题目页面的特征,并向数据库检索与题目页面匹配的标准页面信息,解决了以单一题目作为检索对象在检索过程中数据匹配量大导致获取目标题目效率低的问题,实现了减少检索过程中进行数据匹配的数据量,提高获取目标检索题目的速度以及识别准确率。
实施例二
本实施例在上述实施例基础上,进一步对获取了标准页面后判断用户手写题目答案是否正确的过程进行了描述,与上述实施例提出的信息检索方法属于同一发明构思,未在本实施例中详尽描述的技术细节可参见上述实施例。
图2示出了本公开实施例二提供的一种信息检索方法的流程图,本公开实施例中提供的信息检索方法包括如下步骤:
S210、建立所述目标数据库,其中,所述目标数据库包括含有题目的书籍的标准页面以及各题目的答案。
具体的,目标数据库中含有题目的书籍的标准页面是大量的题册、课本及试卷等的标准页面,其页面中包含有相应的题目,各题目中有相应的题干区域与答题区域,可以将各题目的答案显示于相应的答题区域中,或是将各题目与题目答案分别显示。后者,需要建立题目页与答案页的映射关系,以便确定了目标检索题目之后,同时可以匹配到相应的答案。
S220、获取包含有目标检索题目的题目页面的图片,其中,所述题目页面是所述目标检索题目所在书籍页面的完整页面或部分页面,所述部分页面中包含用于提取题目页面特征的页面区域。
S230、提取所述图片中的所述题目页面的特征。
S240、根据所述特征向目标数据库中检索并获取与所述题目页面相匹配的标准页面信息,其中所述标准页面信息中包括所述目标检索题目和所述目标检索题目的答案信息。
在一种优选的实施方式中,若在目标数据库中未匹配到与所述题目页面相匹配的标准页面信息时,还可以进一步的识别所述题目页面中的至少一个题目文本信息,然后,根据所述至少一个题目文本提供至少一个与所述题目文本相似的参考题目及参考题目的答案。其中,详相似的题目是指题目类型相同,或是仅题目中给出的数字不同,或是题干中人物、对象名称不同的题目,这样可以在未匹配到标准页面时,为用户提供一个解题思路,启发用户解答出题目。
S250、将所述图片输入至预先训练好的手写答案提取模型,以确定所述图片中的手写答案,其中,所述手写答案提取模型是以含有题目的页面图片以及经过答案标注的含有题目的页面图片作为训练样本,并通过机器学习训练成的模型。
当在目标数据库中检索到与题目页面相匹配的标准页面之后,用户便可以根据检索到的标准页面中的题目和各题目的答案,来确定其目标检索题目的答案。
在本实施例中,还可以自动的根据检索到的答案来确定用户的答案是否正确。具体的,可以将用户拍摄的图片输入到预先训练好的手写答案提取模型中。在用户拍摄的图片中,通常包含印刷体文字的题干部分,以及用户手写体文字的答案部分,手写体答案内容通常会被写在各题目对应的答题区域中。当图片经过手写答案提取模型之后,便可以确定图片中所有手写字体中属于各题目的答案内容,如填空题答案、选择题答案或是在应用题解题过程等内容中提取出的答案。
这里需要说明的是,手写答案提取模型是以含有题目的页面图片以及经过答案标注的含有题目的页面图片作为训练样本,并通过机器学习训练成的模型。如在模型建立阶段,可收集大量的题目页图片,并人工标记出题目页图片中各种题型的答题区域以及答题区域中的答案内容。
S260、将所述手写答案与所述标准页面中相对应题目的答案进行匹配,以确定用户手写答案是否正确。
当提取出手写答案之后,便可以将手写答案与标准页面中的答案进行匹配,判断出用户的答案是否正确。
在一种实施方式中,还可以直接根据题目页面中各题目文本直接计算出答案来与提取出的用户手写答案进行对比,从而确定用户的手写答案是否正确。
本公开实施例二提供的一种信息检索方法,通过获取包含有目标检索题目的题目页面的图片,将图片中题目页面整体作为检索的对象,提取题目页面的特征,并向数据库检索与题目页面匹配的标准页面信息,进而提取用户的手写答案,判断用户的答案是否正确,解决了以单一题目作为检索对象在检索过程中数据匹配量大导致获取目标题目效率低的问题,实现了减少检索过程中进行数据匹配的数据量,提高获取目标检索题目的速度以及识别准确率。
实施例三
图3示出了本公开实施例三提供的一种信息检索装置的结构示意图,本公开实施例可适用于在网络中查找题目并确定题目答案是否正确的情况,通过本公开提供的信息检索装置可实现上述实施例提供的信息检索方法。
如图3所示,本公开实施例中信息检索装置,包括:图片获取模块310、特征提取模块320和信息检索模块330。
其中,图片获取模块310,用于获取包含有目标检索题目的题目页面的图片,其中,所述题目页面是所述目标检索题目所在书籍页面的完整页面或部分页面,所述部分页面中包含用于提取题目页面特征的页面区域;特征提取模块320,用于提取所述图片中的所述题目页面的特征;信息检索模块330,用于根据所述特征向目标数据库中检索并获取与所述题目页面相匹配的标准页面信息,其中所述标准页面信息中包括所述目标检索题目和所述目标检索题目的答案信息。
本公开实施例的技术方案,通过获取包含有目标检索题目的题目页面的图片,将图片中题目页面整体作为检索的对象,提取题目页面的特征,并向数据库检索与题目页面匹配的标准页面信息,解决了以单一题目作为检索对象在检索过程中数据匹配量大导致获取目标题目效率低的问题,实现了减少检索过程中进行数据匹配的数据量,提高获取目标检索题目的速度以及识别准确率。
可选的,所述题目页面的特征包括页面布局、页面文字行间距、页面文字字体、页面的页眉标识、页面的页脚标识和题目页面中相邻题目内容中至少一个。
可选的,信息检索装置还包括数据库建立模块,用于建立所述目标数据库,其中,所述目标数据库包括含有题目的书籍的标准页面以及各题目的答案。
可选的,信息检索装置还包括手写答案提取模块和答案匹配模块;
手写答案提取模块用于在获取所述标准页面之后,将所述图片输入至预先训练好的手写答案提取模型,以确定所述图片中的手写答案,其中,所述手写答案提取模型是以含有题目的页面图片以及经过答案标注的含有题目的页面图片作为训练样本,并通过机器学习训练成的模型;
答案匹配模块用于将所述手写答案与所述标准页面中相对应题目的答案进行匹配,以确定用户手写答案是否正确。
可选的,信息检索装置还包括图片处理模块,用于在提取所述图片中的所述题目页面的特征之前,对所述图片进行预处理操作,所述预处理操作包括对所述图片进行压缩、透视、旋转、裁切、矫正、框出题目及识别文本笔体中至少一项操作。
可选的,信息检索装置还包括题目推荐模块,用于当在目标数据库中未匹配到与所述题目页面相匹配的标准页面信息时,根据所述至少一个题目文本提供至少一个与所述题目文本相似的参考题目及参考题目的答案。
本公开实施例提供的信息检索装置,与上述实施例提供的信息检索方法属于同一发明构思,未在本公开实施例中详尽描述的技术细节可参见上述实施例,并且本公开实施例与上述实施例具有相同的有益效果。
实施例四
下面参考图4,其示出了适于用来实现本公开实施例的终端设备400的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端。图4示出的终端设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图4所示,终端设备400可以包括处理装置(例如中央处理器、图形处理器等)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储装置406加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有终端设备400操作所需的各种程序和数据。处理装置401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
通常,以下装置可以连接至I/O接口405:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置406;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置407;包括例如磁带、硬盘等的存储装置406;以及通信装置409。通信装置409可以允许终端设备400与其他设备进行无线或有线通信以交换数据。虽然图4示出了具有各种装置的终端设备400,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置409从网络上被下载和安装,或者从存储装置406被安装,或者从ROM 402被安装。在该计算机程序被处理装置401执行时,执行本公开实施例的方法中限定的上述功能。
本公开实施例提供的终端实现的方法与上述实施例提供的信息检索方法属于同一发明构思,未在本公开实施例中详尽描述的技术细节可参见上述实施例,并且本公开实施例与上述实施例具有相同的有益效果。
实施例五
本公开实施例提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例所提供的信息检索方法。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述终端设备中所包含的;也可以是单独存在,而未装配入该终端设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该终端设备执行时,使得该终端设备:获取至少两个网际协议地址;向节点评价设备发送包括所述至少两个网际协议地址的节点评价请求,其中,所述节点评价设备从所述至少两个网际协议地址中,选取网际协议地址并返回;接收所述节点评价设备返回的网际协议地址;其中,所获取的网际协议地址指示内容分发网络中的边缘节点。
或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该终端设备执行时,使得该终端设备:接收包括至少两个网际协议地址的节点评价请求;从所述至少两个网际协议地址中,选取网际协议地址;返回选取出的网际协议地址;其中,接收到的网际协议地址指示内容分发网络中的边缘节点。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上***(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一个或多个实施例,【示例一】提供了一种信息检索方法包括:
获取包含有目标检索题目的题目页面的图片,其中,所述题目页面是所述目标检索题目所在书籍页面的完整页面或部分页面,所述部分页面中包含用于提取题目页面特征的页面区域;
提取所述图片中的所述题目页面的特征;
根据所述特征向目标数据库中检索并获取与所述题目页面相匹配的标准页面信息,其中所述标准页面信息中包括所述目标检索题目和所述目标检索题目的答案信息。
根据本公开的一个或多个实施例,【示例二】提供了示例一的方法,还包括:
所述题目页面的特征包括页面布局、页面文字行间距、页面文字字体、页面的页眉标识、页面的页脚标识和题目页面中相邻题目内容中至少一个
根据本公开的一个或多个实施例,【示例三】提供了示例一的方法,还包括:
在获取包含有目标检索题目的题目页面图片之前,所述方法还包括:
建立所述目标数据库,其中,所述目标数据库包括含有题目的书籍的标准页面以及各题目的答案。
根据本公开的一个或多个实施例,【示例四】提供了示例一的方法,还包括:
在获取所述标准页面之后,所述方法还包括:
将所述图片输入至预先训练好的手写答案提取模型,以确定所述图片中的手写答案,其中,所述手写答案提取模型是以含有题目的页面图片以及经过答案标注的含有题目的页面图片作为训练样本,并通过机器学习训练成的模型;
将所述手写答案与所述标准页面中相对应题目的答案进行匹配,以确定用户手写答案是否正确。
根据本公开的一个或多个实施例,【示例五】提供了示例一的方法,还包括:
在提取所述图片中的所述题目页面的特征之前,所述方法还包括:
对所述图片进行预处理操作,所述预处理操作包括对所述图片进行压缩、透视、旋转、裁切、矫正、框出题目及识别文本笔体中至少一项操作。
根据本公开的一个或多个实施例,【示例六】提供了示例一的方法,还包括:
当在目标数据库中未匹配到与所述题目页面相匹配的标准页面信息时,所述方法还包括:
识别所述题目页面中的至少一个题目文本;
根据所述至少一个题目文本提供至少一个与所述题目文本相似的参考题目及参考题目的答案。
根据本公开的一个或多个实施例,【示例七】提供了一种信息检索装置,包括:
图片获取模块,用于获取包含有目标检索题目的题目页面的图片,其中,所述题目页面是所述目标检索题目所在书籍页面的完整页面或部分页面,所述部分页面中包含用于提取题目页面特征的页面区域;
特征提取模块,用于提取所述图片中的所述题目页面的特征;
题目检索模块,用于根据所述特征向目标数据库中检索并获取与所述题目页面相匹配的标准页面信息,其中所述标准页面信息中包括所述目标检索题目和所述目标检索题目的答案信息。
根据本公开的一个或多个实施例,【示例八】提供了示例七的装置,还包括:
所述题目页面的特征包括页面布局、页面文字行间距、页面文字字体、页面的页眉标识、页面的页脚标识和题目页面中相邻题目内容中至少一个。
根据本公开的一个或多个实施例,【示例九】提供了示例七的装置,还包括:
信息检索装置还包括数据库建立模块,用于建立所述目标数据库,其中,所述目标数据库包括含有题目的书籍的标准页面以及各题目的答案。
根据本公开的一个或多个实施例,【示例十】提供了示例七的装置,还包括:
信息检索装置还包括手写答案提取模块和答案匹配模块;
手写答案提取模块用于在获取所述标准页面之后,将所述图片输入至预先训练好的手写答案提取模型,以确定所述图片中的手写答案,其中,所述手写答案提取模型是以含有题目的页面图片以及经过答案标注的含有题目的页面图片作为训练样本,并通过机器学习训练成的模型;
答案匹配模块用于将所述手写答案与所述标准页面中相对应题目的答案进行匹配,以确定用户手写答案是否正确。
根据本公开的一个或多个实施例,【示例十一】提供了示例七的装置,还包括:
信息检索装置还包括图片处理模块,用于在提取所述图片中的所述题目页面的特征之前,对所述图片进行预处理操作,所述预处理操作包括对所述图片进行压缩、透视、旋转、裁切、矫正、框出题目及识别文本笔体中至少一项操作。
根据本公开的一个或多个实施例,【示例十二】提供了示例七的装置,还包括:
信息检索装置还包括题目推荐模块,用于当在目标数据库中未匹配到与所述题目页面相匹配的标准页面信息时,根据所述至少一个题目文本提供至少一个与所述题目文本相似的参考题目及参考题目的答案。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (10)

1.一种信息检索方法,其特征在于,包括:
获取包含有目标检索题目的题目页面的图片,其中,所述题目页面是所述目标检索题目所在书籍页面的完整页面或部分页面,所述部分页面中包含用于提取题目页面特征的页面区域;
提取所述图片中的所述题目页面的特征;
根据所述特征向目标数据库中检索并获取与所述题目页面相匹配的标准页面信息,其中所述标准页面信息中包括所述目标检索题目和所述目标检索题目的答案信息。
2.根据权利要求1所述的方法,其特征在于,所述题目页面的特征包括页面布局、页面文字行间距、页面文字字体、页面的页眉标识、页面的页脚标识和题目页面中相邻题目内容中至少一个。
3.根据权利要求1所述的方法,其特征在于,在获取包含有目标检索题目的题目页面图片之前,所述方法还包括:
建立所述目标数据库,其中,所述目标数据库包括含有题目的书籍的标准页面以及各题目的答案。
4.根据权利要求3所述的方法,其特征在于,在获取所述标准页面之后,所述方法还包括:
将所述图片输入至预先训练好的手写答案提取模型,以确定所述图片中的手写答案,其中,所述手写答案提取模型是以含有题目的页面图片以及经过答案标注的含有题目的页面图片作为训练样本,并通过机器学习训练成的模型;
将所述手写答案与所述标准页面中相对应题目的答案进行匹配,以确定用户手写答案是否正确。
5.根据权利要求1所述的方法,其特征在于,在提取所述图片中的所述题目页面的特征之前,所述方法还包括:
对所述图片进行预处理操作,所述预处理操作包括对所述图片进行压缩、透视、旋转、裁切、矫正、框出题目及识别文本笔体中至少一项操作。
6.根据权利要求1所述的方法,其特征在于,当在目标数据库中未匹配到与所述题目页面相匹配的标准页面信息时,所述方法还包括:
识别所述题目页面中的至少一个题目文本;
根据所述至少一个题目文本提供至少一个与所述题目文本相似的参考题目及参考题目的答案。
7.一种信息检索装置,其特征在于,所述装置包括:
图片获取模块,用于获取包含有目标检索题目的题目页面的图片,其中,所述题目页面是所述目标检索题目所在书籍页面的完整页面或部分页面,所述部分页面中包含用于提取题目页面特征的页面区域;
特征提取模块,用于提取所述图片中的所述题目页面的特征;
题目检索模块,用于根据所述特征向目标数据库中检索并获取与所述题目页面相匹配的标准页面信息,其中所述标准页面信息中包括所述目标检索题目和所述目标检索题目的答案信息。
8.根据权利要求7所述的装置,其特征在于,所述题目页面的特征包括页面布局、页面文字行间距、页面文字字体、页面的页眉标识、页面的页脚标识和题目页面中相邻题目内容中至少一个。
9.一种终端设备,其特征在于,所述终端包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的信息检索方法。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的信息检索方法。
CN201910816832.3A 2019-08-30 2019-08-30 一种信息检索方法、装置、设备及介质 Pending CN112307158A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910816832.3A CN112307158A (zh) 2019-08-30 2019-08-30 一种信息检索方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910816832.3A CN112307158A (zh) 2019-08-30 2019-08-30 一种信息检索方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN112307158A true CN112307158A (zh) 2021-02-02

Family

ID=74485575

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910816832.3A Pending CN112307158A (zh) 2019-08-30 2019-08-30 一种信息检索方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN112307158A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113255629A (zh) * 2021-07-15 2021-08-13 北京世纪好未来教育科技有限公司 文档处理方法、装置、电子设备及计算机可读存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295514A (zh) * 2016-07-27 2017-01-04 中山市读书郎电子有限公司 一种图像识别题目显示答案的方法及装置
CN106340219A (zh) * 2016-08-16 2017-01-18 广东小天才科技有限公司 一种题目推荐方法及***、相关设备
CN107908801A (zh) * 2017-12-25 2018-04-13 广东小天才科技有限公司 一种基于语音的题目搜索方法及电子设备
TW201816636A (zh) * 2016-10-19 2018-05-01 預見數位股份有限公司 書籍內容數位化互動系統及方法
CN108021320A (zh) * 2017-12-25 2018-05-11 广东小天才科技有限公司 一种电子设备题目搜索方法及电子设备
CN109326161A (zh) * 2018-12-05 2019-02-12 杭州大拿科技股份有限公司 一种试卷批改一体机
CN109670504A (zh) * 2018-12-28 2019-04-23 杭州大拿科技股份有限公司 一种手写答案识别批改方法及装置
CN110033662A (zh) * 2019-03-29 2019-07-19 金华市花儿教育咨询有限公司 一种题目信息采集的方法及***

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295514A (zh) * 2016-07-27 2017-01-04 中山市读书郎电子有限公司 一种图像识别题目显示答案的方法及装置
CN106340219A (zh) * 2016-08-16 2017-01-18 广东小天才科技有限公司 一种题目推荐方法及***、相关设备
TW201816636A (zh) * 2016-10-19 2018-05-01 預見數位股份有限公司 書籍內容數位化互動系統及方法
CN107908801A (zh) * 2017-12-25 2018-04-13 广东小天才科技有限公司 一种基于语音的题目搜索方法及电子设备
CN108021320A (zh) * 2017-12-25 2018-05-11 广东小天才科技有限公司 一种电子设备题目搜索方法及电子设备
CN109326161A (zh) * 2018-12-05 2019-02-12 杭州大拿科技股份有限公司 一种试卷批改一体机
CN109670504A (zh) * 2018-12-28 2019-04-23 杭州大拿科技股份有限公司 一种手写答案识别批改方法及装置
CN110033662A (zh) * 2019-03-29 2019-07-19 金华市花儿教育咨询有限公司 一种题目信息采集的方法及***

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113255629A (zh) * 2021-07-15 2021-08-13 北京世纪好未来教育科技有限公司 文档处理方法、装置、电子设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN110837579B (zh) 视频分类方法、装置、计算机以及可读存储介质
CN107766371B (zh) 一种文本信息分类方法及其装置
CN110210542B (zh) 图片文字识别模型训练方法、装置及文字识别***
CN112712069B (zh) 一种判题方法、装置、电子设备及存储介质
CN111340131A (zh) 图像的标注方法、装置、可读介质和电子设备
CN110969012A (zh) 文本纠错方法、装置、存储介质及电子设备
CN112364829B (zh) 一种人脸识别方法、装置、设备及存储介质
CN110750624A (zh) 信息输出方法及装置
CN115544241B (zh) 一种线上作业的智能推送方法及装置
CN111460185A (zh) 书籍搜索方法、装置和***
CN111753616A (zh) 一种错题收集方法及学习设备
CN107729491B (zh) 提高题目答案搜索的准确率的方法、装置及设备
CN111797266B (zh) 图像处理方法和装置、存储介质和电子设备
CN113868538A (zh) 信息处理方法、装置、设备及介质
CN112307246A (zh) 一种学习小组的获取方法、装置、服务器和存储介质
CN112307158A (zh) 一种信息检索方法、装置、设备及介质
CN111914068A (zh) 试题知识点的提取方法
CN107451194A (zh) 一种图片搜索方法及装置
CN115759293A (zh) 模型训练方法、图像检索方法、装置及电子设备
CN112036343B (zh) 答案提取方法、装置、计算机可读介质及电子设备
CN111666474B (zh) 一种整页搜题的方法及终端
CN115168534A (zh) 智能检索方法及装置
CN114612909A (zh) 字符识别方法、装置、可读介质及电子设备
CN113793539A (zh) 辅助教学方法、装置及电子设备和存储介质
CN114676705A (zh) 一种对话关系处理方法、计算机及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination