CN112069349A - 自动填写答案的方法、电子设备和可读存储介质 - Google Patents

自动填写答案的方法、电子设备和可读存储介质 Download PDF

Info

Publication number
CN112069349A
CN112069349A CN202010968795.0A CN202010968795A CN112069349A CN 112069349 A CN112069349 A CN 112069349A CN 202010968795 A CN202010968795 A CN 202010968795A CN 112069349 A CN112069349 A CN 112069349A
Authority
CN
China
Prior art keywords
question
area
test paper
content
answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010968795.0A
Other languages
English (en)
Inventor
何涛
罗欢
陈明权
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dana Technology Inc
Original Assignee
Hangzhou Dana Technology Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dana Technology Inc filed Critical Hangzhou Dana Technology Inc
Priority to CN202010968795.0A priority Critical patent/CN112069349A/zh
Publication of CN112069349A publication Critical patent/CN112069349A/zh
Priority to PCT/CN2021/117224 priority patent/WO2022057708A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供自动填写答案的方法、电子设备和可读存储介质,通过检测出目标试卷图像中题干区域的内容,并根据目标试卷题干区域的内容在题库中查找标准答案,而后将标准答案填写到相应作答区域,使得根据用户提供的目标试卷的图像便可提供填好答案的试卷图像;或者,对题库中的样本试卷进行标准答案填写,而后通过检测出目标试卷的图像中题干区域的内容,并根据目标试卷题干区域的内容在题库中查找题干内容相匹配的包含答案的样本试卷的图片,使得根据用户提供的目标试卷的图像便可输出填好答案的试卷图像,因此,相对于现有技术,可避免因文字输入错误而无法查找到对应的答案的情况,也可大大提升搜索效率。

Description

自动填写答案的方法、电子设备和可读存储介质
技术领域
本发明涉及人工智能技术领域,特别涉及一种自动填写答案的方法、电子设备和可读存储介质。
背景技术
随着计算机技术和教育信息化的不断推进,计算机技术已经逐步应用于日常的教育教学各项活动中。
目前在家长进行功课辅导时,有时也会出现有些题目不会,需要上网搜索答案的情况。现有的题目搜索方法在进行题目搜索时,是根据各个题目的题干的文字内容在题库中进行查找,然而,这种搜索方式效率低,而且很容易出错,有部分文字内容不同就无法查找到对应的答案,而且每次只能搜索一个题目的答案。
发明内容
本发明的目的在于提供一种自动填写答案的方法、电子设备和可读存储介质,以解决现有技术中的一个或多个问题。
为解决上述技术问题,本发明提供一种自动填写答案的方法,包括:
获取目标试卷的图像,对所述图像进行检测,检测出所述目标试卷上各题目的位置区域,所述位置区域包括题干区域和作答区域;
识别每一所述题目的所述题干区域的内容,根据每一所述题干区域的内容在题库中搜索每一所述题目的标准答案,并将每一所述题目的所述标准答案填写到相应所述作答区域。
可选的,在所述的自动填写答案的方法中,在将每一所述题目的所述标准答案填写到相应的所述作答区域时,所述自动填写答案的方法还包括:
根据每一所述题目的所述作答区域的宽度数据和高度数据调整所述标准答案的字符大小。
可选的,在所述的自动填写答案的方法中,根据每一所述作答区域的宽度数据和高度数据调整所述标准答案的字符大小包括:
根据每一所述题目的所述作答区域的宽度数据和高度数据确定所述作答区域的标注框尺寸;
以每一所述题目的所述标注框尺寸的预设比例填写所述标准答案至相应所述题目的所述作答区域,所述预设比例不超过100%。
可选的,在所述的自动填写答案的方法中,若所述目标试卷的一所述题目具有多个标准答案,则根据所述题目的所述作答区域的位置排列顺序将多个所述标准答案依次填写到所述作答区域。
可选的,在所述的自动填写答案的方法中,所述识别每一所述题目的所述题干区域的内容,根据每一所述题干区域的内容在题库中搜索每一所述题目的标准***括:
识别每一所述题目的所述题干区域的内容,并将每一所述题目的所述题干区域的内容转换为特征向量;
在题库中进行向量搜索,以查找出与每一所述题目的所述特征向量相匹配的目标特征向量,并在所述题库中提取每一所述目标特征向量所对应的标准答案。
可选的,在所述的自动填写答案的方法中,若所述目标试卷中的所述题目不包含图片,则识别每一所述题目的所述题干区域的内容,并将每一所述题目的所述题干区域的内容转换为特征向量包括:
识别每一所述题干区域的字符信息,并通过题干向量化模型将各所述题目的所述题干区域的内容转换为第一特征向量,作为所述特征向量。
可选的,在所述的自动填写答案的方法中,若所述目标试卷中的所述题目包含图片,则识别每一所述题目的所述题干区域的内容,并将每一所述题目的所述题干区域的内容转换为特征向量包括:
识别每一所述题干区域的字符信息,并通过题干向量化模型将每个所述题目的所述题干区域的内容转换为第一特征向量;
利用图片向量化模型将包含图片的所述题目的图片转换为第二特征向量;
对于不包含图片的所述题目,将所述第一特征向量作为所述特征向量,对于包含图片的所述题目,将所述第一特征向量和所述第二特征向量进行拼接,作为所述特征向量。
可选的,在所述的自动填写答案的方法中,利用区域识别模型检测出所述目标试卷上各题目的位置区域,所述区域识别模型通过预先对样本进行训练而得到。
可选的,在所述的自动填写答案的方法中,在利用区域识别模型对所述图像进行检测之前,所述自动填写答案的方法还包括:
对获取的所述图像进行文档边缘识别、文本校正和二值化处理中的一种或多种。
基于同一思想,本发明还提供另一种自动填写答案的方法,包括:
识别题库中所保存的多个样本试卷的各题目的位置区域,所述位置区域包括题干区域和作答区域;
识别每一所述样本试卷的每一所述题目的所述题干区域的内容,并根据每一所述样本试卷的各所述题干区域的内容,填写标准答案至相应的所述作答区域,并生成填写好标准答案的多个所述样本试卷的图像;
在获取目标试卷的图像后,对所述图像进行检测,检测出所述目标试卷上各题目的题干区域;
识别所述目标试卷的每一所述题目的所述题干区域的内容,在所述题库中搜索与每一所述题目的所述题干区域的内容相匹配的填写好标准答案的所述样本试卷的图像,并将搜索结果输出给用户端。
可选的,在所述的另一种自动填写答案的方法中,在将每一所述样本试卷的每一所述题目的所述标准答案填写到相应的所述作答区域时,所述自动填写答案的方法还包括:
根据每一所述样本试卷的每一所述题目的所述作答区域的宽度数据和高度数据调整所述标准答案的字符大小。
可选的,在所述的另一种自动填写答案的方法中,根据每一所述样本试卷的每一所述题目的所述作答区域的宽度数据和高度数据调整所述标准答案的字符大小包括:
根据每一所述样本试卷的每一所述题目的所述作答区域的宽度数据和高度数据确定相应所述作答区域的标注框尺寸;
以每一所述样本试卷的每一所述题目的所述标注框尺寸的预设比例填写所述标准答案至相应所述作答区域,所述预设比例不超过100%。
可选的,在所述的另一种自动填写答案的方法中,所述识别所述目标试卷的每一所述题目的所述题干区域的内容,在所述题库中搜索与每一所述题目的所述题干区域的内容相匹配的填写好标准答案的所述样本试卷的图像,并将搜索结果输出给用户端包括:
识别所述目标试卷的每一所述题目的所述题干区域的内容,并将每一所述题目的所述题干区域的内容转换为特征向量;
在所述题库中进行向量搜索,以获取特征向量与每一所述题目的所述特征向量相匹配的填写好标准答案的所述样本试卷的图像,并将搜索结果输出给用户端。
可选的,在所述的另一种自动填写答案的方法中,若所述目标试卷中的题目不包含图片,则识别每一所述题目的所述题干区域的内容,并通过将每一所述题目的所述题干区域的内容转换为特征向量包括:
识别每一所述题干区域的字符信息,并通过题干向量化模型将各所述题目的所述题干区域的内容转换为第一特征向量,作为所述特征向量。
可选的,在所述的另一种自动填写答案的方法中,若所述目标试卷中的题目包含图片,则识别每一所述题目的所述题干区域的内容,并将每一所述题目的所述题干区域的内容转换为特征向量包括:
识别每一所述题干区域的字符信息,并通过题干向量化模型将每个所述题目的所述题干区域的内容转换为第一特征向量;
利用图片向量化模型将包含图片的所述题目的图片转换为第二特征向量;
对于不包含图片的所述题目,将所述第一特征向量作为所述特征向量,对于包含图片的所述题目,将所述第一特征向量和所述第二特征向量进行拼接,作为所述特征向量。
可选的,在所述的另一种自动填写答案的方法中,利用区域识别模型检测出所述样本试卷和所述目标试卷上各题目的位置区域,所述区域识别模型通过预先对样本进行训练而得到。
可选的,在所述的另一种自动填写答案的方法中,在生成填写好答案的多个所述样本试卷的图片后,所述自动填写答案的方法还包括:
对多个所述样本试卷的图片进行文本校正和/或二值化处理。
基于同一思想,本发明还提供一种电子设备,包括处理器和存储器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,实现如上所述的填写答案的方法。
基于同一思想,本发明还提供一种可读存储介质,所述可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时,实现如上所述的自动填写答案的方法。
在本发明提供的一种自动填写答案的方法、电子设备和可读存储介质中,在获取目标试卷的图像后,对所述图像进行检测,检测出所述目标试卷上各题目的位置区域,所述位置区域包括题干区域和作答区域,之后,识别每一所述题目的所述题干区域的内容,并根据每一所述题干区域的内容在题库中搜索每一所述题目的标准答案,并将每一所述题目的所述标准答案填写到相应所述作答区域。如此,便可根据用户提供的目标试卷的图像提供填好答案的试卷图像。相较于现有技术通过题干的文字来查找答案,本发明通过检测目标试卷图像的题干区域的内容,并根据题干区域的内容在题库中查找标准答案,可以避免因文字输入错误而无法查找到对应的答案的情况。另外,由于每次可获取整个目标试卷的图像,因此可以识别到所有题干的内容,进而可以找到所有题目的标准答案,相对于现有技术,大大提升了搜索效率。
在本发明提供的另一种自动填写答案的方法、电子设备和可读存储介质中,首先,对题库中所保存的多个样本试卷进行答案填写,并生成填写好答案的多个所述样本试卷的图片;之后,识别题库中所保存的多个样本试卷的各题目的位置区域,所述位置区域包括题干区域和作答区域;识别每一所述样本试卷的每一所述题目的所述题干区域的内容,并根据每一所述样本试卷的各所述题干区域的内容,填写标准答案至相应的所述作答区域,并生成填写好标准答案的多个所述样本试卷的图像;在获取目标试卷的图像后,对所述图像进行检测,检测出所述目标试卷上各题目的题干区域;识别所述目标试卷的每一所述题目的所述题干区域的内容,在所述题库中搜索与每一所述题目的所述题干区域的内容相匹配的填写好标准答案的所述样本试卷的图像,并将搜索结果输出给用户端。如此,便可根据用户提供的目标试卷的图像输出填好答案的试卷图像。相较于现有技术通过题干的文字来查找答案,本发明通过检测目标试卷图像的题干区域的内容,并根据题干区域的内容在题库中查找题干内容相匹配的包含答案的样本试卷的图片,可以避免因文字输入错误而无法查找到对应的答案的情况,而且无需每个题目分别进行搜索,因此可大大提升搜索效率。
附图说明
本领域的普通技术人员将会理解,提供的附图用于更好地理解本发明,而不对本发明的范围构成任何限定。其中:
图1为本发明实施例提供的一种自动填写答案的方法的流程图;
图2为本发明实施例中字符大小随标注框尺寸而调整的示意图;
图3为本发明实施例提供的另一种自动填写答案的方法的流程图。
具体实施方式
本发明的核心思想在于解决现有技术在进行题目答案搜索时,搜索方式效率低,而且很容易出错,有部分文字内容不同就无法查找到对应的答案,而且每次只能搜索一个题目的答案等问题。
基于上述思想,本发明提供一种自动填写答案的方法、电子设备和可读存储介质,根据目标试卷的题干区域的内容在题库中查找标准答案,而后将标准答案填写到相应作答区域,使得根据用户提供的目标试卷的图像便可获取填好答案的试卷图像。
基于同一思想,本发明提供另一种自动填写答案的方法、电子设备和可读存储介质,根据目标试卷的题干区域的内容,在题库中查找题干内容与目标试卷的题干区域的内容相匹配的包含答案的样本试卷的图片,使得根据用户提供的目标试卷的图像便可输出填好答案的试卷图像。
以上,本发明提供的两种自动填写答案的方法、电子设备和可读存储介质,相较于现有技术通过题干的文字来查找答案,可以避免因文字输入错误而无法查找到对应的答案的情况。另外,由于每次可获取整个目标试卷的图像,因此可以识别到所有题干的内容,进而可以通过所有题干的内容找到各自的标准答案,相对于现有技术,大大提升了搜索效率。
以下结合附图和具体实施例对本发明提出的自动填写答案的方法、电子设备和可读存储介质作进一步详细说明。为使本发明的目的、特征更明显易懂,下面结合附图对本发明的技术方案作详细的说明,然而,本发明可以用不同的形式实现,不应只是局限在所述的实施例。此外,需要说明的是,本文的框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机程序指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
如图1所示,为本发明实施例提供的自动填写答案的方法的流程图,该自动填写答案的方法包括如下步骤:
S11,获取目标试卷的图像,对所述图像进行检测,检测出所述目标试卷上各题目的位置区域,所述位置区域包括题干区域和作答区域;
S12,识别每一所述题目的所述题干区域的内容;
S13,根据每一所述题干区域的内容在题库中搜索每一所述题目的标准答案,并将每一所述题目的所述标准答案填写到相应所述作答区域。
通过上述步骤S11~S13,即可根据用户提供的目标试卷的图像提供填好答案的试卷图像。可见,相较于现有技术,操作简单,查找效率高且不容易出错。
以下对上述各步骤进行详细描述。
步骤S11中,可利用区域识别模型检测出所述目标试卷上各题目的位置区域,所述区域识别模型可通过预先对样本进行训练得到。当目标试卷上的题目为多个时,利用所述区域识别模型可识别出目标试卷的每个题目的位置区域。
具体的,所述区域识别模型可为基于神经网络的模型,例如,基于深度卷积神经网络(Convolutional Neural Networks,CNN)的模型,可通过神经网络预先对试卷样本训练集中的样本进行训练得到的。利用训练好的区域识别模型从待搜索试卷的图像中提取二维特征向量,在二维特征向量的每个网格生成不同形状的锚点,使用标注框(GroundtruthBoxes)将检测出的每个题目的位置区域进行标注,还可以将标注框与生成的锚点作回归(regression)处理,以使标注框更贴近题目的实际位置。识别完题目区域后会将每个题目进行切割为单个图像,或者不实施切割,而是在处理时将每个题目区域区分开为单个区域图像进行处理,会根据题目位置信息进行排序。
本实施例中,较佳的,在利用区域识别模型对所述图像进行检测之前,先对获取的所述图像进行文档边缘识别、文本校正和二值化处理中的一种或多种。通过文档边缘识别可将目标图像从所拍摄图像中提取出来,通过文本校正,可使得文本图像记载的信息被更加准确的存储和传输,通过二值化处理,可使得文本图像中的信息更易被提取。所述文档边缘识别、所述文本校正和所述二值化处理可采用本领域人员所熟知的方法,在此不再赘述。
在检测出目标试卷每个题目的位置区域后,执行步骤S12。步骤S12中,可利用识别模型识别出各题目的题干区域中的内容,所述识别模型是基于神经网络的模型。首先标注出目标试卷题目中的各个组成部分,组成部分可以包括题干、答题和/或图片,进而通过识别模型识别出题目中题干的内容。其中,所述识别模型可以是基于空洞卷积和注意力模型建立的,具体的,采用空洞卷积对题干、答题和/或图片对应的标注框进行特征提取,再通过注意力模型将提取到的特征进行解码。
可选的,步骤S12中,在识别每一所述题目的所述题干区域的内容之后,可将每一所述题目的所述题干区域的内容转换为特征向量,进而步骤S13中,可采用向量搜索的方式搜索每一所述题目的标准答案。
在所述目标试卷的题目不包含图片时,各题目的题干区域的内容仅包括字符,故而步骤S12中,在识别出目标试卷各题干区域的字符信息后,将各题干区域的字符信息输入题干向量化模型,利用题干向量化模型将每一所述题目的所述题干区域的字符信息转换为第一特征向量,作为所述特征向量。具体的,将每一所述题目的所述题干区域的字符信息输入至所述题干向量化模型,以使所述题干向量化模型将每一所述题目的所述题干区域的字符信息转换为第一特征向量。所述题干向量化模型也可通过预先对样本进行训练得到。具体的,所述题干向量化模型可以是基于神经网络的模型,如CNN模型,所述题干向量化模型可以通过以下步骤训练得到:对第一题目样本训练集中每个题目样本进行标注处理,标注出每个题目样本中题干的字符信息;利用神经网络模型对每个题目样本中题干的字符信息进行二维特征向量提取,从而训练得到所述题干向量化模型。其中,具体的训练过程属于现有技术,在此不做赘述。
在获取各题目的所述特征向量后,执行步骤S13,根据每一所述题干区域的特征向量在题库中搜索每一所述题目的标准答案。具体的,在题库中进行向量搜索,以查找出与每一所述题目的所述特征向量相匹配的目标特征向量,并在所述题库中提取每一所述特征向量所对应的标准答案,填写到相应所述题目的所述作答区域。
其中,可以通过向量近似搜索的方式,在题库中查找与每个题目的特征向量相匹配的目标特征向量,具体为在题库中查找与每个题目的特征向量距离最近的特征向量。可以理解的是,不同向量之间的相似性度量(Similarity Measurement)通常采用的方法就是计算向量间的“距离(Distance)”,常用的距离计算方式有:欧式距离、曼哈顿距离、夹角余弦(Cosine)等。
特别的,若所述目标试卷的一题目具有多个标准答案,则根据所述题目的所述作答区域的位置排列顺序将多个所述标准答案依次填写到所述作答区域。例如,第一行从左到右,然后到第二行。
另外,优选的,在将所述标准答案填写到所述作答区域时,还根据每一所述题目的所述作答区域的宽度数据和高度数据调整所述标准答案的字符大小。具体的,可包括如下步骤:根据每一所述题目的所述作答区域的宽度数据和高度数据确定所述作答区域的标注框尺寸;以每一所述题目的所述标注框尺寸的预设比例填写所述标准答案至相应所述题目的所述作答区域,所述预设比例不超过100%。例如,如图2所示,根据标注框的尺寸,第一题的“宋”字相对较大,第二题的“B”字相对较小。
本领域技术人员可以理解的是,待填写答案的目标试卷中经常会有包含图片的题目,此时,图片也是题干区域的一个重要组成部分,因此,在进行题目的答案的搜索时结合题干中的字符信息和图片进行搜索,可以进一步提高搜索的准确度。
鉴于此,对于题目包含图片的目标试卷,步骤S12中,除了识别每一所述题干区域的字符信息,并通过题干向量化模型将每个所述题目的所述题干区域的内容转换为第一特征向量外,还包括:利用图片向量化模型将包含图片的所述题目的图片转换为第二特征向量;对于不包含图片的所述题目,将所述第一特征向量作为所述特征向量,对于包含图片的所述题目,将所述第一特征向量和所述第二特征向量进行拼接,作为所述特征向量。
其中,所述图片向量化模型可以是基于神经网络的模型,如CNN模型,所述图片向量化模型可以通过以下步骤训练得到:对第二题目样本训练集中每个题目样本进行标注处理,标注出每个题目样本中的图片;利用神经网络模型对每个题目样本中的图片进行二维特征向量提取,从而训练得到所述图片向量化模型。其中,第二题目样本训练集可以与第一题目样本训练集相同,也可以不同,本发明实施例对此不做限定。另外,具体的训练过程属于现有技术,在此不做赘述。
需要说明的是,当某一待搜索题目中包含两个及以上图片时,分别将各个图片输入图片向量化模型中,得到各个图片的第二特征向量,然后依次将各个图片的第二特征向量与题干的第一特征向量拼接在一起。由于不同题目的图片数量以及题干的文字数量不同,因此得到题目的特征向量的长度也是不同的。
对于连线类题目,这是一类比较特殊的题目,那么在进行答案填写的时候,可通过获取左侧题目最右侧字符行中线点的坐标和右侧答案最左侧字符中性点的坐标,渲染出连线连接两点。
在另外一些实施例中,步骤S12中,也可在识别每一所述题目的所述题干区域的内容后,不将其转换为特征向量,而是直接基于识别的内容在题库中进行标准答案的搜索。
基于同一思想,本发明另一实施例提供另一种自动填写答案的方法,如图3所示,包括如下步骤:
S21,识别题库中所保存的多个样本试卷的各题目的位置区域,所述位置区域包括题干区域和作答区域;
S22,识别每一所述样本试卷的每一所述题目的所述题干区域的内容,并根据每一所述样本试卷的各所述题干区域的内容,填写标准答案至相应的所述作答区域,并生成填写好标准答案的多个所述样本试卷的图像;
S23,在获取目标试卷的图像后,对所述图像进行检测,检测出所述目标试卷上各题目的题干区域;
S24,识别所述目标试卷的每一所述题目的所述题干区域的内容,在所述题库中搜索与每一所述题目的所述题干区域的内容相匹配的填写好标准答案的所述样本试卷的图像,并将搜索结果输出给用户端。
通过上述步骤S21~S24,即可根据用户提供的目标试卷的图像输出填好答案的试卷图像。可见,相较于现有技术,操作简单,查找效率高且不容易出错。
其中,较佳的,在执行步骤S23之前,对多个所述样本试卷的图片进行文本校正和/或二值化处理。通过文本校正,可使得样本试卷图像记载的信息被更加准确的存储和传输,通过二值化处理,可使得样本试卷图像中的信息更易被提取。
步骤S21及步骤S23中,同样的,可利用区域识别模型检测出所述目标试卷上各题目的位置区域,所述区域识别模型可通过预先对样本进行训练得到。
另外,与上一实施例所提供的自动填写答案的方法类似的,在获取目标试卷的题干区域的内容后,将题干区域的内容转换为特征向量,采用向量搜索的方式在题库中找到题干内容相匹配的样本试卷。
且同样的,若所述目标试卷中的题目不包含图片,则步骤S24中,在识别所述目标试卷的每一所述题目的所述题干区域的内容后,通过题干向量化模型将各所述题目的所述题干区域的内容转换为第一特征向量,作为所述特征向量。若所述目标试卷中的题目包含图片,则步骤S24还包括:识别每一所述题干区域的字符信息,并通过题干向量化模型将每个所述题目的所述题干区域的内容转换为第一特征向量;利用图片向量化模型将包含图片的所述题目的图片转换为第二特征向量;对于不包含图片的所述题目,将所述第一特征向量作为所述特征向量,对于包含图片的所述题目,将所述第一特征向量和所述第二特征向量进行拼接,作为所述特征向量。
所述区域识别模型、所述题干向量化模型以及所述图片向量化模型与前文描述均一致,在此亦不再赘述。
本发明实施例还提供另一种电子设备,包括处理器和存储器,所述存储器用于存放计算机程序;所述计算机程序被所述处理器执行时实现上述步骤S11~S13。
关于该方法各个步骤的具体实现以及相关解释内容可以参见上述图1所示的方法实施例,在此不做赘述。
本发明另一实施例提供另一种电子设备,包括处理器和存储器,所述存储器用于存放计算机程序;所述计算机程序被所述处理器执行时实现上述步骤S21~S24。
关于该方法各个步骤的具体实现以及相关解释内容可以参见上述图3所示的方法实施例,在此不做赘述。
在本发明两个实施例所提供的所述电子设备中,所述存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。
可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
所述处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明实施例还提供一种可读存储介质,所述可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述步骤S11~S13。
本发明另一实施例提供另一种可读存储介质,所述另一种可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述步骤S21~S24。
在本发明两个实施例提供的所述可读存储介质中,所述可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备,例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备以及上述的任意合适的组合。这里所描述的计算机程序可以从可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收所述计算机程序,并转发该计算机程序,以供存储在各个计算/处理设备中的可读存储介质中。用于执行本发明操作的计算机程序可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。所述计算机程序可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机程序的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、***和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序实现。这些计算机程序可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些程序在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机程序存储在可读存储介质中,这些计算机程序使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有该计算机程序的可读存储介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机程序加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的计算机程序实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
综上所述,本发明提供的自动填写答案的方法、电子设备和可读存储介质,通过将目标试卷的题干区域的内容转化为特征向量,并以特征向量的形式在题库中查找标准答案,而后将标准答案填写到相应作答区域,使得根据用户提供的目标试卷的图像便可提供填好答案的试卷图像;或者,通过将目标试卷的题干的内容转化为特征向量,并以特征向量的形式在题库中查找相匹配的特征向量所对应的包含答案的样本试卷的图片,使得根据用户提供的目标试卷的图像便可输出填好答案的试卷图像,因此,相对于现有技术,可避免因文字输入错误而无法查找到对应的答案的情况,也可大大提升搜索效率。
需要说明的是,本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于电子设备、计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述描述仅是对本发明较佳实施例的描述,并非对本发明范围的任何限定,本发明领域的普通技术人员根据上述揭示内容做的任何变更、修饰,均属于权利要求书的保护范围。

Claims (19)

1.一种自动填写答案的方法,其特征在于,包括:
获取目标试卷的图像,对所述图像进行检测,检测出所述目标试卷上各题目的位置区域,所述位置区域包括题干区域和作答区域;
识别每一所述题目的所述题干区域的内容,根据每一所述题干区域的内容在题库中搜索每一所述题目的标准答案,并将每一所述题目的所述标准答案填写到相应所述作答区域。
2.如权利要求1所述的自动填写答案的方法,其特征在于,在将每一所述题目的所述标准答案填写到相应的所述作答区域时,所述自动填写答案的方法还包括:
根据每一所述题目的所述作答区域的宽度数据和高度数据调整所述标准答案的字符大小。
3.如权利要求2所述的自动填写答案的方法,其特征在于,根据每一所述作答区域的宽度数据和高度数据调整所述标准答案的字符大小包括:
根据每一所述题目的所述作答区域的宽度数据和高度数据确定所述作答区域的标注框尺寸;
以每一所述题目的所述标注框尺寸的预设比例填写所述标准答案至相应所述题目的所述作答区域,所述预设比例不超过100%。
4.如权利要求1所述的自动填写答案的方法,其特征在于,若所述目标试卷的一所述题目具有多个标准答案,则根据所述题目的所述作答区域的位置排列顺序将多个所述标准答案依次填写到所述作答区域。
5.如权利要求1所述的自动填写答案的方法,其特征在于,所述识别每一所述题目的所述题干区域的内容,根据每一所述题干区域的内容在题库中搜索每一所述题目的标准***括:
识别每一所述题目的所述题干区域的内容,并将每一所述题目的所述题干区域的内容转换为特征向量;
在题库中进行向量搜索,以查找出与每一所述题目的所述特征向量相匹配的目标特征向量,并在所述题库中提取每一所述目标特征向量所对应的标准答案。
6.如权利要求5所述的自动填写答案的方法,其特征在于,若所述目标试卷中的所述题目不包含图片,则识别每一所述题目的所述题干区域的内容,并将每一所述题目的所述题干区域的内容转换为特征向量包括:
识别每一所述题干区域的字符信息,并通过题干向量化模型将各所述题目的所述题干区域的内容转换为第一特征向量,作为所述特征向量。
7.如权利要求5所述的自动填写答案的方法,其特征在于,若所述目标试卷中的所述题目包含图片,则识别每一所述题目的所述题干区域的内容,并将每一所述题目的所述题干区域的内容转换为特征向量包括:
识别每一所述题干区域的字符信息,并通过题干向量化模型将每个所述题目的所述题干区域的内容转换为第一特征向量;
利用图片向量化模型将包含图片的所述题目的图片转换为第二特征向量;
对于不包含图片的所述题目,将所述第一特征向量作为所述特征向量,对于包含图片的所述题目,将所述第一特征向量和所述第二特征向量进行拼接,作为所述特征向量。
8.如权利要求1所述的自动填写答案的方法,其特征在于,利用区域识别模型检测出所述目标试卷上各题目的位置区域,所述区域识别模型通过预先对样本进行训练而得到。
9.如权利要求1所述的自动填写答案的方法,其特征在于,在利用区域识别模型对所述图像进行检测之前,所述自动填写答案的方法还包括:
对获取的所述图像进行文档边缘识别、文本校正和二值化处理中的一种或多种。
10.一种自动填写答案的方法,其特征在于,包括:
识别题库中所保存的多个样本试卷的各题目的位置区域,所述位置区域包括题干区域和作答区域;
识别每一所述样本试卷的每一所述题目的所述题干区域的内容,并根据每一所述样本试卷的各所述题干区域的内容,填写标准答案至相应的所述作答区域,并生成填写好标准答案的多个所述样本试卷的图像;
在获取目标试卷的图像后,对所述图像进行检测,检测出所述目标试卷上各题目的题干区域;
识别所述目标试卷的每一所述题目的所述题干区域的内容,在所述题库中搜索与每一所述题目的所述题干区域的内容相匹配的填写好标准答案的所述样本试卷的图像,并将搜索结果输出给用户端。
11.如权利要求10所述的自动填写答案的方法,其特征在于,在将每一所述样本试卷的每一所述题目的所述标准答案填写到相应的所述作答区域时,所述自动填写答案的方法还包括:
根据每一所述样本试卷的每一所述题目的所述作答区域的宽度数据和高度数据调整所述标准答案的字符大小。
12.如权利要求11所述的自动填写答案的方法,其特征在于,根据每一所述样本试卷的每一所述题目的所述作答区域的宽度数据和高度数据调整所述标准答案的字符大小包括:
根据每一所述样本试卷的每一所述题目的所述作答区域的宽度数据和高度数据确定相应所述作答区域的标注框尺寸;
以每一所述样本试卷的每一所述题目的所述标注框尺寸的预设比例填写所述标准答案至相应所述作答区域,所述预设比例不超过100%。
13.如权利要求10所述的自动填写答案的方法,其特征在于,所述识别所述目标试卷的每一所述题目的所述题干区域的内容,在所述题库中搜索与每一所述题目的所述题干区域的内容相匹配的填写好标准答案的所述样本试卷的图像,并将搜索结果输出给用户端包括:
识别所述目标试卷的每一所述题目的所述题干区域的内容,并将每一所述题目的所述题干区域的内容转换为特征向量;
在所述题库中进行向量搜索,以获取特征向量与每一所述题目的所述特征向量相匹配的填写好标准答案的所述样本试卷的图像,并将搜索结果输出给用户端。
14.如权利要求13所述的自动填写答案的方法,其特征在于,若所述目标试卷中的题目不包含图片,则识别每一所述题目的所述题干区域的内容,并通过将每一所述题目的所述题干区域的内容转换为特征向量包括:
识别每一所述题干区域的字符信息,并通过题干向量化模型将各所述题目的所述题干区域的内容转换为第一特征向量,作为所述特征向量。
15.如权利要求13所述的自动填写答案的方法,其特征在于,若所述目标试卷中的题目包含图片,则识别每一所述题目的所述题干区域的内容,并将每一所述题目的所述题干区域的内容转换为特征向量包括:
识别每一所述题干区域的字符信息,并通过题干向量化模型将每个所述题目的所述题干区域的内容转换为第一特征向量;
利用图片向量化模型将包含图片的所述题目的图片转换为第二特征向量;
对于不包含图片的所述题目,将所述第一特征向量作为所述特征向量,对于包含图片的所述题目,将所述第一特征向量和所述第二特征向量进行拼接,作为所述特征向量。
16.如权利要求10所述的自动填写答案的方法,其特征在于,利用区域识别模型检测出所述样本试卷和所述目标试卷上各题目的位置区域,所述区域识别模型通过预先对样本进行训练而得到。
17.如权利要求10所述的自动填写答案的方法,其特征在于,在生成填写好答案的多个所述样本试卷的图片后,所述自动填写答案的方法还包括:
对多个所述样本试卷的图片进行文本校正和/或二值化处理。
18.一种电子设备,其特征在于,包括处理器和存储器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,实现如权利要求1至17任一项所述的方法。
19.一种可读存储介质,其特征在于,所述可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1至17任一项所述的方法。
CN202010968795.0A 2020-09-15 2020-09-15 自动填写答案的方法、电子设备和可读存储介质 Pending CN112069349A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010968795.0A CN112069349A (zh) 2020-09-15 2020-09-15 自动填写答案的方法、电子设备和可读存储介质
PCT/CN2021/117224 WO2022057708A1 (zh) 2020-09-15 2021-09-08 自动填写答案的方法、电子设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010968795.0A CN112069349A (zh) 2020-09-15 2020-09-15 自动填写答案的方法、电子设备和可读存储介质

Publications (1)

Publication Number Publication Date
CN112069349A true CN112069349A (zh) 2020-12-11

Family

ID=73695922

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010968795.0A Pending CN112069349A (zh) 2020-09-15 2020-09-15 自动填写答案的方法、电子设备和可读存储介质

Country Status (2)

Country Link
CN (1) CN112069349A (zh)
WO (1) WO2022057708A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113111154A (zh) * 2021-06-11 2021-07-13 北京世纪好未来教育科技有限公司 相似度评估方法、答案搜索方法、装置、设备及介质
CN113239717A (zh) * 2021-02-26 2021-08-10 北京百度网讯科技有限公司 用于处理题目的方法、装置、设备、介质和程序产品
WO2022057708A1 (zh) * 2020-09-15 2022-03-24 杭州大拿科技股份有限公司 自动填写答案的方法、电子设备和可读存储介质

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115565190A (zh) * 2022-11-17 2023-01-03 江西风向标智能科技有限公司 试卷版面分析方法、***、计算机及可读存储介质
CN117058700B (zh) * 2023-07-03 2024-03-22 北京博思创成技术发展有限公司 答题卡识别方法、装置、设备和存储介质
CN117216312B (zh) * 2023-11-06 2024-01-26 长沙探月科技有限公司 提问素材的生成方法、装置、电子设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106934039A (zh) * 2017-03-15 2017-07-07 泰康保险集团股份有限公司 问卷生成方法及装置
CN109271401A (zh) * 2018-09-26 2019-01-25 杭州大拿科技股份有限公司 一种题目搜索、批改方法、装置、电子设备和存储介质
CN109326161A (zh) * 2018-12-05 2019-02-12 杭州大拿科技股份有限公司 一种试卷批改一体机
CN109634961A (zh) * 2018-12-05 2019-04-16 杭州大拿科技股份有限公司 一种试卷样本生成方法、装置、电子设备和存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109712456A (zh) * 2019-01-15 2019-05-03 山东仁博信息科技有限公司 一种基于摄像头的学生纸质作业智能批阅***
CN112069349A (zh) * 2020-09-15 2020-12-11 杭州大拿科技股份有限公司 自动填写答案的方法、电子设备和可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106934039A (zh) * 2017-03-15 2017-07-07 泰康保险集团股份有限公司 问卷生成方法及装置
CN109271401A (zh) * 2018-09-26 2019-01-25 杭州大拿科技股份有限公司 一种题目搜索、批改方法、装置、电子设备和存储介质
CN109326161A (zh) * 2018-12-05 2019-02-12 杭州大拿科技股份有限公司 一种试卷批改一体机
CN109634961A (zh) * 2018-12-05 2019-04-16 杭州大拿科技股份有限公司 一种试卷样本生成方法、装置、电子设备和存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022057708A1 (zh) * 2020-09-15 2022-03-24 杭州大拿科技股份有限公司 自动填写答案的方法、电子设备和可读存储介质
CN113239717A (zh) * 2021-02-26 2021-08-10 北京百度网讯科技有限公司 用于处理题目的方法、装置、设备、介质和程序产品
CN113111154A (zh) * 2021-06-11 2021-07-13 北京世纪好未来教育科技有限公司 相似度评估方法、答案搜索方法、装置、设备及介质

Also Published As

Publication number Publication date
WO2022057708A1 (zh) 2022-03-24

Similar Documents

Publication Publication Date Title
CN112069349A (zh) 自动填写答案的方法、电子设备和可读存储介质
CN109271401B (zh) 一种题目搜索、批改方法、装置、电子设备和存储介质
US11151177B2 (en) Search method and apparatus based on artificial intelligence
US11508251B2 (en) Method and system for intelligent identification and correction of questions
CN110795543B (zh) 基于深度学习的非结构化数据抽取方法、装置及存储介质
CN109697239B (zh) 用于生成图文信息的方法
CN109284355B (zh) 一种批改试卷中口算题的方法及装置
CN112712069B (zh) 一种判题方法、装置、电子设备及存储介质
CN108491387B (zh) 用于输出信息的方法和装置
CN112597999B (zh) 一种题目识别方法、装置、电子设备及计算机存储介质
CN109189895B (zh) 一种针对口算题的题目批改方法及装置
US10885122B2 (en) Estimating article publication dates and authors based on social media context
US9286526B1 (en) Cohort-based learning from user edits
CN109583389B (zh) 绘本识别方法及装置
CN113360699A (zh) 模型训练方法和装置、图像问答方法和装置
CN112347997A (zh) 一种试题检测识别方法、装置、电子设备及介质
CN113157959A (zh) 基于多模态主题补充的跨模态检索方法、装置及***
CN117668181A (zh) 信息处理方法、装置、终端设备以及存储介质
CN112949616A (zh) 一种题目处理方法、装置、电子设备及计算机存储介质
CN116361502B (zh) 一种图像检索方法、装置、计算机设备及存储介质
US10810497B2 (en) Supporting generation of a response to an inquiry
WO2023024898A1 (zh) 题目辅助方法、题目辅助装置和题目辅助***
CN114691907B (zh) 一种跨模态检索的方法、设备及介质
CN115270768A (zh) 用于文本中待纠错的目标重点词确定的方法与设备
CN111708891B (zh) 一种多源食材数据之间的食材实体链接方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination