物品的可视化文件归档的方法、装置和电子设备
技术领域
本申请涉及电子信息处理领域,更具体地涉及物品的可视化文件归档的方法、装置和电子设备。
背景技术
证件是指用来证明身份、经历等的证书和文件,每个人都会有大量的证件,例如身份证件类证件、财产证明类证件、证书类证件、法律文书类证件、票据类证件等等。如此多的证件,很容易出现证件遗失、找不到的情况,造成一定的经济损失。也有临时要用,证件不在身边的情况,造成不必要的麻烦。
目前可以通过将纸质证件对应的电子证件存储在电子设备上的方法避免上述可能出现的问题。为了方便使用,通常需要将电子证件分类存储。目前通常采用的方法是需要用户手动设置好类别,并上传电子证件到相应的类别下。这种方法操作麻烦,需要花费大量的时间。
因此,需求一种物品的可视化文件归档的方法,来克服上述技术问题。
发明内容
本申请的目的在于提供一种物品的可视化文件归档的方法、装置和电子设备,能够根据与物品相关的可视化文件和分类规则确定可视化文件所属的类别,避免用户手动选择类别带来的操作不便、时间成本高的问题。
为解决上述技术问题,本申请实施例是这样实现的:
第一方面,提供了一种物品的可视化文件归档的方法,包括:
获取与物品相关的可视化文件;
根据所述可视化文件和分类规则,确定所述可视化文件所属的类别;
获取所述物品上承载的信息;
在所述类别下存储所述可视化文件和所述物品上承载的信息。
第二方面,提供了一种物品的可视化文件归档的装置,包括:
处理单元,获取与物品相关的可视化文件;
类别确定单元,根据所述可视化文件和分类规则,确定所述可视化文件所属的类别;
所述处理单元,获取所述物品上承载的信息;
存储单元,在所述类别下存储所述可视化文件和所述物品上承载的信息。
第三方面,提供了一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取与物品相关的可视化文件;
根据所述可视化文件和分类规则,确定所述可视化文件所属的类别;
获取所述物品上承载的信息;
在所述类别下存储所述可视化文件和所述物品上承载的信息。
第四方面,提供了一种计算机可读介质,所述计算机可读介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取与物品相关的可视化文件;
根据所述可视化文件和分类规则,确定所述物品所属的类别;
获取所述物品上承载的信息;
在所述类别下存储所述可视化文件和所述物品上承载的信息。
由以上本申请实施例提供的技术方案可见,本申请实施例在获取与物品相关的可视化文件之后,根据可视化文件和分类规则确定可视化文件所属的类别,并在确定出的类别下存储可视化文件和物品上承载的信息。本申请实施例提供的技术方案能够避免由于物品遗失、找不到的情况造成的经济损失,能够避免临时要用的物品不在身边的情况造成的不必要的麻烦。并且不需要用户手动选择类别即可实现将物品对应的可视化文件存储到选择的类别下,操作简便、时间成本低。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请的一个实施例的物品的可视化文件归档的方法的流程图。
图2是根据本申请一个实施例的主类别和子类别的示意图。
图3是根据本申请一个实施例的对Googlenet网络的网络参数进行训练的方法。
图4是根据本申请一个具体实施例的物品的可视化文件归档的方法的流程图。
图5是根据本申请一个实施例的电子设备的结构示意图。
图6是根据本申请一个实施例的物品的可视化文件归档的装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
图1是根据本申请的一个实施例的物品的可视化文件归档的方法的流程图。图1的方法由物品的可视化文件归档的装置执行。应理解,本申请实施例中的物品包括但不限于证件,其中,证件是指用来证明身份、经历等的证书和文件,证件包括但不限于身份证件类证件、财产证明类证件、证书类证件、法律文书类证件、票据类证件、保修单类证件。
如图1所示出的,在S102处,获取与物品相关的可视化文件。
需要说明的是,在S102处,如果物品为上文中所述的证件,这里的证件通常指纸质证件。获取与物品相关的可视化文件的过程也可以理解为将纸质证件转换为电子证件的过程。可选地,S102处的可视化文件为包括物品的图像文件或包括物品的视频文件。
可选地,作为一个例子,S102处的获取与物品相关的可视化文件具体可以是采集与物品相关的可视化文件。例如,提示用户通过电子设备上的照相机拍摄证件的照片或者通过照相机的录像功能拍摄包括物品的视频。
可选地,作为另一个例子,S102处的获取与物品相关的可视化文件为从已存储的可视化文件中获取所述与物品相关的可视化文件。这里已存储的可视化文件可以是电子设备内部存储的可视化文件,也可以是与电子设备能够进行通信的服务器内部存储的可视化文件。在这种情况下,提示用户上传与物品相关的可视化文件。
在S104处,根据可视化文件和分类规则,确定可视化文件所属的类别。
可以理解的是,在S104处确定可视化文件所述的类别也就是确定与可视化文件对应的物品所属的类别。
可选地,作为一个例子,在S104处,根据可视化文件获取物品的图像特征,根据物品的图像特征和分类规则,确定可视化文件所属的类别。可以理解是,分类规则实际上描述了图像特征和类别之间的对应关系。
可选地,在一些实施例中,通过Googlenet网络自动学习物品的图像特征,然后根据图像特征和分类规则确定可视化文件所属的类别。这里采用Googlenet网络自动学习的方式获取物品的图像特征,具有更好的鲁棒性。
可选地,在一些实施例中,在S104处的类别包括子类别和主类别,主类别包括至少一个子类别,至少一个子类别包括所述子类别,分类规则包括第一子分类规则和第二子分类规则,则在S104处,根据可视化文件和第一子分类规则,确定可视化文件所属的子类别;之后根据第二子分类规则,确定子类别所属的主类别。或者可以理解为,本申请实施例对物品的可视化文件进行分类时,采用的是二级分类方法,先确定可视化文件所属的子类别,然后再确定子类别所属的主类别。
举例来说,如图2所示出的,以物品为证件为例,假设有30个子类别,7个主类别。主类别和子类别之间具有映射关系。其中,7个主类别分别为身份证件类、孩子证件、财产证明、证书类、执照类、法律文书、票据保修单。身份证件类包括的子类别包括户口本、身份证、护照、港澳通行证、结婚证、社保卡和医保卡。孩子证件包括的子类别包括出生证明、独生子女证明、疫苗接种卡。财产证明包括的子类别包括房产类、银行卡、存折、存单、借款协议和理财。证书类包括的子类别包括毕业证、学位证、职称和荣誉证书。执照类包括的子类别包括驾照、行驶证、潜水和飞行。法律文书包括的子类别包括劳务合同、租房合同和保险单。票据保修单包括的子类别包括保修卡、***和报销。如果根据一可视化文件获取到的图像特征和第一子分类规则确定出可视化文件所属的子类别为身份证,则可以根据主类别和子类别之间的映射关系(也就是上文中的第二子分类规则)确定出可视化文件所属的主类别为身份证件类。
可选地,在一些实施例中,在S104处的类别包括子类别和主类别,主类别包括至少一个子类别,至少一个子类别包括所述子类别,分类规则包括第一子分类规则和第二子分类规则,则在S104处,先根据可视化文件和第一子分类规则确定出可视化文件所属的主类别,再根据可视化文件和第二子分类规则确定出可视化文件所属的子类别。这里在根据可视化文件和第一子分类规则确定可视化文件所属的主类别时,可以根据预设规则(或者说算法)获取物品的粗略的图像特征。在根据可视化文件和第二子分类规则确定可视化文件所属的子类别时,可以根据预设规则(或者说算法)获取物品的精细的图像特征。
进一步地,在一些实施例中,在确定可视化文件所属的类别之后,向当前用户展示所述类别,提示当前用户进行确认,当接收到当前用户输入的第一确认信息时,确定类别为合适的类别。如果接收到当前用户输入的否定确认信息,可以重进获取物品的图像特征,根据重新获取到的图像特征和分类规则确定可视化文件所属的类别,之后再向当前用户展示确定的类别,提示当前用户进行确认,如果再次收到当前用户输入的否定确认信息,可以提示用户手动创建可视化文件所属的类别。由此,通过与当前用户之间的交互保证将可视化文件所属的类别的准确性。
在S106处,获取物品上承载的信息。
可选地,在一些实施例中,在S106处,可以采用光学识别符识别(OpticalCharacter Recognition,OCR)技术对与物品相关的文件进行分析,提取物品上承载的信息。例如,物品为身份证,采用OCR技术对身份证图片进行分析,快速提取身份证上的姓名、身份证号、家庭住址、有效期等信息。
可选地,在另一些实施例中,在S106处,可以接收当前用户输入的物品上承载的信息。例如,可以向用户展示必填信息框,提示用户将物品上承载的信息填充到必填信息框中。
进一步地,在另一些实施例中,可以先采用OCR技术提取物品上承载的信息,如果信息提取失败,提示用户手动输入物品上承载的信息。
可选地,在一些实施例中,当获取到物品上承载的信息之后,向当前用户展示获取到的信息,提示当前用户对获取到的信息进行确认,当接收到当前用户输入的第二确认信息时,确定正确获取物品上承载的信息。
在S108处,在所述类别下存储可视化文件和物品上承载的信息。
可选地,作为一个实施例,在S104处,确定是否已创建所述类别,如果确定未创建所述类别,则创建所述类别。相对应地,在S108处,将可视化文件和物品上承载的信息存储到创建的类别下。如果确定已经创建所述类别,则不需要重新创建所述类别,在S108处直接将可视化文件和物品上承载的信息存储到创建的类别下。由于,本申请实施例的方法能够自动创建类别并将物品对应的可视化文件归档,能够节省用户的时间成本,降低管理成本,方便易用。
在本申请实施例中,可选地,在所述类别下存储可视化文件和物品上承载的信息之后,可以向当前用户提示物品的可视化文件自动归档完毕。例如,可以在显示屏上显示“物品归档完毕,请进行下一物品的归档操作”。
进一步地,在一些实施例中,提示当前用户设置校验密码,校验密码用于验证需要查看所述可视化文件和所述物品上承载的信息的用户的合法性。例如,当用户需要查看存储的可视化文件和物品上承载的信息时,提示用户输入校验密码,如果用户输入的校验密码与初始设置的校验密码不一致,则提示用户无权查看,如果用户输入的校验密码和初始设置的校验密码一致时,允许用户查看。由此,能够提高用户信息的安全性。
在本申请实施例中,可选地,分类规则是采用训练样本对Googlenet网络的网络参数进行训练得到的,其中,Googlenet网络的最后一层全连接层包括的节点数为预设值,这里的预设值可以是子类别的总数。下面将以物品为证件为例,将结合图3详细介绍对Googlenet网络的网络参数进行训练的方法。
如图3所示出的,在S302处,确定采用Googlenet网络。
在S304处,定义类别,类别包括主类别和子类别。
可选地,在S304处定义的主类别和子类别为如图2所示出的主类别和子类别。
在S306处,根据定义的类别,收集证件数据。
可选地,在S306处,证件数据为证件图片。收集证件数据具体可以是从网络上下载证件图片。可以理解的是,收集到的证件数据是对Googlenet网络的网络参数进行训练的训练样本。
在S308处,定义Googlenet网络的网络结构。
具体地,在一些实施例中,将现有Googlenet网络中的最后一层全连接层包括的节点个数设置为30个(对应前面的例子,共有30个子类别),之后将最后一层全连接层与Softmax层连接。由此,每个节点代表输入的一个图像特征属于这个节点的概率。
在S310处,利用所述证件数据,训练网络参数,得到分类规则。
具体地,在一些实施例中,可以先下载(Load)现有Googlenet的模型参数,忽略最后一层全连接层,之后再利用收集到的证件数据进行网络参数训练。
图4示出了根据本申请另一个实施例的物品的可视化文件归档的方法。可以理解的是,图4示出的实施例仅仅是本申请的物品为证件的一个具体实施例。
如图4所示,在S402处,确定用于证件归档的应用程序(Application,APP)被打开。
可以理解的是,在方法400中对证件进行归档的本质是对证件的可视化文件进行归档。
在S404处,打开拍摄界面。
具体地,在一些实施例中,在确定APP被打开之后,自动触发照相机,使当前界面成为照相机的拍摄界面。或者在确定APP被打开之后,提示当前用户上传与证件相关的多媒体文件,使得当前用户主动打开照相机,使得当前界面成为照相机的拍摄界面。
在S406处,获取证件的图像。
在S408处,根据证件分类算法确定证件所属的类别。
具体地,在S408处,根据证件分类算法确定证件所属的类别的具体实现方式与方法100中根据可视化文件和分类规则,确定可视化文件所属的类别相同。具体地,获取证件的图像特征,根据获取到的图像特征和分类规则,确定证件所属的类别。
在S410处,自动创建证件所属的主类别。
在S412处,自动创建证件所属的子类别。
需要说明的是,在执行S410和S412之前,判断是否已经创建了证件所属的主类别和子类别。如果没有创建,则执行S410和S412,如果已经创建,则不执行S410和S412。
在S414处,跳转到APP的证件类目界面。
可以理解的是,在S414处,跳转到APP的证件类目界面是为了向用户展示确定的证件所属的类别,提示用户确定所述类别是否是合适的类别。
在S416处,用户确认证件类别。
可选地,接收到用户输入的确认信息时,确定用户确认所述类别是合适的类别。
可选地,如果接收到的是用户输入的否定信息,确定所述类别不是合适的类别,或者说证件类别确定不准确。在这种情况下,可以提示用户手动输入证件所属的类别,将用户输入的类别确定为证件所属的类别。
在S418处,采用OCR技术获取证件上承载的信息。
由于OCR技术能够将图形数字化,即将图片转换为可以编辑的文本,能够实现信息的快速输入,降低证件分类的时间成本。
在S420处,用户确认OCR识别结果。
可选地,向用户展示OCR识别结果,在接收到用户输入的确认信息时,确定证件上承载的信息被正确获取。
可选地,如果向用户展示OCR识别结果之后,接收到的是用户输入的否定信息,提示用户输入证件上承载的信息。
在S422处,确认证件自动归档完毕。
可选地,在确定证件自动归档完毕时,向用户提示归档完毕。
进一步地,在向用户提示归档完毕时,提示用户是否退出APP,如果用户确定退出APP,则关闭APP。如果用户确定不退出APP,则执行S424。
在S424处,返回拍摄界面。
在S426处,提示用户将下一张证件拍摄归档。
以上结合图1至图4详细描述了根据本申请实施例的物品的可视化文件归档的方法。下面将结合图5详细描述根据本申请实施例的电子设备。参考图5,在硬件层面,电子设备包括处理器,可选地,包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外设部件互连标准(Peripheral Component Interconnect,PCI)总线或扩展工业标准结构(ExtendedIndustry Standard Architecture,EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成物品的可视化文件归档的装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
获取与物品相关的可视化文件;
根据所述可视化文件和分类规则,确定所述可视化文件所属的类别;
获取所述物品上承载的信息;
在所述类别下存储所述可视化文件和所述物品上承载的信息。
上述如本申请图1所示实施例揭示的物品的可视化文件归档的装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(CentralProcessing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图1的方法,并实现物品的可视化文件归档的装置在图1所示实施例的功能,本申请实施例在此不再赘述。
当然,除了软件实现方式之外,本申请的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行图1所示实施例的方法,并具体用于执行以下方法:
获取与物品相关的可视化文件;
根据所述可视化文件和分类规则,确定所述可视化文件所属的类别;
获取所述物品上承载的信息;
在所述类别下存储所述可视化文件和所述物品上承载的信息。
图6是本申请的一个实施例的物品的可视化文件归档的装置的结构示意图。请参考图6,在一种软件实施方式中,物品的可视化文件归档的装置600可包括:处理单元601、类别确定单元602和存储单元603,其中,
处理单元601,获取与物品相关的可视化文件;
类别确定单元602,根据所述可视化文件和分类规则,确定所述可视化文件所属的类别;
所述处理单元601,获取所述物品上承载的信息;
存储单元603,在所述类别下存储所述可视化文件和所述物品上承载的信息。
在本申请实施例中,物品的可视化文件归档的装置在获取与物品相关的可视化文件之后,根据可视化文件和分类规则确定可视化文件所属的类别,并在确定的类别下存储可视化文件和物品上承载的信息。能够避免由于物品遗失找不到的情况造成的经济损失,避免临时要用的物品不在身边的情况造成的不必要的麻烦,并且能够自动将物品的可视化文件存储到确定的类别下,操作简便,时间成本低。
可选地,作为一个实施例,所述类别确定单元602,根据所述可视化文件,获取所述物品的图像特征;根据所述物品的图像特征和所述分类规则,确定所述可视化文件所属的类别。
可选地,作为一个实施例,所述处理单元601:确定是否已创建所述类别;如果确定未创建所述类别,创建所述类别。
可选地,作为一个实施例,所述类别包括子类别和主类别,所述主类别包括至少一个子类别,所述至少一个子类别包括所述子类别,所述分类规则包括第一子分类规则和第二子分类规则;
其中,所述类别确定单元602,根据所述可视化文件和所述第一子分类规则,确定所述可视化文件所属的所述子类别;根据所述第二子分类规则,确定所述子类别所属的所述主类别。
可选地,作为一个实施例,所述处理单元601,采集所述与物品相关的可视化文件;或,从已存储的可视化文件中获取所述与物品相关的可视化文件。
可选地,作为一个实施例,所述处理单元601,向当前用户展示所述类别;接收所述当前用户输入的第一确认信息,所述第一确认信息用于确认所述类别为合适的类别。
可选地,作为一个实施例,所述处理单元601,采用光学字符识别OCR技术提取所述物品上承载的信息;或,接收当前用户输入的所述物品上承载的信息。
可选地,作为一个实施例,所述处理单元601,向当前用户展示所述物品上承载的信息;接收所述当前用户输入的第二确认信息,所述第二确认信息用于确认所述物品上承载的信息被正确获取。
可选地,作为一个实施例,所述处理单元601,采用训练样本对Googlenet网络的网络参数进行训练,得到所述分类规则,其中,所述Googlenet网络的最后一个全连接层包括的节点数为预设值。
可选地,作为一个实施例,所述与物品相关的可视化文件为包括所述物品的图片文件或包括所述物品的视频文件。
可选地,作为一个实施例,所述处理单元601,提示当前用户设置校验密码,所述校验密码用于验证需要查看所述可视化文件和所述物品上承载的信息的用户的合法性。
物品的可视化文件归档的装置600还可执行图1所示实施例的方法,并实现物品的可视化文件归档的装置在图4所示实施例的功能,本申请实施例在此不再赘述。
总之,以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。