CN111190973A - 一种申报表的分类方法、装置、设备及存储介质 - Google Patents

一种申报表的分类方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111190973A
CN111190973A CN201911420087.7A CN201911420087A CN111190973A CN 111190973 A CN111190973 A CN 111190973A CN 201911420087 A CN201911420087 A CN 201911420087A CN 111190973 A CN111190973 A CN 111190973A
Authority
CN
China
Prior art keywords
target
project name
statement
standard
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911420087.7A
Other languages
English (en)
Inventor
钱力扬
王培勇
陈宏仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Servyou Software Group Co ltd
Original Assignee
Servyou Software Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Servyou Software Group Co ltd filed Critical Servyou Software Group Co ltd
Priority to CN201911420087.7A priority Critical patent/CN111190973A/zh
Publication of CN111190973A publication Critical patent/CN111190973A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请公开了一种申报表的分类方法,包括:预先利用深度学习神经网络训练出分类模型;获取目标申报表的各目标项目名称;将各目标项目名称输入至预设的分类模型中,并得出对应的分类结果。由于分类模型预先学习了各不同类型的财务报表的特征,因此相较于现有技术中通过将目标申报表与标准财务报表进行项目名称匹配以确定目标申报表的报表类型的方式,本方法能够排除掉无关符号、乱码以及表述上的差异等情况对分类的影响,进而提高对申报表进行分类的准确度。本申请还公开了一种申报表的分类装置、设备及计算机可读存储介质,均具有上述有益效果。

Description

一种申报表的分类方法、装置、设备及存储介质
技术领域
本发明涉及文件分类领域,特别涉及一种申报表的分类方法、装置、设备及计算机可读存储介质。
背景技术
财务报表包括资产负债表、利润表和现金流量表三种类型;其中,每种类型的财务报表,根据财务制度不同,又包含多种类型的子表。在需要将用户提供的目标申报表整合成上述对应类型财务报表时,需要将目标申报表与上述各类型的财务报表(子表)进行匹配,从而确定出申报表的类型。目前,一般是将目标申报表的各目标项目名称分别与各标准财务报表的各标准项目名称进行匹配,目标申报表的各项目名称与某个标准财务报表的各标准项目名称的整体匹配度达到预设匹配阈值时,则根据该标准财务报表的报表类型确定出该目标申报表的报表类型。但是,由于不同的现实因素影响,用户的目标申报表中可能存在无关符号、乱码以及表述上的差异等情况,因此,按照现有技术中的方法进行匹配,将大大降低与标准财务报表的匹配度,从而使得无法准确地确定出目标申报表的报表类型。
因此,如何准确地对申报表进行分类,是本领域技术人员目前需要解决的技术问题。
发明内容
有鉴于此,本发明的目的在于提供一种申报表的分类方法,能够准确地对申报表进行分类;本发明的另一目的是提供一种申报表的分类装置、设备及计算机可读存储介质,均具有上述有益效果。
为解决上述技术问题,本发明提供一种申报表的分类方法,包括:
预先利用深度学习神经网络训练出分类模型;
获取目标申报表的各目标项目名称;
将所述各目标项目名称输入至预设的分类模型中,并得出对应的分类结果。
优选地,在所述获取目标申报表的各目标项目名称之后,进一步包括:
分别计算各所述目标项目名称与各标准财务报表的标准项目名称的相似度;
确定出相似度超过预设阈值的目标项目名称,并利用标准项目名称更新所述目标项目名称;
对应的,所述将所述各目标项目名称输入至预设的分类模型中,并得出对应的分类结果的过程,具体为:
将更新后的各所述目标项目名称输入至预设的所述分类模型中,并得出对应的分类结果。
优选地,进一步包括:
将所述目标申报表中的各目标项目名称与预先按照预设数据结构存储的预存项目名称进行匹配;
将匹配成功的目标项目名称修改为对应的预存项目名称;
筛选出所述目标申报表中未修改的所述目标项目名称,并进入所述分别计算各所述目标项目名称与各标准财务报表的标准项目名称的相似度的步骤。
优选地,所述分别计算各所述目标项目名称与各标准财务报表的标准项目名称的相似度的过程,具体包括:
将所述目标项目名称和所述标准项目名称分别切分为目标词语和标准词语;
依据所述目标词语和所述标准词语将所述目标项目名称和所述标准项目名称分别转换为对应的目标向量和标准向量;
将所述目标向量和所述标准向量拼接,并计算出对应的相似度值。
优选地,按照预设数据结构存储所述预存项目名称的过程具体包括:
按照DAT数据结构存储所述预存项目名称。
优选地,在所述获取目标申报表的各目标项目名称之后,进一步包括:
对所述目标申报表的各目标项目名称进行文本清洗操作。
优选地,在所述将所述各目标项目名称输入至预设的分类模型中,并得出对应的分类结果之后,进一步包括:
记录所述目标申报表的标识信息以及所述目标申报表对应的报表类型。
为解决上述技术问题,本发明还提供一种申报表的分类装置,包括:
预设模块,用于预先利用深度学习神经网络训练出分类模型;
获取模块,用于获取目标申报表的各目标项目名称;
分类模块,用于将所述各目标项目名称输入至预设的分类模型中,并得出对应的分类结果。
为解决上述技术问题,本发明还提供一种申报表的分类设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现上述任一种申报表的分类方法的步骤。
为解决上述技术问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种申报表的分类方法的步骤。
本发明提供的一种申报表的分类方法,是预先利用深度学习神经网络训练出分类模型,再在需要对目标申报表进行分类时,利用预先训练出的分类模型进行分类,由于分类模型预先学习了各不同类型的财务报表的特征,因此相较于现有技术中通过将目标申报表与标准财务报表进行项目名称匹配以确定目标申报表的报表类型的方式,本方法能够排除掉无关符号、乱码以及表述上的差异等情况对分类的影响,进而提高对申报表进行分类的准确度。
为解决上述技术问题,本发明还提供了一种申报表的分类装置、设备及计算机可读存储介质,均具有上述有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种申报表的分类方法的流程图;
图2为本发明实施例提供的一种DAT数据结构的示意图;
图3为本发明实施例提供的一种申报表的分类装置的结构图;
图4为本发明实施例提供的一种申报表的分类设备的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例的核心是提供一种申报表的分类方法,能够准确地对申报表进行分类;本发明的另一核心是提供一种申报表的分类装置、设备及计算机可读存储介质,均具有上述有益效果。
为了使本领域技术人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
图1为本发明实施例提供的一种申报表的分类方法的流程图。如图1所示,一种申报表的分类方法包括:
S10:预先利用深度学习神经网络训练出分类模型;
S20:获取目标申报表的各目标项目名称;
S30:将各目标项目名称输入至预设的分类模型中,并得出对应的分类结果。
在本实施例中,首先利用各种不同类型的样本财务报表训练出分类模型。具体的,根据实际需求,获取各种类型的样本财务报表,包括资产负债表、利润表和现金流量表以及各对应的多种类型的子表,然后将大量的样本财务报表输入至深度学习神经网络中进行学习训练,学习得到各类型的财务报表的特征,得出分类模型。
然后,在需要确定出目标申报表对应的报表类型时,获取目标申报表的各目标项目名称,再将该目标申报表的各目标项目名称作为一个整体输入至预先训练出的分类模型中,该分类模型通过提取出目标申报表的各目标项目名称的特征,与预先学习到的各报表类型对应的特征进行比较,确定出与目标申报表对应的目标类型,即,得出目标申报表的分类结果。
可见,本发明实施例提供的一种申报表的分类方法,是预先利用深度学习神经网络训练出分类模型,再在需要对目标申报表进行分类时,利用预先训练出的分类模型进行分类,由于分类模型预先学习了各不同类型的财务报表的特征,因此相较于现有技术中通过将目标申报表与标准财务报表进行项目名称匹配以确定目标申报表的报表类型的方式,本方法能够排除掉无关符号、乱码以及表述上的差异等情况对分类的影响,进而提高对申报表进行分类的准确度。
在上述实施例的基础上,本实施例对技术方案作了进一步的说明和优化,具体的,本实施例在获取目标申报表的各目标项目名称之后,进一步包括:
分别计算各目标项目名称与各标准财务报表的标准项目名称的相似度;
确定出相似度超过预设阈值的目标项目名称,并利用标准项目名称更新目标项目名称;
对应的,将各目标项目名称输入至预设的分类模型中,并得出对应的分类结果的过程,具体为:
将更新后的各目标项目名称输入至预设的分类模型中,并得出对应的分类结果。
具体的,在本实施例中,是进一步先将各目标项目名称与各标准财务报表的标准项目名称进行相似度匹配,确定出各目标项目名称与各标准项目名称的相似度;然后,确定出相似度超过预设阈值的目标项目名称以及对应的标准项目名称,再利用该标准项目名称更新该目标项目名称。
具体来说,在本实施例中,是为了进一步预先修正目标申报表中存在无关符号、乱码以及表述上的差异的目标项目名称,首先确定出与目标项目名称的相似度超过预设阈值的标准项目名称。相似度超过预设阈值的目标项目名称和标准项目名称表示这两个文本实质上指的是相同的项目,只是目标项目名称中存在无关符号、乱码以及表述上的差异等异常,因此,利用标准项目名称修正目标申报表中的存在异常的目标项目名称。
在对目标申报表中存在异常的目标项目名称进行修正之后,再将更新之后的各目标项目名称输入至预设的分类模型中,得出对应的分类结果。
作为优选的实施方式,在本实施例中,分别计算各目标项目名称与各标准财务报表的标准项目名称的相似度的过程,具体包括:
将目标项目名称和标准项目名称分别切分为目标词语和标准词语;
依据目标词语和标准词语将目标项目名称和标准项目名称分别转换为对应的目标向量和标准向量;
将目标向量和标准向量拼接,并计算出对应的相似度。
具体的,在本实施例中,是通过一个计算短文本相似度的框架——短文本语义匹配(SimilarityNet,SimNet)来分别计算出各目标项目名称和各标准项目名称之间分别对应的相似度。
更具体的,在实际操作中,首先将目标项目名称和标准项目名称分别切分为对应的目标词语和标准词语;然后通过word2vec将目标词语和标准词语分别转换为对应的向量,从而得出目标项目名称对应的目标向量,以及标准项目名称对应的标准向量。其中,word2vec是一种利用bow模型将词语转换为向量的技术,在实际操作中,还可以利用其他技术将目标词语和标准词语转换为对应的向量,本实施例对具体实现方式不做限定。然后,通过CNN网络将目标向量和标准向量进行拼接,并计算出目标项目名称和标准项目名称对应的相似度。
可见,本实施例通过先将目标申报表中存在无关符号、乱码以及表述上的差异等异常的目标项目名称修正为标准项目名称,再利用预设的分类模型进行分类,能够进一步提高对目标申报表的分类准确度。
在上述实施例的基础上,本实施例对技术方案作了进一步的说明和优化,具体的,本实施例中,进一步包括:
将目标申报表中的各目标项目名称与预先按照预设数据结构存储的预存项目名称进行匹配;
将匹配成功的目标项目名称修改为对应的预存项目名称;
筛选出目标申报表中未修改的目标项目名称,并进入分别计算各目标项目名称与各标准财务报表的标准项目名称的相似度的步骤。
需要说明的是,在本实施例中,预先按照预设数据结构存储常用的标准项目名称,得出预存项目名称;然后将目标申报表中的各目标项目名称与预先存储的预存项目名称进行匹配。当确定出匹配成功的目标项目名称时,与该目标项目名称匹配的预存项目名称,即为该目标项目名称的标准项目名称,因此将该目标项目名称修改成对应的预存项目名称,即标准项目名称。然后,筛选出目标申报表中未修改的目标项目名称,也就是说,后续在分别将各目标项目名称与各标准财务报表的标准项目名称进行相似度匹配的步骤中,仅需要对本步骤中未修改的目标项目名称进行匹配操作。
作为一种优选的实施方式,本实施例中,按照预设数据结构存储预存项目名称的过程具体包括:
按照DAT数据结构存储预存项目名称。
具体的,如图2所示的一种DAT数据结构的示意图,本实施例通过预先按照DAT数据结构存储预先确定出的预存项目名称。可以理解的是,按照DAT(Double Array TRIE)数据结构存储预存项目名称后,假设用户需要查询目标项目名称“小企业会计准则B”,则可以按照DAT数据结构依次查询目标项目名称中的各字,若预存项目名称中存在“小企业会计准则”时,表示该预存项目名称与目标项目名称匹配成功,进而利用“小企业会计准则”修正目标项目名称“小企业会计准则B”。
可见,在本实施例中,将目标申报表中的各目标项目名称与预先按照预设数据结构存储的预存项目名称进行匹配;并将匹配成功的目标项目名称修改为对应的标准项目名称,再筛选出目标申报表中未修改的目标项目名称,并进入分别计算各目标项目名称与各标准财务报表的标准项目名称的相似度的步骤;并且,利用DAT数据结构存储预存项目名称;避免了很多重复的比对过程,能够更加快速便捷地修正目标申报表中存在无关符号、乱码以及表述上的差异等异常的目标项目名称,因此能够进一步提升对目标申报表进行分类的效率。
在上述实施例的基础上,本实施例对技术方案作了进一步的说明和优化,具体的,本实施例在获取目标申报表的各目标项目名称之后,进一步包括:
对目标申报表的各目标项目名称进行文本清洗操作。
在本实施例中,是在获取目标申报表的各目标项目名称之后,进一步对目标申报表的各目标项目名称进行文本清洗操作。需要说明的是,文本清洗操作可以包括去除目标项目名称中的无用字符或者停用词等词语或者一些预设标签等,进一步去除掉目标项目名称中可能对分类过程造成干扰的信息,因此,在对目标申报表的各目标项目名称进行文本清洗操作之后,再利用目标申报表的各目标项目名称进行分类,能够进一步提高分类的准确度。
在上述实施例的基础上,本实施例对技术方案作了进一步的说明和优化,具体的,本实施例在将各目标项目名称输入至预设的分类模型中,并得出对应的分类结果之后,进一步包括:
记录目标申报表的标识信息以及目标申报表对应的报表类型。
在本实施例中,是在确定出目标申报表所对应的报表类型之后,进一步记录目标申报表以及对应的报表类型。具体的,可以根据目标申报表的标识信息以及对应的报表类型,按照确定出目标申报表的报表类型的时间依次进行记录。在实际操作中,具体可以是以表格的形式进行记录,或者也可以是以文本或者其他的方式进行记录,本实施例对此不做限定。
因此,在后续的操作中,可以根据标识信息快速准确地查找目标申报表对应的报表类型,进一步提升用户后续查找操作的便捷度,进一步提升用户的使用体验,
上文对于本发明提供的一种申报表的分类方法的实施例进行了详细的描述,本发明还提供了一种与该方法对应的申报表的分类装置、设备及计算机可读存储介质,由于装置、设备及计算机可读存储介质部分的实施例与方法部分的实施例相互照应,因此装置、设备及计算机可读存储介质部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
图3为本发明实施例提供的一种申报表的分类装置的结构图,如图3所示,一种申报表的分类装置包括:
预设模块31,用于预先利用深度学习神经网络训练出分类模型;
获取模块32,用于获取目标申报表的各目标项目名称;
分类模块33,用于将各目标项目名称输入至预设的分类模型中,并得出对应的分类结果。
本发明实施例提供的申报表的分类装置,具有上述申报表的分类方法的有益效果。
作为优选的实施方式,申报表的分类装置进一步包括:
计算模块,用于分别计算各目标项目名称与各标准财务报表的标准项目名称的相似度;
更新模块,用于确定出相似度超过预设阈值的目标项目名称,并利用标准项目名称更新目标项目名称;
对应的,分类模块33具体为:
分类子模块,用于将更新后的各目标项目名称输入至预设的分类模型中,并得出对应的分类结果。
作为优选的实施方式,申报表的分类装置进一步包括:
匹配模块,用于将目标申报表中的各目标项目名称与预先按照预设数据结构存储的预存项目名称进行匹配;
修改模块,用于将匹配成功的目标项目名称修改为对应的预存项目名称;
筛选模块,用于筛选出目标申报表中未修改的目标项目名称,并调用计算模块。
作为优选的实施方式,计算模块具体包括:
分词子模块,用于将目标项目名称和标准项目名称分别切分为目标词语和标准词语;
转换子模块,用于依据目标词语和标准词语将目标项目名称和标准项目名称分别转换为对应的目标向量和标准向量;
计算子模块,用于将目标向量和标准向量拼接,并计算出对应的相似度。
作为优选的实施方式,匹配模块具体包括:
存储子模块,用于按照DAT数据结构存储预存项目名称。
作为优选的实施方式,进一步包括:
清洗模块,用于在获取目标申报表的各目标项目名称之后,对目标申报表的各目标项目名称进行文本清洗操作。
作为优选的实施方式,进一步包括:
记录模块,用于在将各目标项目名称输入至预设的分类模型中,并得出对应的分类结果之后,记录目标申报表的标识信息以及目标申报表对应的报表类型。
图4为本发明实施例提供的一种申报表的分类设备的结构图,如图4所示,一种申报表的分类设备包括:
存储器41,用于存储计算机程序;
处理器42,用于执行计算机程序时实现如上述申报表的分类方法的步骤。
本发明实施例提供的申报表的分类设备,具有上述申报表的分类方法的有益效果。
为解决上述技术问题,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述申报表的分类方法的步骤。
本发明实施例提供的计算机可读存储介质,具有上述申报表的分类方法的有益效果。
以上对本发明所提供的申报表的分类方法、装置、设备及计算机可读存储介质进行了详细介绍。本文中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

Claims (10)

1.一种申报表的分类方法,其特征在于,包括:
预先利用深度学习神经网络训练出分类模型;
获取目标申报表的各目标项目名称;
将所述各目标项目名称输入至预设的分类模型中,并得出对应的分类结果。
2.根据权利要求1所述的方法,其特征在于,在所述获取目标申报表的各目标项目名称之后,进一步包括:
分别计算各所述目标项目名称与各标准财务报表的标准项目名称的相似度;
确定出相似度超过预设阈值的目标项目名称,并利用标准项目名称更新所述目标项目名称;
对应的,所述将所述各目标项目名称输入至预设的分类模型中,并得出对应的分类结果的过程,具体为:
将更新后的各所述目标项目名称输入至预设的所述分类模型中,并得出对应的分类结果。
3.根据权利要求2所述的方法,其特征在于,进一步包括:
将所述目标申报表中的各目标项目名称与预先按照预设数据结构存储的预存项目名称进行匹配;
将匹配成功的目标项目名称修改为对应的预存项目名称;
筛选出所述目标申报表中未修改的所述目标项目名称,并进入所述分别计算各所述目标项目名称与各标准财务报表的标准项目名称的相似度的步骤。
4.根据权利要求2所述的方法,其特征在于,所述分别计算各所述目标项目名称与各标准财务报表的标准项目名称的相似度的过程,具体包括:
将所述目标项目名称和所述标准项目名称分别切分为目标词语和标准词语;
依据所述目标词语和所述标准词语将所述目标项目名称和所述标准项目名称分别转换为对应的目标向量和标准向量;
将所述目标向量和所述标准向量拼接,并计算出对应的相似度值。
5.根据权利要求3所述的方法,其特征在于,按照预设数据结构存储所述预存项目名称的过程具体包括:
按照DAT数据结构存储所述预存项目名称。
6.根据权利要求1至5任一项所述的方法,其特征在于,在所述获取目标申报表的各目标项目名称之后,进一步包括:
对所述目标申报表的各目标项目名称进行文本清洗操作。
7.根据权利要求6所述的方法,其特征在于,在所述将所述各目标项目名称输入至预设的分类模型中,并得出对应的分类结果之后,进一步包括:
记录所述目标申报表的标识信息以及所述目标申报表对应的报表类型。
8.一种申报表的分类装置,其特征在于,包括:
预设模块,用于预先利用深度学习神经网络训练出分类模型;
获取模块,用于获取目标申报表的各目标项目名称;
分类模块,用于将所述各目标项目名称输入至预设的分类模型中,并得出对应的分类结果。
9.一种申报表的分类设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述的申报表的分类方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的申报表的分类方法的步骤。
CN201911420087.7A 2019-12-31 2019-12-31 一种申报表的分类方法、装置、设备及存储介质 Pending CN111190973A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911420087.7A CN111190973A (zh) 2019-12-31 2019-12-31 一种申报表的分类方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911420087.7A CN111190973A (zh) 2019-12-31 2019-12-31 一种申报表的分类方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN111190973A true CN111190973A (zh) 2020-05-22

Family

ID=70707972

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911420087.7A Pending CN111190973A (zh) 2019-12-31 2019-12-31 一种申报表的分类方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111190973A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112530597A (zh) * 2020-11-26 2021-03-19 山东健康医疗大数据有限公司 基于Bert字模型的数据表分类方法、装置及介质
CN113010503A (zh) * 2021-03-01 2021-06-22 广州智筑信息技术有限公司 一种基于深度学习的工程造价数据智能解析方法及***
CN114564928A (zh) * 2022-02-25 2022-05-31 北京圣博润高新技术股份有限公司 用于办公***的文件管理方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140279328A1 (en) * 2013-03-18 2014-09-18 Laxmisekar Pendem Method and system automates a comprehensive, on-going survey of forward-looking financial estimates entering projected financial statements and valuation calculations
CN108241741A (zh) * 2017-12-29 2018-07-03 深圳市金立通信设备有限公司 一种文本分类方法、服务器及计算机可读存储介质
CN108563783A (zh) * 2018-04-25 2018-09-21 张艳 一种基于大数据的财务分析管理***及方法
CN110389990A (zh) * 2019-07-25 2019-10-29 齐鲁工业大学 一种基于大数据的综合财务审计***
CN110442722A (zh) * 2019-08-13 2019-11-12 北京金山数字娱乐科技有限公司 分类模型训练的方法及装置、数据分类的方法及装置
CN110543475A (zh) * 2019-08-29 2019-12-06 深圳市原点参数科技有限公司 一种基于机器学习的财务报表数据自动识别和分析方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140279328A1 (en) * 2013-03-18 2014-09-18 Laxmisekar Pendem Method and system automates a comprehensive, on-going survey of forward-looking financial estimates entering projected financial statements and valuation calculations
CN108241741A (zh) * 2017-12-29 2018-07-03 深圳市金立通信设备有限公司 一种文本分类方法、服务器及计算机可读存储介质
CN108563783A (zh) * 2018-04-25 2018-09-21 张艳 一种基于大数据的财务分析管理***及方法
CN110389990A (zh) * 2019-07-25 2019-10-29 齐鲁工业大学 一种基于大数据的综合财务审计***
CN110442722A (zh) * 2019-08-13 2019-11-12 北京金山数字娱乐科技有限公司 分类模型训练的方法及装置、数据分类的方法及装置
CN110543475A (zh) * 2019-08-29 2019-12-06 深圳市原点参数科技有限公司 一种基于机器学习的财务报表数据自动识别和分析方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112530597A (zh) * 2020-11-26 2021-03-19 山东健康医疗大数据有限公司 基于Bert字模型的数据表分类方法、装置及介质
CN113010503A (zh) * 2021-03-01 2021-06-22 广州智筑信息技术有限公司 一种基于深度学习的工程造价数据智能解析方法及***
CN114564928A (zh) * 2022-02-25 2022-05-31 北京圣博润高新技术股份有限公司 用于办公***的文件管理方法、装置、设备及存储介质
CN114564928B (zh) * 2022-02-25 2024-02-27 北京圣博润高新技术股份有限公司 用于办公***的文件管理方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN107122346B (zh) 一种输入语句的纠错方法及装置
CN108256074B (zh) 校验处理的方法、装置、电子设备和存储介质
CN109189767B (zh) 数据处理方法、装置、电子设备及存储介质
US20160267359A1 (en) Image object category recognition method and device
CN112070138B (zh) 多标签混合分类模型的构建方法、新闻分类方法及***
CN109933661B (zh) 一种基于深度生成模型的半监督问答对归纳方法和***
CN111190973A (zh) 一种申报表的分类方法、装置、设备及存储介质
CN113407694A (zh) 客服机器人知识库歧义检测方法、装置及相关设备
CN111338692B (zh) 基于漏洞代码的漏洞分类方法、装置及电子设备
CN108027814A (zh) 停用词识别方法与装置
JP2007157058A (ja) 分類モデル学習装置、分類モデル学習方法、及び分類モデルを学習するためのプログラム
CN114818643A (zh) 一种保留特定业务信息的日志模板提取方法
CN110990627A (zh) 一种知识图谱构建的方法、装置、电子设备及介质
CN111782793A (zh) 智能客服处理方法和***及设备
CN113934848B (zh) 一种数据分类方法、装置和电子设备
US20230214679A1 (en) Extracting and classifying entities from digital content items
CN113761925B (zh) 基于噪声感知机制的命名实体识别方法、装置及设备
JP2023145767A (ja) 語彙抽出支援システムおよび語彙抽出支援方法
CN110489517B (zh) 虚拟助理的自动学习方法及***
JP2010272004A (ja) 判別装置及び判別方法、並びにコンピューター・プログラム
CN114139636B (zh) 异常作业处理方法及装置
CN111881266B (zh) 一种应答方法及装置
CN112015897B (zh) 语料的意图标注方法、装置、设备及存储介质
CN113722431A (zh) 命名实体关系识别方法、装置、电子设备及存储介质
CN113010339A (zh) 联机交易测试中故障自动处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination