CN118193652B

CN118193652B - 一种资产回收管理用资产类型识别方法

Info

Publication number: CN118193652B
Application number: CN202410586966.1A
Authority: CN
Inventors: 韩燕超
Original assignee: Yunnan Chenzhiyu Technology Co ltd; Yunnan Youlanda Technology Service Co ltd
Current assignee: Yunnan Chenzhiyu Technology Co ltd; Yunnan Youlanda Technology Service Co ltd
Priority date: 2024-05-13
Filing date: 2024-05-13
Publication date: 2024-07-09
Anticipated expiration: 2044-05-13
Also published as: CN118193652A

Abstract

本发明涉及图像识别技术领域，具体涉及一种资产回收管理用资产类型识别方法，包括如下步骤：S1：通过扫描仪扫描记录有资产信息的档案信息，将档案信息转换为图像文件；S2：利用OCR技术将档案信息的图像文件转化为可处理的数字信息，并对得到的数字信息进行识别；S3：将识别后的数字信息与数据库中的资产信息进行匹配，确认资产关键信息；S4：采用模糊匹配策略计算提取出档案信息与数据库中所有资产信息的相似度，进一步确定资产类型。本发明引入模糊匹配技术，允许在一定程度上克服OGR技术识别错误带来的挑战，即使识别结果存在一定程度的误差，也能通过模糊匹配找到与之相近的有效匹配项，大大提高了匹配的成功率和识别资产类型的精确度。

Description

一种资产回收管理用资产类型识别方法

技术领域

本发明涉及图像识别技术领域，尤其为一种资产回收管理用资产类型识别方法。

背景技术

在资产管理领域，尤其是资产回收管理中，对资产类型进行准确识别是至关重要的。这不仅涉及到资产的价值评估，还包括了资产的分类、维护、处置以及合规性等多个方面。资产类型识别方法通常结合了物理属性和数字技术，以确保资产管理的有效性和透明性，为了提高识别效率和准确性，现代资产管理***越来越多地采用了条形码、二维码和射频识别标签等技术。这些技术使得资产跟踪更为自动化和精确，减少了人工输入错误和处理时间，此外，随着人工智能和机器学习技术的发展，图像识别和数据分析也被应用于资产类型识别中，通过训练模型来识别资产的视觉特征，可以快速区分不同类型的资产，并对其进行分类。传统方法依赖大量的人工干预，包括手动输入数据、手动核对识别结果等，耗费时间和人力资源，效率低下；且传统方法在面对识别错误或不确定性时缺乏鲁棒性，一旦出现误差，可能会导致整个识别过程失败，因此，提出新的一种资产回收管理用资产类型识别方法尤为重要。

发明内容

本发明的主要目的在于提供一种资产回收管理用资产类型识别方法，以解决相关技术中提出的在面对识别错误或不确定性时缺乏鲁棒性和大量人工干预效率低的问题。

为了实现上述目的，根据本发明的一个方面，提供了一种资产回收管理用资产类型识别方法，包括如下步骤：

S1：通过扫描仪扫描记录有资产信息的档案信息，将档案信息转换为图像文件；

其中，档案信息包括资产名称和资产型号；

S2：利用OCR技术将档案信息的图像文件转化为可处理的数字信息，并对得到的数字信息进行识别；

S3：将识别后的数字信息与数据库中的资产信息进行匹配，确认资产关键信息；

其中，资产关键信息包括资产类型、资产编号、购买日期和资产价值；

S4：采用模糊匹配策略计算提取出档案信息与数据库中所有资产信息的相似度，进一步确定资产类型。

进一步地，S2的具体步骤如下：

S21：对S1中的档案信息的图像进行预处理；

S22：识别档案信息的图像文件中的文本区域；

S23：将文本区域的字符串与内置字典进行匹配，以识别每个字符串。

进一步地，S21中，预处理包括调整档案信息的图像亮度、对比度、颜色平衡和去除噪声。

进一步地，S22的具体步骤如下：

S221：将档案信息的彩色图像转换为灰色图像；

S222：对灰度图像进行水平和垂直投影，分别计算每一行和每一列的像素值之和，得到水平和垂直投影直方图；

S223：根据投影直方图的峰值和谷值，确定阈值将档案信息的图像分割成文本区域和非文本区域；

S224：根据阈值化处理的结果，提取出文本区域的位置信息。

进一步地，S221的表达式如下：

I(y，x)＝0.2989×R(y，x)+0.5870×G(y，x)+0.1140×B(y，x)

其中，I(y，x)为档案信息的灰度图像在(y，x)处的像素值；原始色彩的像素值为(R(y，x)，G(y，x)，B(y，x))，0.2989、0.5870和0.1140分别为R、G、B的权重。

进一步地，S222的表达式如下：

其中，H(y)为水平投影直方图；V(x)为垂直投影直方图；M是档案信息的图像的高度；N是档案信息的图像的宽度；I(y，x)表示档案信息的图像在(y，x)处的像素值。

进一步地，S223的计算步骤如下：

通过阈值T将档案信息的图像分为两个子区域：一个包含小于等于T的像素，另一个包含大于T的像素；

其中，peak_H和valley_H分别是水平投影直方图的峰值和谷值，peak_V和valley_V分别是垂直投影直方图的峰值和谷值；

其中，H₁为小于等于阈值T的子区域的熵；H₂为大于阈值T的子区域的熵；n_i表示灰度级i的像素数目；N表示档案信息的图像总像素数目；N₁表示小于等于阈值T的子区域的总像素数目；N₂表示大于阈值T的子区域的总像素数目；档案信息的图像灰度级范围是[0，L-1]；H(T)表示总熵；L为档案信息图像的灰度级总数；

调整垂直投影直方图和水平投影直方图的峰值和谷值，找到使得总熵最大或最小的阈值T，即为最佳阈值；

根据最佳阈值将灰度图像进行二值化处理：

其中，Binary Image(y，x)＝1为文本区域；Binary Image(y，x)＝0为非文本区域。

进一步地，S3的具体步骤如下：

S31：连接到包含资产信息的数据库；

S32：使用提取的数字信息作为查询条件，在数据库中检索相关资产信息；

S33：根据匹配的数据库中的信息得到资产的关键信息；

S34：如果提取的数字信息在数据库中检索失败，则执行S4。

进一步地，在S4中，模糊匹配策略的具体步骤如下：

S41：准备需要匹配的OCR识别后的文本字符串；

S42：对数据库中的参考匹配项进行清洗和标准化；

S43：利用编辑距离算法对每个文本字符串计算其与数据库中参考匹配项之间的相似度；

S44：设定阈值，当相似度超过设定阈值则找到有效匹配项；

S45：如果存在多个有效匹配项，对所有有效匹配项按照相似度由高至低排列，选择相似度最高的有效匹配项。

进一步地，在S43中，编辑距离算法的计算表达式如下：

其中，dp[i][j]表示str1的前i个字符与str2的前j个字符之间的编辑距离；str1表示OCR识别后检索失败的文本字符串；str2为数据库中参考匹配项的字符串；

通过编辑距离算法的计算表达式，可以得出dp[L1][L2]，L1和L2分别为str1和str2的字符串长度；根据编辑距离，将其转换为相似度值：

其中，S为两个字符串的相似度。

与现有技术相比，本发明具有以下有益效果：

1.本发明通过OCR技术计算投影直方图的峰值和谷值，结合熵自动确定最佳阈值进行图像分割和二值化处理，从而有效地提取出文本区域，有助于准确识别档案信息中的文本内容，为后续的资产类型识别提供准确的数据支持，提高了资产回收管理的效率和精度；

2.本发明引入模糊匹配技术，允许在一定程度上克服OCR技术识别错误带来的挑战，即使识别结果存在一定程度的误差，也能通过模糊匹配找到与之相近的有效匹配项，大大提高了匹配的成功率和识别资产类型的精确度。

附图说明

图1为本发明整体的方法流程图。

具体实施方式

为更进一步阐述本发明为实现预定发明目的所采取的技术手段及功效，以下结合附图及较佳实施例，对依据本发明的具体实施方式、结构、特征及其功效，详细说明如后。

请参阅图1，本实施例提供一种资产回收管理用资产类型识别方法，包括如下步骤：

其中，档案信息包括资产名称和资产型号；

S2的具体步骤如下：

S21：对S1中的档案信息的图像进行预处理；

S22：识别档案信息的图像文件中的文本区域；

S21中，预处理包括调整档案信息的图像亮度、对比度、颜色平衡和去除噪声。

S22的具体步骤如下：

S221：将档案信息的彩色图像转换为灰色图像；

S224：根据阈值化处理的结果，提取出文本区域的位置信息。

S221的表达式如下：

I(y，x)＝0.2989×R(y，x)+0.5870×G(y，x)+0.1140×B(y，x)

S222的表达式如下：

S223的计算步骤如下：

根据最佳阈值将灰度图像进行二值化处理：

S3的具体步骤如下：

S31：连接到包含资产信息的数据库；

S33：根据匹配的数据库中的信息得到资产的关键信息；

S34：如果提取的数字信息在数据库中检索失败，则执行S4。

在S4中，模糊匹配策略的具体步骤如下：

S41：准备需要匹配的OCR识别后的文本字符串；

S42：对数据库中的参考匹配项进行清洗和标准化；

S44：设定阈值，当相似度超过设定阈值则找到有效匹配项；

在S43中，编辑距离算法的计算表达式如下：

其中，S为两个字符串的相似度。

在本实施例中，档案信息为纸质材料，上面包括资产名称和资产型号，通过扫描仪扫描记录有资产信息的档案信息，将档案信息转换为图像文件，通过OCR技术识别出图片中的文字，然后通过数据库进行检索，检索出产品名称与型号会出现产品其他的关键信息，其中就包括资产的类型，但是OCR技术识别出的文字会有误差，存在检索失败的问题，因此又采用模糊匹配策略将识别出的错误的字符串与数据库中的参考匹配项进行匹配，选择相似度最高的有效匹配项，进一步确认资产的类型。具体方法如下：

利用OCR技术将档案信息的图像文件转化为可处理的数字信息，并对得到的数字信息进行识别；具体为：首先，对档案信息的图像进行预处理；包括调整档案信息的图像亮度、对比度、颜色平衡和去除噪声。通过调整图像的亮度和对比度可以增强图像的视觉效果，同时调整颜色平衡可以使图像的颜色更加真实；噪声会降低图像质量，因此需要去除图像中的噪声。

接着，识别档案信息的图像文件中的文本区域；先将档案信息的彩色图像转换为灰色图像；通常涉及到将RGB(红、绿、蓝)三个通道的颜色信息合并成一个灰度值。使用加权平均法，将不同通道的像素值乘以不同的权重，然后相加得到灰度值，表达式如下：

I(y，x)＝0.2989×R(y，x)+0.5870×G(y，x)+0.1140×B(y，x)

其中，I(y，x)为档案信息的灰度图像在(y，x)处的像素值；原始色彩的像素值为(R(y，x)，G(y，x)，B(y，x))，0.2989、0.5870和0.1140分别为R、G、B的权重。这些权重是根据人眼对不同颜色的敏感度而选择的，以确保灰度图像在视觉上更符合人类感知。通过这种加权平均的方法，可以将彩色图像转换为灰度图像，保留了图像的亮度信息，同时减少了数据量。

然后对灰度图像进行水平和垂直投影，分别计算每一行和每一列的像素值之和，得到水平和垂直投影直方图；表达式如下：

根据投影直方图的峰值和谷值，对于每个像素，检查其周围的邻域，如果它是邻域中的最大值，则被认为是峰值；如果它是邻域中的最小值，则被认为是谷值；然后确定阈值将档案信息的图像分割成文本区域和非文本区域；确定阈值使用的是熵法，熵法利用图像的灰度直方图计算图像的熵，并寻找使得熵最大化或最小化的阈值，以实现图像分割，计算步骤如下：

其中，peak_H和valley_H分别是水平投影直方图的峰值和谷值，peak_V和valley_V分别是垂直投影直方图的峰值和谷值；该阈值T不是最终的阈值；

调整垂直投影直方图和水平投影直方图的峰值和谷值，直至找到使得总熵最大或最小的阈值T，即为最佳阈值；这样可以在图像处理中更精确地确定合适的阈值，以实现图像分割；

根据最佳阈值将灰度图像进行二值化处理：

其中，Binary Image(y，x)＝1为文本区域；Binary Image(y，x)＝0为非文本区域，这样就可以根据阈值化处理的结果，提取出文本区域的位置信息。最后，将文本区域的字符串与内置字典进行匹配，以识别每个字符串。

进一步地，将识别后的数字信息与数据库中的资产信息进行匹配，确认资产关键信息，资产关键信息包括资产类型、资产编号、购买日期和资产价值；先连接到包含资产信息的数据库；使用提取的数字信息作为查询条件，在数据库中检索相关资产信息；根据匹配的数据库中的信息得到资产的关键信息，其中就包括资产的类型；如果提取的数字信息在数据库中检索失败，则执行S4。

由于图像质量、字体多样性、光照条件等因素的影响，OCR识别过程中可能会产生错误或不确定性，导致识别结果不够精准，不能直接匹配到已知数据库中的参考匹配项，因此引入模糊匹配策略，模糊匹配允许在一定程度上容忍识别结果与标准数据之间的差异，比如拼写错误、缺少部分字符、顺序颠倒等。模糊匹配策略执行时先准备需要匹配的OCR识别后的文本字符串；然后对数据库中的参考匹配项进行清洗和标准化；

利用编辑距离算法对每个文本字符串计算其与数据库中参考匹配项之间的相似度；编辑距离算法的递推关系能够计算出两个字符串之间的编辑距离，即通过一系列***、删除和替换操作将一个字符串转换为另一个字符串所需的最小操作数，编辑距离可以用作衡量两个字符串之间相似度的指标，计算表达式如下：

上述编辑距离算法的计算表达式的详细步骤为：先初始化一个二维矩阵dp，大小为(L1+1)×(L2+1)；用于存储计算过程中的中间结果，方便后续的计算和存储编辑距离；

然后填充边界条件：当i＝0且j＝0时，dp[i][j]＝0；当i＝0且j>0时，dp[i][j]＝j；当i>0且j＝0时，dp[i][j]＝i。即当一个字符串为空时，另一个字符串的编辑距离为其长度，这是递推关系的基础；

当i>0且j>0时，递推计算dp[i][j]；如果str1[i]＝str2[j]，则dp[i][j]＝dp[i-1][j-1]；否则，dp[i][j]＝min(dp[i-1][j]+1，dp[i][j-1]+1，dp[i-1][j-1]+1)；即当前位置的编辑距离取决于其左、上、左上三个位置的编辑距离。如果当前字符相同，则编辑距离不变；否则，考虑***、删除和替换操作后的最小编辑距离。

最终通过上述编辑距离算法的计算表达式，可以得出dp[L1][L2]，L1和L2分别为str1和str2的字符串长度，即通过***、删除和替换操作将一个字符串转换为另一个字符串所需的最小操作数；根据编辑距离，将其转换为相似度值，相似度值标准化到0到1的范围内，方便比较不同字符串间的相似度，使得结果更易于解释和比较：

其中，S为两个字符串的相似度。当编辑距离为0时，相似度为1，表示两个字符串完全相同；而当编辑距离接近最大可能编辑距离时，相似度趋近于0，表示两个字符串差异很大。也就是越接近1表示两个字符串越相似，越接近0表示两个字符串越不相似，通过相似度值，我们可以更方便地比较不同字符串之间的相似程度，无需直接比较编辑距离的数值大小，从而更直观地了解它们之间的关系。

因此，可以在匹配之前设定阈值，阈值范围在0-1之间，当相似度超过设定阈值则找到有效匹配项；如果存在多个有效匹配项，对所有有效匹配项按照相似度由高至低排列，选择相似度最高的有效匹配项。提取该匹配项即能够获得到资产类型。

以上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制，虽然本发明已以较佳实施例揭示如上，然而并非用以限定本发明，任何本领域技术人员，在不脱离本发明技术方案范围内，当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例，但凡是未脱离本发明技术方案内容，依据本发明的技术实质对以上实施例所作的任何间接修改、等同变化与修饰，均仍属于本发明技术方案的范围内。

Claims

1.一种资产回收管理用资产类型识别方法，其特征在于，包括如下步骤：

其中，档案信息包括资产名称和资产型号；

S2的具体步骤如下：

S21：对S1中的档案信息的图像进行预处理；

S22：识别档案信息的图像文件中的文本区域；

S23：将文本区域的字符串与内置字典进行匹配，以识别每个字符串；

S3：将识别后的数字信息与数据库中的资产信息进行匹配，确认资产关键信息，如果提取的数字信息在数据库中检索失败，则执行S4；

S4：采用模糊匹配策略计算提取出档案信息与数据库中所有资产信息的相似度，进一步确定资产类型；

在S4中，模糊匹配策略的具体步骤如下：

S41：准备需要匹配的OCR识别后的文本字符串；

S42：对数据库中的参考匹配项进行清洗和标准化；

S44：设定阈值，当相似度超过设定阈值则找到有效匹配项；

S45：如果存在多个有效匹配项，对所有有效匹配项按照相似度由高至低排列，选择相似度最高的有效匹配项；

在S43中，编辑距离算法的计算表达式如下：

其中，S为两个字符串的相似度。

2.根据权利要求1所述的一种资产回收管理用资产类型识别方法，其特征在于，S21中，预处理包括调整档案信息的图像亮度、对比度、颜色平衡和去除噪声。

3.根据权利要求2所述的一种资产回收管理用资产类型识别方法，其特征在于，S22的具体步骤如下：

S221：将档案信息的彩色图像转换为灰色图像；

S224：根据阈值化处理的结果，提取出文本区域的位置信息。

4.根据权利要求3所述的一种资产回收管理用资产类型识别方法，其特征在于，S221的表达式如下：

I(y，x)＝0.2989×R(y，x)+0.5870×G(y，x)+0.1140×B(y，x)

5.根据权利要求4所述的一种资产回收管理用资产类型识别方法，其特征在于，S222的表达式如下：

6.根据权利要求5所述的一种资产回收管理用资产类型识别方法，其特征在于，S223的计算步骤如下：

根据最佳阈值将灰度图像进行二值化处理：

7.根据权利要求6所述的一种资产回收管理用资产类型识别方法，其特征在于，S3的具体步骤如下：

S31：连接到包含资产信息的数据库；

S33：根据匹配的数据库中的信息得到资产的关键信息；

S34：如果提取的数字信息在数据库中检索失败，则执行S4。