CN104715359B - 一种结构化建设行业材料文件及材料数据识别管理方法 - Google Patents

一种结构化建设行业材料文件及材料数据识别管理方法 Download PDF

Info

Publication number
CN104715359B
CN104715359B CN201510160769.4A CN201510160769A CN104715359B CN 104715359 B CN104715359 B CN 104715359B CN 201510160769 A CN201510160769 A CN 201510160769A CN 104715359 B CN104715359 B CN 104715359B
Authority
CN
China
Prior art keywords
file
data
construction industry
valid data
title
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510160769.4A
Other languages
English (en)
Other versions
CN104715359A (zh
Inventor
陈红仙
张晓�
张涛
贺阳
谭厚能
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Con-Com Polytron Technologies Inc
Original Assignee
Guangdong Con-Com Polytron Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Con-Com Polytron Technologies Inc filed Critical Guangdong Con-Com Polytron Technologies Inc
Priority to CN201510160769.4A priority Critical patent/CN104715359B/zh
Publication of CN104715359A publication Critical patent/CN104715359A/zh
Application granted granted Critical
Publication of CN104715359B publication Critical patent/CN104715359B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种结构化建设行业材料文件及材料数据识别管理方法,其对结构化建设行业材料文件进行文件类型检测及转换,确定出有效类型文件,使得到的文件可以按统一方式处理;对所述效类型文件进行检测,确定出有效数据文件,以提高后续识别及管理的效率;运用预设的国标材料数据库从所述有效数据文件中识别出所述有效数据文件的材料名称和材料属性值,实现了材料数据的准确识别;所述材料名称和材料属性值形成关联属性数据,便于后续查询及使用,有助于提高查询及使用的效率及精确性。本发明可以自动完成材料文件及材料数据的识别及管理,而不需要过多依赖人工操作,能够大大提高工作效率,并且显著地降低了运营成本。

Description

一种结构化建设行业材料文件及材料数据识别管理方法
技术领域
本发明属于建设行业材料文件处理领域,尤其涉及一种结构化建设行业材料文件及材料数据识别管理方法。
背景技术
目前,建设行业材料多达几十万种,材料来源呈多样化,且记载材料数据的材料文件格式各异,因此难以进行统一规范及管理。在行业信息化管理及使用过程中,如何将材料数据从材料文件中甄别、判断材料属性是否完全,及对同类材料进行去重、归类,一直是行业的痛点。
现有技术中针对建设行业材料文件及材料数据的识别及管理主要还是基于人工操作的方式,即对各类型材料文件进行收集后,人工将甄选的材料数据归并入分类的Excel文件进行保存,以备后续查阅及使用。但是,这种方式显然存在工作效率低下、运营成本过高等缺陷。
发明内容
本发明针对现有技术中存在的工作效率低、运营成本过高等缺陷,提出一种效率高且能够节约运营成本的结构化建设行业材料文件及材料数据识别管理方法。
本发明提出的一种结构化建设行业材料文件及材料数据识别管理方法,其包括以下步骤:
检测接收到的结构化建设行业材料文件的文件类型是否属于预设文件类型,若是,则确定其为有效类型文件;若否,则将其转换为预设文件类型,以形成有效类型文件;
检测所述有效类型文件的内容,确定其是否存在三列以上非空数据,若是,则确定其为有效数据文件;
读取所述有效数据文件内容中的材料数据,将所述材料数据与预设的国标材料数据库中的材料名称进行匹配,得出所述有效数据文件的材料名称,并标记出其在所述有效数据文件中的位置;
从所述国标材料数据库中调取与所述有效数据文件的材料名称相应的材料属性单位,根据所述材料属性单位,读取所述有效数据文件中材料名称的位置之后的材料数据,得出所述有效数据文件的材料属性值;
基于所述有效数据文件的材料名称和材料属性值,形成关联属性数据并保存。
进一步,读取所述有效数据文件内容中的材料数据之前还包括以下步骤:
检测所述有效类型文件中表头的位置,并对所述表头的内容进行词义分析,确认出表头对应的数据列所代表的信息;
所述读取所述有效数据文件内容中的材料数据包括:根据所述数据列所代表的信息,相应从所述数据列中读取所需的材料数据。
进一步,从所述数据列中读取所需的材料数据之后,还包括以下步骤:
通过字符识别将所述数据列中的无效数据进行清洗;
将所述材料数据与预设的国标材料数据库中的材料名称进行匹配的步骤具体为:将所述材料数据中的有效数据与预设的国标材料数据库中的材料名称进行匹配。
进一步,通过字符识别将所述数据列中的无效数据进行清洗的步骤具体包括:通过字符识别,对所述数据列中的空行或无效字符做相应的清除处理,并相应进行全角/半角转换。
进一步,所述检测所述有效类型文件中表头的位置之后,还包括以下步骤:
检测是否存在合并单元格;若是,则判断所述合并单元格是否为规格列;若是,则对其进行规范拆分;
进一步,对所述表头的内容进行词义分析之后,还包括以下步骤:
基于所述词义分析,确定是否存在多个价格表头;若是,则根据预设的优先顺序选取对应的数据列中的优选价格数据;
所述得出所述有效数据文件的材料属性值的步骤中,将所述优选价格数据作为所述有效数据文件在价格方面的材料属性值。
进一步,所述检测所述有效类型文件中表头的位置的步骤具体为:检测所述表头所处的列数及行数,以确定所述表头的位置。
进一步,所述结构化建设行业材料文件包括:以XML、Excel、Word或PDF格式呈现的建设行业材料文件。
进一步,所述预设文件类型具体为Excel文件类型。
有益效果:本发明提出的结构化建设行业材料文件及材料数据识别管理方法,其对结构化建设行业材料文件进行文件类型检测及转换,确定出有效类型文件,使得到的文件可以按统一方式处理;对所述效类型文件进行检测,确定出有效数据文件,以提高后续识别及管理的效率;运用预设的国标材料数据库从所述有效数据文件中识别出所述有效数据文件的材料名称和材料属性值,实现了材料数据的准确识别;所述材料名称和材料属性值形成关联属性数据,便于后续查询及使用,有助于提高查询及使用的效率及精确性。本发明可以自动完成材料文件及材料数据的识别及管理,而不需要过多依赖人工操作,能够大大提高工作效率,并且显著地降低了运营成本。
附图说明
图1为本发明提出的一种结构化建设行业材料文件及材料数据识别管理方法实施例的主要流程示意图。
图2为本发明提出的一种结构化建设行业材料文件及材料数据识别管理方法实施例的详细流程示意图。
具体实施方式
为了便于本领域技术人员理解,下面将结合附图以及实施例对本发明进行进一步描述。
本发明提出的一种结构化建设行业材料文件及材料数据识别管理方法实施例,可由具备关系型数据库存储结构的单台电脑、局域网电脑及广域互联网电脑来实施,请参阅图1,其主要包括以下步骤S100至S500:
S100、检测接收到的结构化建设行业材料文件的文件类型是否属于预设文件类型,若是,则确定其为有效类型文件;若否,则将其转换为预设文件类型,以形成有效类型文件。
步骤S100中,所述结构化建设行业材料文件具体是指:诸如XML、Excel、Word或PDF等已经数字化、格式化的建设行业材料文件,而不是像TXT之类没格式化的、纯文本的文件。
所述预设文件类型是指可以进行统一处理的文件类型,本实施例中的预设文件类型以Excel文件类型为例,以便于材料数据的识别及处理。
因此,在步骤S100中,假设接收到(用户上传)的结构化建设行业材料文件为Excel文件,则确定其为有效类型文件,不需要进行格式转换;假设接收到(用户上传)的结构化建设行业材料文件为PDF文件,则需将其转换成有效类型文件,即转换成Excel文件。
S200、检测所述有效类型文件的内容,确定其是否存在三列以上非空数据,若是,则确定其为有效数据文件。
步骤S200中,若所述有效类型文件中非空数据少于三列,说明该有效类型文件的材料数据非常不完整,没有信息化意义;为了提高识别及管理的效率,本实施例去除这类文件,优选处理存在三列以上非空数据的文件。
S300、读取所述有效数据文件内容中的材料数据,将所述材料数据与预设的国标材料数据库中的材料名称进行匹配,得出所述有效数据文件的材料名称,并标记出其在所述有效数据文件中的位置。
步骤S300中,所述国标材料数据库是按照国家规定的建设行业材料标准分类法建立的数据库,其包括各种材料对应的通用的材料名称及对应的属性单位等。本实施例将所述材料数据与预设的国标材料数据库中的材料名称进行匹配,可以大大提高材料识别的精度和管理的专业度。
例如,国标材料数据库中存在通用的材料名称“圆钢”,同时,通过匹配发现所述有效数据文件内容中存在“圆钢”这一字样,则将“圆钢”作为所述有效数据文件的材料名称,同时标记所述有效数据文件内容中“圆钢”这一字样的位置。
所述对材料名称位置的标记,以Excel文件为例,具体可以标记出该(匹配出的)材料名称在Excel文件中的行数和列数。
S400、从所述国标材料数据库中调取与所述有效数据文件的材料名称相应的材料属性单位,根据所述材料属性单位,读取所述有效数据文件中材料名称的位置之后的材料数据,得出所述有效数据文件的材料属性值。
在建设行业领域,材料属性包括“规格”、“单位”和“单价”等,所述国标材料数据库中的材料属性单位包括“t”和“元”等。假设所述国标材料数据库中材料名称“圆钢”对应的材料属性单位为“t”,在步骤S400中,读取所述有效数据文件中材料名称的位置之后的材料数据得到“10t”的字样(先匹配到“t”),则将(“t”所在的整个Excel单元格的材料数据)“10t”作为所述有效数据文件的材料属性值。
步骤S400中,从所标记的材料名称的位置去识别材料属性值可以大大提高材料数据的识别效率。
S500、基于所述有效数据文件的材料名称和材料属性值,形成关联属性数据并保存。
步骤S500中,所述有效数据文件中的材料数据均被有效甄别,基于甄别出来的材料名称和材料属性值形成关联属性数据(例如将上述“圆钢”与“10t”进行关联),该关联属性数据可供后续查询及使用,有助于提高查询及使用的效率及精确性。
本实施例提出的结构化建设行业材料文件及材料数据识别管理方法,其对结构化建设行业材料文件进行文件类型检测及转换,确定出有效类型文件,使得到的文件可以按统一方式处理;对所述效类型文件进行检测,确定出有效数据文件,以提高后续识别及管理的效率;运用预设的国标材料数据库从所述有效数据文件中识别出所述有效数据文件的材料名称和材料属性值,实现了材料数据的准确识别;所述材料名称和材料属性值形成关联属性数据,便于后续查询及使用,有助于提高查询及使用的效率及精确性。本实施例可以自动完成材料文件及材料数据的识别及管理,而不需要过多依赖人工操作,能够大大提高工作效率,并且显著地降低了运营成本。
为了更好地实现本实施例的目的,本实施例还对各步骤做了进一步优化。
具体的,步骤S300中读取所述有效数据文件内容中的材料数据之前还包括以下步骤S210:
S210、检测所述有效类型文件中表头的位置,并对所述表头的内容进行词义分析,确认出表头对应的数据列所代表的信息。
在步骤S210的基础上,所述步骤S300中读取所述有效数据文件内容中的材料数据包括以下步骤S310:
S310、根据所述数据列所代表的信息,相应从所述数据列中读取所需的材料数据。
步骤S210中,检测表头的位置具体可以通过检测所述表头所处的列数及行数来确定;而对所述表头内容的词义分析可以较大提高材料数据识别的效率。例如,从步骤S210中分析得出表头的内容为“名称”,则该表头对应的列(的单元格)中的材料数据很可能便是该有效数据文件的材料名称;如果需要读取该有效数据文件的材料名称,在步骤S310中便可只对该表头中对应的数据列中进行读取即可,而不需要读取所有的数据列。
本实施例中,在步骤S310中从所述数据列中读取所需的材料数据之后,还包括以下步骤S320:
S320、通过字符识别将所述数据列中的无效数据进行清洗。
在步骤S320的基础上,步骤S300中将所述材料数据与预设的国标材料数据库中的材料名称进行匹配的步骤具体为以下步骤S330:
S330、将所述材料数据中的有效数据与预设的国标材料数据库中的材料名称进行匹配。
本实施例中的无效数据包括空行或无效字符等不具备识别价值的数据,同时还包括其格式不便于直接识别或使用的字符,例如全角或半角等,因此本实施例对这些无效数据进行了清洗,只保留(或使其形成)有效数据,这样能够有效减少数据量,降低数据的复杂度,提高数据的识别效率及数据的规范性,并节约存储空间资源。
具体的,所述步骤S320中通过字符识别将所述数据列中的无效数据进行清洗的步骤具体包括:通过字符识别,对所述数据列中的空行或无效字符做相应的清除处理,并相应进行全角/半角转换。
本实施例中,所述步骤S210中检测所述有效类型文件中表头的位置之后,还可包括以下步骤S220:
S220、检测是否存在合并单元格;若是,则判断所述合并单元格是否为规格列;若是,则对其进行规范拆分。
由于用户上传的建设行业材料文件往往并非规范的文件,其中可能会出现合并单元格等影响本实施例的材料数据识别效率的情况,因此本实施步骤S220中还检测是否存在合并单元格,若存在合并单元格,则判断其是否为规格列,若是则可进行拆分;若否,则通常情况下应该是无法拆分的单元格,为了提高效率,可以不做拆分处理。
基于以上步骤S100、S200、S210、S220、S300、S310、S320、S330、S400以及S500形成的详细流程示意图请参阅图2。
此外,本实施例中所述步骤S210中对所述表头的内容进行词义分析之后,还可进一步包括以下步骤S215:
S215、基于所述词义分析,确定是否存在多个价格表头;若是,则根据预设的优先顺序选取对应的数据列中的优选价格数据;
在步骤S215的基础上,所述步骤S400中得出所述有效数据文件的材料属性值具体为:将所述优选价格数据作为所述有效数据文件在价格方面的材料属性值。
即当所述材料属性值具体指价格时,则根据预设的优先顺序选取对应的数据列中的优选价格,以提高材料数据识别的准确度。
以下用三个具体实例来展示本发明实施例的具体应用过程(仅介绍主要流程)。
实例1,以用户上传了内含“圆钢”这一材料数据的Excel文件为例,包括以下步骤:
L1、检测用户想要上传的文件是否是Excel、Word、PDF之类的结构化文件,若是,则允许上传。由于用户上传的是Excel文件,因此允许上传。
L2、检测用户上传的文件是否为预设文件类型,即Excel文件类型;若是,则确定其为有效类型文件;若否,则将其转换为预设文件类型。由于用户上传的是Excel文件,因此可以确定其为有效类型文件,不需要进行转换。
L3、执行文件读取操作,并将读取到的材料数据与预设的国标材料数据库中的材料名称进行匹配,发现有“圆钢”字样,对该字样的位置进行标记。
L4、依据标记的文字位置,调取国标材料数据库中“圆钢”的属性单位,与从该标记字样“圆钢”起的后续文字进行匹配,获取该“圆钢”的属性值。假设获取到的规格“Q235”、单位“t”、和价格“3469”。
L5、将步骤L3获取到的“圆钢”与步骤L4获取到的规格“Q235”、单位“t”、和价格“3469”形成关联属性数据并保存。
L6、材料文件及材料数据已被有效甄别,进程结束。
实例2,以用户上传了内含“沥青复合胎柔性防水卷材-双面膜”这一材料数据的Excel文件为例,包括以下步骤:
X1、检测用户想要上传的文件是否是Excel、Word、PDF之类的结构化文件,若是,则允许上传。由于用户上传的是Excel文件,因此允许上传。
X2、检测用户上传的文件是否为预设文件类型,即Excel文件类型;若是,则确定其为有效类型文件;若否,则将其转换为预设文件类型。由于用户上传的是Excel文件,因此可以确定其为有效类型文件,不需要进行转换。
X3、执行文件读取操作,并将读取到的材料数据与预设的国标材料数据库中的材料名称进行匹配,发现有“沥青复合胎柔性防水卷材-双面膜”字样,对该字样的位置进行标记。
X4、依据标记的文字位置,调取国标材料数据库中“沥青复合胎柔性防水卷材-双面膜”的属性单位,与从该标记字样“沥青复合胎柔性防水卷材-双面膜”起的后续文字进行匹配,获取该“沥青复合胎柔性防水卷材-双面膜”的属性值。假设获取到的获取到(其中一面)“YH-GK-S3型号:35#,-5摄氏度”、单位“m2”、价格“9.54”,以及(另一面)“YH-GK-S4型号:45#,-10摄氏度”、单位“m2”、价格“13.91”。
X5、将步骤X3获取到的“沥青复合胎柔性防水卷材-双面膜”分别与步骤X4获取到(其中一面)“YH-GK-S3型号:35#,-5摄氏度”、单位“m2”、价格“9.54”,以及(另一面)“YH-GK-S4型号:45#,-10摄氏度”、单位“m2”、价格“13.91”形成关联属性数据并保存。
X6、材料文件及材料数据已被有效甄别,进程结束。
实例3,以用户上传了内含“氯丁橡胶沥青防水涂料”这一材料数据的PDF文件为例,包括以下步骤:
M1、检测用户想要上传的文件是否是Excel、Word、PDF之类的结构化文件,若是,则允许上传。由于用户上传的是PDF文件,因此允许上传。
M2、检测用户上传的文件是否为预设文件类型,即Excel文件类型;若是,则确定其为有效类型文件;若否,则将其转换为预设文件类型。由于用户上传的是PDF文件,因此需要进行转换成Excel文件。
M3、执行文件读取操作,并将读取到的材料数据与预设的国标材料数据库中的材料名称进行匹配,发现有“氯丁橡胶沥青防水涂料”字样,对该字样的位置进行标记。
M4、依据标记的文字位置,调取国标材料数据库中“氯丁橡胶沥青防水涂料”的属性单位,与从该标记字样“氯丁橡胶沥青防水涂料”起的后续文字进行匹配,获取该“氯丁橡胶沥青防水涂料”的属性值。假设获取到的规格“AT-118”、单位“kg”、和价格“13.20”。
M5、将步骤M3获取到的“氯丁橡胶沥青防水涂料”与步骤M4获取到的规格“AT-118”、单位“kg”、和价格“13.20”形成关联属性数据并保存。
M6、材料文件及材料数据已被有效甄别,进程结束。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (8)

1.一种结构化建设行业材料文件及材料数据识别管理方法,其特征在于,包括以下步骤:
检测接收到的结构化建设行业材料文件的文件类型是否属于预设文件类型,若是,则确定其为有效类型文件;若否,则将其转换为预设文件类型,以形成有效类型文件;
检测所述有效类型文件的内容,确定其是否存在三列以上非空数据,若是,则确定其为有效数据文件;
读取所述有效数据文件内容中的材料数据,将所述材料数据与预设的国标材料数据库中的材料名称进行匹配,得出所述有效数据文件的材料名称,并标记出其在所述有效数据文件中的位置;
从所述国标材料数据库中调取与所述有效数据文件的材料名称相应的材料属性单位,根据所述材料属性单位,读取所述有效数据文件中材料名称的位置之后的材料数据,得出所述有效数据文件的材料属性值;
基于所述有效数据文件的材料名称和材料属性值,形成关联属性数据并保存;
其中,读取所述有效数据文件内容中的材料数据之前还包括以下步骤:
检测所述有效类型文件中表头的位置,并对所述表头的内容进行词义分析,确认出表头对应的数据列所代表的信息;
所述读取所述有效数据文件内容中的材料数据包括:根据所述数据列所代表的信息,相应从所述数据列中读取所需的材料数据。
2.根据权利要求1所述的一种结构化建设行业材料文件及材料数据识别管理方法,其特征在于,从所述数据列中读取所需的材料数据之后,还包括以下步骤:
通过字符识别将所述数据列中的无效数据进行清洗;
将所述材料数据与预设的国标材料数据库中的材料名称进行匹配的步骤具体为:将所述材料数据中的有效数据与预设的国标材料数据库中的材料名称进行匹配。
3.根据权利要求2所述的一种结构化建设行业材料文件及材料数据识别管理方法,其特征在于,通过字符识别将所述数据列中的无效数据进行清洗的步骤具体包括:通过字符识别,对所述数据列中的空行或无效字符做相应的清除处理,并相应进行全角/半角转换。
4.根据权利要求1所述的一种结构化建设行业材料文件及材料数据识别管理方法,其特征在于,所述检测所述有效类型文件中表头的位置之后,还包括以下步骤:
检测是否存在合并单元格;若是,则判断所述合并单元格是否为规格列;若是,则对其进行规范拆分。
5.根据权利要求1所述的一种结构化建设行业材料文件及材料数据识别管理方法,其特征在于,对所述表头的内容进行词义分析之后,还包括以下步骤:
基于所述词义分析,确定是否存在多个价格表头;若是,则根据预设的优先顺序选取对应的数据列中的优选价格数据;
所述得出所述有效数据文件的材料属性值的步骤中,将所述优选价格数据作为所述有效数据文件在价格方面的材料属性值。
6.根据权利要求1所述的一种结构化建设行业材料文件及材料数据识别管理方法,其特征在于,所述检测所述有效类型文件中表头的位置的步骤具体为:检测所述表头所处的列数及行数,以确定所述表头的位置。
7.根据权利要求1至6任一项所述的一种结构化建设行业材料文件及材料数据识别管理方法,其特征在于,所述结构化建设行业材料文件包括:以XML、Excel、Word或PDF格式呈现的建设行业材料文件。
8.根据权利要求7所述的一种结构化建设行业材料文件及材料数据识别管理方法,其特征在于,所述预设文件类型具体为Excel文件类型。
CN201510160769.4A 2015-04-03 2015-04-03 一种结构化建设行业材料文件及材料数据识别管理方法 Active CN104715359B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510160769.4A CN104715359B (zh) 2015-04-03 2015-04-03 一种结构化建设行业材料文件及材料数据识别管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510160769.4A CN104715359B (zh) 2015-04-03 2015-04-03 一种结构化建设行业材料文件及材料数据识别管理方法

Publications (2)

Publication Number Publication Date
CN104715359A CN104715359A (zh) 2015-06-17
CN104715359B true CN104715359B (zh) 2017-11-17

Family

ID=53414664

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510160769.4A Active CN104715359B (zh) 2015-04-03 2015-04-03 一种结构化建设行业材料文件及材料数据识别管理方法

Country Status (1)

Country Link
CN (1) CN104715359B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6571462B2 (ja) * 2015-09-10 2019-09-04 千代田化工建設株式会社 建設資材管理システムおよび建設資材管理方法
CN107193788A (zh) * 2017-06-13 2017-09-22 广东中建普联科技股份有限公司 建设行业工程项目Excel文件数据格式化存储方法及***
CN107273484A (zh) * 2017-06-13 2017-10-20 广东中建普联科技股份有限公司 建设行业工程项目xml文件数据归集方法及***
CN110019153B (zh) * 2017-09-13 2022-03-04 北京宸信征信有限公司 一种多类型批量数据处理***及其处理方法
CN109062921B (zh) * 2018-05-31 2021-06-29 武昌船舶重工集团有限公司 一种提取船舶托盘管理信息的方法及***
CN109685576A (zh) * 2018-12-25 2019-04-26 华联世纪工程咨询股份有限公司 一种工程材料自动配价方法、装置、终端设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101241486A (zh) * 2007-02-08 2008-08-13 佛山市顺德区顺达电脑厂有限公司 数据复制的方法
CN101770470A (zh) * 2008-12-31 2010-07-07 ***股份有限公司 一种文件类型识别分析方法及***
CN102508869A (zh) * 2011-10-11 2012-06-20 西安煤航信息产业有限公司 将cad图形与属性数据导入gis***的方法
CN102567418A (zh) * 2010-12-23 2012-07-11 北大方正集团有限公司 一种数据整合、搜索的方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0004831L (sv) * 2000-03-22 2001-09-23 Soeren Molin Ett datalagringsförfarande och en datalagringsstruktur

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101241486A (zh) * 2007-02-08 2008-08-13 佛山市顺德区顺达电脑厂有限公司 数据复制的方法
CN101770470A (zh) * 2008-12-31 2010-07-07 ***股份有限公司 一种文件类型识别分析方法及***
CN102567418A (zh) * 2010-12-23 2012-07-11 北大方正集团有限公司 一种数据整合、搜索的方法及装置
CN102508869A (zh) * 2011-10-11 2012-06-20 西安煤航信息产业有限公司 将cad图形与属性数据导入gis***的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"半结构化数据语义分析与映射方法研究";付玥;《中国优秀硕士学位论文全文数据库 信息科技辑》;20121215;第I138-171页 *
"半结构化文本信息抽取方法半结构化文本信息抽取方法研究及应用";王允富;《中国优秀硕士学位论文全文数据库 信息科技辑》;20150315;第I138-2908页 *
"散乱Excel表中数据规范化处理方法研究";刘芳 等;《青岛大学学报》;20140630;第29卷(第2期);第29-33页 *

Also Published As

Publication number Publication date
CN104715359A (zh) 2015-06-17

Similar Documents

Publication Publication Date Title
CN104715359B (zh) 一种结构化建设行业材料文件及材料数据识别管理方法
CN101770470B (zh) 一种文件类型识别分析方法及***
US8015198B2 (en) Method for automatically indexing documents
CN110020433B (zh) 一种基于企业关联关系的工商高管人名消歧方法
Bininda-Emonds et al. Garbage in, garbage out: data issues in supertree construction
CN112700325A (zh) 一种基于Stacking集成学习的网贷回头客预测的方法
CN114862845B (zh) 手机触摸屏的缺陷检测方法、装置、设备及存储介质
CN113282955A (zh) 隐私政策中隐私信息提取方法、***、终端及介质
CN103064941A (zh) 图像检索方法和装置
CN111046858A (zh) 一种基于图像的动物物种细分类方法、***及介质
CN116664944A (zh) 一种基于属性特征知识图谱的葡萄园害虫识别方法
CN110188207B (zh) 知识图谱构建方法及装置、可读存储介质、电子设备
CN111401002A (zh) 一种自动识别pdf电子回单信息的方法、装置与计算机存储介质
CN115659226A (zh) 一种获取app标签的数据处理***
CN115098679A (zh) 文本分类标注样本的异常检测方法、装置、设备及介质
CN114724158A (zh) 一种工程量审核方法、***、电子设备和存储介质
CN110826318A (zh) 物流信息识别的方法、设备、计算机设备和存储介质
CN112199376B (zh) 一种基于聚类分析的标准知识库管理方法及***
CN110674832A (zh) 互联网用户所属企业的识别方法、装置和终端
CN112164040A (zh) 基于半监督深度学习算法的钢铁表面缺陷识别方法
CN103257961A (zh) 书目消重的方法、装置及***
CN116340387A (zh) 一种用于数据表的个人信息披露情况统计分析方法及***
TWI396990B (zh) 引用文獻記錄擷取系統、方法及程式產品
CN110728240A (zh) 一种对电子卷宗的标题自动识别的方法及装置
JP2007317133A (ja) 画像分類方法及び装置及びプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 510000 Guangdong city of Guangzhou province Tianhe District Guangyuan Expressway Hui Yuan Street 23, Guangdong railway investment building 6 floor

Applicant after: GUANGDONG ZHONGJIAN PULIAN TECHNOLOGY CO.,LTD.

Address before: 510000 Guangdong city of Guangzhou province Tianhe District Tong Road 146 Kim business building room 4028

Applicant before: GUANGDONG ZHONGJIAN PULIAN SCIENCE & TECHNOLOGY CO.,LTD.

COR Change of bibliographic data
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Identity management method for material files and material data of structure construction industry

Effective date of registration: 20180815

Granted publication date: 20171117

Pledgee: China Co. truction Bank Corp Guangzhou economic and Technological Development Zone sub branch

Pledgor: GUANGDONG ZHONGJIAN PULIAN TECHNOLOGY CO.,LTD.

Registration number: 2018440000235

PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20200618

Granted publication date: 20171117

Pledgee: China Co. truction Bank Corp Guangzhou economic and Technological Development Zone sub branch

Pledgor: GUANGDONG ZHONGJIAN PULIAN TECHNOLOGY Co.,Ltd.

Registration number: 2018440000235

PC01 Cancellation of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Identification and management method of material file and material data in structured construction industry

Effective date of registration: 20200827

Granted publication date: 20171117

Pledgee: Development Zone sub branch of Bank of Guangzhou Co.,Ltd.

Pledgor: GUANGDONG ZHONGJIAN PULIAN TECHNOLOGY Co.,Ltd.

Registration number: Y2020980005489

PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20210928

Granted publication date: 20171117

Pledgee: Development Zone sub branch of Bank of Guangzhou Co.,Ltd.

Pledgor: GUANGDONG ZHONGJIAN PULIAN TECHNOLOGY Co.,Ltd.

Registration number: Y2020980005489

PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A material file and material data identification management method for structured construction industry

Effective date of registration: 20211103

Granted publication date: 20171117

Pledgee: Yuexiu sub branch of Bank of Guangzhou Co.,Ltd.

Pledgor: GUANGDONG ZHONGJIAN PULIAN TECHNOLOGY CO.,LTD.

Registration number: Y2021980011829

PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20221115

Granted publication date: 20171117

Pledgee: Yuexiu sub branch of Bank of Guangzhou Co.,Ltd.

Pledgor: GUANGDONG ZHONGJIAN PULIAN TECHNOLOGY CO.,LTD.

Registration number: Y2021980011829

PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Method of Identifying and Managing Material Files and Data in Structured Construction Industry

Effective date of registration: 20221116

Granted publication date: 20171117

Pledgee: Yuexiu sub branch of Bank of Guangzhou Co.,Ltd.

Pledgor: GUANGDONG ZHONGJIAN PULIAN TECHNOLOGY CO.,LTD.

Registration number: Y2022980022010