CN114579712A - 基于动态模型的文本属性提取匹配方法 - Google Patents
基于动态模型的文本属性提取匹配方法 Download PDFInfo
- Publication number
- CN114579712A CN114579712A CN202210478783.9A CN202210478783A CN114579712A CN 114579712 A CN114579712 A CN 114579712A CN 202210478783 A CN202210478783 A CN 202210478783A CN 114579712 A CN114579712 A CN 114579712A
- Authority
- CN
- China
- Prior art keywords
- null
- extraction
- attribute
- attribute name
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于动态模型的文本属性提取匹配***,能够自动对文本数据中的属性名进行自动提取和匹配,能够提高提取和匹配速度以及准确性。
Description
技术领域
本申请涉及文本识别领域,具体涉及一种基于动态模型的文本属性提取匹配方法。
背景技术
一般对于生活中的物资,都配备有对应的说明书,以便获知该物资的特点和作用。当前,都是通过人工从说明书中获取其中的属性,以便获知对应物资的属性信息,例如,物资名称、物资成份等属性信息。然而,对于大批量的说明书,这种人工获取的方式存在效率低下,劳动强度大等缺陷。
发明内容
针对上述技术问题,本发明实施例提供一种基于动态模型的文本属性提取匹配***,用于至少解决上述技术问题之一。
本发明实施例采用的技术方案为:
本发明实施例提供一种基于动态模型的文本属性提取匹配***,包括:通信连接的处理器、存储器和数据库,所述存储器中存储有N类目标对象的文本数据,所述数据库的第i行包括(Ci,A0 i,Di,R0 i),Ci为第i类目标对象的ID,A0 i为Ci对应的文本数据Ti的当前属性名集,A0 i的初始值为Null;Di=(Di1,Di2,…,Dimi),Dij为Ti对应的数据元集Di中的第j个数据元;R0 i为与A0 i对应的匹配结果集,R0 i∈Di,R0 i的初始值为Null;
对于任一目标对象i的文本数据Ti,所述处理器用于执行计算机程序,以实现如下步骤:
S10,基于Ti,从数据库中获取对应的当前属性名集A0 i;如果A0 i不为Null,执行S20,否则,执行S30;
S20,基于A0 i提取Ti中的属性名,得到Ti的属性名集Ai;
S30,基于设定的提取规则提取Ti中的属性,得到Ti的属性名集Ai;
S40,基于Ti,对Ai进行修正,得到修正后的属性名集Ac i=(Ac i1,Ac i2,…,Ac ini),Ac ir为Ac i中的第r个属性名,r的取值为1到ni,ni为Ac i中的属性名数量;利用Ac i更新A0 i;
S50,如果Ac ir∈A0 i,则将A0 i中与Ac ir相同的属性名对应的数据元作为Ac ir的匹配结果;否则,执行S60;
S60,获取Dc ir=max(Dc ir1,Dc ir2,…,Dc irmi),Dc irs为Ac ir与文本数据Ti对应的数据元集Di中的数据元Dis的相似度,s的取值为1到mi;
S70,如果Dc ir>D,则将Dc ir对应的数据元作为Ac ir的匹配结果; D为设定阈值;
S80,基于S60~S70得到Ac i的匹配结果集Ri;对Ri进行修正,得到修正后的匹配结果集Rc i,并利用Rc i更新R0 i。
本发明实施例提供一种基于动态模型的文本属性提取匹配***,利用当前提取的属性名集优化上一次提取的属性名集,以作为下次提取属性名的依据。由于数据库中存储的属性名集都是上次人工修正后的属性名集,因此,能够使得后续的自动提取的属性名更加准确,能够尽可能准确的自动提取到文本数据中的所有属性名。并且,由于对每次匹配结果进行了修正,修正后的匹配结果作为下次属性名的匹配依据,因此,能够对自动的匹配结果进行不断优化,从而使得自动匹配结果更加准确,能够尽可能准确的自动从设定的属性名集中找到提取的属性名的匹配结果。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于动态模型的文本属性提取匹配***执行计算机程序时实现的方法流程图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本发明实施例提供一种基于动态模型的文本属性提取匹配***,包括:通信连接的处理器、存储器和数据库。
其中,所述存储器中存储有N类目标对象的文本数据,所述数据库的第i行包括(Ci,A0 i,Di,R0 i),Ci为第i类目标对象的ID,A0 i为Ci对应的文本数据Ti的当前属性名集,Ai=(Ai1,Ai2,…,Aini),A0 ip为Ai中的第p个属性名,p的取值为1到ni,ni为Ai中的属性名数量;A0 i的初始值为Null。Di=(Di1,Di2,…,Dimi),Dij为Ti对应的数据元集Di中的第j个数据元;R0 i为与A0 i对应的匹配结果集,R0 i∈Di,R0 i的初始值为Null。
在本发明实施例中,目标对象可为物资,例如,可为药品、食品、器材等产品。所述文本数据可为从目标对象对应的描述文件例如说明书中识别得到的文本。本领域技术人员知晓,可采用现有方式例如ocr图片文字识别软件从目标对象对应的描述文件中识别得到的文本。
进一步地,在本发明实施例中,用于识别的目标对象的描述文件可通过摄像装置拍照获取。
在本发明实施例中,属性名可为描述物资特征的名称,例如,规格、含量、成份等。
在本发明实施例中,数据元可为对目标对象的主要属性名,即通过数据元能够知晓目标对象的主要信息。
进一步地,在本发明实施例中,对于任一目标对象i的文本数据Ti,所述处理器用于执行计算机程序,以实现如下步骤(如图1所示):
S10,基于Ti,从数据库中获取对应的当前属性名集A0 i;如果A0 i不为Null,执行S20,否则,执行S30。
否则,说明是首次处理文本数据Ti,数据库中没有存储有Ti的历史数据,即A0 i为Null。
S20,基于A0 i提取Ti中的属性名,得到Ti的属性名集Ai。
如果A0 i不为Null,说明不是首次处理文本数据Ti,数据库中存储有Ti的历史数据,A0 i为上一次提取的属性名集,因此,利用A0 i提取Ti中的属性名,得到Ti的属性名集Ai,能够提高属性提取准确度。
S30,基于设定的提取规则提取Ti中的属性,得到Ti的属性名集Ai。
在本发明实施例中,所述数据库的第i行还包括Ti的对应的第一标识符集M1i和第二标识符集M2i。第一标识符集M1i为Ti中固有的标识符集,可包括至少一个标识符,标识符例如可为“:”、“< >”、“【】”等。第二标识符集M2i可为自定义的标识符集,可包括至少一个标识符。
进一步地,在S30中,如果M1i不为Null,则基于M1i提取Ti中的属性名。具体地,如果M1i包括ui个标识符,即M1i=(M1i1,M1i2,…,M1iui),则可按照如下方式提取Ti中的属性名:
S301,遍历M1i,利用任一M1iv从Ti中提取对应的属性名;v的取值为1到ui;
S302,基于S301,生成基于M1i提取的Ti的属性名。
基于每个标识符提取到的信息可为键值对,即包括key和对应的value值,在本发明中,key为属性名。本领域技术人员知晓,基于标识符提取文本数据中的属性名可为现有方法。
进一步地,在S30中,如果M1i为Null并且M2i不为Null,则基于M2i提取Ti中的属性名。基于M2i提取Ti中的属性名可与基于M1i提取Ti中的属性名的方式相似。
进一步地,在本发明一实施例中,在S30中,如果M1i为Null并且M2i为Null,则可基于Null提取Ti中的属性名,得到的属性名也为Null。
进一步地,在本发明一实施例中,在S30中,如果M1i为Null并且M2i为Null,则可基于随机生成的标识符提取Ti中的属性名,得到的对应的属性名。
S40,基于Ti,对Ai进行修正,得到修正后的属性名集Ac i=(Ac i1,Ac i2,…,Ac ini),Ac ir为Ac i中的第r个属性名,r的取值为1到ni,ni为Ac i中的属性名数量;利用Ac i更新A0 i。
在本发明实施例中,可通过人工方式对Ai进行修正。具体地,操作人员可通过人工寻找方式从Ti中寻找出所有的属性名,形成对照属性名集,然后将Ai与形成的对照属性名集进行比对,找出遗漏的、错误的或者多余的属性名,以对Ai进行修正,得到修正后的属性名集Ac i。
在本发明实施例中,利用Ac i更新A0 i可为将A0 i替换为Ac i,即利用当前提取的属性名集优化上一次提取的属性名集,以作为下次提取属性名的依据。由于数据库中存储的属性名集都是上次人工修正后的属性名集,因此,能够使得后续的自动提取的属性名更加准确,能够尽可能准确的自动提取到文本数据中的所有属性名。
S50,如果Ac ir∈A0 i,则将A0 i中与Ac ir相同的属性名对应的数据元作为Ac ir的匹配结果;否则,执行S60。
在本发明一实施例中,每个文本数据对应的数据元是固定的,即Di是固定的。
在本发明另一实施例中,每个文本数据对应的数据元可以是动态变化的,例如,随着每类物资的更新而更新,这种情况下,由于Di更新的原因,会存在Ac ir∈A0 i,A0 i中与Ac ir相同的属性名对应的数据元不在Di中的情况,因此,在S50中,如果A0 i中与Ac ir相同的属性名对应的数据元不属于Di,则执行S60。
S50的技术效果在于,如果Ac ir∈A0 i,并且A0 i中与Ac ir相同的属性名对应的数据元在Di中,则将A0 i中与Ac ir相同的属性名对应的数据元作为Ac ir的匹配结果,能够基于上次的匹配结果直接得到本次的匹配结果,能够提高匹配速度和匹配准确性。
S60,获取Dc ir=max(Dc ir1,Dc ir2,…,Dc irmi),Dc irs为Ac ir与文本数据Ti对应的数据元集Di中的数据元Dis的相似度,s的取值为1到mi。
具体地,在该步骤中,对于Ac i中的任一属性名Ac ir,首先,可分别获取与Di中的每个数据元之间的相似度,即分别得到Dc ir1,Dc ir2,…,Dc irmi;接着,从Dc ir1,Dc ir2,…,Dc irmi中选取最大者作为Dc ir。本领域技术人员知晓,可采用现有的相似度计算方法例如hanlp获取相似度,例如,欧式距离、余弦距离、马氏距离等。
S70,如果Dc ir>D,则将Dc ir对应的数据元作为Ac ir的匹配结果;D为设定阈值。
在本发明实施例中,D可为经验值,例如90%~99%,优选,可为95%~99%,更优选,可为99%。
S80,基于S60~S70得到Ac i的匹配结果集Ri;对Ri进行修正,得到修正后的匹配结果集Rc i,并利用Rc i更新R0 i。
在本发明实施例中,可基于经验对Ri进行修正。
在本发明实施例中,利用Rc i更新R0 i可为,将R0 i替换为Rc i。
在本发明实施例中,由于对每次匹配结果进行了修正,修正后的匹配结果作为下次属性名的匹配依据,因此,能够对自动的匹配结果进行不断优化,从而使得自动匹配结果更加准确,能够尽可能准确的自动从设定的属性名集中找到提取的属性名的匹配结果。
进一步地,在本发明实施例中,数据元在S40之前,还包括:
S32,对Ac i进行可视化呈现。
在可视化呈现时,可按照顺序依次呈现例如由上至下依次呈现Ac i中的属性名和对应的value值,例如,每行显示的内容可为:名称;XX等。
进一步地,在本发明实施例中,还包括:
S90,对Rc i进行可视化呈现。
在对Rc i进行可视化呈现时,可按照顺序依次呈现例如由上至下依次呈现Rc i中的数据元和对应的属性名。
虽然已经通过示例对本申请的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本申请的范围。本领域的技术人员还应理解,可以对实施例进行多种修改而不脱离本申请的范围和精神。本申请公开的范围由所附权利要求来限定。
Claims (9)
1.一种基于动态模型的文本属性提取匹配***,其特征在于,包括:通信连接的处理器、存储器和数据库,所述存储器中存储有N类目标对象的文本数据,所述数据库的第i行包括(Ci,A0 i,Di,R0 i),Ci为第i类目标对象的ID,A0 i为Ci对应的文本数据Ti的当前属性名集,A0 i的初始值为Null;Di=(Di1,Di2,…,Dimi),Dij为Ti对应的数据元集Di中的第j个数据元;R0 i为与A0 i对应的匹配结果集,R0 i∈Di,R0 i的初始值为Null;
对于任一目标对象i的文本数据Ti,所述处理器用于执行计算机程序,以实现如下步骤:
S10,基于Ti,从数据库中获取对应的当前属性名集A0 i;如果A0 i不为Null,执行S20,否则,执行S30;
S20,基于A0 i提取Ti中的属性名,得到Ti的属性名集Ai;
S30,基于设定的提取规则提取Ti中的属性,得到Ti的属性名集Ai;
S40,基于Ti,对Ai进行修正,得到修正后的属性名集Ac i=(Ac i1,Ac i2,…,Ac ini),Ac ir为Ac i中的第r个属性名,r的取值为1到ni,ni为Ac i中的属性名数量;利用Ac i更新A0 i;
S50,如果Ac ir∈A0 i,则将A0 i中与Ac ir相同的属性名对应的数据元作为Ac ir的匹配结果;否则,执行S60;
S60,获取Dc ir=max(Dc ir1,Dc ir2,…,Dc irmi),Dc irs为Ac ir与文本数据Ti对应的数据元集Di中的数据元Dis的相似度,s的取值为1到mi;
S70,如果Dc ir>D,则将Dc ir对应的数据元作为Ac ir的匹配结果; D为设定阈值;
S80,基于S60~S70得到Ac i的匹配结果集Ri;对Ri进行修正,得到修正后的匹配结果集Rc i,并利用Rc i更新R0 i。
2.根据权利要求1所述的***,其特征在于,所述文本数据为从目标对象对应的描述文件中识别得到的文本。
3.根据权利要求1所述的***,其特征在于,所述数据库的第i行还包括Ti的对应的第一标识符集M1i和第二标识符集M2i。
4.根据权利要求3所述的***,其特征在于,在S30中,如果M1i不为Null,则基于M1i提取Ti中的属性名。
5.根据权利要求3所述的***,其特征在于,在S30中,如果M1i为Null并且M2i不为Null,则基于M2i提取Ti中的属性名。
6.根据权利要求1所述的***,其特征在于,在S50中,如果A0 i中与Ac ir相同的属性名对应的数据元不属于Di,则执行S60。
7.根据权利要求1所述的***,其特征在于,在S40之前,还包括:
S32,对Ac i进行可视化呈现。
8.根据权利要求1所述的***,其特征在于,还包括:
S90,对Rc i进行可视化呈现。
9.根据权利要求1至8任一项所述的***,其特征在于,所述目标对象为物资。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210478783.9A CN114579712B (zh) | 2022-05-05 | 2022-05-05 | 基于动态模型的文本属性提取匹配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210478783.9A CN114579712B (zh) | 2022-05-05 | 2022-05-05 | 基于动态模型的文本属性提取匹配方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114579712A true CN114579712A (zh) | 2022-06-03 |
CN114579712B CN114579712B (zh) | 2022-07-15 |
Family
ID=81784688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210478783.9A Active CN114579712B (zh) | 2022-05-05 | 2022-05-05 | 基于动态模型的文本属性提取匹配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114579712B (zh) |
Citations (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100250598A1 (en) * | 2009-03-30 | 2010-09-30 | Falk Brauer | Graph based re-composition of document fragments for name entity recognition under exploitation of enterprise databases |
US20120323576A1 (en) * | 2011-06-17 | 2012-12-20 | Microsoft Corporation | Automated adverse drug event alerts |
CN102999623A (zh) * | 2012-12-04 | 2013-03-27 | 方蝶软件(上海)有限公司 | 一种利用等值线树的拓扑构建流体数字化动态模型的方法 |
US20140188867A1 (en) * | 2004-08-31 | 2014-07-03 | Semantic Search Technologies Llc | Computer-aided extraction of semantics from keywords to confirm match of buyer offers to seller bids |
CN104268241A (zh) * | 2014-09-29 | 2015-01-07 | 北京合力思腾科技股份有限公司 | 一种配置数据库中属性显示方法 |
US20160246779A1 (en) * | 2015-02-23 | 2016-08-25 | International Business Machines Corporation | Facilitating information extraction via semantic abstraction |
CN105912666A (zh) * | 2016-04-12 | 2016-08-31 | 中国科学院软件研究所 | 一种面向云平台的混合结构数据高性能存储、查询方法 |
CN106997509A (zh) * | 2017-03-28 | 2017-08-01 | 南京航空航天大学 | 一种不确定信息融合的应急物资分布需求预测方法 |
CN107784397A (zh) * | 2017-11-09 | 2018-03-09 | 贵州电网有限责任公司 | 一种电网物资需求预测***及其预测方法 |
CN107798435A (zh) * | 2017-11-09 | 2018-03-13 | 贵州电网有限责任公司 | 一种基于文本信息抽取的电力物资需求预测方法 |
US20180075323A1 (en) * | 2016-09-13 | 2018-03-15 | Sophistio, Inc. | Automatic wearable item classification systems and methods based upon normalized depictions |
CN108228158A (zh) * | 2018-01-18 | 2018-06-29 | 东南大学 | 一种基于本体的架构行为模式识别方法 |
CN109033135A (zh) * | 2018-06-06 | 2018-12-18 | 北京大学 | 一种面向软件项目知识图谱的自然语言查询方法及*** |
CN109064294A (zh) * | 2018-08-21 | 2018-12-21 | 重庆大学 | 一种融合时间因素、文本特征和相关性的药品推荐方法 |
CN109062921A (zh) * | 2018-05-31 | 2018-12-21 | 武昌船舶重工集团有限公司 | 一种提取船舶托盘管理信息的方法及*** |
CN109147010A (zh) * | 2018-08-22 | 2019-01-04 | 广东工业大学 | 带属性人脸图像生成方法、装置、***及可读存储介质 |
CN109429260A (zh) * | 2017-08-23 | 2019-03-05 | 中兴通讯股份有限公司 | 一种北向数据的校验方法及装置 |
CN109598794A (zh) * | 2018-11-30 | 2019-04-09 | 苏州维众数据技术有限公司 | 三维gis动态模型的构建方法 |
CN109598063A (zh) * | 2018-12-04 | 2019-04-09 | 中国航空无线电电子研究所 | 一种基于aadl的数据链组网动态模型驱动方法 |
CN109783614A (zh) * | 2019-01-25 | 2019-05-21 | 北京信息科技大学 | 一种社交网络待发布文本的差分隐私泄露检测方法及*** |
CN109885688A (zh) * | 2019-03-05 | 2019-06-14 | 湖北亿咖通科技有限公司 | 文本分类方法、装置、计算机可读存储介质和电子设备 |
CN109902144A (zh) * | 2019-01-11 | 2019-06-18 | 杭州电子科技大学 | 一种基于改进wmd算法的实体对齐方法 |
CN110069631A (zh) * | 2019-04-08 | 2019-07-30 | 腾讯科技(深圳)有限公司 | 一种文本处理方法、装置以及相关设备 |
US10438264B1 (en) * | 2016-08-31 | 2019-10-08 | Amazon Technologies, Inc. | Artificial intelligence feature extraction service for products |
CN110334814A (zh) * | 2019-07-01 | 2019-10-15 | 阿里巴巴集团控股有限公司 | 用于构建风险控制模型的方法和*** |
CN110471367A (zh) * | 2019-08-14 | 2019-11-19 | 上海明材教育科技有限公司 | 一种能够协同运动的动态三维模型的构建方法 |
CN110609998A (zh) * | 2019-08-07 | 2019-12-24 | 中通服建设有限公司 | 一种电子文档信息的数据提取方法、电子设备及存储介质 |
CN110674272A (zh) * | 2019-09-05 | 2020-01-10 | 科大讯飞股份有限公司 | 一种问题答案确定方法及相关装置 |
CN110795482A (zh) * | 2019-10-16 | 2020-02-14 | 浙江大华技术股份有限公司 | 数据对标方法、装置、及存储装置 |
CN110796390A (zh) * | 2019-11-08 | 2020-02-14 | 云南电网有限责任公司昆明供电局 | 基于动态模型的配网检修、投产及带电作业申请融合*** |
CN110889036A (zh) * | 2019-10-31 | 2020-03-17 | 深圳市微立德科技有限公司 | 一种多维度信息的处理方法、装置及终端设备 |
CN111078833A (zh) * | 2019-12-03 | 2020-04-28 | 哈尔滨工程大学 | 一种基于神经网络的文本分类方法 |
CN111241793A (zh) * | 2020-02-17 | 2020-06-05 | 湖南快乐阳光互动娱乐传媒有限公司 | 解析富文本编辑器内容给原生客户端渲染的方法、***及介质 |
CN111274783A (zh) * | 2020-01-14 | 2020-06-12 | 广州供电局有限公司 | 一种基于语义相似分析的围串标智能识别方法 |
CN111404960A (zh) * | 2020-03-26 | 2020-07-10 | 军事科学院***工程研究院网络信息研究所 | 应用于天地一体化网络接入管控***的属性提取方法 |
CN111639815A (zh) * | 2020-06-02 | 2020-09-08 | 贵州电网有限责任公司 | 一种多模型融合预测电网缺陷物资的方法及*** |
CN111723371A (zh) * | 2020-06-22 | 2020-09-29 | 上海斗象信息科技有限公司 | 构建恶意文件的检测模型以及检测恶意文件的方法 |
CN112434691A (zh) * | 2020-12-02 | 2021-03-02 | 上海三稻智能科技有限公司 | 基于智能解析识别的hs编码匹配、展示方法、***及存储介质 |
CN114153962A (zh) * | 2021-11-26 | 2022-03-08 | 浙江大华技术股份有限公司 | 一种数据匹配方法、装置及电子设备 |
-
2022
- 2022-05-05 CN CN202210478783.9A patent/CN114579712B/zh active Active
Patent Citations (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140188867A1 (en) * | 2004-08-31 | 2014-07-03 | Semantic Search Technologies Llc | Computer-aided extraction of semantics from keywords to confirm match of buyer offers to seller bids |
US20170199933A1 (en) * | 2004-08-31 | 2017-07-13 | Semantic Search Technologies Llc, A Texas Limited Liability Company | Computer-aided extraction of semantics from keywords to confirm match of buyer offers to seller bids |
US20100250598A1 (en) * | 2009-03-30 | 2010-09-30 | Falk Brauer | Graph based re-composition of document fragments for name entity recognition under exploitation of enterprise databases |
US20120323576A1 (en) * | 2011-06-17 | 2012-12-20 | Microsoft Corporation | Automated adverse drug event alerts |
CN102999623A (zh) * | 2012-12-04 | 2013-03-27 | 方蝶软件(上海)有限公司 | 一种利用等值线树的拓扑构建流体数字化动态模型的方法 |
CN104268241A (zh) * | 2014-09-29 | 2015-01-07 | 北京合力思腾科技股份有限公司 | 一种配置数据库中属性显示方法 |
US20160246779A1 (en) * | 2015-02-23 | 2016-08-25 | International Business Machines Corporation | Facilitating information extraction via semantic abstraction |
CN105912666A (zh) * | 2016-04-12 | 2016-08-31 | 中国科学院软件研究所 | 一种面向云平台的混合结构数据高性能存储、查询方法 |
US10438264B1 (en) * | 2016-08-31 | 2019-10-08 | Amazon Technologies, Inc. | Artificial intelligence feature extraction service for products |
US20180075323A1 (en) * | 2016-09-13 | 2018-03-15 | Sophistio, Inc. | Automatic wearable item classification systems and methods based upon normalized depictions |
CN106997509A (zh) * | 2017-03-28 | 2017-08-01 | 南京航空航天大学 | 一种不确定信息融合的应急物资分布需求预测方法 |
CN109429260A (zh) * | 2017-08-23 | 2019-03-05 | 中兴通讯股份有限公司 | 一种北向数据的校验方法及装置 |
CN107798435A (zh) * | 2017-11-09 | 2018-03-13 | 贵州电网有限责任公司 | 一种基于文本信息抽取的电力物资需求预测方法 |
CN107784397A (zh) * | 2017-11-09 | 2018-03-09 | 贵州电网有限责任公司 | 一种电网物资需求预测***及其预测方法 |
CN108228158A (zh) * | 2018-01-18 | 2018-06-29 | 东南大学 | 一种基于本体的架构行为模式识别方法 |
CN109062921A (zh) * | 2018-05-31 | 2018-12-21 | 武昌船舶重工集团有限公司 | 一种提取船舶托盘管理信息的方法及*** |
CN109033135A (zh) * | 2018-06-06 | 2018-12-18 | 北京大学 | 一种面向软件项目知识图谱的自然语言查询方法及*** |
CN109064294A (zh) * | 2018-08-21 | 2018-12-21 | 重庆大学 | 一种融合时间因素、文本特征和相关性的药品推荐方法 |
CN109147010A (zh) * | 2018-08-22 | 2019-01-04 | 广东工业大学 | 带属性人脸图像生成方法、装置、***及可读存储介质 |
CN109598794A (zh) * | 2018-11-30 | 2019-04-09 | 苏州维众数据技术有限公司 | 三维gis动态模型的构建方法 |
CN109598063A (zh) * | 2018-12-04 | 2019-04-09 | 中国航空无线电电子研究所 | 一种基于aadl的数据链组网动态模型驱动方法 |
CN109902144A (zh) * | 2019-01-11 | 2019-06-18 | 杭州电子科技大学 | 一种基于改进wmd算法的实体对齐方法 |
CN109783614A (zh) * | 2019-01-25 | 2019-05-21 | 北京信息科技大学 | 一种社交网络待发布文本的差分隐私泄露检测方法及*** |
CN109885688A (zh) * | 2019-03-05 | 2019-06-14 | 湖北亿咖通科技有限公司 | 文本分类方法、装置、计算机可读存储介质和电子设备 |
CN110069631A (zh) * | 2019-04-08 | 2019-07-30 | 腾讯科技(深圳)有限公司 | 一种文本处理方法、装置以及相关设备 |
CN110334814A (zh) * | 2019-07-01 | 2019-10-15 | 阿里巴巴集团控股有限公司 | 用于构建风险控制模型的方法和*** |
CN110609998A (zh) * | 2019-08-07 | 2019-12-24 | 中通服建设有限公司 | 一种电子文档信息的数据提取方法、电子设备及存储介质 |
CN110471367A (zh) * | 2019-08-14 | 2019-11-19 | 上海明材教育科技有限公司 | 一种能够协同运动的动态三维模型的构建方法 |
CN110674272A (zh) * | 2019-09-05 | 2020-01-10 | 科大讯飞股份有限公司 | 一种问题答案确定方法及相关装置 |
CN110795482A (zh) * | 2019-10-16 | 2020-02-14 | 浙江大华技术股份有限公司 | 数据对标方法、装置、及存储装置 |
CN110889036A (zh) * | 2019-10-31 | 2020-03-17 | 深圳市微立德科技有限公司 | 一种多维度信息的处理方法、装置及终端设备 |
CN110796390A (zh) * | 2019-11-08 | 2020-02-14 | 云南电网有限责任公司昆明供电局 | 基于动态模型的配网检修、投产及带电作业申请融合*** |
CN111078833A (zh) * | 2019-12-03 | 2020-04-28 | 哈尔滨工程大学 | 一种基于神经网络的文本分类方法 |
CN111274783A (zh) * | 2020-01-14 | 2020-06-12 | 广州供电局有限公司 | 一种基于语义相似分析的围串标智能识别方法 |
CN111241793A (zh) * | 2020-02-17 | 2020-06-05 | 湖南快乐阳光互动娱乐传媒有限公司 | 解析富文本编辑器内容给原生客户端渲染的方法、***及介质 |
CN111404960A (zh) * | 2020-03-26 | 2020-07-10 | 军事科学院***工程研究院网络信息研究所 | 应用于天地一体化网络接入管控***的属性提取方法 |
CN111639815A (zh) * | 2020-06-02 | 2020-09-08 | 贵州电网有限责任公司 | 一种多模型融合预测电网缺陷物资的方法及*** |
CN111723371A (zh) * | 2020-06-22 | 2020-09-29 | 上海斗象信息科技有限公司 | 构建恶意文件的检测模型以及检测恶意文件的方法 |
CN112434691A (zh) * | 2020-12-02 | 2021-03-02 | 上海三稻智能科技有限公司 | 基于智能解析识别的hs编码匹配、展示方法、***及存储介质 |
CN114153962A (zh) * | 2021-11-26 | 2022-03-08 | 浙江大华技术股份有限公司 | 一种数据匹配方法、装置及电子设备 |
Non-Patent Citations (1)
Title |
---|
贾丽梅 等: ""基于动态权值的关联数据语义相似度算法研究"", 《计算机科学》 * |
Also Published As
Publication number | Publication date |
---|---|
CN114579712B (zh) | 2022-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12019675B2 (en) | Recognizing text in image data | |
CN109783617B (zh) | 用于答复问题的模型训练方法、装置、设备及存储介质 | |
US10740372B2 (en) | System and method for extracting data from a non-structured document | |
CN111582169B (zh) | 图像识别数据纠错方法、装置、计算机设备和存储介质 | |
US8971641B2 (en) | Spatial image index and associated updating functionality | |
CN107784057B (zh) | 医疗数据匹配方法和装置 | |
CN105843889B (zh) | 基于可信度面向大数据及普通数据的数据采集方法和*** | |
CN110990546A (zh) | 智能问答语料库更新方法和装置 | |
US20200142862A1 (en) | System and method for integrating message content into a target data processing device | |
CN105787028A (zh) | 一种名片校对方法及*** | |
CN110046155B (zh) | 特征数据库的更新、数据特征的确定方法、装置及设备 | |
CN111368867A (zh) | 档案归类方法及***、计算机可读存储介质 | |
US11442982B2 (en) | Method and system for acquiring data files of blocks of land and of building plans and for making matches thereof | |
CN112148819A (zh) | 结合rpa和ai的地址识别方法和装置 | |
CN112528882B (zh) | 基于ocr识别房产证信息确定方法、装置、设备及介质 | |
CN114579712B (zh) | 基于动态模型的文本属性提取匹配方法 | |
KR20160116789A (ko) | 학습 이력 관리 방법 및 이를 이용한 시스템 | |
CN112417195A (zh) | 基于移动端的商标查询***、方法及存储介质 | |
CN115827899A (zh) | 基于知识图谱的数据集成方法、装置、设备及存储介质 | |
JP2017111500A (ja) | 文字認識装置及びプログラム | |
CN110147791A (zh) | 文字识别方法、装置、设备及存储介质 | |
LU102633B1 (en) | Ticket troubleshooting support system | |
CN112333182B (zh) | 档案处理方法、装置、服务器及存储介质 | |
CN114547059A (zh) | 平台数据的更新处理方法、装置及计算机设备 | |
JP2012226429A (ja) | 画像検索および認識システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |