CN104915420A - 知识库数据处理方法及*** - Google Patents
知识库数据处理方法及*** Download PDFInfo
- Publication number
- CN104915420A CN104915420A CN201510315695.7A CN201510315695A CN104915420A CN 104915420 A CN104915420 A CN 104915420A CN 201510315695 A CN201510315695 A CN 201510315695A CN 104915420 A CN104915420 A CN 104915420A
- Authority
- CN
- China
- Prior art keywords
- relation information
- knowledge base
- template
- data
- machine learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种知识库数据处理方法,所述方法包括:从知识库中提取标记的三元组数据并选取所述三元组数据中的关系信息,根据选取的所述关系信息,训练得到与所述关系信息对应的模板,以所述模板作为输入特征,训练得到机器学习模型,在对所述机器学习模型评估达标后提取所述关系信息;将提取的所述关系信息加入所述知识库中,通过搜索引擎查询请求数据,并对查询到的数据进行模板匹配,再由所述机器学习模型进行预测处理。通过采用本发明,可更加准确高效地对知识库数据进行补充。
Description
技术领域
本发明涉及数据处理领域,更为具体而言,涉及一种知识库数据处理方法和***。
背景技术
当今各类信息的数字化应用已经越来越普及,人们在工作生活的方方面面都在应用各类知识库信息。然而,在知识库不断完善的过程中,需要对数据中不完整的数据进行补充。
特别是知识库的SPO三元组(Subject Predicate Object Triples)数据的补充,在工业界和学术界一直是一个待解决的问题。在大众应用知识库中,大概有94%的人物没有父母信息,大概有99%的人物没有种族信息。在中文知识库中这种情况尤为明显。尽管当前具有两种知识库三元组的数据补充方法。一种是从文本中提取,如从***,一般的网页提取三元组数据。另一种是构造查询,从搜索引擎返回的结果中提取三元组信息。但是第一种从文本中提取三元组数据存在的问题是需要对海量的网页进行解析,提取出三元组结果,这种召回比较高,但是抽取的三元组的准确度较低,受噪音的影响比较大。第二种从搜索引擎的结果中提取三元组的准确度比较高,但当前也只能利用搜索引擎对页面的评分进行了线性融合,导致得到的三元组数据的评分的可信度仍然有待提高。
为解决现有技术中知识库中三元组数据补充准确度低、受噪音影响大,亟需一种全新的知识库数据补充方式。
发明内容
为了解决现有技术中知识库中三元组数据补充准确度低、受噪音影响大的问题,本发明的实施方式提供了一种知识库数据补充方法和***。
一方面,本发明实施方式提供了一种知识库数据处理方法,所述方法包括:
从知识库中提取标记的三元组数据并选取所述三元组数据中的关系信息,根据选取的所述关系信息,训练得到与所述关系信息对应的模板,以所述模板作为输入特征,训练得到机器学习模型,在对所述机器学习模型评估达标后提取所述关系信息;
将提取的所述关系信息加入所述知识库中,通过搜索引擎查询请求数据,并对查询到的数据进行模板匹配,再由所述机器学习模型进行预测处理。
相应的,本发明实施方式还提供了一种知识库数据处理***,所述***包括:
训练模块,用于从知识库中提取标记的三元组数据并选取所述三元组数据中的关系信息,根据选取的所述关系信息,训练得到与所述关系信息对应的模板,以所述模板作为输入特征,训练得到机器学习模型,在对所述机器学习模型评估达标后提取所述关系信息;
处理模块,用于将提取的所述关系信息加入所述知识库中,通过搜索引擎查询请求数据,并对查询到的数据进行模板匹配,再由所述机器学习模型进行预测处理。
实施本发明的各种实施方式具有以下有益效果:可更加准确高效地对知识库数据进行补充。
附图说明
图1是根据本发明实施方式的知识库数据处理方法的流程图;
图2示出了图1所示方法的步骤S1的具体流程图;
图3是根据本发明实施方式的知识库数据处理***的架构图;
图4示出了图4所示的训练模块100的框图。
具体实施方式
以下结合附图和具体实施方式对本发明的各个方面进行详细阐述。其中,众所周知的模块、单元及其相互之间的连接、链接、通信或操作没有示出或未作详细说明。并且,所描述的特征、架构或功能可在一个或一个以上实施方式中以任何方式组合。本领域技术人员应当理解,下述的各种实施方式只用于举例说明,而非用于限制本发明的保护范围。还可以容易理解,本文所述和附图所示的各实施方式中的模块或单元或处理方式可以按各种不同配置进行组合和设计。
图1是根据本发明实施方式的知识库数据处理方法的流程图;参见图1,所述方法包括如下步骤:
S1,从知识库中提取标记的三元组数据并选取所述三元组数据中的关系信息,根据选取的所述关系信息,训练得到与所述关系信息对应的模板,以所述模板作为输入特征,训练得到机器学习模型,在对所述机器学习模型评估达标后提取所述关系信息;
S2,将提取的所述关系信息加入所述知识库中,在对所述机器学习模型评估达标后提取所述关系信息作为抽取器;将提取的抽取器加入所述的知识库数据处理流程中,在所述的知识库数据处理流程中,通过搜索引擎查询请求数据,并对查询到的数据进行模板匹配,再由所述机器学习模型进行预测处理。
在本发明的实施方式中,知识库数据处理方法可包括:执行步骤S1,从知识库中提取标记的三元组数据并选取所述三元组数据中的关系信息,根据选取的所述关系信息,训练得到与所述关系信息对应的模板,以所述模板作为输入特征,训练得到机器学习模型,在对所述机器学习模型评估达标后提取所述关系信息。其中,所述三元组数据包括:主体信息、客体信息和所述主体信息与所述客体信息之间的关系信息,其形式可表示为<主体,谓词,客体>。
接下来,执行步骤S2,其中,所述对查询到的数据进行模板匹配包括:对所述查询到的数据进行分词处理得到若干文本片段(例如,一个以上文本片段),将各个所述文本片段进行预处理后(包括名词或语法的检测)与所述模板进行匹配。例如,给定“卫夫子”和“儿子”分别作为主体信息和客体信息,我们的目标是抽取对应的“刘据”。首先针对<卫夫子,儿子>,构造相应的查询向搜索引擎查询;将搜索结果进行数据预处理,包括对其进行分句或分词处理,从而得到若干的文本片段,每个文本片段和训练好的模板进行匹配,输出潜在包含“刘据”的文本片段。然后对潜在包含“刘据”的文本片段进行过滤(包括但不限于:通过人名分词过滤的关系过滤方式,以及时间过滤和字典过滤等过来方式)。过滤完成后得到“刘据”这个候选列表。将“刘据”命中的模板集合训练机器学习模型,作为特征输入到机器学习模型中,输出“刘据”是“卫夫子儿子”成立的评分。最终根据评分由高至低进行排列,优选并输出待补充的知识库数据。过滤完成后得到“刘据”这个候选命中模板集合,将“刘据”命中的模板集合,作为特征输入到机器学习模型中,输出“刘据”是“卫夫子儿子”成立的评分。
通过采用本发明的实施方式,可更加准确高效地对知识库数据进行补充。
图2示出了图1所示方法的步骤S1的具体流程图。参见图2,所述步骤S1包括:
S11,从知识库中提取所述标记的三元组数据,挑选出所述三元组数据的主体信息和客体信息的文本片段,保留关系信息作为所述模板。主体替换成统一的“主体”标签(subject),客体替换成统一的“客体”标签(object),并保留描述主体和客体之间的词语,一起作为统一的模板。模板示例:“主体,儿子,客体”;“主体,儿子,是,客体”等,例如:从知识库中提取出已有的标记数据三元组<卫夫子,儿子,刘据>,构造查询向搜索引擎请求数据,将搜索结果中同时包含“卫夫子”和“刘据”的文本片段挑选出来,并将“卫夫子”替换成相应的标签,得到了相应的模板<主体,儿子,客体>。
S12,标记所述关系信息的标记样本作为正例,其他关系的标记样本作为负例,将所述正例和所述负例命中所述模板的集合作为输入特征,训练得到所述机器学习模型。
另外,S1步骤中所述在对所述机器学习模型评估达标后提取所述关系包括:对所述机器学习模型进行准确率和召回率的评估,当所述三元组数据达到预设标注值时,提取所述三元组数据中的关系信息(提取所述关系信息作为抽取器)。例如:在训练一种关系信息为“儿子”的时候,选择该关系“儿子”的标记样本作为正例(如<卫夫子,儿子,刘据>),其他关系的标记样本作为负例(<刘德华,女儿,刘向蕙>)。候选“刘据”在模板匹配的过程中会记录命中的模板集合(“主体,儿子,客体”;“主体,儿子,是,客体”等),作为正例特征;候选“刘向蕙”在模板匹配的过程中会记录命中的模板集合(“主体,女儿,客体”;“主体,女儿,是,客体”等),作为负例特征。我们将正例负例命中的模板集合作为特征输入,训练模型,并对训练好的模型进行准确率和召回率的评估,例如,可设置三元组达到一定的准确率(80%)后供后续抽取使用。
图3是根据本发明实施方式的知识库数据处理***的架构图。参见图3,所述***1包括:
训练模块100,用于从知识库中提取标记的三元组数据并选取所述三元组数据中的关系信息,根据选取的所述关系信息,训练得到与所述关系信息对应的模板,以所述模板作为输入特征,训练得到机器学习模型,在对所述机器学习模型评估达标后提取所述关系信息;
处理模块200,用于将提取的所述关系信息加入所述知识库中,在对所述机器学习模型评估达标后提取所述关系信息作为抽取器;将提取的抽取器加入所述的知识库数据处理流程中,在所述的知识库数据处理流程中,通过搜索引擎查询请求数据,并对查询到的数据进行模板匹配,再由所述机器学习模型进行预测处理。
在本发明的实施方式中,知识库数据处理***可包括:训练模块100,用于从知识库中提取标记的三元组数据并选取所述三元组数据中的关系信息(提取所述关系信息作为抽取器),根据选取的所述关系信息,训练得到与所述关系信息对应的模板,以所述模板作为输入特征,训练得到机器学习模型,在对所述机器学习模型评估达标后提取所述关系信息。其中,所述三元组数据包括:主体信息、客体信息和所述主体信息与所述客体信息之间的关系信息,其形式可表示为<主体,谓词,客体>。
处理模块200,用于将提取的所述关系信息加入所述知识库中,通过搜索引擎查询请求数据,并对查询到的数据进行模板匹配,再由所述机器学习模型进行预测处理,其中,所述对查询到的数据进行模板匹配包括:对所述查询到的数据进行分词处理得到若干文本片段,将各个所述文本片段进行预处理后(包括名词或语法的检测)与所述模板进行匹配。例如,给定“卫夫子”和“儿子”分别作为主体信息和客体信息,我们的目标是抽取对应的“刘据”。首先针对<卫夫子,儿子>,构造相应的查询向搜索引擎查询;将搜索结果进行数据预处理,包括对其进行分句或分词处理,从而得到若干的文本片段,每个文本片段和训练好的模板进行匹配,输出潜在包含“刘据”的文本片段。然后对潜在包含“刘据”的文本片段进行过滤(包括但不限于:通过人名分词过滤的关系过滤方式,以及时间过滤和字典过滤等过来方式)。过滤完成后得到“刘据”这个候选列表。将“刘据”命中的模板集合训练机器学习模型),作为特征输入到机器学习模型中,输出“刘据”是“卫夫子儿子”成立的评分。最终根据评分由高至低进行排列,优选并输出待补充的知识库数据。过滤完成后得到“刘据”这个候选命中模板集合,将“刘据”命中的模板集合,作为特征输入到机器学习模型中,输出“刘据”是“卫夫子儿子”成立的评分。
通过采用本发明的实施方式,可更加准确高效地对知识库数据进行补充。
图4示出了图4所示的训练模块100的框图。参见图4,所述训练模块100包括:
标记单元110,用于从知识库中提取所述标记的三元组数据,挑选出所述三元组数据的主体信息和客体信息的文本片段,保留关系信息作为所述模板。主体替换成统一的“主体”标签(subject),客体替换成统一的“客体”标签(object),并保留描述主体和客体之间的词语,一起作为统一的模板。模板示例:“主体,儿子,客体”;“主体,儿子,是,客体”等,例如:从知识库中提取出已有的标记数据三元组<卫夫子,儿子,刘据>,构造查询向搜索引擎请求数据,将搜索结果中同时包含“卫夫子”和“刘据”的文本片段挑选出来,并将“卫夫子”替换成相应的标签,得到了相应的模板<主体,儿子,客体>。
训练单元120,用于标记所述关系信息的标记样本作为正例,其他关系的标记样本作为负例,将所述正例和所述负例命中所述模板的集合作为输入特征,训练得到所述机器学习模型。
例如:在训练一种关系信息为“儿子”的时候,选择该关系“儿子”的标记样本作为正例(如<卫夫子,儿子,刘据>),其他关系的标记样本作为负例(<刘德华,女儿,刘向蕙>)。候选“刘据”在模板匹配的过程中会记录命中的模板集合(“主体,儿子,客体”;“主体,儿子,是,客体”等),作为正例特征;候选“刘向蕙”在模板匹配的过程中会记录命中的模板集合(“主体,女儿,客体”;“主体,女儿,是,客体”等),作为负例特征。我们将正例负例命中的模板集合作为特征输入,训练模型,并对训练好的模型进行准确率和召回率的评估,例如,可设置三元组达到一定的准确率(80%)后供后续抽取使用。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件结合硬件平台的方式来实现,当然也可以全部通过硬件来实施。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,智能手机或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本发明说明书中使用的术语和措辞仅仅为了举例说明,并不意味构成限定。本领域技术人员应当理解,在不脱离所公开的实施方式的基本原理的前提下,对上述实施方式中的各细节可进行各种变化。因此,本发明的范围只由权利要求确定,在权利要求中,除非另有说明,所有的术语应按最宽泛合理的意思进行理解。
Claims (10)
1.一种知识库数据处理方法,其特征在于,所述方法包括:
从知识库中提取标记的三元组数据并选取所述三元组数据中的关系信息,根据选取的所述关系信息,训练得到与所述关系信息对应的模板,以所述模板作为输入特征,训练得到机器学习模型,在对所述机器学习模型评估达标后提取所述关系信息;
将提取的所述关系信息加入所述知识库中,通过搜索引擎查询请求数据,并对查询到的数据进行模板匹配,再由所述机器学习模型进行预测处理。
2.如权利要求1所述的方法,其特征在于,所述三元组数据包括:主体信息、客体信息和所述主体信息与所述客体信息之间的关系信息。
3.如权利要求2所述的方法,其特征在于,从知识库中提取标记的三元组数据并选取所述三元组数据中的关系信息,根据选取的所述关系信息,训练得到与所述关系信息对应的模板,以所述模板作为输入特征,训练得到机器学习模型,包括:
从知识库中提取所述标记的三元组数据,挑选出所述三元组数据的主体信息和客体信息的文本片段,保留关系信息作为所述模板;
标记所述关系信息的标记样本作为正例,其他关系的标记样本作为负例,将所述正例和所述负例命中所述模板的集合作为输入特征,训练得到所述机器学习模型。
4.如权利要求1所述的方法,其特征在于,所述在对所述机器学习模型评估达标后提取所述关系包括:
对所述机器学习模型进行准确率和召回率的评估,当所述三元组数据达到预设标注值时,提取所述三元组数据中的关系信息。
5.如权利要求1所述的方法,其特征在于,所述对查询到的数据进行模板匹配包括:
对所述查询到的数据进行分词处理得到一个以上文本片段,将各个所述文本片段进行预处理后与所述模板进行匹配。
6.一种知识库数据处理***,其特征在于,所述***包括:
训练模块,用于从知识库中提取标记的三元组数据并选取所述三元组数据中的关系信息,根据选取的所述关系信息,训练得到与所述关系信息对应的模板,以所述模板作为输入特征,训练得到机器学习模型,在对所述机器学习模型评估达标后提取所述关系信息;
处理模块,用于将提取的所述关系信息加入所述知识库中,通过搜索引擎查询请求数据,并对查询到的数据进行模板匹配,再由所述机器学习模型进行预测处理。
7.如权利要求6所述的***,其特征在于,所述三元组数据包括主体信息、客体信息和所述主体信息与所述客体信息之间的关系信息。
8.如权利要求7所述的***,其特征在于,所述训练模块包括:
标记单元,用于从知识库中提取所述标记的三元组数据,挑选出所述三元组数据的主体信息和客体信息的文本片段,保留关系信息作为所述模板;
训练单元,用于标记所述关系信息的标记样本作为正例,其他关系的标记样本作为负例,将所述正例和所述负例命中所述模板的集合作为输入特征,训练得到所述机器学习模型。
9.如权利要求8所述的***,其特征在于,所述训练模块对所述机器学习模型评估达标后提取所述关系包括:
对所述机器学习模型进行准确率和召回率的评估,当所述三元组数据达到预设标注值时,提取所述三元组数据中的关系信息。
10.如权利要求6所述的***,其特征在于,所述处理模块中所述对查询到的数据进行模板匹配包括:
对所述查询到的数据进行分词处理得到一个以上文本片段,将各个所述文本片段进行预处理后与所述模板进行匹配。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510315695.7A CN104915420B (zh) | 2015-06-10 | 2015-06-10 | 知识库数据处理方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510315695.7A CN104915420B (zh) | 2015-06-10 | 2015-06-10 | 知识库数据处理方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104915420A true CN104915420A (zh) | 2015-09-16 |
CN104915420B CN104915420B (zh) | 2019-12-31 |
Family
ID=54084483
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510315695.7A Active CN104915420B (zh) | 2015-06-10 | 2015-06-10 | 知识库数据处理方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104915420B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106294186A (zh) * | 2016-08-30 | 2017-01-04 | 深圳市悲画软件自动化技术有限公司 | 智能软件自动化测试方法 |
WO2018171533A1 (en) * | 2017-03-23 | 2018-09-27 | Huawei Technologies Co., Ltd. | Review machine learning system |
CN109471888A (zh) * | 2018-11-15 | 2019-03-15 | 广东电网有限责任公司信息中心 | 一种快速过滤xml文件中无效信息的方法 |
CN110032650A (zh) * | 2019-04-18 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 一种训练样本数据的生成方法、装置及电子设备 |
CN110275962A (zh) * | 2019-06-25 | 2019-09-24 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN110413739A (zh) * | 2019-08-01 | 2019-11-05 | 苏州思必驰信息科技有限公司 | 用于口语语义理解的数据增强方法及*** |
CN110569335A (zh) * | 2018-03-23 | 2019-12-13 | 百度在线网络技术(北京)有限公司 | 基于人工智能的三元组校验方法、装置及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102982154A (zh) * | 2012-11-30 | 2013-03-20 | 首都师范大学 | 一种中文网页语义过滤方法 |
CN103139314A (zh) * | 2013-03-19 | 2013-06-05 | 东南大学 | 基于P2P的分布式Web服务发现方法及其*** |
CN103617265A (zh) * | 2013-12-03 | 2014-03-05 | 北京航空航天大学深圳研究院 | 一种基于本体语义信息的本体查询引擎优化*** |
US20160171062A1 (en) * | 2014-12-10 | 2016-06-16 | International Business Machines Corporation | Establishing User Specified Interaction Modes in a Question Answering Dialogue |
-
2015
- 2015-06-10 CN CN201510315695.7A patent/CN104915420B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102982154A (zh) * | 2012-11-30 | 2013-03-20 | 首都师范大学 | 一种中文网页语义过滤方法 |
CN103139314A (zh) * | 2013-03-19 | 2013-06-05 | 东南大学 | 基于P2P的分布式Web服务发现方法及其*** |
CN103617265A (zh) * | 2013-12-03 | 2014-03-05 | 北京航空航天大学深圳研究院 | 一种基于本体语义信息的本体查询引擎优化*** |
US20160171062A1 (en) * | 2014-12-10 | 2016-06-16 | International Business Machines Corporation | Establishing User Specified Interaction Modes in a Question Answering Dialogue |
Non-Patent Citations (2)
Title |
---|
(新西兰)威滕,(新西兰)弗兰克,(新西兰)霍尔著: "高级数据挖掘", 《数据挖掘 实用机器学习工具与技术 原书 第3版》 * |
ROBERT WEST ET AL.: "Knowledge base completion via search-based question answering", 《THE INTERNATIONAL WORLD WIDE WEB CONFERENCE COMMITTEE》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106294186A (zh) * | 2016-08-30 | 2017-01-04 | 深圳市悲画软件自动化技术有限公司 | 智能软件自动化测试方法 |
WO2018171533A1 (en) * | 2017-03-23 | 2018-09-27 | Huawei Technologies Co., Ltd. | Review machine learning system |
US11138514B2 (en) | 2017-03-23 | 2021-10-05 | Futurewei Technologies, Inc. | Review machine learning system |
CN110569335A (zh) * | 2018-03-23 | 2019-12-13 | 百度在线网络技术(北京)有限公司 | 基于人工智能的三元组校验方法、装置及存储介质 |
US11275810B2 (en) | 2018-03-23 | 2022-03-15 | Baidu Online Network Technology (Beijing) Co., Ltd. | Artificial intelligence-based triple checking method and apparatus, device and storage medium |
CN109471888A (zh) * | 2018-11-15 | 2019-03-15 | 广东电网有限责任公司信息中心 | 一种快速过滤xml文件中无效信息的方法 |
CN109471888B (zh) * | 2018-11-15 | 2021-11-09 | 广东电网有限责任公司信息中心 | 一种快速过滤xml文件中无效信息的方法 |
CN110032650A (zh) * | 2019-04-18 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 一种训练样本数据的生成方法、装置及电子设备 |
CN110275962A (zh) * | 2019-06-25 | 2019-09-24 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN110413739A (zh) * | 2019-08-01 | 2019-11-05 | 苏州思必驰信息科技有限公司 | 用于口语语义理解的数据增强方法及*** |
CN110413739B (zh) * | 2019-08-01 | 2021-11-12 | 思必驰科技股份有限公司 | 用于口语语义理解的数据增强方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN104915420B (zh) | 2019-12-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104915420A (zh) | 知识库数据处理方法及*** | |
CN106815192B (zh) | 模型训练方法及装置和语句情感识别方法及装置 | |
CN103123618B (zh) | 文本相似度获取方法和装置 | |
CN108319888B (zh) | 视频类型的识别方法及装置、计算机终端 | |
CN102081732B (zh) | 一种版式识别模板方法及*** | |
CN106815194A (zh) | 模型训练方法及装置和关键词识别方法及装置 | |
CN106708949A (zh) | 一种视频有害内容识别方法 | |
CN104268541A (zh) | 一种设备铭牌和能效标识的智能化图像识别方法 | |
CN103150359B (zh) | 微博信息显示方法和装置 | |
CN109977668B (zh) | 恶意代码的查询方法及*** | |
CN105550253B (zh) | 一种类型关系的获取方法及装置 | |
CN110909168A (zh) | 知识图谱的更新方法和装置、存储介质及电子装置 | |
CN109284763A (zh) | 一种生成分词训练数据的方法和服务器 | |
CN103488998A (zh) | 一种基于神经网络和图像处理技术的身份证识别方法 | |
CN104063701B (zh) | 基于surf词汇树和模板匹配的快速电视台台标识别***及其实现方法 | |
CN104915399A (zh) | 基于新闻标题的推荐数据处理方法及*** | |
CN106933919A (zh) | 数据表的连接方法及装置 | |
CN105825228A (zh) | 图像识别方法及装置 | |
CN103678554A (zh) | 字符替换的方法和装置 | |
CN102693236A (zh) | 基于内容理解的不良信息过滤方法 | |
CN104298786B (zh) | 一种图像检索方法及装置 | |
CN104408188B (zh) | 数据处理方法和装置 | |
CN111475699B (zh) | 网站数据爬取方法和装置、电子设备、及可读存储介质 | |
CN102200966A (zh) | 一种版面信息提取和加工的方法 | |
US11386340B2 (en) | Method and apparatus for performing block retrieval on block to be processed of urine sediment image |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |