CN108415971A - 采用知识图谱推荐供求信息的方法和装置 - Google Patents
采用知识图谱推荐供求信息的方法和装置 Download PDFInfo
- Publication number
- CN108415971A CN108415971A CN201810128794.8A CN201810128794A CN108415971A CN 108415971 A CN108415971 A CN 108415971A CN 201810128794 A CN201810128794 A CN 201810128794A CN 108415971 A CN108415971 A CN 108415971A
- Authority
- CN
- China
- Prior art keywords
- demand
- triple
- supply
- service
- predicate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/105—Human resources
- G06Q10/1053—Employment or hiring
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Computational Linguistics (AREA)
- Animal Behavior & Ethology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种采用知识图谱推荐供求信息的方法和装置,前述方法包括:判断是否有一般三元组同时包含供需三元组A和供需三元组B的实体,和/或,是否有一般三元组同时包含供需三元组A和供需三元组C的服务;如果有,则将包含供需三元组C中服务、并且谓词与供需三元组C中谓词涵义相反的供需三元组推荐给供需三元组B的实体。在进行数据推荐时,通过供需三元组建立未直接联系的元素的可能性关系,再在一般三元组中检索是否有前述元素的关联关系;在一般三元组有前述关联关系的情况下认为前述可能性关系存在的概率较高,并据此实现信息的推荐。
Description
技术领域
本发明涉及信息检索技术领域,更为具体地,涉及一种采用知识图谱推荐供求信息的方法,还涉及一种采用知识图谱推荐供求信息的装置。
背景技术
以各种形式发布并存储在网络中、采用各种方式记载的文档中包含大量相互关联的关系信息。为开发相互关联的关系信息,搜索引擎服务商开发了各种数据挖掘算法,并依托数据挖掘算法向定向用户提供关系信息推送服务。
目前,得到广泛使用的文本数据挖掘算法有知识图谱算法。知识图谱算法通过提取文本中的三元组,通过三元组建立知识图谱,并利用建立的知识图谱向用户推荐关系信息。
在专门用于商业供求信息推荐的搜索引擎中,利用知识图谱向用户推荐供求信息时,建立知识图谱的各个三元组中的谓词均为供需谓词;向用户推荐供求信息时,检索引擎通过供需谓词确定向用户推荐的内容。
例如有如下三元组组成的知识图谱:{A公司,需要,数据挖掘服务},{B公司,需要,数据挖掘服务},{B公司,需要,打印服务},{D公司,提供,打印服务}。因为A公司和B公司均需要数据挖掘服务,所以搜索引擎即认为A公司和B公司为相同行业或者相似行业,二者需要相同产品的概率很大;进行线索推荐时,搜索引擎即将三元组{D公司,提供,打印服务}推荐给A。
而实际情况是A公司和B公司的行业类型并不相同,A公司偶然地需要数据挖掘服务,并且不需要打印服务。前述推荐因为B公司同时需要数据挖掘服务和打印服务,就认为数据挖掘服务和打印服务具有较大概率的关联关系,并将{D公司,提供,打印服务}的信息推荐给A公司;但前述推荐与实际情况并不相同。在两个实体关联度不大、两个服务关联度也不大的情况下,前述推荐的信息被A公司采用的概率很低。
发明内容
本发明提供一种采集知识图谱推荐供求信息的方法和装置,通过一般三元组验证用已知供需三元组推断出事件的概率大小,以解决现有技术信息推荐命中概率较低的问题。
一方面,本发明提供一种采用知识图谱推荐供求信息的方法,
其中,所述知识图谱包括供需三元组A、供需三元组B、供需三元组C和至少一个一般三元组;
所述供需三元组A、所述供需三元组B和所述供需三元组C均为由实体、供需谓词和服务组成的三元组;所述一般三元组为不包含供需谓词的三元组;所述方法包括:
在所述供需三元组A、所述供需三元组B和所述供需三元组C的谓词相同,所述供需三元组A和所述供需三元组B的服务相同,并且,所述供需三元组A和所述供需三元组C的实体相同的情况下,
判断是否有所述一般三元组同时包含所述供需三元组A和所述供需三元组B的实体,和/或,
是否有所述一般三元组同时包含所述供需三元组A和所述供需三元组C的服务;
如果有,则将服务为所述供需三元组C中服务、并且谓词与供需三元组C中谓词涵义相反的供需三元组推荐给供需三元组B的实体。
可选的,在前述方法中:
如果所述供需三元组A和所述供需三元组B的服务相同,但是谓词的涵义相反,
则将所述供需三元组A推荐给供需三元组B中的实体。
另一方面,本发明提供一种采用知识图谱推荐供求信息的装置,包括:
存储单元,用于存储所述知识图谱;其中,所述知识图谱包括供需三元组A、供需三元组B、供需三元组C和至少一个一般三元组;所述供需三元组A、所述供需三元组B和所述供需三元组C均为由实体、供需谓词和服务组成的三元组;所述一般三元组为不包含供需谓词的三元组;
判断单元,用于在所述供需三元组A、所述供需三元组B和所述供需三元组C的谓词相同,所述供需三元组A和所述供需三元组B的服务相同,并且,所述供需三元组A和所述供需三元组C的实体相同的情况下,判断是否有所述一般三元组同时包含所述供需三元组A和所述供需三元组B的实体,和/或,判断是否有所述一般三元组同时包含所述供需三元组A和所述供需三元组C的服务;
推荐单元,用于在所述一般三元组同时包含所述供需三元组A和所述供需三元组B的实体时,或者在所述一般三元组同时包含所述供需三元组A和所述供需三元组C的服务时,将服务为所述供需三元组C中服务、并且谓词与供需三元组C中谓词涵义相反的供需三元组推荐给供需三元组B的实体。
可选的,在前述装置中:判断单元还用于判断所述供需三元组A和所述供需三元组B的服务是否相同、谓词的涵义是否相反;
推荐单元,还用于在所述供需三元组A和所述供需三元组B的服务相同、谓词的涵义相反的情况下,将所述供需三元组A推荐给供需三元组B中的实体。
再一方面,本发明提供一种采用知识图谱推荐供求信息的方法,其中,所述知识图谱包括供需三元组A、供需三元组B、供需三元组C和至少一个一般三元组;
所述供需三元组A、所述供需三元组B和所述供需三元组C均为由实体、供需谓词和服务组成的三元组;
所述一般三元组为不包含供需谓词的三元组;所述方法包括:
在所述供需三元组A和所述供需三元组B的实体和谓词均相同,所述供需三元组A的谓词与所述供需三元组C的谓词涵义相反,所述供需三元组A的服务和所述供需三元C的服务相同的情况下,
判断是否有所述一般三元组是否包含供需三元组A和所述供需三元组B的服务,
如果有,则将所述供需三元组B推荐给供需三元组C中的实体。
再一方面,本发明提供一种采用知识图谱推荐供求信息的装置,包括存储单元,用于存储所述知识图谱;其中,所述知识图谱包括供需三元组A、供需三元组B、供需三元组C和至少一个一般三元组;所述供需三元组A、所述供需三元组B和所述供需三元组C均为由实体、供需谓词和服务组成的三元组;所述一般三元组为不包含供需谓词的三元组;
判断单元,用于在所述供需三元组A和所述供需三元组B的实体和谓词均相同,所述供需三元组A的谓词与所述供需三元组C的涵义相反,所述供需三元组A和所述供需三元C的服务相同的情况下,判断是否有所述一般三元组是否包含供需三元组A和所述供需三元组B的服务;
推荐单元,用于在所述一般三元组包含供需三元组A和所述供需三元组B的服务的情况下,将所述供需三元组A推荐给供需三元组C中的实体。
采用前述方法或者装置进行信息推荐时,通过供需三元组建立未直接联系的实体与实体、服务与服务、实体与服务的可能性联系,再利用一般三元组中检索是否有前述实体与实体、服务与服务、实体与服务的关联关系;在一般三元组有前述关联关系的情况下认为前述可能性关系存在的概率较高,并据此实现信息的推荐。
附图说明
通过参考以下结合附图的说明及权利要求书的内容,并且随着对本发明的更全面理解,本发明的其它目的及结果将更加明白及易于理解。在附图中:
图1是实施例一提供的采用知识图谱推荐供求信息的方法流程图;
图2是实施例一提供的采用知识图谱推荐供求信息的装置结构图;
图3是实施例二提供的采用知识图谱推荐供求信息的方法流程图;
图4是实施例二提供的采用知识图谱推荐供求信息的装置结构图;
图2中:11-存储单元,12-判断单元,13-推荐单元;图4中:21-存储单元,22-判断单元,23-推荐单元。
在所有附图中相同的标号指示相似或相应的特征或功能。
具体实施方式
本发明提供一种采用知识图谱推荐供求信息的方法,利用其它关联信息和知识图谱中的供需三元组结合,进行相关信息关联性的判定,并根据判定结果确定是否推荐信息。以下将结合附图对本发明的具体实施例进行详细描述。
知识图谱是进行供求信息推荐方法的基础,因此在具体陈述各个实施例前,首先对本发明实施例中采用的知识图谱的建立方法、知识图谱中的元素类型做简要的说明。
知识图谱的组成元素是三元组,因此在建立知识图谱前需要获得建立知识图谱的三元组。因为三元组是从文本文档、用户输入结构化数据、半结构化数据中得出,所以需要对各种数据进行各种规范化处理,形成三元组。具体的,三元组提取可以由人工处理完成,也可以由训练得到的各种文本处理算法得到。
本申请中提供的知识图谱建立方法中,首先通过人工标注的方法和专家知识对样本文档进行训练、获取各种类型的抽取器,再利用训练得到的抽取器对文本总体进行训练,得到各种类型的三元组。
人工标注过程中,首先对样本文档进行分词,并去掉分词结果中的停用词、虚词等不符合当前语言习惯或者没有实际涵义的类型词,仅留下名词和动词。在分词过程中,分别对内涵为实体和服务的名词、对内涵是供需谓词的动词进行标注。
具体的:实体是可以进行日常交易的主体(包括组织和个人),例如“XX公司”、“XX机构”和“张三”等;服务是日常交易的客体,不仅可以是诸如“货物”、“楼房”、“石油”等实例性实体,也可以是诸如“工程”、“数据服务”、“智能设备”等概念性实体;供需谓词可以是“需要”、“采购”、“提供”和“发布”等谓词。
具体实施中,本申请采用实体识别软件进行实体的标注,采用人工标注方法对供需谓词和服务进行分类。当然,在其他实施例中也可以采用人工标准方法实现实体的标注。
使用被标注的文本对建立的模型进行训练,得到实体抽取器、供需谓词分类器和服务分类器,直至各个分析器均达到预定的准确度标准。此处对供需谓词分类器进行特别说明,供需谓词分类器为二元分类器,其可以将供需谓词分为“需要”和“提供”两类。
利用得到的实体抽取器、供需谓词分类器和服务分类器分别对总体文本进行标注,得到标注化的总体文本D。当然,在实际操作中,也可以采用人工标注的方法对总体文本进行标注。
总体文本D进行各种词性标注后,对文本进行三元组提取。对三元组进行提取分为两部分,分别为供需三元组的提取和一般三元组的提取。
供需三元组提取的主要步骤如下。首先是基于实体和服务,提取D中形如{实体,谓词,服务名称}的三元组;随后根据对谓词的标记、谓词的涵义,将其中的供需谓词替换为“需要”或者“提供”两类供需谓词,并剔除其中谓词为非供需谓词的三元组,形成供需三元组集合。实际应用中,可以通过调整供需谓词分类器中窗口的阈值改变得到的供需谓词的数量。
一般三元组提取除了包括供需三元组提取时被剔除的谓词为非供需谓词、形如{实体,谓词,服务名称}的三元组外,还包括其他各种类型的三元组,例如由{实体,谓词,实体}、{服务,谓词,服务}的三元组。
在本发明一个具体实施中,提取一个文档D形成的供需三元组包括:{斗志公司,提供,云计算},{斗志公司,提供,数据挖掘},{斗志公司,需求,自然语言处理工程师},{斗志公司,需求,数据采集},{α公司,需求,云计算},{β公司,需求,数据挖掘},{兰达机器学习团队,提供,数据挖掘},{陶博士,需求,云计算},{官大大数据公司,提供,云计算},{官大大数据公司,需求,自然语言处理工程师},{李四,提供,数据采集}(其中,斗志公司、α公司、β公司、兰达机器学习团队和官大大数据公司是企业或者类似企业的社会团体组织,李四为个人)。
提取一个文档D形成的一般三元组包括:{徐博士,is CEO of,斗志公司},{徐博士,校友,陶博士},{官大大数据公司,type,高新技术软件企业},{斗志公司,type,高新技术软件企业},{云计算,type,数据服务},{数据挖掘,type,数据服务},{自然语言处理工程师,type,人才服务},{斗志公司,type,命名实体识别},{自然语言处理工程师,type,服务实体识别},{自然语言处理工程师,学习,数据采集},{云计算,相关,数据挖掘}。
采用前述的供需三元组和一般三元组形成知识图谱。
实施例一
图1是实施例一提供的采用知识图谱推荐供求信息的方法流程图。如图1所示,本实施例提供的采用知识图谱推荐供求信息的方法包括以下步骤。
S101:判断供需三元组A和供需三元组B的服务是否相同;如果相同,则执行S102;如果不同,则执行结束。
S102:判断供需三元则A和供需三元组B的谓词是否相同;如果相反,则执行S103;如果相同,则执行S104。
S103:将供需三元组A推荐给供需三元组B中的实体。
S104:查找是否有供需三元组C包含供需三元组A中的实体,并且谓词与供需三元组A涵义相同;如果有,则执行S105;如果否,则执行结束。
S105:判断是否有一般三元组同时包含供需三元组A和供需三元组B的实体,和/或,判断是否有一般三元组同时包含供需三元组A和供需三元组C的服务;
如果有,则执行S106;如果没有,则执行结束。
S106:将服务为供需三元组C中服务、并且谓词与供需三元组C中谓词涵义相反的供需三元组推荐给供需三元组B中的实体。
以下通过前文建立的知识图谱中的三元组进行举例。
(1)根据前述的知识图谱,检索到两个供需三元组分别为{斗志公司,提供,云计算}(供需三元组A)和{α公司,需求,云计算}(供需三元组B)。
采用前述的方法,{斗志公司,提供,云计算}和{α公司,需求,云计算}符合S101但不符合S102,应当执行S103,将{斗志公司,提供,云计算}推荐给X公司;同样的,也可以将{α公司,需求,云计算}推荐给斗志公司。
(2)根据前述的知识图谱,检索到三个供需三元组{斗志公司,提供,云计算}(供需三元组A),{官大大数据公司,提供,云计算}(供需三元组B)和{斗志公司,提供,数据挖掘}(供需三元组C)。
因为{斗志公司,提供,云计算}和{官大大数据公司,提供,云计算}的服务和谓词相同,所以执行S104;因为{斗志公司,提供,数据挖掘}的实体与{斗志公司,提供,云计算}中的实体和谓词均相同,所以可以继续执行S105。
查找一般三元组后,发现{斗志公司,合作伙伴,官大大数据公司}符合S105中条件,则可以将包含{斗志公司,提供,数据挖掘}中服务“数据挖掘”、并且谓词为与“提供”相反的供需三元组推荐给“官大大数据公司”,即将{β公司,需求,数据挖掘}推荐给“官大大数据公司”。
根据逻辑推理,因为“斗志公司”和“官大大数据公司”均提供“云计算”服务,所以二者可能属于同一类型服务的实体,“官大大数据公司”也可能提供“数据挖掘”。但是,前述推理为真的概率还相对较小,需要通过其他条件进一步地验证“斗志公司”和“官大大数据公司”为同一类型实体的概率。
而从一般三元组{斗志公司,合作伙伴,官大大数据公司}可确定“斗志公司”和“官大大数据公司”有除了提供相同服务以外的其他联系,使得“斗志公司”和“官大大数据公司”为同一类实体的概率提高,“官大大数据公司”提供“数据挖掘”的概率相应地提高。因此,可以将需求“数据挖掘”的实体推荐给“官大大数据公司”。而{β公司,需求,数据挖掘}是与{斗志公司,提供,数据挖掘}中的服务相同,则可以将{β公司,需求,数据挖掘}推荐给“官大大数据公司”。
(3)根据前述知识图谱,检索到三个供需三元组{斗志公司,需求,自然语言处理工程师}(供需三元组A)、{官大大数据公司,需求,自然语言处理工程师}(供需三元组B)和{斗志公司,需求,数据采集}(供需三元组C)。
因为{斗志公司,需求,自然语言处理工程师}和{官大大数据公司,需求,自然语言处理工程师}的服务和谓词相同,所以执行S104;因为{斗志公司,需求,数据采集}和{斗志公司,需求,自然语言处理工程师}实体和谓词均相同,所以执行S105。
查找一般三元组后,发现{自然语言处理工程师,擅长,数据采集}符合S105中条件,则可以将包含{斗志公司,需求,数据采集}中服务“数据采集”、并且谓词为“提供”供需三元组推荐给“官大大数据公司”,即将{李四,提供,数据采集}推荐给“官大大数据公司”。
根据逻辑推理,因为“斗志公司”和“官大大数据公司”均需求“自然语言处理工程师”,“官大大数据公司”也可能需要“数据采集”。但是,前述逻辑推理概率为真的概率还相对较小,需要通过其他条件进一步地验证“斗志公司”和“官大大数据公司”为提供同一类型服务实体的概率。
而从一般三元组{自然语言处理工程师,擅长,数据采集}可确定,“自然语言处理工程师”和“数据处理”为同一类型服务的概率增大,使得“官大大数据公司”需求“数据采集”的概率相应地提高。因此,可以将提供“数据采集”的实体推荐给“官大大数据公司”。而{李四,提供,数据采集}是与{斗志公司,需求,数据采集}的服务相同,则可以将{李四,提供,数据采集}推荐给“官大大数据公司”。
(4)根据前述知识图谱,检索到三个供需三元组{斗志公司,提供,云计算}(供需三元组A),{官大大数据公司,提供,云计算}(供需三元组B)和{斗志公司,提供,数据挖掘}(供需三元组C)。
因为{斗志公司,提供,云计算}和{官大大数据公司,提供,云计算}的服务和谓词相同,所以执行S104;因为{斗志公司,提供,数据挖掘}与{斗志公司,提供,云计算}中的实体和谓词均相同,所以可以继续执行S105。
查找一般三元组后,发现{云计算,相关,数据挖掘}符合S105中条件,则可以将包含{斗志公司,提供,数据挖掘}中服务“数据挖掘”、并且谓词为与“提供”相反的供需三元组推荐给“官大大数据公司”,即将{B公司,需求,数据挖掘}推荐给“官大大数据公司”。
根据逻辑推理,因为“斗志公司”和“官大大数据公司”均提供“云计算”服务,所以二者可能属于提供同一类型服务的实体,“官大大数据公司”也可能提供“数据挖掘”。但是,需要验证“云计算”和“数据挖掘”为同一类型服务,才能估计“斗志公司”和“官大大数据公司”是同一类的实体的概率较高。
而从一般三元组{云计算,相关,数据挖掘}可确定“云计算”和“数据挖掘”属于同一类服务,则“斗志公司”和“官大大数据公司”为同一类实体的概率提高,“官大大数据公司”提供“数据挖掘”的概率相应地提高。因此,可以将需求“数据挖掘”的实体推荐给官大大数据公司。而{β公司,需求,数据挖掘}是与{斗志公司,提供,数据挖掘}中的服务相同,则可以将{β公司,需求,数据挖掘}推荐给“官大大数据公司”。
(5)根据前述知识图谱,检索到三个供需三元组{斗志公司,提供,云计算}(供需三元组A),{官大大数据公司,提供,云计算}(供需三元组B)和{斗志公司,提供,数据挖掘}(供需三元组C)。
因为{斗志公司,提供,云计算}和{官大大数据公司,提供,云计算}的服务和谓词相同,所以执行S104;因为{斗志公司,提供,数据挖掘}与{斗志公司,提供,云计算}中的实体和谓词均相同,所以继续执行S105。
查找一般三元组后,发现{云计算,相关,数据挖掘}、{斗志公司,合作伙伴,官大大数据公司}符合S105中条件,则可以将包含{斗志公司,提供,数据挖掘}中服务“数据挖掘”、并且谓词为与“提供”相反的供需三元组推荐给“官大大数据公司”,即将{B公司,需求,数据挖掘}推荐给“官大大数据公司”。
(6)根据前述知识图谱,检索到三个供需三元组{斗志公司,需求,自然语言处理工程师}(供需三元组A)、{官大大数据公司,需求,自然语言处理工程师}(供需三元组B)和{斗志公司,需求,数据采集}(供需三元组C)。
因为{斗志公司,需求,自然语言处理工程师}和{官大大数据公司,需求,自然语言处理工程师}的服务和谓词相同,所以执行S104;因为{斗志公司,需求,数据采集}和{斗志公司,需求,自然语言处理工程师}的实体和谓词相同,所以执行S105。
查找一般三元组后,发现{自然语言处理工程师,学习,数据采集}、{斗志公司,合作伙伴,官大大数据公司}符合S105中条件,则可以将包含{斗志公司,需求,数据采集}中服务“数据采集”、并且谓词为与“需求”相反的供需三元组推荐给“官大大数据公司”,即将{李四,提供,数据采集}推荐给“官大大数据公司”。
本实施例除了提供前述的采用知识图谱推荐供求信息的方法外,还提供一种采用知识图谱推荐供求信息的装置。图2是实施例一提供的采用知识图谱推荐供求信息的装置结构图,如图2所示,本实施例提供的采用知识图谱推荐供求信息的装置包括存储单元11、判断单元12和推荐单元13。
存储单元11用于存储前述的知识图谱。知识图谱包括供需三元组A、供需三元组B、供需三元组C和至少一个一般三元组。
判断单元12,用于在供需三元组A、供需三元组B和供需三元组C的谓词相同,供需三元组A和供需三元组B的服务相同,并且,供需三元组A和供需三元组C的实体相同的情况下,判断是否有一般三元组同时包含供需三元组A和供需三元组B的实体,或者,判断是否有一般三元组同时包含供需三元组A和供需三元组C的服务。
推荐单元13,用于在一般三元组同时包含供需三元组A和供需三元组B的实体时,和/或,在一般三元组同时包含供需三元组A和供需三元组C的服务时,将服务为供需三元组C中服务、并且谓词与供需三元组C中谓词涵义相反的供需三元组推荐给供需三元组B的实体。
与前述方法对应的,本实施例提供的采用知识图谱推荐供求信息的装置中:判断单元还用于判断单元还用于判断供需三元组A和供需三元组B的服务是否相同、谓词的涵义是否相反;推荐单元还用于在供需三元组A和供需三元组B的服务相同、谓词的涵义相反的情况下,将供需三元组A推荐给供需三元组B中的实体。
实施例二
图3是实施例二提供的采用知识图谱推荐供求信息的方法流程图。如图3所示,本实施例提供的采用知识图谱推荐供求信息的方法包括以下步骤。
S201:判断供需三元组A和供需三元组B的实体是否相同;如果相同,则执行S202;如果不同,则执行结束。
S202:判断供需三元则A和供需三元组B的谓词是否相同;如果相反,则执行结束;如果相同,则执行S204。
S204:查找是否有包含供需三元组A中的服务、但是谓词与供需三元组A中谓词相反的供需三元组C;如果有,则执行S205;如果否,则执行结束。
S205:判断是否有一般三元组同时包含供需三元组A和供需三元组B的服务;
如果有,则执行S206;如果没有,则执行结束。
S206:将供需三元组B推荐给供需三元组C中的实体。
以下通过前文建立的知识图谱中的三元组进行举例。
(1)根据前述的知识图谱,检索到两个供需三元组分别为{斗志公司,需求,数据采集}(供需三元组A)和{斗志公司,需求,自然语言采集工程师}供需三元组B)和{李四,提供,数据采集}(供需三元组C)。
因为{斗志公司,需求,自然语言采集工程师}和{斗志公司,需求,数据采集}的实体和谓词相同,所以执行S204;因为{李四,提供,数据采集}的服务与{斗志公司,需求,数据采集}与的服务相同、谓词与{斗志公司,需求,数据采集}相反,所以继续执行S205。
查找一般三元组后,发现{自然语言处理工程师,擅长,数据采集}符合S205的条件,则可以将{斗志公司,需求,自然语言采集工程师}推荐给{李四,提供,数据采集}中是实体“李四”。
根据逻辑推理,因为“斗志公司”同时需求“数据采集”和“自然语言采集工程师”,则“数据采集”和“自然语言采集工程师”可能是一类的服务,并且可能有同一实体提供。但是,前述推理为真的概率相对较小,需要通过其他条件进一步地验证。
而从一般三元组{自然语言处理工程师,擅长,数据采集}可确定“自然语言处理工程师”和“数据采集”之间又很大的关联性,二者由同一实体提供的概率较高。而在“李四”提供“数据采集”的前提下,“李四”提供(是)“自然语言处理工程师”的概率较高,而“斗志公司”又需求“自然语言处理工程师”,因此将{斗志公司,需求,自然语言采集工程师}推荐给“李四”。
本方案的可能应用场景是:李四在一些网站注册时,主要是基于自身具有的技能填写信息(例如直接填写了会数据采集),而没有基于企业的岗位需求(例如自然语言采集工程师);而因为数据采集仅仅是自然序言采集工程师可能提供的技能不仅仅是数据采集,还可能会其他技能;单单利用数据采集可能使得提供给李四的推荐信息过少(或者说过窄,如前文中仅提供{斗志公司,需求,数据采集});而采用实施例二的规则,则可以将推荐给李四的信息扩展,便于李四获得更多的信息。
(2)根据前述的知识图谱,检索到两个供需三元组分别为{斗志公司,提供,云计算}(供需三元组A)和{斗志公司,提供,数据挖掘}(供需三元组B)和{α公司,需求,云计算}(供需三元组C)。
因为{斗志公司,提供,云计算}和{斗志公司,提供,数据挖掘}的实体和谓词相同,所以执行S204;因为{斗志公司,提供,云计算}的服务与{α公司,需求,云计算}的服务相同、谓词与{α公司,需求,云计算}相反,所以继续执行S205。
查找一般三元组后,发现{云计算,相关,数据挖掘}符合S205的条件,则可以将{斗志公司,提供,数据挖掘}推荐给{α公司,需求,云计算}中的实体“α公司”。
根据逻辑推理,因为“斗志公司”同时提供“云计算”和“数据挖掘”,则“云计算”和“数据挖掘”可能是一类的服务,并且可能有实体同时需要。但是,前述推理为真的概率相对较小,需要通过其他条件进一步地验证。
而从一般三元组{云计算,相关,数据挖掘}可确定“云计算”和“数据挖掘”之间又很大的关联性,二者由同一实体提供的概率较高。而在“α公司”需求“云计算”的前提下,“α公司”需求“数据挖掘”的概率较高,而“斗志公司”又提供“数据挖掘”,因此将{斗志公司,提供,数据挖掘}推荐给“α公司”。
本实施例除了提供前述的采用知识图谱推荐供求信息的方法外,还提供一种采用知识图谱推荐供求信息的装置。图4是实施例二提供的采用知识图谱推荐供求信息的装置结构图,如图4所示,本实施例提供的采用知识图谱推荐供求信息的装置包括存储单元21、判断单元22和推荐单元23。
存储单元21,用于存储知识图谱;其中,知识图谱包括供需三元组A、供需三元组B、供需三元组C和至少一个一般三元组;;
判断单元22,用于在供需三元组A和供需三元组B的实体和谓词均相同,供需三元组A的谓词与供需三元组C的谓词涵义相反,供需三元组A和供需三元C的服务相同的情况下,判断是否有一般三元组是否包含供需三元组A和供需三元组B的服务;
推荐单元23,用于在一般三元组包含供需三元组A和供需三元组B的服务的情况下,将供需三元组A推荐给供需三元组C中的实体。
与前述方法对应的,判断单元还用于在供需三元组A和供需三元组B的服务是否相同、谓词的涵义是否相反;
推荐单元还用于在供需三元组A和供需三元组B的服务相同、谓词涵义相反的情况下,将供需三元组A推荐给供需三元组B中的实体。
本发明提供的两个实施例中,在建立的知识图谱中同时包含供需三元组和一般三元组。在进行数据推荐时,通过供需三元组建立未直接联系的实体与实体、服务与服务、实体与服务的可能性关系,再在一般三元组中检索是否有前述实体与实体、服务与服务、实体与服务的关联关系;并在一般三元组有前述关联关系的情况下认为前述可能性关系存在的概率较高,并据此实现信息的推荐。
应当注意,在前述实施例采用的知识图谱中,供需三元组中的供需谓词也可以不采用“需求”和“供给”两个供需谓词,而是直接采用D中标记的供需谓词;但在此种情况下,需要对供需谓词的属性进行划分,即确定其是需求谓词还是供给谓词。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (6)
1.一种采用知识图谱推荐供求信息的方法,其特征在于:
所述知识图谱包括供需三元组A、供需三元组B、供需三元组C和至少一个一般三元组;
所述供需三元组A、所述供需三元组B和所述供需三元组C均为由实体、供需谓词和服务组成的三元组;所述一般三元组为不包含供需谓词的三元组;所述方法包括:
在所述供需三元组A、所述供需三元组B和所述供需三元组C的谓词相同,所述供需三元组A和所述供需三元组B的服务相同,并且,所述供需三元组A和所述供需三元组C的实体相同的情况下,
判断是否有所述一般三元组同时包含所述供需三元组A和所述供需三元组B的实体,和/或,
是否有所述一般三元组同时包含所述供需三元组A和所述供需三元组C的服务;
如果有,则将服务为所述供需三元组C中服务、并且谓词与供需三元组C中谓词涵义相反的供需三元组推荐给供需三元组B的实体。
2.根据权利要求1所述的采用知识图谱推荐供求信息的方法,其特征在于:
如果所述供需三元组A和所述供需三元组B的服务相同,但是谓词的涵义相反,
则将所述供需三元组A推荐给供需三元组B中的实体。
3.一种采用知识图谱推荐供求信息的装置,其特征在于,包括:
存储单元,用于存储所述知识图谱;其中,所述知识图谱包括供需三元组A、供需三元组B、供需三元组C和至少一个一般三元组;所述供需三元组A、所述供需三元组B和所述供需三元组C均为由实体、供需谓词和服务组成的三元组;所述一般三元组为不包含供需谓词的三元组;
判断单元,用于在所述供需三元组A、所述供需三元组B和所述供需三元组C的谓词相同,所述供需三元组A和所述供需三元组B的服务相同,并且,所述供需三元组A和所述供需三元组C的实体相同的情况下,
判断是否有所述一般三元组同时包含所述供需三元组A和所述供需三元组B的实体,和/或,判断是否有所述一般三元组同时包含所述供需三元组A和所述供需三元组C的服务;
推荐单元,用于在所述一般三元组同时包含所述供需三元组A和所述供需三元组B的实体时,或者在所述一般三元组同时包含所述供需三元组A和所述供需三元组C的服务时,将服务为所述供需三元组C中服务、并且谓词与供需三元组C中谓词涵义相反的供需三元组推荐给供需三元组B的实体。
4.根据权利要求3所述的采用知识图谱推荐供求信息的装置,其特征在于:
判断单元还用于判断所述供需三元组A和所述供需三元组B的服务是否相同、谓词的涵义是否相反;
推荐单元还用于在所述供需三元组A和所述供需三元组B的服务相同、谓词的涵义相反的情况下,将所述供需三元组A推荐给供需三元组B中的实体。
5.一种采用知识图谱推荐供求信息的方法,其特征在于:
所述知识图谱包括供需三元组A、供需三元组B、供需三元组C和至少一个一般三元组;
所述供需三元组A、所述供需三元组B和所述供需三元组C均为由实体、供需谓词和服务组成的三元组;
所述一般三元组为不包含供需谓词的三元组;所述方法包括:
在所述供需三元组A和所述供需三元组B的实体和谓词均相同,所述供需三元组A的谓词与所述供需三元组C的谓词涵义相反,所述供需三元组A的服务和所述供需三元C的服务相同的情况下,
判断是否有所述一般三元组包含供需三元组A和所述供需三元组B的服务,
如果有,则将所述供需三元组B推荐给供需三元组C中的实体。
6.一种采用知识图谱推荐供求信息的装置,其特征在于,包括:
存储单元,用于存储所述知识图谱;其中,所述知识图谱包括供需三元组A、供需三元组B、供需三元组C和至少一个一般三元组;所述供需三元组A、所述供需三元组B和所述供需三元组C均为由实体、供需谓词和服务组成的三元组;所述一般三元组为不包含供需谓词的三元组;
判断单元,用于在所述供需三元组A和所述供需三元组B的实体和谓词均相同,所述供需三元组A的谓词与所述供需三元组C的谓词涵义相反,所述供需三元组A的服务和所述供需三元C的服务相同的情况下,
判断是否有所述一般三元组是否包含供需三元组A和所述供需三元组B的服务;
推荐单元,用于在所述一般三元组包含供需三元组A和所述供需三元组B的服务的情况下,将所述供需三元组A推荐给供需三元组C中的实体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810128794.8A CN108415971B (zh) | 2018-02-08 | 2018-02-08 | 采用知识图谱推荐供求信息的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810128794.8A CN108415971B (zh) | 2018-02-08 | 2018-02-08 | 采用知识图谱推荐供求信息的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108415971A true CN108415971A (zh) | 2018-08-17 |
CN108415971B CN108415971B (zh) | 2021-07-23 |
Family
ID=63128081
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810128794.8A Active CN108415971B (zh) | 2018-02-08 | 2018-02-08 | 采用知识图谱推荐供求信息的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108415971B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109299472A (zh) * | 2018-11-09 | 2019-02-01 | 天津开心生活科技有限公司 | 文本数据处理方法、装置、电子设备及计算机可读介质 |
CN111460826A (zh) * | 2020-03-31 | 2020-07-28 | 科大讯飞(苏州)科技有限公司 | 实体分类方法以及相关装置 |
CN112837118A (zh) * | 2021-01-21 | 2021-05-25 | 北京电解智科技有限公司 | 企业用户的商品推荐方法和装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102262653A (zh) * | 2011-06-09 | 2011-11-30 | 华中科技大学 | 一种基于用户动机倾向性的标签推荐方法及*** |
CN103488724A (zh) * | 2013-09-16 | 2014-01-01 | 复旦大学 | 一种面向图书的阅读领域知识图谱构建方法 |
US20150095303A1 (en) * | 2013-09-27 | 2015-04-02 | Futurewei Technologies, Inc. | Knowledge Graph Generator Enabled by Diagonal Search |
CN105373590A (zh) * | 2015-10-22 | 2016-03-02 | 百度在线网络技术(北京)有限公司 | 知识数据的处理方法及装置 |
US20160224637A1 (en) * | 2013-11-25 | 2016-08-04 | Ut Battelle, Llc | Processing associations in knowledge graphs |
CN106209959A (zh) * | 2015-05-26 | 2016-12-07 | 徐尚英 | 基于用户需求的网络服务智能发现方法 |
CN107067230A (zh) * | 2017-04-12 | 2017-08-18 | 安徽有果信息技术服务有限公司 | 一种智能旅游大数据平台 |
CN107291687A (zh) * | 2017-04-27 | 2017-10-24 | 同济大学 | 一种基于依存语义的中文无监督开放式实体关系抽取方法 |
CN107391677A (zh) * | 2017-07-21 | 2017-11-24 | 深圳狗尾草智能科技有限公司 | 携带实体关系属性的中文通用知识图谱的生成方法及装置 |
CN107391512A (zh) * | 2016-05-17 | 2017-11-24 | 北京邮电大学 | 知识图谱预测的方法和装置 |
-
2018
- 2018-02-08 CN CN201810128794.8A patent/CN108415971B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102262653A (zh) * | 2011-06-09 | 2011-11-30 | 华中科技大学 | 一种基于用户动机倾向性的标签推荐方法及*** |
CN103488724A (zh) * | 2013-09-16 | 2014-01-01 | 复旦大学 | 一种面向图书的阅读领域知识图谱构建方法 |
US20150095303A1 (en) * | 2013-09-27 | 2015-04-02 | Futurewei Technologies, Inc. | Knowledge Graph Generator Enabled by Diagonal Search |
US20160224637A1 (en) * | 2013-11-25 | 2016-08-04 | Ut Battelle, Llc | Processing associations in knowledge graphs |
CN106209959A (zh) * | 2015-05-26 | 2016-12-07 | 徐尚英 | 基于用户需求的网络服务智能发现方法 |
CN105373590A (zh) * | 2015-10-22 | 2016-03-02 | 百度在线网络技术(北京)有限公司 | 知识数据的处理方法及装置 |
CN107391512A (zh) * | 2016-05-17 | 2017-11-24 | 北京邮电大学 | 知识图谱预测的方法和装置 |
CN107067230A (zh) * | 2017-04-12 | 2017-08-18 | 安徽有果信息技术服务有限公司 | 一种智能旅游大数据平台 |
CN107291687A (zh) * | 2017-04-27 | 2017-10-24 | 同济大学 | 一种基于依存语义的中文无监督开放式实体关系抽取方法 |
CN107391677A (zh) * | 2017-07-21 | 2017-11-24 | 深圳狗尾草智能科技有限公司 | 携带实体关系属性的中文通用知识图谱的生成方法及装置 |
Non-Patent Citations (1)
Title |
---|
陈柏良: "面向中文知识图谱的数据重组与应用", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109299472A (zh) * | 2018-11-09 | 2019-02-01 | 天津开心生活科技有限公司 | 文本数据处理方法、装置、电子设备及计算机可读介质 |
CN111460826A (zh) * | 2020-03-31 | 2020-07-28 | 科大讯飞(苏州)科技有限公司 | 实体分类方法以及相关装置 |
CN111460826B (zh) * | 2020-03-31 | 2024-02-20 | 科大讯飞(苏州)科技有限公司 | 实体分类方法以及相关装置 |
CN112837118A (zh) * | 2021-01-21 | 2021-05-25 | 北京电解智科技有限公司 | 企业用户的商品推荐方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108415971B (zh) | 2021-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105912645B (zh) | 一种智能问答方法及装置 | |
Wiratunga et al. | Feature selection and generalisation for retrieval of textual cases | |
CN108415971A (zh) | 采用知识图谱推荐供求信息的方法和装置 | |
Rizk et al. | A computationally efficient multi-modal classification approach of disaster-related Twitter images | |
CN110880142B (zh) | 一种风险实体获取方法及装置 | |
CN110516036A (zh) | 法律文书信息提取方法、装置、计算机设备及存储介质 | |
CN104536953A (zh) | 一种文本情绪极性的识别方法及装置 | |
CN102567375B (zh) | 数据挖掘方法及设备 | |
Choy | Effective listings of function stop words for twitter | |
CN103577766A (zh) | 电子文档的安全管理方法和*** | |
CN110458296A (zh) | 目标事件的标记方法和装置、存储介质及电子装置 | |
CN113094560A (zh) | 基于数据中台的数据标签库构建方法、装置、设备及介质 | |
Moreno-Garcia et al. | Digitisation of assets from the oil & gas industry: challenges and opportunities | |
CN108280357A (zh) | 基于语义特征提取的数据防泄漏方法、*** | |
Alves et al. | Leveraging BERT's Power to Classify TTP from Unstructured Text | |
CN107368610A (zh) | 基于全文的大文本 crf 和规则分类方法和*** | |
CN116739408A (zh) | 基于数据标签的电网调度安全监控方法、***及电子设备 | |
CN115953080A (zh) | 工程师服务等级确定方法、设备和存储介质 | |
Jamalpur et al. | Opinion mining on restaurant rating based on aspects | |
CN106777124B (zh) | 语义认知方法、装置及*** | |
CN113095073B (zh) | 语料标签生成方法、装置、计算机设备和存储介质 | |
Chen et al. | Email visualization correlation analysis forensics research | |
CN114708073A (zh) | 一种围标串标智能检测方法、装置、电子设备及存储介质 | |
CN110322252B (zh) | 风险主体识别方法以及装置 | |
Geng et al. | Using data mining methods to predict personally identifiable information in emails |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |