CN110737774B - 图书知识图谱的构建、图书推荐方法、装置、设备及介质 - Google Patents
图书知识图谱的构建、图书推荐方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN110737774B CN110737774B CN201810719673.0A CN201810719673A CN110737774B CN 110737774 B CN110737774 B CN 110737774B CN 201810719673 A CN201810719673 A CN 201810719673A CN 110737774 B CN110737774 B CN 110737774B
- Authority
- CN
- China
- Prior art keywords
- entity
- book
- entities
- books
- knowledge graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 100
- 238000010276 construction Methods 0.000 title claims abstract description 21
- 238000012545 processing Methods 0.000 claims description 17
- 238000013507 mapping Methods 0.000 claims description 14
- 238000001914 filtration Methods 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 13
- 238000012216 screening Methods 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 abstract description 13
- 230000008569 process Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 230000003287 optical effect Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 241000282465 Canis Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005295 random walk Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种图书知识图谱的构建、图书推荐方法、装置、计算机设备及存储介质。该图书推荐方法包括:获取与至少两本图书分别对应的文摘语料;根据与图书对应的文摘语料进行实体识别;根据识别出的实体,建立实体与图书关联表;根据所述实体与图书关联表,构建所述图书知识图谱,本发明实施例的技术方案,给出了一种根据各个实体与各本图书之间的关联程度构建图书知识图谱,并基于该图书知识图谱进行图书推荐的新方式,优化了现有的图书推荐技术,满足人们日益增长的个性化、便捷化的图书阅读需求。
Description
技术领域
本发明实施例涉及数据处理技术,尤其涉及一种图书知识图谱的构建、图书推荐方法、装置、计算机设备及存储介质。
背景技术
目前,随着手机等移动终端的普及以及电子书阅读器的发展,电子书越来越受阅读用户的青睐。现在的阅读类APP(应用程序),都会推荐一些比较畅销的图书或好评率较高的图书在主界面,供用户选择阅读。但是畅销的图书或者好评率较图书的书不一定是用户喜欢的。
随着技术的不断提高,人们对图书推荐技术的要求也在不断提高,现有的图书推荐技术已经无法满足人们日益增长的个性化、便捷化的图书阅读需求。
发明内容
本发明实施例提供了一种图书知识图谱的构建、图书推荐方法、装置、计算机设备及存储介质,以提供一种构建图书知识图谱的新方式,并基于该图书知识图谱提供一种图书推荐的新方式。
第一方面,本发明实施例提供了一种图书知识图谱的构建方法,包括:
获取与至少两本图书分别对应的文摘语料;
根据与图书对应的文摘语料进行实体识别;
根据识别出的实体,建立实体与图书关联表,所述实体与图书关联表中包括:实体与图书之间的第一关联权重;
根据所述实体与图书关联表,构建所述图书知识图谱。
第二方面,本发明实施例还提供了一种图书推荐方法,包括:
获取用户的至少一本历史关注图书,并根据所述历史关注图书,查询图书知识图谱,所述图书知识图谱包括:实体与图书关联表,所述实体与图书关联表中包括:实体与图书之间的第一关联权重;
在所述实体与图书关联表中,查找与所述历史关注图书关联的至少一个目标实体;
根据所述目标实体,在所述实体与图书关联表中反向查找与目标实体对应的至少一本图书作为待推荐图书;
将所述待推荐图书提供给所述用户。
第三方面,本发明实施例还提供了一种图书知识图谱的构建装置,包括:
文摘语料获取模块,用于获取与至少两本图书分别对应的文摘语料;
实体识别模块,用于根据与图书对应的文摘语料进行实体识别;
实体与图书关联表建立模块,用于根据识别出的实体,建立实体与图书关联表,所述实体与图书关联表中包括:实体与图书之间的第一关联权重;
图书知识图谱构建模块,用于根据所述实体与图书关联表,构建所述图书知识图谱。
第四方面,本发明实施例还提供了一种图书推荐装置,包括:
图书知识图谱查询模块,用于获取用户的至少一本历史关注图书,并根据所述历史关注图书,查询图书知识图谱,所述图书知识图谱包括:实体与图书关联表,所述实体与图书关联表中包括:实体与图书之间的第一关联权重;
目标实体查找模块,用于在所述实体与图书关联表中,查找与所述历史关注图书关联的至少一个目标实体;
待推荐图书查找模块,用于根据所述目标实体,在所述实体与图书关联表中反向查找与目标实体对应的至少一本图书作为待推荐图书;
待推荐图书提供模块,用于将所述待推荐图书提供给所述用户。
第五方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明实施例中任一所述的图书知识图谱的构建方法,或者实现如本发明实施例中任一所述的图书推荐方法。
第六方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的图书知识图谱的构建方法,或者实现如本发明实施例中任一所述的图书推荐方法。
本发明实施例的技术方案,首先根据与图书对应的文摘语料进行实体识别;根据识别出的实体,建立实体与图书关联表,并基于所述实体与图书关联表,构建所述图书知识图谱;之后根据用户的历史关注图书,查询图书知识图谱,在所述实体与图书关联表中,查找到与所述历史关注图书关联的至少一个目标实体后,根据所述目标实体,在所述实体与图书关联表中反向查找与目标实体对应的至少一本图书作为待推荐图书提供给所述用户,本发明实施例的技术方案给出了一种根据各个实体与各本图书之间的关联程度构建图书知识图谱,并基于该图书知识图谱进行图书推荐的新方式,优化了现有的图书推荐技术,满足人们日益增长的个性化、便捷化的图书阅读需求。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明实施例一中的一种图书知识图谱的构建方法的流程图;
图2是本发明实施例二中的一种图书知识图谱的构建方法的流程图;
图3是本发明实施例三中的一种图书知识图谱的构建方法的流程图;
图4a是本发明实施例四中的一种图书知识图谱的构建方法的流程图;
图4b是通过本发明实施例四中方法构建出的图书知识图谱的结构示意图;
图5是本发明实施例五中的一种图书推荐方法的流程图;
图6a是本发明实施例六中的一种图书推荐方法的流程图;
图6b是本发明实施例的方法所适用的一种应用场景的示意图;
图7是本发明实施例七中的一种图书知识图谱的构建装置的结构示意图;
图8是本发明实施例八中的一种图书推荐装置的结构示意图;
图9是本发明实施例九中的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
为了便于阅读,首先将各个附图与本申请主要内容的对应关系进行简述:针对图书知识图谱的构建方法的实施例,主要涉及的附图为:图1、图2、图3、图4a以及图4b;针对图书推荐方法的实施例,主要涉及的附图为:图5、图6a以及图6b,针对图书知识图谱的构建装置以及图书推荐装置的实施例,主要涉及的附图为:图7以及图8;针对计算机设备的实施例,主要涉及的附图为图9。
实施例一
图1为本发明实施例一提供的一种图书知识图谱的构建方法的流程图,本实施例可适用于构建用于向用户推荐图书的图书知识图谱的情况,该方法可以由本发明实施例中的图书知识图谱的构建装置来执行,该装置可采用软件和/或硬件的方式实现,并一般可以集成在具有一定计算能力的设备中,例如,终端或者服务器等。如图1所示,该方法具体包括如下操作:
S110、获取与至少两本图书分别对应的文摘语料。
其中,文摘语料是简明、确切地记述图书主要内容的语义连贯的短文。一般来说,互联网在收录一本电子图书时,会相应收录与该图书对应的文摘语料,该文摘语料用于用户对该图书进行检索。
典型的,可以通过一个或者多个数据源(例如,百度文库或者其他电子文献库等)获取与各本电子书分别对应的文摘语料。需要说明的是,如果通过至少两个数据源获取到多本图书的文摘语料,则需要首先对多数据源文摘语料进行书名映射(典型的,可以通过书名的相似度计算的方式实现书名映射),得到与同一图书匹配的一个或者多个文摘语料。
可选的,在获取到与至少两本图书分别对应的文摘语料后,可以首先对文摘语料进行数据过滤清洗,例如,执行去除特殊符号或者解决编码格式等问题的操作,得到满足设定数据格式的文摘语料。
S120、根据与图书对应的文摘语料进行实体识别。
在本实施例中,所述实体是指用于以设定角度对图书的内容进行描述的定义或者抽象概念。例如,图书中包含的地名(例如:临河),图书所描述内容对应的历史时期(例如,南北朝时期),图书中出现的主要历史人物(例如,赵云)等。
在本实施例的一个可选的实施方式中,根据与图书对应的文摘语料进行实体识别,可以为:将与图书对应的文摘语料进行分词,并将分词结果与设定实体词库进行匹配,根据匹配结果确定文摘语料中包括的实体;
在本实施例的另一个可选的实施方式中,根据与图书对应的文摘语料进行实体识别,还可以为:将与图书对应的文摘语料输入到实体识别模型中进行实体识别,得到与所述实体识别模型匹配的实体。
其中,所述实体识别模型可以通过设定标注有实体的训练样本进行预先训练。
S130、根据识别出的实体,建立实体与图书关联表,所述实体与图书关联表中包括:实体与图书之间的第一关联权重。
其中,所述第一关联权重用于衡量实体与图书之间的关联程度,实体与图书之间的关联程度越高,第一关联权重的值也就越大。典型的,第一关联权重的取值范围可以为[0,1]之间。
可选的,可以仅获取第一关联权重的值大于设定阈值(例如,0.8)的实体与图书,构建所述实体与图书关联表,这样可以确保在实体与图示关联表中收录的实体以及图书之间有明确的关联关系。
在本实施例中,可以根据实体在图书的文摘语料中出现的频度,确定实体与图书之间的第一关联权重;
进一步的,由于图书的文摘语料在一定程度上反映的图书的主要内容,因此,可以简单的将实体与文摘语料之间的关联权重,作为实体与图书之间的第一关联权重,因此,可以在S120中通过实体识别模型输出与文摘语料对应的实体的过程中,同时输出文摘语料与该实体之间的识别权重,并将该识别权重作为实体与图书之间的第一关联权重。
作为示例而非限定,实体与图书关联表中的数据形式可以为:实体名:明清史;图书名:《明朝那些事》;第一关联权重:0.85;实体名:苏黎世;图书名:《别爱苏黎世》;第一关联权重:0.92。
可以理解的是,在实体与图书关联表中,实体名与图书名除了可以使用中文名或者英文名的形式表示外,还可以以实体名编号(ID)或者图书名编号的形式,只要保证同一编号能够唯一确定一个实体名或者一个图书名即可,这里并不进行限制。
S140、根据所述实体与图书关联表,构建所述图书知识图谱。
在本实施例中,可以基于与多本图书以及多个实体对应的实体与图书关联表,构建一个图书知识图谱,在该图书知识图谱中记录有图书与实体之间的关联关系。
进一步的,当需要对用户进行图书推荐时,可以首先根据用户历史关注图书(例如,浏览过或者搜索过的图书),查询该图书知识图谱,确定该历史关注图书中包括的实体,在获取到实体后,反向查找该图书知识图谱,确定与该实体对应的其他图书,进而可以实现基于实体的图书推荐新方法。
本发明实施例的技术方案,通过根据与图书对应的文摘语料进行实体识别;根据识别出的实体,建立实体与图书关联表,并基于所述实体与图书关联表,构建所述图书知识图谱的技术手段,构建出表征实体与图书之间关联程度的新的图书知识图谱,通过多本书中包括的实体情况,建立了多本书之间的关联关系,对图书知识图谱中的内容进行了重新定义,进而可以实现基于该图书知识图谱进行图书推荐的新技术。
在上述各实施例的基础上,在根据与图书对应的文摘语料进行实体识别在根据与图书对应的文摘语料进行实体识别之后,还可以包括:
根据与至少两本图书分别对应的文摘语料,计算与识别出的实体对应的逆文本频率指数;根据计算得到的所述逆文本频率指数,滤除所述实体中包括的第一普遍性实体;和/或
根据与识别出实体的文摘语料对应的图书,统计与每个实体关联的图书数量值;根据统计得到的所述图书数量值,滤除所述实体中包括的第二普遍性实体。
这样设置的好处是,可以仅保留那些有特点的,可区分的非普遍性实体构造图书知识图谱,进而使得最终得到的图书知识图谱中的实体对图书的代表性更强,最终图书推荐的效果也更好。
实施例二
图2为本发明实施例二中的一种图书知识图谱的构建方法的流程图,本实施例以上述实施例为基础进行具体化,在本实施例中,将根据与图书对应的文摘语料进行实体识别,具体为:将与图书对应的文摘语料输入到至少一种实体识别模型中进行实体识别,得到与所述实体识别模型匹配的实体;以及,
在将与图书对应的文摘语料输入到至少一种实体识别模型中进行实体识别,得到与所述实体识别模型匹配的实体之后,还具体包括:如果识别出的实体包括至少两种数据形式,则根据不同数据形式的实体之间的映射关系,将得到的至少两种数据形式的实体转换为同一数据形式的实体;对同一数据形式的所述实体进行去重处理。相应的,本实施例的方法具体包括如下操作:
S210、获取与至少两本图书分别对应的文摘语料。
S220、将与图书对应的文摘语料输入到至少一种实体识别模型中进行实体识别,得到与所述实体识别模型匹配的实体。其中,不同类型的实体识别模型通过不同类型的训练数据训练得到。
在本实施例中,所述实体识别模型的类型可以包括:概念性实体识别模型、关注点实体识别模型以及专名实体识别模型;
其中,所述概念性实体识别模型用于识别概念性实体,所述概念性实体为与所述图书具有主题关联的话题标签;所述关注点实体识别模型用于识别关注点实体,所述关注点实体为与用户兴趣点关联的话题标签;所述专名实体识别模型用于识别专名实体,所述专名实体为所述文摘语料中包括的专有名词。
在一个具体例子中,所述概念性实体具体是指与图书的主题或者内容直接相关的实体,例如:“言情小说”或者“权谋小说”等,所述关注点实体具体是指多个用户针对一本图书搜索的关键词确定的与用户兴趣点相关的实体,例如:“心理学”或者“厚黑”等。所述专名实体具体是指图书中包括的专有名词如人物、地名、文学作品、专业术语等。
在本实施例的一个可选的实施方式中,可以预先构建不同类型的实体识别模型,每个实体识别模型针对其所能识别的实体特点,选取对应的标注有实体的训练样本进行训练得到。
S230、判断识别出的实体是否包括至少两种数据形式,若是,执行S240;否则,执行S250。
基于关注点实体以及专名实体的不同特征,发明人所构建的所述关注点实体识别模型识别出的实体与所述专名实体识别模型识别出的实体具有不同的数据形式。典型的,专有名词识别类型为code编码,关注点图谱类型为Tag值,两者的数据形式并不统一。为了方便后续操作,在确定识别出的实体中同时具有专名实体以及关注点实体时,首先需要将上述两种实体的数据形式进行统一。
S240、根据不同数据形式的实体之间的映射关系,将得到的至少两种数据形式的实体转换为同一数据形式的实体,执行S250。
典型的,可以建立专名实体以及关注点实体之间的映射关系,假设关注点实体与概念性实体之间的数据形式相一致,进而可以基于上述映射关系,将识别出的实体中的专名实体的数据形式向关注点实体的数据形式进行转换,确保最终得到的全部实体均为同一数据形式的实体。以方便后续的处理。
S250、对同一数据形式的所述实体进行去重处理。
在确定通过各个实体识别模型中得到的实体的数据形式均一致时,可以方便的去除其中包括的重复实体。
S260、获取将文摘语料输入至实体识别模型后所输出的,与识别出的实体对应的识别权重,并将所述识别权重作为实体与文摘语料对应的图书之间的第一关联权重。
在本实施例中,在构建实体识别模型时,使得该实体识别模型在输入文摘语料时,除了能够输出对应识别出的实体之外,还可以同时输出该实体与输入文摘语料之间的识别权重,该识别权重反映了输出的实体与输入的文摘语料之间的关联程度,上述识别权重,可以使用取值范围在[0,1]之间的数值来表示。
S270、根据与识别出实体的实体识别模型对应的权重调整系数,对所述第一关联权重进行调整。其中,不同类型的实体识别模型具有不同的权重调整系数。
在本实施例中,考虑到一共构造了三种不同类型的实体识别模型,也即:概念性实体识别模型、关注点实体识别模型以及专名实体识别模型,用于对三种不同类型的实体进行识别,为了使得实体对用户实际需求的命中率更高,可以预先规定与不同实体对应的权重,或者说重要程度,进而在进行图书推荐时,可以优先使用权重高的实体对用户进行图书推荐。
可选的,可以预先规定:概念性实体的权重>关注点实体的权重>专名实体的权重,相应的,基于上述权重设定,可以进而设置:概念性实体识别模型的权重调整系数大于关注点实体识别模型的权重调整系数;关注点实体识别模型的权重调整系数大于专名实体识别模型的权重调整系数。
相应的,根据与识别出实体的实体识别模型对应的权重调整系数,对所述第一关联权重进行调整,可以实现对不同类型的实体进行权重调整的目的。
在一个具体例子中:一段文摘语料在输入至概念性实体识别模型后,识别出实体A,与该实体A对应的第一关联权重为0.9;该文摘语料在输入至关注点实体识别模型后,识别出实体B,与该实体B对应的第一关联权重为0.9;该文摘语料在输入至专名实体识别模型后,识别出实体C,与该实体C对应的第一关联权重也为0.9。
虽然,不同实体识别模型得到的上述实体A、实体B以及实体C的第一关联权重均相同,但是考虑到上述三个实体具有不同重要程度,可以设定与概念性实体识别模型对应的权重调整系数为1,与关注点实体识别模型对应的权重调整系数为0.95,与专名实体识别模型对应的权重调整系数为0.92,相应的,可以基于上述权重调整系数,将实体A对应的第一关联权重调整至0.9*1=0.9;将实体B对应的第一关联权重调整至0.9*0.95=0.855,将实体C对应的第一关联权重调整至0.9*0.92=0.828。
S280、根据所述第一关联权重建立所述实体与图书关联表。
在本实施例中,可以选取第一关联权重的取值大于设定阈值的图书以及对应的实体建立所述实体与图书关联表。
S290、根据所述实体与图书关联表,构建所述图书知识图谱。
本发明实施例的技术方案从实际应用场景出发,构造了不同类型的实体识别模型,并可以基于不同类型的实体识别模型识别出可以满足用户实际需求的各种类型的实体,通过基于该实体建立图书知识图谱,可以更加精准的命中用户实际期望的图书进行推荐,以进一步提高用户的使用体验;
同时,通过对不同实体识别模型识别出的实体进行权重调整,可以使得重要性高的实体在图书知识图谱中被优先选取,进而可以在使用该图书知识图谱进行图书推荐时,对用户实际需求的命中率更高。
实施例三
图3为本发明实施例三中的一种图书知识图谱的构建方法的流程图,本实施例以上述实施例为基础进行具体化,在本实施例中,将根据识别出的实体,建立实体与图书关联表的操作进行具体化,并加入了对根据与图书对应的文摘语料进行实体识别后得到的实体进行筛选的操作。相应的,本实施例的方法具体包括如下操作:
S310、获取与至少两本图书分别对应的文摘语料。
S320、将与图书对应的文摘语料输入到至少一种实体识别模型中进行实体识别,得到与所述实体识别模型匹配的实体。
S330、根据与至少两本图书分别对应的文摘语料,计算与识别出的实体对应的逆文本频率指数;根据计算得到的所述逆文本频率指数,滤除所述实体中包括的第一普遍性实体。
逆向文件频率(Inverse Document Frequency,IDF)指数,是一个词语普遍重要性的度量。某一特定词语(实体)的IDF指数,可以由语料库中的总文件(文摘语料)数目除以包含该词语之文件(文摘语料)的数目,再将得到的商取对数得到。
也就是说,一个实体的IDF指数越低,出现该实体的文摘语料的数量就越多,该实体也就越不能精确定义一本图书。因此,可以在计算得到各个实体的IDF指数之后,可以将IDF指数小于设定阈值的实体(也即:第一普遍性实体)进行滤除。也可以按照IDF指数从大到小的顺序对得到的各个实体进行排序,并按照排序结果保留设定数量的实体后,对剩下的实体进行滤除。
S340、根据与识别出实体的文摘语料对应的图书,统计与每个实体关联的图书数量值;根据统计得到的所述图书数量值,滤除所述实体中包括的第二普遍性实体。
在本实施例中,可以预先设置如果一本图书的文摘语料与一个实体之间的第一关联权重大于设定阈值,例如:0.8,则该图书与该实体相关联。相应的,可以进而统计出与每个实体关联的总的图书数量值。在本实施例中,考虑到如果一个实体关联的图书的数量很大,则这个实体不能很好的区分不同的图书,因此,可以将关联的图书数量超过设定数量阈值(例如,20本或者30本等)的实体进行滤除。
S350、根据识别出的实体,建立实体与图书关联表,所述实体与图书关联表中包括:实体与图书之间的第一关联权重。
其中,所述实体具体是已经滤除第一普遍性实体以及第二普遍性实体之后剩余的,能够准确代表图书的实体。
S360、根据所述实体与图书关联表,构建所述图书知识图谱。
本发明实施例的技术方案通过对通过文摘语料中识别出的实体中滤除普遍性的实体,可以使得图书知识图谱中的实体更能反映不同类型图书的特性,进而使得实体对图书的描述能力更强。
实施例四
图4a为本发明实施例四中的一种图书知识图谱的构建方法的流程图,本实施例以上述实施例为基础进行具体化,在本实施例中,进一步建立了实体表、书表以及实体与实体关联表加入图书知识图谱中。相应的,本实施例的方法具体包括如下操作:
S410、获取与至少两本图书分别对应的文摘语料。
S420、建立与所述至少两本图书对应的书表,所述书表中包括:图书、文摘语料以及图书属性信息之间的对应关系。
其中,所述图书具体是指一本图书的名称、或者用于唯一识别一本图书的图书编号等,所述图书属性信息具体是指用于表述一本图书相关属性或者特征的信息,例如,作者、出版时间、图书分类、用户评价或者网络评分等信息。
S430、根据与图书对应的文摘语料进行实体识别。
S440、根据识别出的实体,建立实体与图书关联表,所述实体与图书关联表中包括:实体与图书之间的第一关联权重。
S450、根据由所述文摘语料识别出的实体,建立实体表;所述实体表中包括:实体与实体类型之间的对应关系。
其中,所述实体类型是所述实体的上位概念,用于表示与多个同类实体对应的类别。典型的,所述实体类型可以包括:文学作品、影视作品、地名、歌曲、卡通、人物、机构、书籍、生物、食物、现象、活动、奖项、化学物质以及天体类等。
在本实施例的一个可选的实施方式中,在构建对应的实体识别模型时,再向一个实体识别模型输出文摘语料后,该实体识别模型除了能够输出识别出的实体之外,还可以输出与识别出的实体对应的实体类型,进而可以根据实体识别模型的输出结果,建立实体表。
在一个具体的例子中,所述实体表中的数据形式可以为:实体名:犬夜叉,实体类型:卡通人物;实体名:北京,实体类型:地名。
可选的,S450可以在S440之后执行,也可以在S440之前执行,本实施例对此并不进行限制。
S460、根据识别出的实体间的语义相似度,建立实体与实体关联表,所述实体与实体关联表包括:两两实体之间的第二关联权重。
其中,所述第二关联权重用于表征两个实体之间的关联程度。
在本实施例的一个可选的实施方式中,根据由所述文摘语料识别出的实体,建立实体表具体可以包括:
将两两实体分别输入至语义相似度识别模型中,得到两两实体间的第二关联权重;根据所述两两实体间的所述第二关联权重,建立所述实体与实体关联表;
其中,所述语义相似度识别模型通过将与至少两本图书对应的文摘语料切分为句子,使用识别出的各所述实体作为分词字典对所述句子进行分词后得到的词向量训练得到。
在一个具体的例子中,所述实体表中的数据形式可以为:实体一:心理学,实体二:韦伯,第二关联权重:0.86;实体一:明朝历史,实体二:王阳明,第二关联权重:0.82。
S470、根据所述实体与图书关联表、所述实体表、所述书表以及所述实体与实体关联表,构建所述图书知识图谱。
具体的,所述图书知识图谱可以由述实体与图书关联表、所述实体表、所述书表以及所述实体与实体关联表共同构成。
本发明实施例的技术方案进一步丰富了图书知识图谱中的内容,进而可以基于该图书知识图谱中包括的各项内容,采取行之有效的推荐策略向用户准确、高效的进行图书推荐。
图4b是通过本发明实施例四中方法构建出的图书知识图谱的结构示意图。如图4b所示,阅读图谱包含:实体,图书,实体与实体关系,实体与图书的关系,图书的属性信息,图书所属分类。实体是从图书的文摘片段中抽取的概念性实体、关注点实体以及专名实体,如人物“伽利略”、地名“苏州”,时间“明朝”。实体与实体关系为语义空间中的相似度权重。实体与图书的关系为实体与书的相关性权重。
其中,图书、图书的属性信息以及图书所述分类可以通过预先构造的书表获取,实体与实体关系可以通过实体与实体关联表获取,实体与书的关系可以通过实体与图书关联表获取。
实施例五
图5为本发明实施例五提供的一种图书推荐方法的流程图,本实施例可适用于构建用于向用户推荐图书的情况,该方法可以由本发明实施例中的图书推荐装置来执行,该装置可采用软件和/或硬件的方式实现,并一般可以集成在具各种终端设备中,例如,手机或者平板电脑等。如图5所示,该方法具体包括如下操作:
S510、获取用户的至少一本历史关注图书,并根据所述历史关注图书,查询图书知识图谱,所述图书知识图谱包括:实体与图书关联表,所述实体与图书关联表中包括:实体与图书之间的第一关联权重。
其中,所述历史关注图书,具体是指用户在最近一段时间内选择查看或者搜索的图书,代表着该用户的兴趣点图书。
S520、在所述实体与图书关联表中,查找与所述历史关注图书关联的至少一个目标实体。
在本实施例的一个可选的实施方式中,如果确定查找到的所述目标实体的数量大于设定的数量阈值(例如,20或者30等),则按照用户对所述至少一本历史关注图书的关注时间,确定所述历史关注图书的优先级顺序,并根据所述优先级顺序,对所述目标实体进行筛选。例如,仅选择用户最近关注的一本或者两本历史关注图书对应的目标实体。
S530、根据所述目标实体,在所述实体与图书关联表中反向查找与目标实体对应的至少一本图书作为待推荐图书。
在本实施例中,由于实体与图书关联表中记录了实体与图书之间的关联关系,因此,在确定出一个或者多个目标实体后,进而可以获取与目标实体关联的图书作为待推荐图书。
可选的,可以在将所述待推荐图书提供给所述用户之前,还包括:对所述待推荐图书进行去重处理。
S540、将所述待推荐图书提供给所述用户。
本发明实施例的技术方案通过获取用户的历史关注图书,并根据所述历史关注图书,查询图书知识图谱,在所述实体与图书关联表中,查找与所述历史关注图书关联的至少一个目标实体;根据所述目标实体,在所述实体与图书关联表中反向查找与目标实体对应的至少一本图书作为待推荐图书提供给所述用户的技术手段,实现了基于各个实体与各本图书之间的关联程度构建的图书知识图谱,进行图书推荐的新方式,优化了现有的图书推荐技术,满足人们日益增长的个性化、便捷化的图书阅读需求。
实施例六
图6a为本发明实施例六中的一种图书推荐方法的流程图,本实施例以上述实施例为基础进行具体化,在本实施例中,基于图书知识图谱中包括的实体表、书表以及实体与实体关联表,对图书推荐方法进行进一步细化。相应的,本发明实施例的方法具体包括如下操作:
S610、获取用户的至少一本历史关注图书,并根据所述历史关注图书,查询图书知识图谱。
所述图书知识图谱包括:实体与图书关联表、实体表、书表以及实体与实体关联表,其中:
所述实体与图书关联表中包括:实体与图书之间的第一关联权重;所述实体表中包括:实体与实体类型之间的对应关系;所述书表中包括:图书、文摘语料以及图书属性信息之间的对应关系;所述实体与实体关联表包括:两两实体之间的第二关联权重。
S620、在所述实体与图书关联表中,查找与所述历史关注图书关联的至少一个目标实体。
S630、判断查找到的所述目标实体的数量是否小于第一数量阈值:若是,执行S640;否则,执行S650。
S640、在所述实体与实体关联表中获取与所述目标实体对应的扩展实体,并将所述扩展实体加入至所述目标实体中,执行S670。
S650、判断查找到的所述目标实体的数量是否大于第二数量阈值:若是,执行S660;否则,执行S670。
S660、按照用户对所述至少一本历史关注图书的关注时间,确定所述历史关注图书的优先级顺序,并根据所述优先级顺序,对所述目标实体进行筛选,执行S670。
S670、根据所述目标实体,在所述实体与图书关联表中反向查找与目标实体对应的至少一本图书作为待推荐图书。
S680、根据所述书表中所述待推荐图书的图书属性信息,对所述待推荐图书进行筛选。
典型的,所述图书属性信息,具体是指图书的评分值,例如,可以在获取的全部待推荐图书中筛除评分值小于8分的图书,以保证最终推荐的图书是质量比较高,用户反馈比较好的图书。
S690、对所述待推荐图书进行去重处理。
S6100、在所述实体表中,查询与所述至少一个目标实体对应的实体类型,并根据所述目标实体以及与所述目标实体对应的实体类型构造与所述待推荐图书对应的推荐理由项。
例如:构造形如:“根据知识图谱里的地名-临河推荐”的推荐理由项,其中,“临河”为目标实体,“地名”为与目标实体对应的实体类型。
通过构造上述推荐理由项,使得向用户推荐的图书具有了可解释性,这是现有技术中任一种图书推荐技术都不具备的能力,现有的图书推荐技术,仅能向用户推荐关联的图书,但是无法定性的向用户描述推荐理由,但是通过使用本发明实施例的基于实体的推荐方法,可以通过实体类型以及实体名的组合,定性的向用户提供图书的推荐理由,可以极大的满足用户的图书阅读需求。
S6110、将所述待推荐图书,以及与所述待推荐图书对应的推荐理由项提供给所述用户。
本发明实施例六中的一种推荐图书显示界面中,界面方框内推荐的图书,即为通过图书知识图谱推荐的图书。
本发明实施例的技术方案通过获取用户的历史关注图书,并根据所述历史关注图书,查询图书知识图谱,在所述实体与图书关联表中,查找与所述历史关注图书关联的至少一个目标实体;根据所述目标实体,在所述实体与图书关联表中反向查找与目标实体对应的至少一本图书作为待推荐图书提供给所述用户的技术手段,实现了基于各个实体与各本图书之间的关联程度构建的图书知识图谱,进行图书推荐的新方式,优化了现有的图书推荐技术,满足人们日益增长的个性化、便捷化的图书阅读需求。
图6b是本发明实施例的方法所适用的一种应用场景的示意图。所述应用场景同时结合了图书知识图谱的构建构成以及图书的推荐过程。如图6b所示,本应用场景共分成四部分:1、多元异构数据处理;2、实体提取3、实体关联计算;4、线上计算。
1、多源异构数据处理:上述处理过程可以分为两个过程,一个过程是书名映射过程,上述过程主要对多处来源的包含文摘语料的图书进行书名映射。典型的,可以通过计算书名之间的jaccard相似度的方式实现上述书名映射;另一个过程是清洗文摘的过程,上述过程主要对书摘进行过滤清洗,去除特殊符号、解决编码格式问题等。
通过多源异构数据处理的操作,可以相应建立与多本图书对应的书表,在所述书表中具体包括的数据项有:书名、书ID、文摘语录、书评分以及书类目等信息。
2、实体提取
对文摘语料提取知识实体。思考一个问题,哪些实体是符合图书推荐的实体,进而可以从应用场景出发,考虑图书知识图谱在推荐中期望实现的两个场景:
(1)实现更细粒度的内容标签推荐体系,比如用户对心理学感兴趣,可以基于人物类型的实体「韦伯」(心理学大师韦伯)推荐其他心理学类别的书籍。
(2)跨领域推荐解决更用户发现更多书籍的需求,基于用户已浏览书籍中的概念性实体『晚清明史』关联的实体【魏晋南北朝】,推荐包含实体「魏晋南北朝」的书籍,探索用户更多兴趣点。
基于以上两个应用场景可以总结出三种方法来提取实体,作为适合书籍应用场景的知识实体。概念性实体、关注点实体以及专名实体。其中,概念性实体是与书标题具有主题关联的抽象话题标签;关注点实体为用户感兴趣的话题标签,粒度比概念性实体更细;专名实体中包含的专有名词如人物、地名、文学作品、专业术语等。相应的,可以通过调用设定服务接口程序(该接口程序为基于不同训练样本得到的不同类型的实体识别模型)提取相应的实体。并进而可以通过上述服务程序结果得到与实体对应的实体类型。
在提取出文摘语料中的全部实体后,可以进而建立实体词典,以及实体类型映射表。建立实体类型映射表的目的是,专有名词实体的类型为code编码,关注点图谱类型为Tag值,通过使用建立起两者之间关系的实体类型映射表,可以统一实体类型。之后可以基于文摘语料计算各个实体的IDF指数,并基于该IDF指数对过于普遍的实体进行过滤,剔除部分阅读书籍中不需要的实体。
通过上述实体提取过程,可以相应建立实体表,在实体表中具体包括的数据项有:实体名、实体ID以及实体类型等信息。
3、实体关联计算
在实体关联计算的过程中,可以首先计算实体与书的关系,首先,可以将三种类型实体识别模型识别出的实体的权重进行融合,权重可以为关系:概念性实体>关注点图谱识别>专名识别;进而可以统计实体包含的图书的数量,并基于实体包含书的数量,对实体从大到小权重排序,过滤部分实体。
通过上述实体与书的关系计算过程,可以相应建立实体与书关联表,在实体与书关联表中具体包括的数据项有:实体ID、书ID以及上述两者的关联权重。
接着可以继续计算实体与实体的关系计算,具体过程可以为:首先将书的文摘切分成句子,输入实体作为分词的词典得到与切分的句子对应的分词;之后计算各个分词的词向量,生成词向量word2vec模型(无监督学习模型的一种);最后基于该词向量word2vec模型,计算实体词之间余弦相似度作为实体之间的权重关系。
通过上述实体与实体的关系计算过程,可以相应建立实体与实体关联表,在实体与实体关联表中具体包括的数据项有:实体1ID、实体2ID以及上述实体间的关联权重。
4、线上计算
在一个具体例子中,基于用户最近购买输入的三本图书,可以从实体与图书关联表中读取实体的集合。(如果三本书的实体数量超过20个,优先取第一本书的实体;如果三本书的实体数量小于5个,则从实体与实体关联表中读取新的实体进行补充);基于读取的实体的集合,反向查找从实体与图书关联表中读取书的集合;基于书的评分排序从高到底输出,采用实体类型+实体名称作为推荐理由输出;去重策略,如果输出的书集合中,包含书名相同的书,则去除。
实施例七
图7为本发明实施例七提供的一种图书知识图谱的构建装置的结构示意图。本实施例可适用于构建用于向用户推荐图书的图书知识图谱的情况,该装置可采用软件和/或硬件的方式实现,该装置可集成在任何提供图书知识图谱的构建功能的设备中,如图7所示,所述图书知识图谱的构建装置具体包括:文摘语料获取模块710、实体识别模块720、实体与图书关联表建立模块730以及图书知识图谱构建模块740。其中:
文摘语料获取模块710,用于获取与至少两本图书分别对应的文摘语料;
实体识别模块720,用于根据与图书对应的文摘语料进行实体识别;
实体与图书关联表建立模块730,用于根据识别出的实体,建立实体与图书关联表,所述实体与图书关联表中包括:实体与图书之间的第一关联权重;
图书知识图谱构建模块740,用于根据所述实体与图书关联表,构建所述图书知识图谱。
本发明实施例的技术方案,通过根据与图书对应的文摘语料进行实体识别;根据识别出的实体,建立实体与图书关联表,并基于所述实体与图书关联表,构建所述图书知识图谱的技术手段,建立出表征实体与图书之间关联程度的新的图书知识图谱,通过多本书中包括的实体情况,建立了多本书之间的关联关系,对图书知识图谱中的内容进行了重新定义,进而可以实现基于该图书知识图谱进行图书推荐的新技术。
在上述各实施例的基础上,实体识别模块720,包括:
模型识别单元,用于将与图书对应的文摘语料输入到至少一种实体识别模型中进行实体识别,得到与所述实体识别模型匹配的实体;
其中,不同类型的实体识别模型通过不同类型的训练数据训练得到。
在上述各实施例的基础上,所述实体识别模型的类型包括:概念性实体识别模型、关注点实体识别模型以及专名实体识别模型;
其中,所述概念性实体识别模型用于识别概念性实体,所述概念性实体为与所述图书具有主题关联的话题标签;
所述关注点实体识别模型用于识别关注点实体,所述关注点实体为与用户兴趣点关联的话题标签;
所述专名实体识别模型用于识别专名实体,所述专名实体为所述文摘语料中包括的专有名词。
在上述各实施例的基础上,还包括:数据形式统一模块,用于:
在将与图书对应的文摘语料输入到至少一种实体识别模型中进行实体识别,得到与所述实体识别模型匹配的实体之后,如果识别出的实体包括至少两种数据形式,则根据不同数据形式的实体之间的映射关系,将得到的至少两种数据形式的实体转换为同一数据形式的实体;对同一数据形式的所述实体进行去重处理;
其中,所述关注点实体识别模型识别出的实体与所述专名实体识别模型识别出的实体具有不同的数据形式。
在上述各实施例的基础上,还包括:实体筛选模块,用于在根据与图书对应的文摘语料进行实体识别之后,根据与至少两本图书分别对应的文摘语料,计算与识别出的实体对应的逆文本频率指数;根据计算得到的所述逆文本频率指数,滤除所述实体中包括的第一普遍性实体;和/或
根据与识别出实体的文摘语料对应的图书,统计与每个实体关联的图书数量值;根据统计得到的所述图书数量值,滤除所述实体中包括的第二普遍性实体。
在上述各实施例的基础上,实体与图书关联表建立模块730,具体包括:
第一关联权重确定单元,用于获取将文摘语料输入至实体识别模型后所输出的,与识别出的实体对应的识别权重,并将所述识别权重作为实体与文摘语料对应的图书之间的第一关联权重;
关联表建立单元,用于根据所述第一关联权重建立所述实体与图书关联表。
在上述各实施例的基础上,还包括:第一关联权重调整单元,用于在根据所述第一关联权重建立所述实体与图书关联表之前,根据与识别出实体的实体识别模型对应的权重调整系数,对所述第一关联权重进行调整;
其中,不同类型的实体识别模型具有不同的权重调整系数。
在上述各实施例的基础上,还包括:实体表建立模块,用于在根据与图书对应的文摘语料进行实体识别之后,根据由所述文摘语料识别出的实体,建立实体表;所述实体表中包括:实体与实体类型之间的对应关系;
相应的,图书知识图谱构建模块740,进一步用于:根据所述实体与图书关联表,以及所述实体表,构建所述图书知识图谱。
在上述各实施例的基础上,还包括:书表建立模块,用于在获取与至少两本图书分别对应的文摘语料之后,建立与所述至少两本图书对应的书表,所述书表中包括:图书、文摘语料以及图书属性信息之间的对应关系;
相应的,图书知识图谱构建模块740,进一步用于:根据所述实体与图书关联表、所述实体表以及所述书表,构建所述图书知识图谱。
在上述各实施例的基础上,还包括:实体与实体关联表建立模块,用于在根据与图书对应的文摘语料进行实体识别之后,根据识别出的实体间的语义相似度,建立实体与实体关联表,所述实体与实体关联表包括:两两实体之间的第二关联权重;
相应的,图书知识图谱构建模块740,进一步用于:根据所述实体与图书关联表、所述实体表、所述书表以及所述实体与实体关联表,构建所述图书知识图谱。
在上述各实施例的基础上,实体与实体关联表建立模块具体用于:将两两实体分别输入至语义相似度识别模型中,得到两两实体间的第二关联权重;
根据所述两两实体间的所述第二关联权重,建立所述实体与实体关联表;
其中,所述语义相似度识别模型通过将与至少两本图书对应的文摘语料切分为句子,使用识别出的各所述实体作为分词字典对句子进行分词后得到的词向量训练得到。
上述产品可执行本发明任意实施例所提供的方法,具备执行方法相应的功能模块和有益效果。
实施例八
图8为本发明实施例八提供的一种图书推荐装置的结构示意图。本实施例可适用于向用户推荐图书的情况,该装置可采用软件和/或硬件的方式实现,该装置可集成在任何提供图书推荐功能的设备中,如图8所示,所述图书推荐装置具体包括:图书知识图谱查询模块810、目标实体查找模块820、待推荐图书查找模块830以及待推荐图书提供模块840,其中:
图书知识图谱查询模块810,用于获取用户的至少一本历史关注图书,并根据所述历史关注图书,查询图书知识图谱,所述图书知识图谱包括:实体与图书关联表,所述实体与图书关联表中包括:实体与图书之间的第一关联权重;
目标实体查找模块820,用于在所述实体与图书关联表中,查找与所述历史关注图书关联的至少一个目标实体;
待推荐图书查找模块830,用于根据所述目标实体,在所述实体与图书关联表中反向查找与目标实体对应的至少一本图书作为待推荐图书;
待推荐图书提供模块840,用于将所述待推荐图书提供给所述用户。
本发明实施例的技术方案通过获取用户的历史关注图书,并根据所述历史关注图书,查询图书知识图谱,在所述实体与图书关联表中,查找与所述历史关注图书关联的至少一个目标实体;根据所述目标实体,在所述实体与图书关联表中反向查找与目标实体对应的至少一本图书作为待推荐图书提供给所述用户的技术手段,实现了基于各个实体与各本图书之间的关联程度构建的图书知识图谱,进行图书推荐的新方式,优化了现有的图书推荐技术,满足人们日益增长的个性化、便捷化的图书阅读需求。
在上述各实施例的基础上,所述图书知识图谱还包括:实体表,所述实体表中包括:实体与实体类型之间的对应关系;
所述装置还包括:推荐理由项构造模块,用于在根据所述目标实体,在所述实体与图书关联表中反向查找与目标实体对应的至少一本图书作为待推荐图书之后,在所述实体表中,查询与所述至少一个目标实体对应的实体类型,并根据所述目标实体以及与所述目标实体对应的实体类型构造与所述待推荐图书对应的推荐理由项;
待推荐图书提供模块840,进一步用于:将所述待推荐图书,以及与所述待推荐图书对应的推荐理由项提供给所述用户。
在上述各实施例的基础上,所述图书知识图谱还包括:书表,所述书表中包括:图书、文摘语料以及图书属性信息之间的对应关系;
所述装置还包括:图书筛选模块,用于在根据所述目标实体,在所述实体与图书关联表中反向查找与目标实体对应的至少一本图书作为待推荐图书之后,根据所述书表中所述待推荐图书的图书属性信息,对所述待推荐图书进行筛选。
在上述各实施例的基础上,所述图书知识图谱还包括:实体与实体关联表,所述实体与实体关联表包括:两两实体之间的第二关联权重;
所述装置还包括:第一目标实体筛选模块,用于在所述实体与图书关联表中,查找与所述历史关注图书关联的至少一个目标实体之后,如果确定查找到的所述目标实体的数量小于第一数量阈值,则在所述实体与实体关联表中获取与所述目标实体对应的扩展实体,并将所述扩展实体加入至所述目标实体中。
在上述各实施例的基础上,所述装置还包括:第二目标实体筛选模块,用于在所述实体与图书关联表中,查找与所述历史关注图书关联的至少一个目标实体之后,如果确定查找到的所述目标实体的数量大于第二数量阈值,则按照用户对所述至少一本历史关注图书的关注时间,确定所述历史关注图书的优先级顺序,并根据所述优先级顺序,对所述目标实体进行筛选;和/或
去重模块,用于在将所述待推荐图书提供给所述用户之前,对所述待推荐图书进行去重处理。
上述产品可执行本发明任意实施例所提供的方法,具备执行方法相应的功能模块和有益效果。
实施例九
图9为本发明实施例九中的一种计算机设备的结构示意图。图9示出了适于用来实现本发明实施方式的示例性计算机设备12的框图。图9显示的计算机设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图9所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,***存储器28,连接不同***组件(包括***存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及***组件互连(PCI)总线。
计算机设备12典型地包括多种计算机***可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
***存储器28可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***34可以用于读写不可移动的、非易失性磁介质(图9未显示,通常称为“硬盘驱动器”)。尽管图9中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。另外,本实施例中的计算机设备12,显示器24不是作为独立个体存在,而是嵌入镜面中,在显示器24的显示面不予显示时,显示器24的显示面与镜面从视觉上融为一体。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
处理单元16通过运行存储在***存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的图书知识图谱的构建方法:
获取与至少两本图书分别对应的文摘语料;根据与图书对应的文摘语料进行实体识别;根据识别出的实体,建立实体与图书关联表,所述实体与图书关联表中包括:实体与图书之间的第一关联权重;根据所述实体与图书关联表,构建所述图书知识图谱。
又例如,实现本发明实施例所提供的图书推荐方法:获取用户的至少一本历史关注图书,并根据所述历史关注图书,查询图书知识图谱,所述图书知识图谱包括:实体与图书关联表,所述实体与图书关联表中包括:实体与图书之间的第一关联权重;在所述实体与图书关联表中,查找与所述历史关注图书关联的至少一个目标实体;根据所述目标实体,在所述实体与图书关联表中反向查找与目标实体对应的至少一本图书作为待推荐图书;将所述待推荐图书提供给所述用户。
实施例十
本发明实施例十提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请所有发明实施例提供的图书知识图谱的构建方法:
获取种子查询式,并使用随机游走技术,获取与所述种子查询式对应的备选查询式;根据所述备选查询式,对与所述种子查询式匹配的待填充的领域同义词表中至少一个领域类别下的领域同义词进行填充,得到所述领域同义词表;根据所述备选查询式以及所述领域同义词表,得到与所述备选查询式对应的查询式生成模板;根据所述领域同义词表以及所述查询式生成模板,生成与所述备选查询式对应的扩展查询式。
或者,该程序被处理器执行时实现如本申请所有发明实施例提供的图书推荐方法:获取用户的至少一本历史关注图书,并根据所述历史关注图书,查询图书知识图谱,所述图书知识图谱包括:实体与图书关联表,所述实体与图书关联表中包括:实体与图书之间的第一关联权重;在所述实体与图书关联表中,查找与所述历史关注图书关联的至少一个目标实体;根据所述目标实体,在所述实体与图书关联表中反向查找与目标实体对应的至少一本图书作为待推荐图书;将所述待推荐图书提供给所述用户。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (17)
1.一种图书知识图谱的构建方法,其特征在于,包括:
获取与至少两本图书分别对应的文摘语料;
根据与图书对应的文摘语料进行实体识别;
根据与至少两本图书分别对应的文摘语料,计算与识别出的实体对应的逆文本频率指数;根据计算得到的所述逆文本频率指数,滤除所述实体中包括的第一普遍性实体;根据与识别出实体的文摘语料对应的图书,统计与每个实体关联的图书数量值;根据统计得到的所述图书数量值,滤除所述实体中包括的第二普遍性实体;其中,第一普遍性实体指逆文本频率指数小于设定阈值的实体;第二普遍性实体指关联的图书数量值超过设定数量阈值的实体;
根据由所述文摘语料识别出的实体,建立实体表;所述实体表中包括:实体与实体类型之间的对应关系;其中,实体是指用于以设定角度对图书的内容进行描述的定义或者抽象概念;所述实体类型包括概念性实体、关注点实体和专名实体;
根据识别出的实体,建立实体与图书关联表,所述实体与图书关联表中包括:实体与图书之间的第一关联权重;
根据所述实体与图书关联表,以及所述实体表,构建所述图书知识图谱;其中,图书知识图谱中包含多本图书以及多个实体对应的实体与图书关联表;该图书知识图谱中记录有图书与实体之间的关联关系。
2.根据权利要求1所述的方法,其特征在于,根据与图书对应的文摘语料进行实体识别,包括:
将与图书对应的文摘语料输入到至少一种实体识别模型中进行实体识别,得到与所述实体识别模型匹配的实体;
其中,不同类型的实体识别模型通过不同类型的训练数据训练得到。
3.根据权利要求2所述的方法,其特征在于,所述实体识别模型的类型包括:概念性实体识别模型、关注点实体识别模型以及专名实体识别模型;
其中,所述概念性实体识别模型用于识别概念性实体,所述概念性实体为与所述图书具有主题关联的话题标签;
所述关注点实体识别模型用于识别关注点实体,所述关注点实体为与用户兴趣点关联的话题标签;
所述专名实体识别模型用于识别专名实体,所述专名实体为所述文摘语料中包括的专有名词。
4.根据权利要求3所述的方法,其特征在于,在将与图书对应的文摘语料输入到至少一种实体识别模型中进行实体识别,得到与所述实体识别模型匹配的实体之后,还包括:
如果识别出的实体包括至少两种数据形式,则根据不同数据形式的实体之间的映射关系,将得到的至少两种数据形式的实体转换为同一数据形式的实体;
对同一数据形式的所述实体进行去重处理;
其中,所述关注点实体识别模型识别出的实体与所述专名实体识别模型识别出的实体具有不同的数据形式。
5.根据权利要求3所述的方法,其特征在于,根据识别出的实体,建立实体与图书关联表,包括:
获取将文摘语料输入至实体识别模型后所输出的,与识别出的实体对应的识别权重,并将所述识别权重作为实体与文摘语料对应的图书之间的第一关联权重;
根据所述第一关联权重建立所述实体与图书关联表。
6.根据权利要求5所述的方法,其特征在于,在根据所述第一关联权重建立所述实体与图书关联表之前,还包括:
根据与识别出实体的实体识别模型对应的权重调整系数,对所述第一关联权重进行调整;
其中,不同类型的实体识别模型具有不同的权重调整系数。
7.根据权利要求1所述的方法,其特征在于,在获取与至少两本图书分别对应的文摘语料之后,还包括:
建立与所述至少两本图书对应的书表,所述书表中包括:图书、文摘语料以及图书属性信息之间的对应关系;
根据所述实体与图书关联表,以及所述实体表,构建所述图书知识图谱,进一步包括:
根据所述实体与图书关联表、所述实体表以及所述书表,构建所述图书知识图谱。
8.根据权利要求7所述的方法,其特征在于,在根据与图书对应的文摘语料进行实体识别之后,还包括:
根据识别出的实体间的语义相似度,建立实体与实体关联表,所述实体与实体关联表包括:两两实体之间的第二关联权重;
根据所述实体与图书关联表、所述实体表以及所述书表,构建所述图书知识图谱,进一步包括:
根据所述实体与图书关联表、所述实体表、所述书表以及所述实体与实体关联表,构建所述图书知识图谱。
9.根据权利要求8所述的方法,其特征在于,根据识别出的实体间的语义相似度,建立实体与实体关联表,包括:
将两两实体分别输入至语义相似度识别模型中,得到两两实体间的第二关联权重;
根据所述两两实体间的所述第二关联权重,建立所述实体与实体关联表;
其中,所述语义相似度识别模型通过将与至少两本图书对应的文摘语料切分为句子,使用识别出的各所述实体作为分词字典对句子进行分词后得到的词向量训练得到。
10.一种图书推荐方法,其特征在于,包括:
获取用户的至少一本历史关注图书,并根据所述历史关注图书,查询图书知识图谱,所述图书知识图谱包括:实体与图书关联表以及实体表,所述实体表中包括:实体与实体类型之间的对应关系,所述实体与图书关联表中包括:实体与图书之间的第一关联权重;
在所述实体与图书关联表中,查找与所述历史关注图书关联的至少一个目标实体;
根据所述目标实体,在所述实体与图书关联表中反向查找与目标实体对应的至少一本图书作为待推荐图书;
在所述实体表中,查询与所述至少一个目标实体对应的实体类型,并根据所述目标实体以及与所述目标实体对应的实体类型构造与所述待推荐图书对应的推荐理由项;
将所述待推荐图书,以及与所述待推荐图书对应的推荐理由项提供给所述用户;
其中,图书知识图谱中包含多本图书以及多个实体对应的实体与图书关联表;该图书知识图谱中记录有图书与实体之间的关联关系;所述图书知识图谱采用权利要求1-9任一所述的图书知识图谱的构建方法来构建。
11.根据权利要求10所述的方法,其特征在于,所述图书知识图谱还包括:书表,所述书表中包括:图书、文摘语料以及图书属性信息之间的对应关系;
在根据所述目标实体,在所述实体与图书关联表中反向查找与目标实体对应的至少一本图书作为待推荐图书之后,还包括:
根据所述书表中所述待推荐图书的图书属性信息,对所述待推荐图书进行筛选。
12.根据权利要求11所述的方法,其特征在于,所述图书知识图谱还包括:实体与实体关联表,所述实体与实体关联表包括:两两实体之间的第二关联权重;
在所述实体与图书关联表中,查找与所述历史关注图书关联的至少一个目标实体之后,还包括:
如果确定查找到的所述目标实体的数量小于第一数量阈值,则在所述实体与实体关联表中获取与所述目标实体对应的扩展实体,并将所述扩展实体加入至所述目标实体中。
13.根据权利要求10-12任一项所述的方法,其特征在于,在所述实体与图书关联表中,查找与所述历史关注图书关联的至少一个目标实体之后,还包括:
如果确定查找到的所述目标实体的数量大于第二数量阈值,则按照用户对所述至少一本历史关注图书的关注时间,确定所述历史关注图书的优先级顺序,并根据所述优先级顺序,对所述目标实体进行筛选;和/或
在将所述待推荐图书提供给所述用户之前,还包括:对所述待推荐图书进行去重处理。
14.一种图书知识图谱的构建装置,其特征在于,包括:
文摘语料获取模块,用于获取与至少两本图书分别对应的文摘语料;
实体识别模块,用于根据与图书对应的文摘语料进行实体识别;
实体筛选模块,用于根据与至少两本图书分别对应的文摘语料,计算与识别出的实体对应的逆文本频率指数;根据计算得到的所述逆文本频率指数,滤除所述实体中包括的第一普遍性实体;根据与识别出实体的文摘语料对应的图书,统计与每个实体关联的图书数量值;根据统计得到的所述图书数量值,滤除所述实体中包括的第二普遍性实体;其中,第一普遍性实体指逆文本频率指数小于设定阈值的实体;第二普遍性实体指关联的图书数量值超过设定数量阈值的实体;
实体表建立模块,用于根据由所述文摘语料识别出的实体,建立实体表;所述实体表中包括:实体与实体类型之间的对应关系;其中,实体是指用于以设定角度对图书的内容进行描述的定义或者抽象概念;所述实体类型包括概念性实体、关注点实体和专名实体;
实体与图书关联表建立模块,用于根据识别出的实体,建立实体与图书关联表,所述实体与图书关联表中包括:实体与图书之间的第一关联权重;
图书知识图谱构建模块,用于根据所述实体与图书关联表,以及所述实体表,构建所述图书知识图谱;
其中,图书知识图谱中包含多本图书以及多个实体对应的实体与图书关联表;该图书知识图谱中记录有图书与实体之间的关联关系。
15.一种图书推荐装置,其特征在于,包括:
图书知识图谱查询模块,用于获取用户的至少一本历史关注图书,并根据所述历史关注图书,查询图书知识图谱,所述图书知识图谱包括:实体与图书关联表以及实体表,所述实体表中包括:实体与实体类型之间的对应关系,所述实体与图书关联表中包括:实体与图书之间的第一关联权重;
目标实体查找模块,用于在所述实体与图书关联表中,查找与所述历史关注图书关联的至少一个目标实体;
待推荐图书查找模块,用于根据所述目标实体,在所述实体与图书关联表中反向查找与目标实体对应的至少一本图书作为待推荐图书;
推荐理由项构造模块,用于在所述实体表中,查询与所述至少一个目标实体对应的实体类型,并根据所述目标实体以及与所述目标实体对应的实体类型构造与所述待推荐图书对应的推荐理由项;
待推荐图书提供模块,用于将所述待推荐图书,以及与所述待推荐图书对应的推荐理由项提供给所述用户;
其中,图书知识图谱中包含多本图书以及多个实体对应的实体与图书关联表;该图书知识图谱中记录有图书与实体之间的关联关系;所述图书知识图谱采用权利要求1-9任一所述的图书知识图谱的构建方法来构建。
16.一种计算机设备,其特征在于,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-9中任一所述的图书知识图谱的构建方法,或者实现如权利要求10-13任一项所述的图书推荐方法。
17.一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-9中任一所述的图书知识图谱的构建方法,或者实现如权利要求10-13任一项所述的图书推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810719673.0A CN110737774B (zh) | 2018-07-03 | 2018-07-03 | 图书知识图谱的构建、图书推荐方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810719673.0A CN110737774B (zh) | 2018-07-03 | 2018-07-03 | 图书知识图谱的构建、图书推荐方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110737774A CN110737774A (zh) | 2020-01-31 |
CN110737774B true CN110737774B (zh) | 2024-05-24 |
Family
ID=69234271
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810719673.0A Active CN110737774B (zh) | 2018-07-03 | 2018-07-03 | 图书知识图谱的构建、图书推荐方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110737774B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111325033B (zh) * | 2020-03-20 | 2023-07-11 | 中国建设银行股份有限公司 | 实体识别方法、装置、电子设备及计算机可读存储介质 |
CN112434168A (zh) * | 2020-11-09 | 2021-03-02 | 广西壮族自治区图书馆 | 基于图书馆的知识图谱构建方法、碎片化知识生成方法 |
CN112182424B (zh) * | 2020-11-11 | 2023-01-31 | 重庆邮电大学 | 一种基于异构信息和同构信息网络融合的社交推荐方法 |
CN112818261A (zh) * | 2021-01-27 | 2021-05-18 | 沈阳美行科技有限公司 | 基于poi知识图谱的导航方法、装置及电子设备 |
CN113688269B (zh) * | 2021-07-21 | 2023-05-02 | 北京三快在线科技有限公司 | 图文匹配结果确定方法、装置、电子设备及可读存储介质 |
CN114428864A (zh) * | 2022-04-01 | 2022-05-03 | 杭州未名信科科技有限公司 | 知识图谱的构建方法、装置、电子设备及介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101826102A (zh) * | 2010-03-26 | 2010-09-08 | 浙江大学 | 一种图书关键字自动生成的方法 |
CN103164405A (zh) * | 2011-12-08 | 2013-06-19 | 盛乐信息技术(上海)有限公司 | 相关视频数据库生成方法、相关视频推荐方法及*** |
CN103914543A (zh) * | 2014-04-03 | 2014-07-09 | 北京百度网讯科技有限公司 | 搜索结果的展现方法和装置 |
CN104346446A (zh) * | 2014-10-27 | 2015-02-11 | 百度在线网络技术(北京)有限公司 | 一种基于知识图谱的论文关联信息推荐方法及装置 |
CN105653706A (zh) * | 2015-12-31 | 2016-06-08 | 北京理工大学 | 一种基于文献内容知识图谱的多层引文推荐方法 |
CN106202184A (zh) * | 2016-06-27 | 2016-12-07 | 华中科技大学 | 一种面向高校图书馆的图书个性化推荐方法和*** |
CN107122444A (zh) * | 2017-04-24 | 2017-09-01 | 北京科技大学 | 一种法律知识图谱自动构建方法 |
CN107729444A (zh) * | 2017-09-30 | 2018-02-23 | 桂林电子科技大学 | 一种基于知识图谱的个性化旅游景点推荐方法 |
CN107943910A (zh) * | 2017-11-18 | 2018-04-20 | 电子科技大学 | 一种基于组合算法的个性化图书推荐方法 |
CN108009194A (zh) * | 2017-10-23 | 2018-05-08 | 广州星耀悦教育科技有限公司 | 一种图书推送方法、电子设备、存储介质及装置 |
CN108090074A (zh) * | 2016-11-22 | 2018-05-29 | 上海阿法迪智能标签***技术有限公司 | 图书推荐***和方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101306667B1 (ko) * | 2009-12-09 | 2013-09-10 | 한국전자통신연구원 | 지식 그래프 정제 장치 및 방법 |
CN104102713B (zh) * | 2014-07-16 | 2018-01-19 | 百度在线网络技术(北京)有限公司 | 推荐结果的展现方法和装置 |
US10032208B2 (en) * | 2015-12-15 | 2018-07-24 | International Business Machines Corporation | Identifying recommended electronic books with detailed comparisons |
-
2018
- 2018-07-03 CN CN201810719673.0A patent/CN110737774B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101826102A (zh) * | 2010-03-26 | 2010-09-08 | 浙江大学 | 一种图书关键字自动生成的方法 |
CN103164405A (zh) * | 2011-12-08 | 2013-06-19 | 盛乐信息技术(上海)有限公司 | 相关视频数据库生成方法、相关视频推荐方法及*** |
CN103914543A (zh) * | 2014-04-03 | 2014-07-09 | 北京百度网讯科技有限公司 | 搜索结果的展现方法和装置 |
CN104346446A (zh) * | 2014-10-27 | 2015-02-11 | 百度在线网络技术(北京)有限公司 | 一种基于知识图谱的论文关联信息推荐方法及装置 |
CN105653706A (zh) * | 2015-12-31 | 2016-06-08 | 北京理工大学 | 一种基于文献内容知识图谱的多层引文推荐方法 |
CN106202184A (zh) * | 2016-06-27 | 2016-12-07 | 华中科技大学 | 一种面向高校图书馆的图书个性化推荐方法和*** |
CN108090074A (zh) * | 2016-11-22 | 2018-05-29 | 上海阿法迪智能标签***技术有限公司 | 图书推荐***和方法 |
CN107122444A (zh) * | 2017-04-24 | 2017-09-01 | 北京科技大学 | 一种法律知识图谱自动构建方法 |
CN107729444A (zh) * | 2017-09-30 | 2018-02-23 | 桂林电子科技大学 | 一种基于知识图谱的个性化旅游景点推荐方法 |
CN108009194A (zh) * | 2017-10-23 | 2018-05-08 | 广州星耀悦教育科技有限公司 | 一种图书推送方法、电子设备、存储介质及装置 |
CN107943910A (zh) * | 2017-11-18 | 2018-04-20 | 电子科技大学 | 一种基于组合算法的个性化图书推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110737774A (zh) | 2020-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110737774B (zh) | 图书知识图谱的构建、图书推荐方法、装置、设备及介质 | |
AU2018383346B2 (en) | Domain-specific natural language understanding of customer intent in self-help | |
CN108829822B (zh) | 媒体内容的推荐方法和装置、存储介质、电子装置 | |
CN107436922B (zh) | 文本标签生成方法和装置 | |
CN110287278B (zh) | 评论生成方法、装置、服务器及存储介质 | |
CN112131350B (zh) | 文本标签确定方法、装置、终端及可读存储介质 | |
CN109190049B (zh) | 关键词推荐方法、***、电子设备和计算机可读介质 | |
CN109388743B (zh) | 语言模型的确定方法和装置 | |
CN110162768B (zh) | 实体关系的获取方法、装置、计算机可读介质及电子设备 | |
US10915756B2 (en) | Method and apparatus for determining (raw) video materials for news | |
CN113342958B (zh) | 问答匹配方法、文本匹配模型的训练方法和相关设备 | |
CN112182145A (zh) | 文本相似度确定方法、装置、设备和存储介质 | |
CN113806660A (zh) | 数据评估方法、训练方法、装置、电子设备以及存储介质 | |
CN113314207A (zh) | 一种对象推荐方法、装置、存储介质及电子设备 | |
CN117131155A (zh) | 多类目识别方法、装置、电子设备及储存介质 | |
CN112231444A (zh) | 结合rpa和ai的语料数据的处理方法、装置和电子设备 | |
CN116796730A (zh) | 基于人工智能的文本纠错方法、装置、设备及存储介质 | |
CN116662495A (zh) | 问答处理方法、训练问答处理模型的方法及装置 | |
CN112883218A (zh) | 一种图文联合表征的搜索方法、***、服务器和存储介质 | |
CN114201622B (zh) | 获取事件信息的方法、装置、电子设备和存储介质 | |
CN114201607B (zh) | 一种信息处理的方法和装置 | |
CN116108181A (zh) | 客户信息的处理方法、装置及电子设备 | |
CN116151258A (zh) | 文本消岐方法、电子设备、存储介质 | |
CN112802454B (zh) | 一种唤醒词的推荐方法、装置、终端设备及存储介质 | |
CN115017385A (zh) | 一种物品搜索方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |