CN110929045B - 诗歌-语义知识图谱的构建方法及*** - Google Patents
诗歌-语义知识图谱的构建方法及*** Download PDFInfo
- Publication number
- CN110929045B CN110929045B CN201911239868.6A CN201911239868A CN110929045B CN 110929045 B CN110929045 B CN 110929045B CN 201911239868 A CN201911239868 A CN 201911239868A CN 110929045 B CN110929045 B CN 110929045B
- Authority
- CN
- China
- Prior art keywords
- poetry
- semantic
- knowledge
- knowledge graph
- question
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供一种诗歌‑语义知识图谱的构建方法。该方法包括:获取诗歌训练数据,确定诗歌训练数据的语义特征以及实体特征;对实体特征进行建模,生成诗歌检索数据库;对语义特征以及实体特征进行建模,生成诗歌知识图谱,诗歌知识图谱用于将语义特征以及实体特征进行关联;将预设的语义网络知识图谱、诗歌知识图谱以及诗歌检索数据库融合进行建模,生成用于诗歌知识问答的诗歌‑语义知识图谱。本发明实施例还提供一种诗歌‑语义知识图谱的构建***。本发明实施例提高检索效率的快速高效,使得诗歌知识图谱可以接收更多的问法,提供能多的服务,使用的场景更加广泛,回答的内容更加准确。
Description
技术领域
本发明涉及知识图谱领域,尤其涉及一种诗歌-语义知识图谱的构建方法及***。
背景技术
关于诗歌问答交互相关的技术包括:对诗歌内容进行爬取;对诗歌的基本信息进行分类;对诗歌的标签,内容等做内容的关联;抽取中一些基本的对象作为诗歌的几个标签:如表达情感,主题等;根据一首诗歌的查找,推荐或关联出其他的诗歌;帮助用户学习知识。而这些都集中在诗歌本身的信息或者是一个诗歌数据库内的关联。
知识图谱在领域上的构建有多种形式和多种领域,如对语义网络的构建,对专有领域(医疗,卫生,健康)等的构建,或者是基于商品买卖的推荐***。诗词常作为教育或者文学领域中的模块在知识图谱中被用到,而常用的如百度百科等大多对诗词的信息做简单的呈现。
在实现本发明过程中,发明人发现相关技术中至少存在如下问题:
在实现诗歌的问答时,一般的诗词问答技术不会对诗词做深层次的知识挖掘,缺少与语义网络的关联,也缺少与通用性知识图谱的联系。
一般的诗词图谱中会包含诗歌的内容,作者,情感,分类,注释,格律等基本信息。然后将这些基本信息存入知识图谱,与相似的诗歌做关联。可以关联同一作者的诗歌,都属于思乡的诗歌,唐代的绝句等。
这些关联缺乏对诗词深度内容的挖掘,在关联时候也是采用直接关联的方法,无法抽取诗歌内容中蕴含的语义信息,检索的范围也是固定有限的。缺乏语义关联表现为:“床前明月光”这句中很难再引申出描述“床”的其他诗句或者跟“明月”有关的诗歌,一般都是对“静夜思”打上一个“思乡”的标签,对诗句内部的语义不做进一步的处理。在数据库建模时也缺乏对诗歌内容的挖掘和表征,语义信息也常常会被忽略。
一般的知识图谱技术很少将诗词作为一个专有的领域去构建。现在已有的文学,诗歌相关的知识图谱通常是将诗词基本信息做诗词领域内的关联,很少与其他领域做关联。比如“黄沙百战穿金甲,不破楼兰忠不还”中不还中的楼兰在今天哪个位置,由于一般的知识图谱没有与这些领域的知识相关联,这些超纲的问题,对于一般的知识图谱就是个很难回答的问题,又或者“去年今日此门中,人面桃花相映红”中桃花是几月盛开的,这类问题在常用的诗歌知识图谱中也无法回答。
发明内容
为了至少解决现有技术中知识图谱的数据库又很难在检索效率上取得快速高效的表现,常见的诗歌知识图谱在应用方向上一般在诗词内部做聚合,缺乏与整个语义网络的联系.导致了这些知识图谱的应用单一,问法单一,服务功能单一,使用的场景也单一,并且回答的内容也可能会出现错误的问题。
第一方面,本发明实施例提供一种诗歌-语义知识图谱的构建方法,包括:
获取诗歌训练数据,确定所述诗歌训练数据的语义特征以及实体特征;
对所述实体特征进行建模,生成诗歌检索数据库;
对所述语义特征以及实体特征进行建模,生成诗歌知识图谱,所述诗歌知识图谱用于将所述语义特征以及实体特征进行关联;
将预设的语义网络知识图谱、所述诗歌知识图谱以及所述诗歌检索数据库融合进行建模,生成用于诗歌知识问答的诗歌-语义知识图谱。
第二方面,本发明实施例提供一种基于诗歌-语义知识图谱的诗歌问答方法,所述方法包括:
响应于用户的诗歌提问,对所述诗歌提问进行语义解析以确定查询语句;
将所述查询语句输入至诗歌-语义知识图谱,基于诗歌检索数据库确定所述查询语句对应的诗句,基于诗歌知识图谱确定所述查询语句的提问语义,基于语义网络知识图谱对所述提问语义进行知识获取,确定回复诗歌提问对话的回复答案;
将所述回复答案反馈给所述用户。
第三方面,本发明实施例提供一种诗歌-语义知识图谱的构建***,包括:
特征确定程序模块,用于获取诗歌训练数据,确定所述诗歌训练数据的语义特征以及实体特征;
检索数据库生成程序模块,用于对所述实体特征进行建模,生成诗歌检索数据库;
诗歌知识图谱生成程序模块,用于对所述语义特征以及实体特征进行建模,生成诗歌知识图谱,所述诗歌知识图谱用于将所述语义特征以及实体特征进行关联;
图谱构建程序模块,用于将预设的语义网络知识图谱、所述诗歌知识图谱以及所述诗歌检索数据库融合进行建模,生成用于诗歌知识问答的诗歌-语义知识图谱。
第四方面,本发明实施例提供一种基于诗歌-语义知识图谱的诗歌问答***,包括:
查询语句确定程序模块,用于响应于用户的诗歌提问,对所述诗歌提问进行语义解析以确定查询语句;
回复答案确定程序模块,用于将所述查询语句输入至所述***构建的诗歌-语义知识图谱,基于诗歌检索数据库确定所述查询语句对应的诗句,基于诗歌知识图谱确定所述查询语句的提问语义,基于语义网络知识图谱对所述提问语义进行知识获取,确定回复诗歌提问对话的回复答案;
反馈程序模块,用于将所述回复答案反馈给所述用户。
第五方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例的诗歌-语义知识图谱的构建方法以及基于诗歌-语义知识图谱的诗歌问答方法的步骤。
第六方面,本发明实施例提供一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现本发明任一实施例的诗歌-语义知识图谱的构建方法以及基于诗歌-语义知识图谱的诗歌问答方法的步骤。
本发明实施例的有益效果在于:将专用的诗词领域和通用的语义网络知识图谱进行了结合,是对多种知识图谱结合的一种成功尝试。提高检索效率的快速高效,同时,使得诗歌知识图谱可以接收更多的问法,提供能多的服务,使用的场景更加广泛,回答的内容更加准确。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的一种诗歌-语义知识图谱的构建方法的流程图;
图2是本发明一实施例提供的一种诗歌-语义知识图谱的构建方法的关系结构图;
图3是本发明一实施例提供的一种基于诗歌-语义知识图谱的诗歌问答方法的流程图;
图4是本发明一实施例提供的一种诗歌-语义知识图谱的构建***的结构示意图;
图5是本发明一实施例提供的一种基于诗歌-语义知识图谱的诗歌问答***的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示为本发明一实施例提供的一种诗歌-语义知识图谱的构建方法的流程图,包括如下步骤:
S11:获取诗歌训练数据,确定所述诗歌训练数据的语义特征以及实体特征;
S12:对所述实体特征进行建模,生成诗歌检索数据库;
S13:对所述语义特征以及实体特征进行建模,生成诗歌知识图谱,所述诗歌知识图谱用于将所述语义特征以及实体特征进行关联;
S14:将预设的语义网络知识图谱、所述诗歌知识图谱以及所述诗歌检索数据库融合进行建模,生成用于诗歌知识问答的诗歌-语义知识图谱。
对于步骤S11,为了更深层次的挖掘诗歌内部的语义信息,应用了多种深度神经网络去抽取是诗歌中的实体信息并进行关联。一首诗歌常见的元素有:标题,内容,作者,年代,主题,情感,注释,格律等基本信息,而这些信息也是诗歌知识图谱最常见的数据呈现。但如果想要深度到每一句诗提到哪些人和事,那个词表示了哪个意向,不通过复杂的数据挖掘就无法抽取带这些特征和表示。
作为一种实施方式,所述语义特征至少包括:关键词、同义词、近义词、反义词、否定词、形容词;
所述实体特征至少包括诗歌中的人物、地点、组织、事件、自然现象、动物、植物。
为了提取更多的信息 , 例如,可以运用transformer,self-attention等技术对诗歌内容进行NER (Named Entity Recognition,命名实体识别)等提取,得到了诗歌内容中所富含的更多的信息。如《静夜思》中“床前明月光,疑是地上霜。举头望明月,低头思故乡。”,可以在基本信息之上再抽取出“床”作为一种生活用品,“霜”作为一种自然现象,“明月”作为一种天体。又比如《送汪伦》中“李白乘舟将欲行,忽闻岸上踏歌声。桃花潭水深千尺,不及汪伦送我情。”,这首诗可以提取出“李白”和“汪伦”两个人物,“桃花潭”这样一个地点等。提取出的语义特征“乘”、“欲”、“闻”、“塌”、“深”、“送”等词语。表示了对应的实体特征的意图。
对于步骤S12,一般的知识图谱在查询时应用RDF(Resource DescriptionFramework,资源描述框架)框架进行知识的建模,优点是能对实体内的关系进行很好的描述,缺点则是检索的速度非常的慢。现在市面上常用的知识图谱检索框架都有查询慢,并发低的问题,尤其是基本只能对实体进行查询,无法对实体的内容和描述进行查询,这导致知识图谱型数据库在实际应用中只能解决一部分的问题。
而一般的推荐或检索型数据库虽然能对文档进行高效的查询,但无法描述文档内部的关联,也无法理解文档和实体知识间的关系。
针对这个问题,对确定的诗歌实体特征进行了数据库建模。对涉及到诗歌内部知识,实体的关联,例如,将桃花潭这一地点和“深”的语义关联,得到诗歌中内部实体知识间的关系。诗歌和语义知识的结合等方面,采用知识图谱框架进行解决。当遇到诗歌检索,推荐型的问题时,使用诗歌检索型数据库进行诗歌内容的搜索。
对于步骤S13,经过将语义特征以及实体特征和常用知识图谱做结合,诗歌知识图谱,可以对诗歌进行丰富多种的知识问答,这在之前的知识图谱中是很少应用的。通过对诗歌内部知识做的深度挖掘,可以挖掘出诗歌中带有的语义和实体,包括:人物,地点,组织,朝代,时间,自然现象,星体,生活用品,数学,事件等特征。再将这些特征与常用的知识图谱做融合,就可以进行非常有趣的知识问答。
如‘“不及汪伦送我情”中汪伦指的是谁’,就可以回答“汪伦,字文焕,一字凤林,歙州黟县(宣州太平县,今安徽黄山市黄山)人。唐开元间任泾县令,诗人,著名诗人李白好友。”
再比如“人面桃花相映红”中桃花开在什么时候,是可以通过抽取来的“桃花”得到答案:桃花一般在春季开放,时间为3,4月。
对于步骤S14,将预设的语义网络知识图谱以及步骤S12、S13确定的诗歌知识图谱以及诗歌检索数据库融合进行建模。这样融合的诗歌-语义知识图谱不但可以将诗歌内部的知识实体相关联,而且还能够利用知识图谱做融合,得到有趣的知识问答。
通过该实施方式可以看出,将专用的诗词领域和通用的语义网络知识图谱进行了结合,是对多种知识图谱结合的一种成功尝试。提高检索效率的快速高效,同时,使得诗歌知识图谱可以接收更多的问法,提供能多的服务,使用的场景更加广泛,回答的内容更加准确。
作为一种实施方式,在本实施例中,所述将预设的语义网络知识图谱、所述诗歌知识图谱以及所述诗歌检索数据库融合进行建模包括:
将所述诗歌知识图谱与所述语义网络知识图谱相关联,用于所述诗歌知识图谱向所述语义网络知识图谱进行知识获取;
将所述诗歌知识图谱与所述诗歌检索数据库相关联,用于所述诗歌知识图谱向所述诗歌检索数据库进行诗歌查询。
在本实施方式中,为了将语义网络知识图谱、诗歌知识图谱以及诗歌检索数据库融合,体现出融合建模后图谱与数据库之间的关系,如图2所示,诗歌知识图谱和语义网络知识图谱相连接,当诗歌知识图谱接收到问题时,向语义网络知识图谱进行知识获取,得到答案。同样的诗歌知识图谱和诗歌检索数据库融合相连接,当诗歌知识图谱接收到诗歌检索问题时,向诗歌检索数据库融进行知识跳转,获取相应的诗歌数据。
通过该实施方式可以看出,给出了各知识图谱以及数据库的结构关系,进一步地提高诗歌-语义知识图谱的检索效率以及回答诗歌问题的准确度。
如图3所示为本发明一实施例提供的一种基于诗歌-语义知识图谱的诗歌问答方法的流程图,包括如下步骤:
S21:响应于用户的诗歌提问,对所述诗歌提问进行语义解析以确定查询语句;
S22:将所述查询语句输入至所述方法构建的诗歌-语义知识图谱,基于诗歌检索数据库确定所述查询语句对应的诗句,基于诗歌知识图谱确定所述查询语句的提问语义,基于语义网络知识图谱对所述提问语义进行知识获取,确定回复诗歌提问对话的回复答案;
S23:将所述回复答案反馈给所述用户。
对于步骤S21,例如,在用户使用的时候,用户说“《题都城南庄》第二句中的花开在什么时候”。此时,对诗歌提问进行语义解析,确定需要查询的语句,首先是《题都城南庄》第二句是什么,确定用户问的是什么花,其次,确定出什么花后,再确定语义问的是花开的时间。
对于步骤S22,这时候,将查询语句输入至诗歌-语义知识图谱中。基于诗歌检索数据库确定所述查询语句对应的诗句,确定出查询的诗句“人面桃花相映红”,基于诗歌知识图谱确定所述查询语句的提问语义,从而确定出用户问的是“桃花的开花诗句”。基于语义网络知识图谱对所述提问语义进行知识获取,查询出“桃花开在3-4月”的答案。
对于步骤S23,将回复答案“人面桃花相映红,中的桃花开在3-4月”。
通过该实施方式可以看出,使用诗歌-语义知识图谱可以回答更加复杂的问题,并且回复的答案更加准确,提高用户的使用效果。
作为一种实施方式,在本实施例中,在所述响应于用户的诗歌提问,对所述诗歌提问进行语义解析以确定查询语句之后,所述方法还包括:
基于所述查询语句确定所述诗歌提问对话的问题类型,所述问题类型至少包括诗歌检索问题;
当所述问题类型为诗歌检索问题时,通过诗歌-语义知识图谱内的诗歌检索数据库确定所述查询语句对应的回答诗句,进行回复。
当用户的问题没有这么复杂时,如果用户仅仅问了查询类型的问题时,例如,仅仅提问诗句的下一句,或者某个诗歌中的某一句时,不需要知识图谱类型的问答时。仅仅使用诗歌检索数据库确定所述查询语句对应的回答诗句进行答复即可。进一步提高了回答用户问题的效率。
作为一种实施方式,在所述将所述回复答案反馈给所述用户之后,所述方法还包括:
向用户发送所述回复答案的多个评价等级,以供用户进行选择,其中,所述多个评价等级至少包括:答案正确、答案错误;
接收用户选择的评价等级,当任一诗歌提问的回复答案收到超过预设数量的答案错误评价等级时,向开发者反馈,以供开发者调整,以提高回复答案的质量。
在本实施方式中,对于不常见的诗词,在诗歌问答时,实体和语义特征就会有明显的偏差。通过引入标注和评估机制,对诗词内容进行反馈,集中解决易错问题能有效提高回复的质量。
如图4所示为本发明一实施例提供的一种诗歌-语义知识图谱的构建***的结构示意图,该***可执行上述任意实施例所述的诗歌-语义知识图谱的构建方法,并配置在终端中。
本实施例提供的一种诗歌-语义知识图谱的构建***10包括:特征确定程序模块11,检索数据库生成程序模块12,诗歌知识图谱生成程序模块13 和图谱构建程序模块14。
其中,特征确定程序模块11用于获取诗歌训练数据,确定所述诗歌训练数据的语义特征以及实体特征;检索数据库生成程序模块12用于对所述实体特征进行建模,生成诗歌检索数据库;诗歌知识图谱生成程序模块13用于对所述语义特征以及实体特征进行建模,生成诗歌知识图谱,所述诗歌知识图谱用于将所述语义特征以及实体特征进行关联;图谱构建程序模块14用于将预设的语义网络知识图谱、所述诗歌知识图谱以及所述诗歌检索数据库融合进行建模,生成用于诗歌知识问答的诗歌-语义知识图谱。
本发明实施例还提供了一种非易失性计算机存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的诗歌-语义知识图谱的构建方法;
作为一种实施方式,本发明的非易失性计算机存储介质存储有计算机可执行指令,计算机可执行指令设置为:
获取诗歌训练数据,确定所述诗歌训练数据的语义特征以及实体特征;
对所述实体特征进行建模,生成诗歌检索数据库;
对所述语义特征以及实体特征进行建模,生成诗歌知识图谱,所述诗歌知识图谱用于将所述语义特征以及实体特征进行关联;
将预设的语义网络知识图谱、所述诗歌知识图谱以及所述诗歌检索数据库融合进行建模,生成用于诗歌知识问答的诗歌-语义知识图谱。
如图5所示为本发明一实施例提供的一种基于诗歌-语义知识图谱的诗歌问答***的结构示意图,该***可执行上述任意实施例所述的基于诗歌-语义知识图谱的诗歌问答方法,并配置在终端中。
本实施例提供的一种基于诗歌-语义知识图谱的诗歌问答***20包括:查询语句确定程序模块21,回复答案确定程序模块22和反馈程序模块23。
其中,查询语句确定程序模块21用于响应于用户的诗歌提问,对所述诗歌提问进行语义解析以确定查询语句;回复答案确定程序模块22用于将所述查询语句输入至诗歌-语义知识图谱,基于诗歌检索数据库确定所述查询语句对应的诗句,基于诗歌知识图谱确定所述查询语句的提问语义,基于语义网络知识图谱对所述提问语义进行知识获取,确定回复诗歌提问对话的回复答案;反馈程序模块23用于将所述回复答案反馈给所述用户。
本发明实施例还提供了一种非易失性计算机存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的基于诗歌-语义知识图谱的诗歌问答方法;
作为一种实施方式,本发明的非易失性计算机存储介质存储有计算机可执行指令,计算机可执行指令设置为:
响应于用户的诗歌提问,对所述诗歌提问进行语义解析以确定查询语句;
将所述查询语句输入至诗歌-语义知识图谱,基于诗歌检索数据库确定所述查询语句对应的诗句,基于诗歌知识图谱确定所述查询语句的提问语义,基于语义网络知识图谱对所述提问语义进行知识获取,确定回复诗歌提问对话的回复答案;
将所述回复答案反馈给所述用户。
作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的方法对应的程序指令/模块。一个或者多个程序指令存储在非易失性计算机可读存储介质中,当被处理器执行时,执行上述任意方法实施例中的诗歌-语义知识图谱的构建方法以及基于诗歌-语义知识图谱的诗歌问答方法。
非易失性计算机可读存储介质可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储根据装置的使用所创建的数据等。此外,非易失性计算机可读存储介质可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,非易失性计算机可读存储介质可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本发明实施例还提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例的诗歌-语义知识图谱的构建方法以及基于诗歌-语义知识图谱的诗歌问答方法的步骤。
本申请实施例的客户端以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC 设备等,例如平板电脑。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器,掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)其他具有数据处理功能的电子装置。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”,不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (9)
1.一种诗歌-语义知识图谱的构建方法,包括:
获取诗歌训练数据,确定所述诗歌训练数据的语义特征以及实体特征;
对所述实体特征进行建模,生成诗歌检索数据库;
对所述语义特征以及实体特征进行建模,生成诗歌知识图谱,所述诗歌知识图谱用于将所述语义特征以及实体特征进行关联;
将预设的语义网络知识图谱、所述诗歌知识图谱以及所述诗歌检索数据库融合进行建模,生成用于诗歌知识问答的诗歌-语义知识图谱,其中,所述将预设的语义网络知识图谱、所述诗歌知识图谱以及所述诗歌检索数据库融合进行建模包括:将所述诗歌知识图谱与所述语义网络知识图谱相关联,用于所述诗歌知识图谱向所述语义网络知识图谱进行知识获取,将所述诗歌知识图谱与所述诗歌检索数据库相关联,用于所述诗歌知识图谱向所述诗歌检索数据库进行诗歌查询。
2.根据权利要求1所述的方法,其中,所述语义特征至少包括:关键词、同义词、近义词、反义词、否定词、形容词;
所述实体特征至少包括诗歌中的人物、地点、组织、事件、自然现象、动物、植物。
3.一种基于诗歌-语义知识图谱的诗歌问答方法,所述方法包括:
响应于用户的诗歌提问,对所述诗歌提问进行语义解析以确定查询语句;
将所述查询语句输入至根据权利要求1所述的方法构建的诗歌-语义知识图谱,基于诗歌检索数据库确定所述查询语句对应的诗句,基于诗歌知识图谱确定所述查询语句的提问语义,基于语义网络知识图谱对所述提问语义进行知识获取,确定回复诗歌提问对话的回复答案;
将所述回复答案反馈给所述用户。
4.根据权利要求3所述的方法,其中,在所述响应于用户的诗歌提问,对所述诗歌提问进行语义解析以确定查询语句之后,所述方法还包括:
基于所述查询语句确定所述诗歌提问对话的问题类型,所述问题类型至少包括诗歌检索问题;
当所述问题类型为诗歌检索问题时,通过诗歌-语义知识图谱内的诗歌检索数据库确定所述查询语句对应的回答诗句,进行回复。
5.根据权利要求3所述的方法,其中,在所述将所述回复答案反馈给所述用户之后,所述方法还包括:
向用户发送所述回复答案的多个评价等级,以供用户进行选择,其中,所述多个评价等级至少包括:答案正确、答案错误;
接收用户选择的评价等级,当任一诗歌提问的回复答案收到超过预设数量的答案错误评价等级时,向开发者反馈,以供开发者调整,以提高回复答案的质量。
6.一种诗歌-语义知识图谱的构建***,包括:
特征确定程序模块,用于获取诗歌训练数据,确定所述诗歌训练数据的语义特征以及实体特征;
检索数据库生成程序模块,用于对所述实体特征进行建模,生成诗歌检索数据库;
诗歌知识图谱生成程序模块,用于对所述语义特征以及实体特征进行建模,生成诗歌知识图谱,所述诗歌知识图谱用于将所述语义特征以及实体特征进行关联;
图谱构建程序模块,用于将预设的语义网络知识图谱、所述诗歌知识图谱以及所述诗歌检索数据库融合进行建模,生成用于诗歌知识问答的诗歌-语义知识图谱,其中,所述将预设的语义网络知识图谱、所述诗歌知识图谱以及所述诗歌检索数据库融合进行建模包括:将所述诗歌知识图谱与所述语义网络知识图谱相关联,用于所述诗歌知识图谱向所述语义网络知识图谱进行知识获取,将所述诗歌知识图谱与所述诗歌检索数据库相关联,用于所述诗歌知识图谱向所述诗歌检索数据库进行诗歌查询。
7.一种基于诗歌-语义知识图谱的诗歌问答***,包括:
查询语句确定程序模块,用于响应于用户的诗歌提问,对所述诗歌提问进行语义解析以确定查询语句;
回复答案确定程序模块,用于将所述查询语句输入至根据权利要求6所述的***构建的诗歌-语义知识图谱,基于诗歌检索数据库确定所述查询语句对应的诗句,基于诗歌知识图谱确定所述查询语句的提问语义,基于语义网络知识图谱对所述提问语义进行知识获取,确定回复诗歌提问对话的回复答案;
反馈程序模块,用于将所述回复答案反馈给所述用户。
8.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述方法的步骤。
9.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-5中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911239868.6A CN110929045B (zh) | 2019-12-06 | 2019-12-06 | 诗歌-语义知识图谱的构建方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911239868.6A CN110929045B (zh) | 2019-12-06 | 2019-12-06 | 诗歌-语义知识图谱的构建方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110929045A CN110929045A (zh) | 2020-03-27 |
CN110929045B true CN110929045B (zh) | 2022-07-12 |
Family
ID=69858155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911239868.6A Active CN110929045B (zh) | 2019-12-06 | 2019-12-06 | 诗歌-语义知识图谱的构建方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110929045B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111651570A (zh) * | 2020-05-13 | 2020-09-11 | 深圳追一科技有限公司 | 文本语句处理方法、装置、电子设备以及存储介质 |
CN112101040B (zh) * | 2020-08-20 | 2024-03-29 | 淮阴工学院 | 一种基于知识图谱的古代诗词语义检索方法 |
CN112632386A (zh) * | 2020-12-29 | 2021-04-09 | 广州视源电子科技股份有限公司 | 诗词推荐方法、装置、设备及存储介质 |
CN113127627B (zh) * | 2021-04-23 | 2023-01-17 | 中国石油大学(华东) | 基于lda主题模型结合诗词知识图谱的诗词推荐方法 |
CN112989068B (zh) * | 2021-04-28 | 2022-04-19 | 新疆大学 | 针对唐诗知识的知识图谱构建方法及唐诗知识问答*** |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8407253B2 (en) * | 2009-12-09 | 2013-03-26 | Electronics And Telecommunications Research Institute | Apparatus and method for knowledge graph stabilization |
CN109766453A (zh) * | 2019-01-18 | 2019-05-17 | 广东小天才科技有限公司 | 一种用户语料语义理解的方法及*** |
CN109902187A (zh) * | 2019-03-21 | 2019-06-18 | 广东小天才科技有限公司 | 一种特征知识图谱的构建方法及装置、终端设备 |
-
2019
- 2019-12-06 CN CN201911239868.6A patent/CN110929045B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8407253B2 (en) * | 2009-12-09 | 2013-03-26 | Electronics And Telecommunications Research Institute | Apparatus and method for knowledge graph stabilization |
CN109766453A (zh) * | 2019-01-18 | 2019-05-17 | 广东小天才科技有限公司 | 一种用户语料语义理解的方法及*** |
CN109902187A (zh) * | 2019-03-21 | 2019-06-18 | 广东小天才科技有限公司 | 一种特征知识图谱的构建方法及装置、终端设备 |
Also Published As
Publication number | Publication date |
---|---|
CN110929045A (zh) | 2020-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110929045B (zh) | 诗歌-语义知识图谱的构建方法及*** | |
CN108446286B (zh) | 一种自然语言问句答案的生成方法、装置及服务器 | |
CN107943998B (zh) | 一种基于知识图谱的人机对话控制***及方法 | |
CN109940627B (zh) | 一种面向绘本阅读机器人的人机交互方法和*** | |
CN111400506B (zh) | 古诗词命题方法及*** | |
CN111081220B (zh) | 车载语音交互方法、全双工对话***、服务器和存储介质 | |
CN105068661A (zh) | 基于人工智能的人机交互方法和*** | |
CN106126524B (zh) | 信息推送方法和装置 | |
JP2019504410A (ja) | 旅行ガイド生成方法及びシステム | |
CN106682170B (zh) | 一种应用搜索方法和装置 | |
WO2014127183A2 (en) | Language learning systems and methods | |
CN107133303A (zh) | 用于输出信息的方法和装置 | |
CN109299399B (zh) | 一种学习内容的推荐方法及终端设备 | |
CN110597962A (zh) | 搜索结果展示方法、装置、介质及电子设备 | |
CN110569364A (zh) | 在线教学方法、装置、服务器及存储介质 | |
CN110110090A (zh) | 搜索方法、教育搜索引擎***及装置 | |
CN108920450A (zh) | 一种基于电子设备的知识点复习方法及电子设备 | |
EP3535745A1 (en) | Mapping data resources to requested objectives | |
KR102146433B1 (ko) | 연상기억법을 이용한 문맥 기반 언어 학습 서비스 제공 방법 | |
CN114707000A (zh) | 一种基于知识图谱的问答库生成方法、装置、电子设备和存储介质 | |
CN112800177B (zh) | 基于复杂数据类型的faq知识库自动生成方法和装置 | |
CN116401341A (zh) | 面向理解的互动答疑*** | |
CN114238787B (zh) | 答题处理方法、装置 | |
CN117932022A (zh) | 一种智能问答方法、装置、电子设备及存储介质 | |
KR101794547B1 (ko) | 단어장 자동 생성 및 학습훈련 시스템 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 215123 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province Applicant after: Sipic Technology Co.,Ltd. Address before: 215123 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province Applicant before: AI SPEECH Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |