CN106095748B - 一种生成事件关系图谱的方法及装置 - Google Patents

一种生成事件关系图谱的方法及装置 Download PDF

Info

Publication number
CN106095748B
CN106095748B CN201610394465.9A CN201610394465A CN106095748B CN 106095748 B CN106095748 B CN 106095748B CN 201610394465 A CN201610394465 A CN 201610394465A CN 106095748 B CN106095748 B CN 106095748B
Authority
CN
China
Prior art keywords
name
sentence
personage
role
relation map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610394465.9A
Other languages
English (en)
Other versions
CN106095748A (zh
Inventor
麦涛
王磊
张旭
白杨
王旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neusoft Corp
Original Assignee
Neusoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neusoft Corp filed Critical Neusoft Corp
Priority to CN201610394465.9A priority Critical patent/CN106095748B/zh
Publication of CN106095748A publication Critical patent/CN106095748A/zh
Application granted granted Critical
Publication of CN106095748B publication Critical patent/CN106095748B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种生成事件关系图谱的方法及装置,其中方法包括:对文稿按照预设标点符号拆分为语句;提取拆分后的语句中的人物,筛选出包含所述人物的语句作为备用语句;所述人物包括人名、角色和人称代词中的至少一种;利用预先获得的句法分析树库对所述备用语句进行句法分析,生成所述人物之间的关联关系;利用所述人物和所述关联关系生成事件关系图谱。利用本方法可以直观地查看人物之间发生的事件,能够使用户利用较短的时间了解事件的主旨,节省阅读时间。

Description

一种生成事件关系图谱的方法及装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种生成事件关系图谱的方法及装置。
背景技术
随着互联网的飞速发展,人们都是通过互联网查看事件。但是互联网上的各类太多,不利于用户快速浏览观看。尤其对于事件中的人物较多,关系错综复杂时,用户需要将整篇阅读完毕才能了解的主要内容。有些内容复杂的,通过摘要也难以清楚事件的主旨。
因此,本领域技术人员需要提供一种方法,能够使用户利用较短的时间了解事件的主旨,节省阅读时间。
发明内容
为了解决现有技术中存在的以上技术问题,本发明提供一种生成事件关系图谱的方法及装置,能够使用户利用较短的时间了解事件的主旨,节省阅读时间。
本发明提供一种生成事件关系图谱的方法,包括:
对文稿按照预设标点符号拆分为语句;
提取拆分后的语句中的人物,筛选出包含所述人物的语句作为备用语句;所述人物包括人名、角色和人称代词中的至少一种;
利用预先获得的句法分析树库对所述备用语句进行句法分析,生成所述人物之间的关联关系;
利用所述人物和所述关联关系生成事件关系图谱。
优选地,在利用预先获得的句法分析树库对所述备用语句进行句法分析之前,还包括:
当文稿中的所述人名存在对应的角色时,提取所述人名对应的角色,记录所述人名与角色之间的对应关系;根据所述人名与角色之间的对应关系,将所述角色转换为对应的人名;
当文稿中的所述人名出现人称代词时,提取所述人名对应的人称代词,记录所述人名与人称代词之间的对应关系;根据所述人名与人称代词之间的对应关系,将所述人称代词转换为对应的人名。
优选地,所述提取拆分后的语句中的人物,具体包括:
利用自然语言处理技术对拆分后的语句进行分词得到分词后的词汇;
根据词性提取所述词汇中的人物。
优选地,在所述根据词性提取所述词汇中的人物之后,还包括:
当所述人物包括人名和角色时且所述角色与所述人名相邻时,记录该人名与角色之间的对应关系;
所述事件关系图谱中呈现的人物包括所述人名和角色,所述角色作为所述人名的定语。
优选地,所述利用预先获得的句法分析树库对所述备用语句进行句法分析,具体为:
利用预先获得的句法分析树库基于最大熵算法、条件随机场算法或神经网络算法对所述备用语句进行句法分析。
本发明实施例还提供一种生成事件关系图谱的装置,包括:语句拆分模块、备用语句筛选模块、关联关系生成模块和关系图谱生成模块;
所述语句拆分模块,用于对文稿按照预设标点符号拆分为语句;
所述备用语句筛选模块,用于提取拆分后的语句中的人物,筛选出包含所述人物的备用语句;所述人物包括人名、角色和人称代词中的至少一种;
所述关联关系生成模块,用于利用预先获得的句法分析树库对所述备用语句进行句法分析,生成所述人物之间的关联关系;
所述关系图谱生成模块,用于利用所述人物和所述关联关系生成事件关系图谱。
优选地,还包括:对应关系第一记录模块、对应关系第二记录模块、第一转换模块和第二转换模块;
所述对应关系第一记录模块,用于当文稿中的所述人名存在对应的角色时,提取所述人名对应的角色,记录所述人名与角色之间的对应关系;
所述第一转换模块,用于根据所述人名与角色之间的对应关系,将所述角色转换为对应的人名;
所述对应关系第二记录模块,用于当文稿中的所述人名出现人称代词时,提取所述人名对应的人称代词,记录所述人名与人称代词之间的对应关系;
所述第二转换模块,用于根据所述人名与人称代词之间的对应关系,将所述人称代词转换为对应的人名。
优选地,所述备用语句筛选模块包括拆分子模块和提取子模块;
所述拆分子模块,用于利用自然语言处理技术对拆分后的语句进行分词得到分词后的词汇;
所述提取子模块,用于根据词性提取所述词汇中的人物。
优选地,还包括:定语修饰模块,用于当所述人物包括人名和角色时且所述角色与所述人名相邻时,记录该人名与角色之间的对应关系;所述事件关系图谱中呈现的人物包括所述人名和角色,所述角色作为所述人名的定语。
优选地,所述关系图谱生成模块具体用于利用预先获得的句法分析树库基于最大熵算法、条件随机场算法或神经网络算法对所述备用语句进行句法分析。
与现有技术相比,本发明至少具有以下优点:
对文稿按照预设标点符号拆分为语句,然后提取拆分后的语句中的人物,筛选出包含所述人物的语句作为备用语句;利用预先获得的句法分析树库对所述备用语句进行句法分析,获得所述人物之间的关联关系;利用所述人物和所述关联关系生成事件关系图谱。利用本方法可以直观地查看人物之间发生的事件,能够使用户利用较短的时间了解事件的主旨,节省阅读时间。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明提供的生成事件关系图谱的方法实施例一流程图;
图2为本发明提供的一种关系图谱实施例;
图3为本发明提供的生成事件关系图谱的方法实施例二流程图;
图4为本发明提供的另一种关系图谱实施例;
图5为本发明提供的生成事件关系图谱的装置实施例一示意图;
图6为本发明提供的生成事件关系图谱的装置实施例二示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
方法实施例一:
参见图1,该图为本发明提供的生成事件关系图谱的方法实施例一流程图。
本实施例提供的生成事件关系图谱的方法,包括:
S101:对文稿按照预设标点符号拆分为语句;
需要说明的是,本实施例提供的方法对于文稿的拆分原则是拆分为长句,即对于标点符号为逗号、冒号、顿号等的句子不进行拆分。例如,预设标点符号可以包括:句号、感叹号、问号和分号。出现预设标点符号的语句默认是完整的一个长句,可以拆分。
S102:提取拆分后的语句中的人物,筛选出包含所述人物的语句作为备用语句;所述人物包括人名、角色和人称代词中的至少一种;
对于每个拆分后的语句可以提取其中的人物,人物可能是以人名出现的,也可能是以角色出现的,也可能是人称代词出现的。例如,人名出现的是:王某某、张某某等;角色出现的是:法官、警察、经理等。人称代词出现的是:他、她、它等。只要语句中包括以上中的至少一种则说明保包含人物,则将这样的语句筛选出来。
可以理解的是,事件的关系图谱呈现的是人物和事件,因此,对于不包括人物的语句可以剔除,只保留包含人物的语句。
S103:利用预先获得的句法分析树库对所述备用语句进行句法分析,生成所述人物之间的关联关系;
需要说明的是,基于句法分析树库对于语句进行句法分析是比较成熟的技术,在此不再赘述。
目前句法分析树库包括三种,分别为哈工大、清华和宾州句法分析树库,可以利用这三种中的任意一种。
利用预先获得的句法分析树库基于最大熵算法、条件随机场算法或神经网络算法对所述备用语句进行句法分析。
可以理解的是,人物之间的关联关系主要是为了提取动词。
S104:利用所述人物和所述关联关系生成事件关系图谱。
例如:拆分后的语句为:某公司经理王某某贿赂法官张某某N万人民币。检察官赵某某举报张某某受贿。
这个语句中出现的人物为:王某某、张某某和赵某某;
人物之间的关联关系为:贿赂、受贿、举报。
根据人物和关联关系生成的事件关系图谱如图2所示。
本实施例提供的方法,对文稿按照预设标点符号拆分为语句,然后提取拆分后的语句中的人物,筛选出包含所述人物的语句作为备用语句;利用预先获得的句法分析树库对所述备用语句进行句法分析,获得所述人物之间的关联关系;利用所述人物和所述关联关系生成事件关系图谱。利用本方法可以直观地查看人物之间发生的事件,能够使用户利用较短的时间了解事件的主旨,节省阅读时间。
方法实施例二:
参见图3,该图为本发明提供的生成事件关系图谱的方法实施例二流程图。
需要说明的是,为了将人名、角色和人称代词合并去重,本实施例中还包括从文稿中提取人名对应的角色和人称代词。
另外,为了使读者更好地理解人物和角色之间的关系,本发明在生成事件关系图谱时,在人名之前添加角色,即将角色作为人名的定语,例如,法官张某某。法官是张某某的定语。
本实施例中S201与S101相同,在此不再赘述。
S202:利用自然语言处理技术对拆分后的语句进行分词得到分词后的词汇;根据词性提取所述词汇中的人物;筛选出包含所述人物的语句作为备用语句;
可以理解的是,利用自然语言处理技术进行分词属于现有技术,具体在此不再赘述。
例如,李某某和王某某在火车站遭遇抢劫。分词后为:李某某,和,王某某,在,火车站,遭遇,抢劫。
词性的类别包括:人名、连词、动词、名词和介词等。
例如,李某某和王某某均是人名。
可以理解的是,筛选包含人物的语句作为备用语句指的是该语句中只要包含一个人物就筛选出来作为备用语句,不是包含所有人物的语句。即筛选出保护至少一个人物的语句作为备用语句。
S203:当文稿中的所述人名存在对应的角色时,提取所述人名对应的角色,记录所述人名与角色之间的对应关系;根据所述人名与角色之间的对应关系,将所述角色转换为对应的人名;
例如,检察官赵某某,其中检察官是赵某某这个人物的角色。
本步骤中记录人名和角色之间的对应关系,一方面是为了合并去重,由于一篇文稿中,对于同一个人物的称呼可能不同。有时使用角色,有时使用人名,有时用人称代词。为了精确呈现事件关系图谱,需要对同一个人物的称呼进行合并去重。
例如:法官王某某指出……;法官指出……;将角色均转换为人名。
另一方面,建立人名和角色之间的对应关系,还为了在呈现事件关系图谱时,在人名之前添加对应的角色,这样有利于用户直观理解人名的角色。
S204:当文稿中的所述人名出现人称代词时,提取所述人名对应的人称代词,记录所述人名与人称代词之间的对应关系;根据所述人名与人称代词之间的对应关系,将所述人称代词转换为对应的人名。
例如,法官王某某因为……;据他描述他在受贿过程中……;因此可以将人称代词“他”转换为“王某某”,实现合并去重。
具体实现时,当发现语句中存在人称代词时,向上或向下寻找相邻语句,根据语义关系,得到上一句或下一句中出现的人名,并将人称代词转换为对应的人名。
S205-S206分别与S103-S104相同,在此不再赘述。
为了使本领域技术人员更好地理解本实施例介绍的方法,下面举例说明。
文稿示例:
3月18日晚,上述4人驾乘黑色凯迪拉克SUV,在济南郭店附近道路上撞飞7岁男童小家研,把孩子扔在路边绿化带后逃逸。肇事驾驶员为20岁的在校大学生安某,扔弃孩子者为车主张某伟,二人系朋友关系。当时,肇事车内另有一名8岁儿童,而令人吃惊的是:事发第二天,车内的4人还带着这名8岁儿童,淡定地前往位于齐河的欧乐堡游乐场游玩。
第一,先分词,分词后根据词性判断人物,包括人名、角色(职位)。
(7岁)男童,小家研,(孩子),(在校大学生)安某,(车主)张某伟,(8岁)儿童。
第二,根据人物筛选备用语句,从备用语句中获得人物之间的关联关系;
安某-〉撞飞-〉7岁男童;
安某-〉撞飞-〉小家研;
张某伟-〉扔弃-〉孩子;
安某-〉朋友-〉张某伟;
XX-〉带着-〉(8岁)儿童。
第三,合并去重,将角色转换为人名,将人称代词转换为人名;
安某-〉撞飞-〉(7岁男童)小家研;
张某伟-〉扔弃-〉(孩子)(7岁男童)小家研;
安某-〉朋友-〉张某伟;
XX-〉带着-〉(8岁)儿童。
第四,生成事件关系图谱,具体可以参见图4。
需要说明的是,第二和第三的先后顺序可以颠倒,即可以先合并去重,再获得人物之间的关联关系。也可以先获得人物之间的关联关系,再合并去重。
可以理解的是,以上实施例提供的方法,为了精确呈现关系图谱,对人物进行了合并去重。并且,该方法不仅适用于新闻报道文稿,而且还适用于公安类笔录、法庭审判会议记录等。
基于以上实施例提供的一种生成事件关系图谱的方法,本发明还提供一种生成事件关系图谱的装置,下面结合附图进行详细的说明。
装置实施例一:
参见图5,该图为本发明提供的生成事件关系图谱的装置实施例一示意图。
本实施例提供的生成事件关系图谱的装置,包括:语句拆分模块501、备用语句筛选模块502、关联关系生成模块503和关系图谱生成模块504;
所述语句拆分模块501,用于对文稿按照预设标点符号拆分为语句;
需要说明的是,本实施例提供的方法对于文稿的拆分原则是拆分为长句,即对于标点符号为逗号、冒号、顿号等的句子不进行拆分。例如,预设标点符号可以包括:句号、感叹号、问号和分号。出现预设标点符号的语句默认是完整的一个长句,可以拆分。
所述备用语句筛选模块502,用于提取拆分后的语句中的人物,筛选出包含所述人物的备用语句;所述人物包括人名、角色和人称代词中的至少一种;
对于每个拆分后的语句可以提取其中的人物,。将含有人物的语句筛选出来。
可以理解的是,事件的关系图谱呈现的是人物和事件,因此,对于不包括人物的语句可以剔除,只保留包含人物的语句。
所述关联关系生成模块503,用于利用预先获得的句法分析树库对所述备用语句进行句法分析,生成所述人物之间的关联关系;
需要说明的是,基于句法分析树库对于语句进行句法分析是比较成熟的技术,在此不再赘述。
目前句法分析树库包括三种,分别为哈工大、清华和宾州句法分析树库,可以利用这三种中的任意一种。
利用预先获得的句法分析树库基于最大熵算法、条件随机场算法或神经网络算法对所述备用语句进行句法分析。
可以理解的是,人物之间的关联关系主要是为了提取动词。
所述关系图谱生成模块504,用于利用所述人物和所述关联关系生成事件关系图谱。
例如:拆分后的语句为:某公司经理王某某贿赂法官张某某N万人民币。检察官赵某某举报张某某受贿。
这个语句中出现的人物为:王某某、张某某和赵某某;
人物之间的关联关系为:贿赂、受贿、举报。
根据人物和关联关系生成的事件关系图谱如图2所示。
本实施例提供的装置,对文稿按照预设标点符号拆分为语句,然后提取拆分后的语句中的人物,筛选出包含所述人物的语句作为备用语句;利用预先获得的句法分析树库对所述备用语句进行句法分析,获得所述人物之间的关联关系;利用所述人物和所述关联关系生成事件关系图谱。利用本方法可以直观地查看人物之间发生的事件,能够使用户利用较短的时间了解事件的主旨,节省阅读时间。
装置实施例二:
参见图6,该图为本发明提供的生成事件关系图谱的装置实施例二示意图。
需要说明的是,为了将人名、角色和人称代词合并去重,本实施例中还包括从文稿中提取人名对应的角色和人称代词。
另外,为了使读者更好地理解人名和角色之间的关系,本发明在生成事件关系图谱时,在人名之前添加角色,即将角色作为人名的定语,例如,法官张某某。法官是张某某的定语。
本发明实施例提供的生成事件关系图谱的装置,还包括:对应关系第一记录模块601、第一转换模块602、对应关系第二记录模块603和第二转换模块604;
所述对应关系第一记录模块601,用于当文稿中的所述人名存在对应的角色时,提取所述人名对应的角色,记录所述人名与角色之间的对应关系;
所述第一转换模块602,用于根据所述人名与角色之间的对应关系,将所述角色转换为对应的人名;
所述对应关系第二记录模块603,用于当文稿中的所述人名出现人称代词时,提取所述人名对应的人称代词,记录所述人名与人称代词之间的对应关系;
所述第二转换模块604,用于根据所述人名与人称代词之间的对应关系,将所述人称代词转换为对应的人名。
可以理解的是,利用自然语言处理技术进行分词属于现有技术,具体在此不再赘述。
例如,李某某和王某某在火车站遭遇抢劫。分词后为:李某某,和,王某某,在,火车站,遭遇,抢劫。
词性的类别包括:人名、连词、动词、名词和介词等。
例如,李某某和王某某均是人名。
可以理解的是,筛选包含人物的语句作为备用语句指的是该语句中只要包含一个人物就筛选出来作为备用语句,不是包含所有人物的语句。即筛选出包括至少一个人物的语句作为备用语句。
例如,检察官赵某某,其中检察官是赵某某这个人物的角色。
本步骤中记录人名和角色之间的对应关系,一方面是为了合并去重,由于一篇文稿中,对于同一个人物的称呼可能不同。有时用角色,有时用人名,有时用人称代词。为了精确呈现事件关系图谱,需要对同一个人物的称呼进行合并去重。
例如:法官王某某指出……;法官指出……;将角色均转换为人名。
另一方面,建立人名和角色之间的对应关系,还为了在呈现事件关系图谱时,在人名之前添加对应的角色,这样有利于用户直观理解人名对应的角色。
其中,所述备用语句筛选模块包括拆分子模块502a和提取子模块502b;
所述拆分子模块502a,用于利用自然语言处理技术对拆分后的语句进行分词得到分词后的词汇;
所述提取子模块502b,用于根据词性提取所述词汇中的人物。
本实施例还包括:定语修饰模块605,用于当所述人物包括人名和角色时且所述角色与所述人名相邻时,记录该人名与角色之间的对应关系;所述事件关系图谱中呈现的人物包括所述人名和角色,所述角色作为所述人名的定语。
所述关系图谱生成模块504具体用于利用预先获得的句法分析树库基于最大熵算法、条件随机场算法或神经网络算法对所述备用语句进行句法分析。
本实施例提供的装置,为了精确呈现关系图谱,对人物进行了合并去重。并且,该方法不仅适用于新闻文稿,而且还适用于公安类笔录、法庭审判会议记录等。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。

Claims (8)

1.一种生成事件关系图谱的方法,其特征在于,包括:
对文稿按照预设标点符号拆分为语句;
提取拆分后的语句中的人物,筛选出包含所述人物的语句作为备用语句;所述人物包括人名、角色和人称代词中的至少一种;
当所述文稿中的所述人名存在对应的角色时,提取所述人名对应的角色,记录所述人名与角色之间的对应关系;根据所述人名与角色之间的对应关系,将所述角色转换为对应的人名;
当所述文稿中的所述人名出现人称代词时,提取所述人名对应的人称代词,记录所述人名与人称代词之间的对应关系;根据所述人名与人称代词之间的对应关系,将所述人称代词转换为对应的人名;
利用预先获得的句法分析树库对所述备用语句进行句法分析,生成所述人物之间的关联关系;
利用所述人物和所述关联关系生成事件关系图谱。
2.根据权利要求1所述的生成事件关系图谱的方法,其特征在于,所述提取拆分后的语句中的人物,具体包括:
利用自然语言处理技术对拆分后的语句进行分词得到分词后的词汇;
根据词性提取所述词汇中的人物。
3.根据权利要求2所述的生成事件关系图谱的方法,其特征在于,在所述根据词性提取所述词汇中的人物之后,还包括:
当所述人物包括人名和角色时且所述角色与所述人名相邻时,记录该人名与角色之间的对应关系;
所述事件关系图谱中呈现的人物包括所述人名和角色,所述角色作为所述人名的定语。
4.根据权利要求1所述的生成事件关系图谱的方法,其特征在于,所述利用预先获得的句法分析树库对所述备用语句进行句法分析,具体为:
利用预先获得的句法分析树库基于最大熵算法、条件随机场算法或神经网络算法对所述备用语句进行句法分析。
5.一种生成事件关系图谱的装置,其特征在于,包括:语句拆分模块、备用语句筛选模块、对应关系第一记录模块、对应关系第二记录模块、第一转换模块、第二转换模块、关联关系生成模块和关系图谱生成模块;
所述语句拆分模块,用于对文稿按照预设标点符号拆分为语句;
所述备用语句筛选模块,用于提取拆分后的语句中的人物,筛选出包含所述人物的备用语句;所述人物包括人名、角色和人称代词中的至少一种;
所述对应关系第一记录模块,用于当文稿中的所述人名存在对应的角色时,提取所述人名对应的角色,记录所述人名与角色之间的对应关系;
所述第一转换模块,用于根据所述人名与角色之间的对应关系,将所述角色转换为对应的人名;
所述对应关系第二记录模块,用于当文稿中的所述人名出现人称代词时,提取所述人名对应的人称代词,记录所述人名与人称代词之间的对应关系;
所述第二转换模块,用于根据所述人名与人称代词之间的对应关系,将所述人称代词转换为对应的人名;
所述关联关系生成模块,用于利用预先获得的句法分析树库对所述备用语句进行句法分析,生成所述人物之间的关联关系;
所述关系图谱生成模块,用于利用所述人物和所述关联关系生成事件关系图谱。
6.根据权利要求5所述的生成事件关系图谱的装置,其特征在于,所述备用语句筛选模块包括拆分子模块和提取子模块;
所述拆分子模块,用于利用自然语言处理技术对拆分后的语句进行分词得到分词后的词汇;
所述提取子模块,用于根据词性提取所述词汇中的人物。
7.根据权利要求6所述的生成事件关系图谱的装置,其特征在于,还包括:定语修饰模块,用于当所述人物包括人名和角色时且所述角色与所述人名相邻时,记录该人名与角色之间的对应关系;所述事件关系图谱中呈现的人物包括所述人名和角色,所述角色作为所述人名的定语。
8.根据权利要求5所述的生成事件关系图谱的装置,其特征在于,所述关系图谱生成模块具体用于利用预先获得的句法分析树库基于最大熵算法、条件随机场算法或神经网络算法对所述备用语句进行句法分析。
CN201610394465.9A 2016-06-06 2016-06-06 一种生成事件关系图谱的方法及装置 Active CN106095748B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610394465.9A CN106095748B (zh) 2016-06-06 2016-06-06 一种生成事件关系图谱的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610394465.9A CN106095748B (zh) 2016-06-06 2016-06-06 一种生成事件关系图谱的方法及装置

Publications (2)

Publication Number Publication Date
CN106095748A CN106095748A (zh) 2016-11-09
CN106095748B true CN106095748B (zh) 2019-08-27

Family

ID=57447276

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610394465.9A Active CN106095748B (zh) 2016-06-06 2016-06-06 一种生成事件关系图谱的方法及装置

Country Status (1)

Country Link
CN (1) CN106095748B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106776544B (zh) * 2016-11-24 2020-05-05 四川无声信息技术有限公司 人物关系识别方法及装置和分词方法
CN107526722A (zh) * 2017-07-31 2017-12-29 努比亚技术有限公司 一种人物关系分析方法及终端
CN107507093A (zh) * 2017-08-22 2017-12-22 深圳市慧择保险经纪有限公司 家庭客户保险需求的数据处理方法及装置
CN110309311A (zh) * 2018-03-09 2019-10-08 北京国双科技有限公司 一种事件处理策略确定方法及装置
CN109657073A (zh) * 2018-12-21 2019-04-19 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN112579786A (zh) * 2019-09-30 2021-03-30 北京国双科技有限公司 一种基于笔录的图谱的构建方法及装置、存储介质、设备
CN111008022B (zh) * 2019-12-04 2023-12-12 浙江大搜车软件技术有限公司 关系图生成方法、装置、计算机设备和存储介质
CN111859970B (zh) * 2020-07-23 2022-05-17 北京字节跳动网络技术有限公司 用于处理信息的方法、装置、设备和介质
CN112241461B (zh) * 2020-09-15 2023-08-18 上海连尚网络科技有限公司 一种用于生成书籍的人物关系图的方法与设备
CN112714253B (zh) * 2020-12-28 2022-08-26 维沃移动通信有限公司 视频录制方法、装置、电子设备和可读存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101706794A (zh) * 2009-11-24 2010-05-12 上海显智信息科技有限公司 基于语义实体关系模型和可视化推荐的信息浏览检索方法
CN102214186A (zh) * 2010-04-07 2011-10-12 腾讯科技(深圳)有限公司 展示对象关系的方法和***
CN102693219A (zh) * 2012-06-05 2012-09-26 苏州大学 一种中文事件的抽取方法及***
CN103617280A (zh) * 2013-12-09 2014-03-05 苏州大学 一种中文事件信息挖掘方法和***
CN105302794A (zh) * 2015-10-30 2016-02-03 苏州大学 一种中文同指事件识别方法及***
CN105468605A (zh) * 2014-08-25 2016-04-06 济南中林信息科技有限公司 一种实体信息图谱生成方法及装置
CN105573977A (zh) * 2015-10-23 2016-05-11 苏州大学 一种中文事件时序关系识别方法及***

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101604312A (zh) * 2007-12-07 2009-12-16 宗刚 信息的检索管理交流的方法和***
CN103488724B (zh) * 2013-09-16 2016-09-28 复旦大学 一种面向图书的阅读领域知识图谱构建方法
CN104462508A (zh) * 2014-12-19 2015-03-25 北京奇虎科技有限公司 基于知识图谱的人物关系搜索方法和装置
CN104615783A (zh) * 2015-03-02 2015-05-13 百度在线网络技术(北京)有限公司 信息搜索方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101706794A (zh) * 2009-11-24 2010-05-12 上海显智信息科技有限公司 基于语义实体关系模型和可视化推荐的信息浏览检索方法
CN102214186A (zh) * 2010-04-07 2011-10-12 腾讯科技(深圳)有限公司 展示对象关系的方法和***
CN102693219A (zh) * 2012-06-05 2012-09-26 苏州大学 一种中文事件的抽取方法及***
CN103617280A (zh) * 2013-12-09 2014-03-05 苏州大学 一种中文事件信息挖掘方法和***
CN105468605A (zh) * 2014-08-25 2016-04-06 济南中林信息科技有限公司 一种实体信息图谱生成方法及装置
CN105573977A (zh) * 2015-10-23 2016-05-11 苏州大学 一种中文事件时序关系识别方法及***
CN105302794A (zh) * 2015-10-30 2016-02-03 苏州大学 一种中文同指事件识别方法及***

Also Published As

Publication number Publication date
CN106095748A (zh) 2016-11-09

Similar Documents

Publication Publication Date Title
CN106095748B (zh) 一种生成事件关系图谱的方法及装置
CN107092596B (zh) 基于attention CNNs和CCR的文本情感分析方法
CN103399916A (zh) 基于产品特征的互联网评论观点挖掘方法及***
CN104516947B (zh) 一种融合显性和隐性特征的中文微博情感分析方法
CN105427869A (zh) 一种基于深度学习的会话情感自动分析方法
KR101074215B1 (ko) 여론 분석 장치 및 문서 분석을 통한 여론 평가 방법
Tao Profiling the Mandarin spoken vocabulary based on corpora
Crespy Analysing European Discourses
CN107357778A (zh) 一种变形词的识别验证方法及***
Armbrust A history of new media in the Arab Middle East
CN107239440A (zh) 一种垃圾文本识别方法和装置
CN102237088A (zh) 语音识别多信息文本获取装置及方法
US20150019206A1 (en) Metadata extraction of non-transcribed video and audio streams
CN106294396A (zh) 关键词扩展方法和关键词扩展***
CN103077207B (zh) 一种微博开心指数分析方法及***
CN103942191A (zh) 一种基于内容的恐怖文本识别方法
KR102196508B1 (ko) 비지도 학습을 통한 개체명 사전 구축 방법 및 시스템
CN113312530B (zh) 一种以文本为核心的多模态情感分类方法
CN104268203B (zh) 一种移动终端及其有效过滤垃圾信息的方法和装置
CN105631015A (zh) 一种智能多媒体播放器
Abecassis The Representation of Parisian Speech in the Cinema of the 1930s
KR101984042B1 (ko) 영상데이터 음성신호 기반 청크 및 핵심어 분석 방법, 그리고 그 시스템
CN116484872A (zh) 基于预训练与注意力的多模态方面级情感判断方法和***
Ghosh et al. Safeguard: A prototype of an application programming interface to save the disaster affected people
AU2021100563A4 (en) An Active Learning Sentiment Analysis Framework for Mobile Phone Review Analysis using Deep Learning to Reduce Human Annotation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant