CN106156365B - 一种知识图谱的生成方法及装置 - Google Patents

一种知识图谱的生成方法及装置 Download PDF

Info

Publication number
CN106156365B
CN106156365B CN201610628591.6A CN201610628591A CN106156365B CN 106156365 B CN106156365 B CN 106156365B CN 201610628591 A CN201610628591 A CN 201610628591A CN 106156365 B CN106156365 B CN 106156365B
Authority
CN
China
Prior art keywords
data
urtext
knowledge
text data
knowledge mapping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610628591.6A
Other languages
English (en)
Other versions
CN106156365A (zh
Inventor
郭瑞
郭祥
雷宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Rubu Technology Co.,Ltd.
Original Assignee
Beijing Rubo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Rubo Technology Co Ltd filed Critical Beijing Rubo Technology Co Ltd
Priority to CN201610628591.6A priority Critical patent/CN106156365B/zh
Publication of CN106156365A publication Critical patent/CN106156365A/zh
Application granted granted Critical
Publication of CN106156365B publication Critical patent/CN106156365B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供了一种知识图谱的生成方法及装置,该方法包括:对指定领域的原始文本数据进行词法、语法和/或语义分析,得到标准化文本数据;从所述标准化文本数据中抽取事实信息,所述事实信息包括以下元素:实体、属性、实体之间的关系以及实体与属性之间的关系;采用预设表现形式对所述事实信息进行结构化表示,得到所述事实信息的结构化数据对;利用所述结构化数据对作为知识条目,构建知识图谱。本发明提出的知识图谱的生成方法,能够构建出具有针对性的知识图谱,满足指定领域,如儿童领域,的智能交互需求,提升不同需求用户的交互体验。

Description

一种知识图谱的生成方法及装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种用于儿童领域智能交互的知识图谱的生成方法及装置。
背景技术
儿童是目前市场上对智能硬件最容易接受的人群,其智能性主要体现在交互智能上,但针对儿童语言和知识处理与研究很少。普通的交互对话多数用检索的方式,构造一问一答的语料集,计算用户问题和语料问题的相似度,进而给出相应回复,这种属于浅层交互。
深度交互需要构建知识图谱来进行知识挖掘和推理。知识图谱,是指以实体、概念作为节点,以语义关系作为边的语义网络。知识图谱使得知识获取更直接,因此能够为阅读提供语义关联的知识,从而实现阅读的便捷化、智能化和人性化。
在实现本发明过程中,发明人发现现有技术中至少存在以下问题:现存的知识图谱多数都是普适目的,缺乏针对性,不足以满足儿童领域的智能交互需求。
发明内容
鉴于上述问题,本发明实施例提出了一种知识图谱的生成方法及装置,用以解决现有的知识图谱缺乏针对性,不足以满足指定领域,如儿童领域,的智能交互需求的问题。
根据本发明的一个方面,提供了一种知识图谱的生成方法,该方法包括:
对指定领域的原始文本数据进行词法、语法和/或语义分析,得到标准化文本数据;
从所述标准化文本数据中抽取事实信息,所述事实信息包括以下元素:实体、属性、实体之间的关系以及实体与属性之间的关系;
采用预设表现形式对所述事实信息进行结构化表示,得到所述事实信息的结构化数据对;
利用所述结构化数据对作为知识条目,构建知识图谱。
可选地,所述方法还包括:
从资源网站、音频资源、视频资源和/或第三方服务器中获取指定领域的原始文本数据。
可选地,所述对原始文本数据进行词法、语法和/或语义分析,得到标准化文本数据,包括:
根据所述原始文本数据的文档结构进行段落结构划分;
对划分出的各段落结构进行词法、语法和/或语义分析,得到标准化文本数据。
可选地,所述根据所述原始文本数据的文档结构进行段落结构划分,包括:
根据文档结构分布特征确定所述原始文本数据的文档结构,根据所述文档结构对所述原始文本数据进行段落结构划分,或
采用预先训练的段落分类器模型对所述原始文本数据的段落进行文档结构分类,根据分类结果对所述原始文本数据进行段落结构划分。
可选地,所述对划分出的各段落结构进行词法、语法和/或语义分析,包括:
若所述原始文本数据为中文资源时,对划分出的各段落结构进行分词、词性标注以及短语识别,并去除段落结构中的标点符号;
若所述原始文本数据为外语资源时,对划分出的各段落结构进行词干处理、词形还原以及短语识别,并去除段落结构中的标点符号。
可选地,所述从所述标准化文本数据中抽取事实信息,包括:
对所述标准化文本数据进行知识抽取,得到所述标准化文本数据中存在的名词,以及各名词之间的关系;
对知识抽取得到的结果进行事实信息的识别,得到所述事实信息。
可选地,所述对所述标准化文本数据进行知识抽取,包括:
根据各类别的名词的结构特征从所述标准化文本数据中抽取相应类别的名词以及各名词之间的关系,或
采用预先训练的名词分类器模型对所述标准化文本数据中的词语进行分类,根据分类结果识别并抽取各类别的名词以及各名词之间的关系。
可选地,所述方法还包括:
采用关系数据库方式对构建的知识图谱进行存储,或
采用Hash表方式对构建的知识图谱进行存储,或
采用索引方式对构建的知识图谱进行存储。
可选地,所述方法还包括:
根据构建的知识图谱进行人机交互。
根据本发明的另一个方面,提供了一种知识图谱的生成装置,该***包括:
预处理单元,用于对指定领域的原始文本数据进行词法、语法和/或语义分析,得到标准化文本数据;
信息抽取单元,用于从所述标准化文本数据中抽取事实信息,所述事实信息包括以下元素:实体、属性、实体之间的关系以及实体与属性之间的关系;
信息表示单元,用于采用预设表现形式对所述事实信息进行结构化表示,得到所述事实信息的结构化数据对;
构建单元,用于利用所述结构化数据对作为知识条目,构建知识图谱。
可选地,所述装置还包括:
获取单元,用于从资源网站、音频资源、视频资源和/或第三方服务器中获取指定领域的原始文本数据。
可选地,所述预处理单元,包括:
第一处理模块,用于根据所述原始文本数据的文档结构进行段落结构划分;
第二处理模块,用于对划分出的各段落结构进行词法、语法和/或语义分析,得到标准化文本数据。
可选地,所述信息抽取单元,包括:
抽取模块,用于对所述标准化文本数据进行知识抽取,得到所述标准化文本数据中存在的名词,以及各名词之间的关系;
识别模块,用于对知识抽取得到的结果进行事实信息的识别,得到所述事实信息。
可选地,所述装置还包括:
存储单元,用于采用关系数据库方式对构建的知识图谱进行存储,或,采用Hash表方式对构建的知识图谱进行存储,或,采用索引方式对构建的知识图谱进行存储。
可选地,所述装置还包括:
交互单元,用于根据构建的知识图谱进行人机交互。
本发明提供的知识图谱的生成方法及装置,通过从指定领域的文本数据中抽取事实信息,以预设表现形式对事实信息进行表示,并采用以预设表现形式进行表示的结构化数据对作为知识条目,构建知识图谱,进而能够构建出具有针对性的知识图谱,满足指定领域,如儿童领域,的智能交互需求,提升不同需求用户的交互体验。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本发明实施例提出的一种知识图谱的生成方法的流程图;
图2为本发明另一实施例提出的一种知识图谱的生成方法的流程图;
图3为本发明实施例提出的一种知识图谱的生成方法中步骤S11的细分流程图;
图4为本发明实施例提出的一种知识图谱的生成方法中步骤S12的细分流程图;
图5为本发明实施例提出的一种知识图谱的生成装置的结构框图;
图6为本发明另一实施例提出的一种知识图谱的生成装置的结构框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非被特定定义,否则不会用理想化或过于正式的含义来解释。
图1示出了本发明实施例的一种知识图谱的生成方法的流程图。参照图1,本发明实施例提出的知识图谱的生成方法具体包括以下步骤:
S11、对指定领域的原始文本数据进行词法、语法和/或语义分析,得到标准化文本数据。
其中,指定领域是指当前实际应用场景的领域,如针对儿童智能交互的儿童领域,具体可根据实际应用进行确定。词法、语法和/或语义分析是指对指定领域的原始文本数据基于词法、语法和/或语义分析进行结构化处理以及分词处理等操作。
S12、从所述标准化文本数据中抽取事实信息,所述事实信息包括以下元素:实体、属性、实体之间的关系以及实体与属性之间的关系。
本实施例中,实体是指命名实体词和事件名等;属性是指命名实体修饰的名词,如年龄、性别、人物关系等。其中,实体属性的关系主要靠计算共现的概率,提取实体共有的,概率最大的属性词。实体之间的关系,一方面根据在句子中的共现概率,另一方面根据识别出的实体属性关系提取实体关系。
S13、采用预设表现形式对所述事实信息进行结构化表示,得到所述事实信息的结构化数据对。
本实施例中,可采用N元组的表现方式实现对所述事实信息进行结构化表示,得到所述事实信息的结构化数据对。
在一个具体示例中,以三元组为例进行说明。具体的,根据知识挖掘的结果,识别输出实体和属性,以及实体属性的关系,构造三元组。每一条事实信息都可以表示成(实体,属性,关系)。
S14、利用所述结构化数据对作为知识条目,构建知识图谱。
本发明实施例提供的知识图谱的生成方法,通过从指定领域的文本数据中抽取事实信息,以预设表现形式对事实信息进行表示,并采用以预设表现形式进行表示的结构化数据对作为知识条目,构建知识图谱,进而能够构建出具有针对性的知识图谱,满足指定领域,如儿童领域,的智能交互需求,提升不同需求用户的交互体验。
在本发明的一个可选实施例中,如图2所示,在步骤S11之前,所述方法还包括以下步骤:
S10、从资源网站、音频资源、视频资源和/或第三方服务器中获取指定领域的原始文本数据。
本发明实施例中,在步骤S11之前还包括从资源网站、音频资源、视频资源和/或第三方服务器中获取指定领域的原始文本数据的步骤,该步骤具体以下方式中的一种或多种:
(1)、通过网页抓取方法从资源网站中获取指定领域的原始文本数据。在实际应用中,可采用网络爬虫技术对网页进行抓取,以从资源网站中获取指定领域的原始文本数据;和/或,采用网络抓包技术对网页进行抓取,以从资源网站中获取指定领域的原始文本数据。
其中,抓包指的是将网络传输发送与接收的数据包进行截获、重发、编辑、转存等操作,网络抓包技术可以通过对网络数据进行截获。
网络爬虫是一个自动提取网页的程序,是搜索引擎的重要组成部分。示例性的,以采用网络爬虫技术进行网页抓取为例,网络抓取过程包括:首先选取种子统一资源定位符URL,将这些种子URL放入待抓取URL队列;从待抓取的URL阵列中取出待抓取URL,解析待抓取URL的域名***DNS,查看与待抓取URL对应的网页,并将这些对应网页已查看的URL放入已抓取URL队列;分析已抓取URL队列中的URL,分析其中包含的其他URL,并将其他URL放入待抓取URL队列,从而进入下一个循环。需要说明的是,本发明实施例中对网页进行抓取时可采用上述的任意一项或多项抓取策略进行抓取,本发明对此不作限制。
(2)、通过内容提取语音识别方法从语音资源中获取指定领域的原始文本数据。具体的,语音资源可以通过语音识别技术将其转成文本,得到原始文本数据。
(3)、通过图像识别方法从视频资源中获取指定领域的原始文本数据。具体的,视频资源可以通过图像识别技术将视频资源中的字幕信息提取并转化成文本,得到原始文本数据。
(4)、通过第三方服务器获取指定领域的原始文本数据。具体的,可通过与第三方机构进行资源合作,从第三方机构的服务器获取儿童作家等新内容资源。
需要说明的是,本发明实施例中提供的获取指定领域的原始文本数据的方式,仅用于举例说明,本领域技术人员可根据实际应用需求选择上述的任意一种或多种方式进行原始文本数据的获取,本发明对此不作限制。
在本发明的一个可选实施例中,如图3所示,上述实施例中的步骤S11进一步包括以下步骤:
S111、根据所述原始文本数据的文档结构进行段落结构划分。
其中,所述步骤S111中的根据所述原始文本数据的文档结构进行段落结构划分,具体包括:根据文档结构分布特征确定所述原始文本数据的文档结构,根据所述文档结构对所述原始文本数据进行段落结构划分,或采用预先训练的段落分类器模型对所述原始文本数据的段落进行文档结构分类,根据分类结果对所述原始文本数据进行段落结构划分。
为了快速、准确地实现原始文本数据的段落结构划分,本发明实施例中,通过将原始文本数据进行结构化,区分出标题、正文、作者、时间、分类等段落,实现原始文本数据的段落结构划分。具体的。具体的,可根据文档结构分布特征,例如:文本的位置、长度、词语内容等方面特征,确定所述原始文本数据的文档结构。或人工标注少许训练语料,根据上述特征构建段落分类器模型对段落进行分类,以分类预测结果作为段落属性。
S112、对划分出的各段落结构进行词法、语法和/或语义分析,得到标准化文本数据。
其中,所述步骤S112中的对划分出的各段落结构进行词法、语法和/或语义分析,具体包括:若所述原始文本数据为中文资源时,对划分出的各段落结构进行分词、词性标注以及短语识别,并去除段落结构中的标点符号;若所述原始文本数据为外语资源时,对划分出的各段落结构进行词干处理、词形还原以及短语识别,并去除段落结构中的标点符号。
为了快速、准确地实现原始文本数据的段落结构划分,本发明实施例,通过判断原始文本数据的语言,若原始文本数据为中文资源时,则对中文资源进行中文分词、词性标注、短语识别等。具体的可用开源工具对中文进行词法、语法和/或语义分析。若所述文本数据为外语资源时,按照对应语言工具对中文资源进行词法、语法和/或语义分析,例如,对英语资源进行词干处理、词形还原、短语识别等,指去除时态、词后缀并还原成原词。具体的也可以用开源工具对英语资源进行词法、语法和/或语义分析。
在本发明的一个可选实施例中,如图4所示,上述实施例步骤S12中的从所述标准化文本数据中抽取事实信息,进一步包括以下步骤:
S121、对所述标准化文本数据进行知识抽取,得到所述标准化文本数据中存在的名词,以及各名词之间的关系。
其中,所述步骤S121中的对所述标准化文本数据进行知识抽取,具体包括:根据各类别的名词的结构特征从所述标准化文本数据中抽取相应类别的名词以及各名词之间的关系,或采用预先训练的名词分类器模型对所述标准化文本数据中的词语进行分类,根据分类结果识别并抽取各类别的名词以及各名词之间的关系。具体的,名词之间的关系可根据在句子中的共现概率确定。
S122、对知识抽取得到的结果进行事实信息的识别,得到所述事实信息。
为了快速、准确地实现标准化文本数据的知识抽取,本发明实施例,通过对已有数据的观察,对名词的开始字、结束字、词长度等特点确定各类别的名词的结构特征,并根据各类别的名词的结构特征从标准化文本数据中抽取相应类别的名词以及各名词之间的关系,进而得到事实信息。
下面以人名为例进行详细举例说明:
首先,提取姓氏字,可以根据百家姓或从已有人名中抽取。
再统计人名中常出现的字概率,如字在文本共出现N次,人名中出现M次,则字可以作为名字的概率为M/N;
最后判断结尾,一般根据长度和字概率,概率和第二步类似,计算字在名字中间、结尾出现的概率,加上长度的限制(中文人名一般2-4个字)即可识别出人名。
此外,在本发明的另一实施例中,还可以基于统计模型的方法实现,具体如下:
首先,构造标注语料。对预处理后的文本数据,标注句子中的人名;
其次,提取各类别的名词的结构特征。可用的特征包括词性、词长度、词位置、前一个词、前词词性、后一个词、后词词性等。
最后,建模和预测。例如,基于标注好的语料和提取出的特征文件,训练统计模型。预测时加载已训练好的模型,对标准化文本数据预测并识别相应类别的名词。
在本发明的一个可选实施例中,所述方法还包括以下步骤:采用关系数据库方式对构建的知识图谱进行存储,或采用Hash表方式对构建的知识图谱进行存储,或采用索引方式对构建的知识图谱进行存储。
知识存储是用于后续的知识应用,需要考虑可查询性、查询效率、空间占用等方面的因素。本发明实施例以三种存储方法为例,对本发明中知识图谱的存储进行解释说明,具体如下:
采用关系数据库方式对构建的知识图谱进行存储。该存储方式对结构化数据对(实体、属性、关系)设计数据库表,根据表键值完成知识存储和查询。
采用Hash表方式对构建的知识图谱进行存储。该存储方式将知识主体(结构化数据对中的实体)作为key,其余作为value,构造hash表存储。
采用索引方式对构建的知识图谱进行存储,对知识(结构化数据对)做全文索引,构造正排索引和倒排索引完成存储和查询。
在本发明的一个可选实施了中,所述方法还包括以下步骤:根据构建的知识图谱进行人机交互。
知识图谱的应用方法多种多样,一般是根据已挖掘的知识,及存储格式和查询方法,完成知识推理、人机交互的过程。应用时,需要识别问题句子中的实体、属性等信息,并转换成知识查询的语法,根据图谱中的关系最后给出推理结果。
需要说明的是,本发明实施例中对知识图谱进行存储时可采用上述的任意一种存储方式实现,本发明对此不作限制。
下面以儿童领域中的白雪公主童话故事为具体实施例,对本发明技术方案进行详细的解释说明。
一、首先对获取到的童话故事文本做预处理,得到标准化的文本数据。
二、根据预处理的结果,对做标准化的文本数据进行知识抽取即事实信息的抽取。
抽取内容包括故事中的人物,如白雪公主、七个小矮人、皇后、王子等;事件,如皇后问魔镜,白雪公主吃毒苹果,白雪公主被救等。
三、知识图谱构建
对知识抽取的事实信息以结构化数据对的形式进行保存,利用所述结构化数据对作为知识条目,构建知识图谱,并对得到的知识图谱进行存储。
事实信息包括人物、地点、时间等。表示形式,例如事件的三元组表示:
(白雪公主被救,施救,七个小矮人);
(白雪公主被救,被救,白雪公主);
(白雪公主被救,地点,森林木屋);
四、知识图谱应用
儿童问:谁救了白雪公主?
首先,进行专名识别,识别出人名:白雪公主,事件:被救。目标是求施救人。
再根据识别结果,查询知识存储查到(白雪公主被救,施救,七个小矮人)。
给出施救人为七个小矮人。
最后生成回复,七个小矮人救了白雪公主,完成人机交互。
对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
图5示意性示出了本发明一个实施例的知识图谱的生成装置的结构框图。参照图5,本发明实施例的知识图谱的生成装置具体包括预处理单元501、信息抽取单元502、信息表示单元503以及构建单元504,其中:预处理单元501,用于对指定领域的原始文本数据进行词法、语法和/或语义分析,得到标准化文本数据;信息抽取单元502,用于从所述标准化文本数据中抽取事实信息,所述事实信息包括以下元素:实体、属性、实体之间的关系以及实体与属性之间的关系;信息表示单元503,用于采用预设表现形式对所述事实信息进行结构化表示,得到所述事实信息的结构化数据对;构建单元504,用于利用所述结构化数据对作为知识条目,构建知识图谱。
本发明实施例提供的知识图谱的生成装置,信息抽取单元502通过从经过预处理单元501处理后的指定领域的文本数据中抽取事实信息,信息表示单元503以预设表现形式对事实信息进行表示,以供构建单元504采用以预设表现形式进行表示的结构化数据对作为知识条目,构建知识图谱,进而能够构建出具有针对性的知识图谱,满足指定领域,如儿童领域,的智能交互需求,提升不同需求用户的交互体验。
在本发明的一个可选实施例中,如图6所示,所述装置还包括获取单元500,所述获取单元500,用于从资源网站、音频资源、视频资源和/或第三方服务器中获取指定领域的原始文本数据。
具体的,所述获取单元500可通过以下至少一种方式获取指定领域的原始文本数据:
通过网页抓取方法从资源网站中获取指定领域的原始文本数据;
通过内容提取语音识别方法从语音资源中获取指定领域的原始文本数据;
通过图像识别方法从视频资源中获取指定领域的原始文本数据;
通过第三方服务器获取指定领域的原始文本数据。
在本发明的一个可选实施例中,所述预处理单元501,包括第一处理模块和第二处理模块,其中:第一处理模块,用于根据所述原始文本数据的文档结构进行段落结构划分;第二处理模块,用于对划分出的各段落结构进行词法、语法和/或语义分析,得到标准化文本数据。
其中,第一处理模块,具体用于根据文档结构分布特征确定所述原始文本数据的文档结构,根据所述文档结构对所述原始文本数据进行段落结构划分,或采用预先训练的段落分类器模型对所述原始文本数据的段落进行文档结构分类,根据分类结果对所述原始文本数据进行段落结构划分。
为了快速、准确地实现原始文本数据的段落结构划分,本发明实施例中,第一处理模块通过将原始文本数据进行结构化,区分出标题、正文、作者、时间、分类等段落,实现原始文本数据的段落结构划分。具体的。具体的,可根据文档结构分布特征,例如:文本的位置、长度、词语内容等方面特征,确定所述原始文本数据的文档结构。或人工标注少许训练语料,根据上述特征构建段落分类器模型对段落进行分类,以分类预测结果作为段落属性。
其中,第二处理模块,具体用于若所述原始文本数据为中文资源时,对划分出的各段落结构进行分词、词性标注以及短语识别,并去除段落结构中的标点符号;若所述原始文本数据为外语资源时,对划分出的各段落结构进行词干处理、词形还原以及短语识别,并去除段落结构中的标点符号。
为了快速、准确地实现原始文本数据的段落结构划分,本发明实施例,第二处理模块通过判断原始文本数据的语言,若原始文本数据为中文资源时,则对中文资源进行中文分词、词性标注、短语识别等。具体的可用开源工具对中文进行词法、语法和/或语义分析。若所述文本数据为外语资源时,按照对应语言工具对中文资源进行词法、语法和/或语义分析,例如,对英语资源进行词干处理、词形还原、短语识别等,指去除时态、词后缀并还原成原词。具体的也可以用开源工具对英语资源进行词法、语法和/或语义分析。
在本发明的一个可选实施例中,所述信息抽取单元502,包括抽取模块和识别模块,其中:抽取模块,用于对所述标准化文本数据进行知识抽取,得到所述标准化文本数据中存在的名词,以及各名词之间的关系;识别模块,用于对知识抽取得到的结果进行事实信息的识别,得到所述事实信息。
其中,抽取模块,具体用于根据各类别的名词的结构特征从所述标准化文本数据中抽取相应类别的名词以及各名词之间的关系,或采用预先训练的名词分类器模型对所述标准化文本数据中的词语进行分类,根据分类结果识别并抽取各类别的名词以及各名词之间的关系。具体的,名词之间的关系可根据在句子中的共现概率确定。
为了快速、准确地实现标准化文本数据的知识抽取,本发明实施例,信息抽取单元502通过对已有数据的观察,对名词的开始字、结束字、词长度等特点确定各类别的名词的结构特征,并根据各类别的名词的结构特征从标准化文本数据中抽取相应类别的名词以及各名词之间的关系,进而得到事实信息。
在本发明的一个可选实施例中,所述装置还包括附图中未示出的存储单元,该存储单元,用于采用关系数据库方式对构建的知识图谱进行存储,或,采用Hash表方式对构建的知识图谱进行存储,或,采用索引方式对构建的知识图谱进行存储。
在本发明的一个可选实施例中,所述装置还包括附图中未示出的交互单元,该交互单元,用于根据构建的知识图谱进行人机交互。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
综上所述,本发明实施例提供的知识图谱的生成方法及装置,通过从指定领域的文本数据中抽取事实信息,以预设表现形式对事实信息进行表示,并采用以预设表现形式进行表示的结构化数据对作为知识条目,构建知识图谱,进而能够构建出具有针对性的知识图谱,满足指定领域,如儿童领域,的智能交互需求,提升不同需求用户的交互体验。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
本领域技术人员可以理解附图只是一个优选实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域技术人员可以理解实施例中的***中的模块可以按照实施例描述进行分布于实施例的***中,也可以进行相应变化位于不同于本实施例的一个或多个***中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种知识图谱的生成方法,其特征在于,包括:
对指定领域的原始文本数据进行词法、语法和/或语义分析,得到标准化文本数据;
从所述标准化文本数据中抽取事实信息,所述事实信息包括以下元素:实体、属性、实体之间的关系以及实体与属性之间的关系;
采用预设表现形式对所述事实信息进行结构化表示,得到所述事实信息的结构化数据对;
利用所述结构化数据对作为知识条目,构建知识图谱;
所述对指定领域的原始文本数据进行词法、语法和/或语义分析,得到标准化文本数据包括:
根据文档结构分布特征确定所述原始文本数据的文档结构,根据所述文档结构对所述原始文本数据进行段落结构划分,或采用预先训练的段落分类器模型对所述原始文本数据的段落进行文档结构分类,根据分类结果对所述原始文本数据进行段落结构划分;
对划分出的各段落结构进行词法、语法和/或语义分析,得到标准化文本数据。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
从资源网站、音频资源、视频资源和/或第三方服务器中获取指定领域的原始文本数据。
3.根据权利要求1或2所述的方法,其特征在于,所述对划分出的各段落结构进行词法、语法和/或语义分析,包括:
若所述原始文本数据为中文资源时,对划分出的各段落结构进行分词、词性标注以及短语识别,并去除段落结构中的标点符号;
若所述原始文本数据为外语资源时,对划分出的各段落结构进行词干处理、词形还原以及短语识别,并去除段落结构中的标点符号。
4.根据权利要求1或2所述的方法,其特征在于,所述从所述标准化文本数据中抽取事实信息,包括:
对所述标准化文本数据进行知识抽取,得到所述标准化文本数据中存在的名词,以及各名词之间的关系;
对知识抽取得到的结果进行事实信息的识别,得到所述事实信息。
5.根据权利要求4所述的方法,其特征在于,所述对所述标准化文本数据进行知识抽取,包括:
根据各类别的名词的结构特征从所述标准化文本数据中抽取相应类别的名词以及各名词之间的关系,或
采用预先训练的名词分类器模型对所述标准化文本数据中的词语进行分类,根据分类结果识别并抽取各类别的名词以及各名词之间的关系。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
采用关系数据库方式对构建的知识图谱进行存储,或
采用Hash表方式对构建的知识图谱进行存储,或
采用索引方式对构建的知识图谱进行存储。
7.一种知识图谱的生成装置,其特征在于,包括:
预处理单元,用于对指定领域的原始文本数据进行词法、语法和/或语义分析,得到标准化文本数据;
信息抽取单元,用于从所述标准化文本数据中抽取事实信息,所述事实信息包括以下元素:实体、属性、实体之间的关系以及实体与属性之间的关系;
信息表示单元,用于采用预设表现形式对所述事实信息进行结构化表示,得到所述事实信息的结构化数据对;
构建单元,用于利用所述结构化数据对作为知识条目,构建知识图谱;
所述预处理单元,包括第一处理模块和第二处理模块,其中:
所述第一处理模块,用于根据文档结构分布特征确定所述原始文本数据的文档结构,根据所述文档结构对所述原始文本数据进行段落结构划分,或采用预先训练的段落分类器模型对所述原始文本数据的段落进行文档结构分类,根据分类结果对所述原始文本数据进行段落结构划分;
所述第二处理模块,用于对划分出的各段落结构进行词法、语法和/或语义分析,得到标准化文本数据。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
获取单元,用于从资源网站、音频资源、视频资源和/或第三方服务器中获取指定领域的原始文本数据。
9.根据权利要求7或8所述的装置,其特征在于,所述信息抽取单元,包括:
抽取模块,用于对所述标准化文本数据进行知识抽取,得到所述标准化文本数据中存在的名词,以及各名词之间的关系;
识别模块,用于对知识抽取得到的结果进行事实信息的识别,得到所述事实信息。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括:
存储单元,用于采用关系数据库方式对构建的知识图谱进行存储,或,采用Hash表方式对构建的知识图谱进行存储,或,采用索引方式对构建的知识图谱进行存储。
CN201610628591.6A 2016-08-03 2016-08-03 一种知识图谱的生成方法及装置 Active CN106156365B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610628591.6A CN106156365B (zh) 2016-08-03 2016-08-03 一种知识图谱的生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610628591.6A CN106156365B (zh) 2016-08-03 2016-08-03 一种知识图谱的生成方法及装置

Publications (2)

Publication Number Publication Date
CN106156365A CN106156365A (zh) 2016-11-23
CN106156365B true CN106156365B (zh) 2019-06-18

Family

ID=57328826

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610628591.6A Active CN106156365B (zh) 2016-08-03 2016-08-03 一种知识图谱的生成方法及装置

Country Status (1)

Country Link
CN (1) CN106156365B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11829726B2 (en) 2021-01-25 2023-11-28 International Business Machines Corporation Dual learning bridge between text and knowledge graph

Families Citing this family (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294321B (zh) * 2016-08-04 2019-05-31 北京儒博科技有限公司 一种特定领域的对话挖掘方法及装置
CN106599091B (zh) * 2016-11-24 2020-07-14 上海交通大学 基于键值存储的rdf图结构存储和索引方法
CN106776564B (zh) * 2016-12-21 2020-04-24 张永成 一种基于知识图谱的语义识别方法及***
CN106777331A (zh) * 2017-01-11 2017-05-31 北京航空航天大学 知识图谱生成方法及装置
CN106933804B (zh) * 2017-03-10 2020-03-31 上海数眼科技发展有限公司 一种基于深度学习的结构化信息抽取方法
CN106934042B (zh) * 2017-03-16 2020-05-29 中国人民解放军国防科学技术大学 一种知识图谱表示***及其实施方法
CN107016072B (zh) * 2017-03-23 2020-05-15 成都市公安科学技术研究所 基于社交网络知识图谱的知识推理***及方法
CN107122444A (zh) * 2017-04-24 2017-09-01 北京科技大学 一种法律知识图谱自动构建方法
CN107169078A (zh) 2017-05-10 2017-09-15 京东方科技集团股份有限公司 中医药知识图谱及其建立方法以及计算机***
CN107066621B (zh) * 2017-05-11 2022-11-08 腾讯科技(深圳)有限公司 一种相似视频的检索方法、装置和存储介质
CN107341215B (zh) * 2017-06-07 2020-05-12 北京航空航天大学 一种基于分布式计算平台的多源垂直知识图谱分类集成查询***
CN107301235A (zh) * 2017-06-27 2017-10-27 山东浪潮商用***有限公司 一种通信知识图谱展示***
CN107526795B (zh) * 2017-08-17 2020-05-29 晶赞广告(上海)有限公司 知识库的构建方法及装置、存储介质、计算设备
CN107633075A (zh) * 2017-09-22 2018-01-26 吉林大学 一种多源异构数据融合平台及融合方法
CN107908671B (zh) * 2017-10-25 2022-02-01 南京擎盾信息科技有限公司 基于法律数据的知识图谱构建方法及***
CN107832407B (zh) * 2017-11-03 2020-08-25 上海点融信息科技有限责任公司 用于生成知识图谱的信息处理方法、装置和可读存储介质
CN108182245A (zh) * 2017-12-28 2018-06-19 北京锐安科技有限公司 人对象属性分类知识图谱的构建方法及装置
CN108133030A (zh) * 2017-12-29 2018-06-08 北京物灵智能科技有限公司 一种绘本问答的实现方法及***
CN108170813A (zh) * 2017-12-29 2018-06-15 智搜天机(北京)信息技术有限公司 一种全媒体内容智能审核的方法及其***
CN108304493B (zh) * 2018-01-10 2020-06-12 深圳市腾讯计算机***有限公司 一种基于知识图谱的上位词挖掘方法及装置
CN108197119A (zh) * 2018-02-05 2018-06-22 成都卓观信息技术有限公司 基于知识图谱的纸质档案数字化方法
CN110209827B (zh) * 2018-02-07 2023-09-19 腾讯科技(深圳)有限公司 搜索方法、装置、计算机可读存储介质和计算机设备
CN108536724A (zh) * 2018-02-13 2018-09-14 西安理工大学 一种基于双层哈希索引的地铁设计规范中主体识别方法
CN108665141B (zh) * 2018-04-03 2022-03-22 山东科技大学 一种从突发事件预案中自动抽取应急响应流程模型的方法
JP7095377B2 (ja) * 2018-04-17 2022-07-05 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
CN108874915A (zh) * 2018-05-30 2018-11-23 苏州思必驰信息科技有限公司 知识组织方法、***、电子设备及存储介质
CN109002435A (zh) * 2018-06-06 2018-12-14 达而观信息科技(上海)有限公司 一种数据处理方法和装置
CN109582799B (zh) * 2018-06-29 2020-09-22 北京百度网讯科技有限公司 知识样本数据集的确定方法、装置及电子设备
CN110851610B (zh) * 2018-07-25 2022-09-27 百度在线网络技术(北京)有限公司 知识图谱生成方法、装置、计算机设备以及存储介质
CN109347798A (zh) * 2018-09-12 2019-02-15 东软集团股份有限公司 网络安全知识图谱的生成方法、装置、设备及存储介质
TWI682287B (zh) * 2018-10-25 2020-01-11 財團法人資訊工業策進會 知識圖譜產生裝置、方法及其電腦程式產品
CN109657065A (zh) * 2018-10-31 2019-04-19 百度在线网络技术(北京)有限公司 知识图谱处理方法、装置及电子设备
CN109189947A (zh) * 2018-11-07 2019-01-11 曲阜师范大学 一种基于关系数据库的移动数据知识图谱自动构建方法
CN109582958B (zh) * 2018-11-20 2023-07-18 厦门大学深圳研究院 一种灾难故事线构建方法及装置
CN109523988B (zh) * 2018-11-26 2021-11-05 安徽淘云科技股份有限公司 一种文本演绎方法及装置
CN111259160B (zh) * 2018-11-30 2023-08-29 百度在线网络技术(北京)有限公司 知识图谱构建方法、装置、设备及存储介质
CN109299290A (zh) * 2018-12-07 2019-02-01 广东小天才科技有限公司 一种基于知识图谱的配乐推荐方法及电子设备
CN111368145A (zh) * 2018-12-26 2020-07-03 沈阳新松机器人自动化股份有限公司 一种知识图谱的创建方法、创建***及终端设备
CN109933671A (zh) * 2019-01-31 2019-06-25 平安科技(深圳)有限公司 构建个人知识图谱的方法、装置、计算机设备和存储介质
US11403328B2 (en) 2019-03-08 2022-08-02 International Business Machines Corporation Linking and processing different knowledge graphs
CN110134842B (zh) * 2019-04-03 2021-08-31 深圳价值在线信息科技股份有限公司 基于信息图谱的信息匹配方法、装置、存储介质和服务器
CN110222198A (zh) * 2019-06-18 2019-09-10 卓尔智联(武汉)研究院有限公司 有色金属行业知识图谱构建方法、电子装置及存储介质
CN110275965B (zh) * 2019-06-27 2021-12-21 卓尔智联(武汉)研究院有限公司 假新闻检测方法、电子装置及计算机可读存储介质
US11379733B2 (en) 2019-07-10 2022-07-05 International Business Machines Corporation Detecting and predicting object events from images
CN110347845A (zh) * 2019-07-15 2019-10-18 北京明略软件***有限公司 知识图谱的绘制方法及装置
CN110750651B (zh) * 2019-10-16 2023-05-26 同方知网数字出版技术股份有限公司 一种基于科技成果的知识图谱构建方法
CN110738982B (zh) * 2019-10-22 2022-01-28 珠海格力电器股份有限公司 一种请求处理方法、装置及电子设备
CN111160841A (zh) * 2019-11-29 2020-05-15 广东轩辕网络科技股份有限公司 一种基于知识图谱的组织架构构建方法及装置
CN111339311A (zh) * 2019-12-30 2020-06-26 智慧神州(北京)科技有限公司 基于生成式网络抽取结构化事件的方法、装置与处理器
CN111259163A (zh) * 2020-01-14 2020-06-09 北京明略软件***有限公司 一种知识图谱的生成方法和装置及计算机可读存储介质
CN111460080B (zh) * 2020-03-25 2022-04-22 中国人民解放军国防科技大学 用于开源数据热度分析的事件图谱构建与查询方法及***
CN112001825B (zh) * 2020-08-18 2021-06-01 上海松鼠课堂人工智能科技有限公司 基于认知图谱的学习认知路径规划***
CN112148893A (zh) * 2020-09-25 2020-12-29 南方电网数字电网研究院有限公司 能源分析知识图谱构建方法与能源分析可视化方法
CN112487213A (zh) * 2020-12-18 2021-03-12 清华大学 跨语言领域知识图谱构建方法及装置
CN112632214A (zh) * 2020-12-24 2021-04-09 中国建设银行股份有限公司 一种创建清单数据索引的方法和装置
CN112613315B (zh) * 2020-12-29 2024-06-07 重庆农村商业银行股份有限公司 一种文本知识自动抽取方法、装置、设备及存储介质
CN112733515B (zh) * 2020-12-31 2022-11-11 贝壳技术有限公司 文本生成方法、装置、电子设备及可读存储介质
CN112765363B (zh) * 2021-01-19 2022-11-22 昆明理工大学 一种面向科技服务需求的需求图谱构建方法
CN112951446A (zh) * 2021-04-16 2021-06-11 平安科技(深圳)有限公司 基于医药图谱的药品查询方法、装置、设备及存储介质
CN113220835B (zh) * 2021-05-08 2023-09-29 北京百度网讯科技有限公司 文本信息处理方法、装置、电子设备以及存储介质
CN113609309B (zh) * 2021-08-16 2024-02-06 脸萌有限公司 知识图谱构建方法、装置、存储介质及电子设备
CN116401375B (zh) * 2023-03-23 2024-02-20 深圳宏鹏数字供应链管理有限公司 一种知识图谱构建方法及***
CN116955639A (zh) * 2023-04-24 2023-10-27 浙商期货有限公司 期货产业链知识图谱构建方法、装置及计算机设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003196296A (ja) * 2001-12-25 2003-07-11 Celestar Lexico-Sciences Inc 文献知識管理装置、文献知識管理方法、プログラム、および、記録媒体
US6598043B1 (en) * 1999-10-04 2003-07-22 Jarg Corporation Classification of information sources using graph structures
CN103699663A (zh) * 2013-12-27 2014-04-02 中国科学院自动化研究所 一种基于大规模知识库的热点事件挖掘方法
CN105550190A (zh) * 2015-06-26 2016-05-04 许昌学院 面向知识图谱的跨媒体检索***
CN105574098A (zh) * 2015-12-11 2016-05-11 百度在线网络技术(北京)有限公司 知识图谱的生成方法及装置、实体对比方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6598043B1 (en) * 1999-10-04 2003-07-22 Jarg Corporation Classification of information sources using graph structures
JP2003196296A (ja) * 2001-12-25 2003-07-11 Celestar Lexico-Sciences Inc 文献知識管理装置、文献知識管理方法、プログラム、および、記録媒体
CN103699663A (zh) * 2013-12-27 2014-04-02 中国科学院自动化研究所 一种基于大规模知识库的热点事件挖掘方法
CN105550190A (zh) * 2015-06-26 2016-05-04 许昌学院 面向知识图谱的跨媒体检索***
CN105574098A (zh) * 2015-12-11 2016-05-11 百度在线网络技术(北京)有限公司 知识图谱的生成方法及装置、实体对比方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"基于Web的实体信息提取和搜索研究";周安林;《中国优秀硕士学位论文全文数据库 信息科技辑》;20160315;正文第2.32节
"知识图谱构建技术综述";刘峤 等;《计算机研究与发展》;20160331;全文

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11829726B2 (en) 2021-01-25 2023-11-28 International Business Machines Corporation Dual learning bridge between text and knowledge graph

Also Published As

Publication number Publication date
CN106156365A (zh) 2016-11-23

Similar Documents

Publication Publication Date Title
CN106156365B (zh) 一种知识图谱的生成方法及装置
US10565244B2 (en) System and method for text categorization and sentiment analysis
CN109657054B (zh) 摘要生成方法、装置、服务器及存储介质
US11514235B2 (en) Information extraction from open-ended schema-less tables
US10423649B2 (en) Natural question generation from query data using natural language processing system
CN104503998B (zh) 针对用户查询句的类型识别方法及装置
CN106960030B (zh) 基于人工智能的推送信息方法及装置
CN109697239B (zh) 用于生成图文信息的方法
CN103593412B (zh) 一种基于树形结构问题的应答方法及***
CN111046656A (zh) 文本处理方法、装置、电子设备及可读存储介质
CN110287314B (zh) 基于无监督聚类的长文本可信度评估方法及***
CN109992781B (zh) 文本特征的处理方法、装置和存储介质
CN111506794A (zh) 一种基于机器学习的谣言管理方法和装置
CN111782793A (zh) 智能客服处理方法和***及设备
CN112069312A (zh) 一种基于实体识别的文本分类方法及电子装置
CN111368066B (zh) 获取对话摘要的方法、装置和计算机可读存储介质
CN113488194B (zh) 一种基于分布式***的药品识别方法与装置
CN109660621A (zh) 一种内容推送方法及服务设备
CN109672586A (zh) 一种dpi业务流量识别方法、装置与计算机可读存储介质
CN111783425A (zh) 基于句法分析模型的意图识别方法及相关装置
CN111199151A (zh) 数据处理方法、及数据处理装置
CN114528851B (zh) 回复语句确定方法、装置、电子设备和存储介质
CN116010545A (zh) 一种数据处理方法、装置及设备
CN116955707A (zh) 内容标签的确定方法、装置、设备、介质及程序产品
US20210295036A1 (en) Systematic language to enable natural language processing on technical diagrams

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room 508-598, Xitian Gezhuang Town Government Office Building, No. 8 Xitong Road, Miyun County Economic Development Zone, Beijing 101500

Applicant after: Beijing Rubo Technology Co., Ltd.

Address before: Room 508-598, Xitian Gezhuang Town Government Office Building, No. 8 Xitong Road, Miyun County Economic Development Zone, Beijing 101500

Applicant before: BEIJING INTELLIGENT HOUSEKEEPER TECHNOLOGY CO., LTD.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20210819

Address after: 301-112, floor 3, building 2, No. 18, YANGFANGDIAN Road, Haidian District, Beijing 100038

Patentee after: Beijing Rubu Technology Co.,Ltd.

Address before: Room 508-598, Xitian Gezhuang Town Government Office Building, No. 8 Xitong Road, Miyun County Economic Development Zone, Beijing 101500

Patentee before: BEIJING ROOBO TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right