CN109656385A - 基于知识图谱的输入预测方法、装置和电子设备 - Google Patents
基于知识图谱的输入预测方法、装置和电子设备 Download PDFInfo
- Publication number
- CN109656385A CN109656385A CN201811621360.8A CN201811621360A CN109656385A CN 109656385 A CN109656385 A CN 109656385A CN 201811621360 A CN201811621360 A CN 201811621360A CN 109656385 A CN109656385 A CN 109656385A
- Authority
- CN
- China
- Prior art keywords
- keyword
- relation chain
- preset
- knowledge
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
- G06F3/0237—Character input methods using prediction or retrieval techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Document Processing Apparatus (AREA)
Abstract
本申请提出一种基于知识图谱的输入预测方法、装置和电子设备,其中,方法包括:获取输入框中输入光标前的文本,并获取当前拼音字符串;对文本进行切词,获取文本中的多个分词,以及对当前拼音字符串进行汉字编码;检测多个分词中是否包括第一关键词,以及检测在汉字编码后是否包括关系链,若获知包括第一关键词和关系链,则查询预设的知识图谱数据库获取与第一关键词和关系链对应的第二关键词;将关系链对应的汉字编码和第二关键词展示在云预测栏。由此,针对用户的输入文本,进行语义分析和理解,以及通过知识图谱数据库进行词语的联想,能够快速的给出合理的输入推荐,提高了用户的沟通效率。
Description
技术领域
本申请涉及智能输入技术领域,尤其涉及一种基于知识图谱的输入预测方法、装置和电子设备。
背景技术
目前,输入法的主要功能,是给用户提供键盘,以便用户通过打字完成输入的需求。然而,输入的需求,便是沟通的需求,如果输入法能预判用户在当前场景下,想要输入什么,以及如何才能快速的完成输入并发送,才是解决了用户最根本的输入需求。
相关技术中,输入法的预测都是基于数据统计的,在语料上统计出高频的词条搭配组合,即二元或者三元等数据结果,比如左元命中,则给出高频的右元作为预测词条供用户选择。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请提出一种基于知识图谱的输入预测方法,针对用户的输入文本,进行语义分析和理解,以及通过知识图谱数据库进行词语的联想,能够快速的给出合理的输入推荐,极大地提高了用户的沟通效率。
本申请提出一种基于知识图谱的输入预测装置。
本申请提出一种电子设备。
本申请提出一种计算机可读存储介质。
本申请第一方面实施例提出了一种基于知识图谱的输入预测方法,包括:
获取输入框中输入光标前的文本,并获取当前拼音字符串;
对所述文本进行切词,获取所述文本中的多个分词,以及对所述当前拼音字符串进行汉字编码;
检测所述多个分词中是否包括第一关键词,以及检测在所述汉字编码后是否包括关系链,
若获知包括所述第一关键词和所述关系链,则查询预设的知识图谱数据库获取与所述第一关键词和所述关系链对应的第二关键词;
将所述关系链对应的汉字编码和所述第二关键词展示在云预测栏。
可选地,作为本申请第一方面的第一种可能的实现方式,在所述查询预设的知识图谱数据库获取与所述第一关键词和所述关系链对应的第二关键词之前,还包括:
获取多个知识词条;
对所述多个知识词条进行识别,获取每个知识词条中的关键词和关系链;
将多个关键词和多个关系链按照预设的方式进行存储生成预设的知识图谱数据库。
可选地,作为本申请第一方面的第二种可能的实现方式,所述检测所述多个分词中是否包括第一关键词,包括:
通过预设实体识别算法对所述多个分词进行识别,获取对应的多个实体;
若所述多个实体在预设的关系链词库中匹配到第一关键词,则确定所述多个分词中包括第一关键词。
可选地,作为本申请第一方面的第三种可能的实现方式,所述关系链包括:第一关系链和第二关系链;
所述查询预设的知识图谱数据库获取与所述第一关键词和所述关系链对应的第二关键词,包括:
根据所述第一关键词和所述第一关系链在预设的知识图谱数据库中获取对应的第三关键词;
根据所述第三关键词和所述第二关系链在预设的知识图谱数据库中获取对应的第二关键词。
可选地,作为本申请第一方面的第四种可能的实现方式,在所述查询预设的知识图谱数据库获取与所述第一关键词和所述关系链对应的第二关键词之后,还包括:
根据所述第一关键词和所述第二关键词在预设的热点词库库中匹配到第四关键词;
将所述第四关键词展示在预测栏的第二预设位置。
本申请第二方面实施例提出了一种基于知识图谱的输入预测装置,该装置包括:
获取模块,用于获取输入框中输入光标前的文本,并获取当前拼音字符串;
获取编码模块,用于对所述文本进行切词,获取所述文本中的多个分词,以及对所述当前拼音字符串进行汉字编码;
检测模块,用于检测所述多个分词中是否包括第一关键词,以及检测在所述汉字编码后是否包括关系链;
查询获取模块,用于若获知包括所述第一关键词和所述关系链,则查询预设的知识图谱数据库获取与所述第一关键词和所述关系链对应的第二关键词;
展示模块,用于将所述关系链对应的汉字编码和所述第二关键词展示在云预测栏。
可选地,作为本申请第二方面的第一种可能的实现方式,所述装置,还包括:
第一获取模块,用于获取多个知识词条;
第二获取模块,用于对所述多个知识词条进行识别,获取每个知识词条中的关键词和关系链;
生成模块,用于将多个关键词和多个关系链按照预设的方式进行存储生成预设的知识图谱数据库。
可选地,作为本申请第二方面的第二种可能的实现方式,所述检测模块,具体用于:
通过预设实体识别算法对所述多个分词进行识别,获取对应的多个实体;
若所述多个实体在预设的关系链词库中匹配到第一关键词,则确定所述多个分词中包括第一关键词。
可选地,作为本申请第二方面的第三种可能的实现方式,所述关系链包括:第一关系链和第二关系链;
所述查询获取模块,具体用于:
根据所述第一关键词和所述第一关系链在预设的知识图谱数据库中获取对应的第三关键词;
根据所述第三关键词和所述第二关系链在预设的知识图谱数据库中获取对应的第二关键词。
可选地,作为本申请第二方面的第四种可能的实现方式,所述装置还包括:
匹配模块,用于根据所述第一关键词和所述第二关键词在预设的热点词库库中匹配到第四关键词;
所述展示模块,还用于将所述第四关键词展示在预测栏的第二预设位置。
本申请第三方面实施例提出了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现第一方面所述的基于知识图谱的输入预测方法。
本申请第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现第一方面所述的基于知识图谱的输入预测方法。
本申请实施例所提供的技术方案,可以包含如下的有益效果:
获取输入框中输入光标前的文本,并获取当前拼音字符串,对文本进行切词,获取文本中的多个分词,并获取当前拼音字符串,以及对当前拼音字符串进行汉字编码,检测多个分词中是否包括第一关键词,以及检测在汉字编码后是否包括关系链,若获知包括第一关键词和关系链,则查询预设的知识图谱数据库获取与第一关键词和关系链对应的第二关键词,最后将关系链对应的汉字编码和第二关键词展示在云预测栏。由此,针对用户的输入文本,进行语义分析和理解,以及通过知识图谱数据库进行词语的联想,能够快速的给出合理的输入推荐,极大地提高了用户的沟通效率。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例所提供的一种基于知识图谱的输入预测方法的流程示意图;
图2为本申请实施例所提供的一种预设的诗词语料库生成的流程示意图;
图3为本申请实施例所提供的基于知识图谱的输入预测的示意图;
图4为本申请实施例提供的一种基于知识图谱的输入预测装置的结构示意图;
图5为本申请实施例所提供的另一种基于知识图谱的输入预测装置的结构示意图;
图6为本申请实施例所提供的又一种基于知识图谱的输入预测装置的结构示意图;以及
图7为本申请电子设备一个实施例的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的基于知识图谱的输入预测方法、装置和电子设备。
图1为本申请实施例所提供的一种基于知识图谱的输入预测方法的流程示意图。
如图1所示,该方法包括以下步骤:
步骤101,获取输入框中输入光标前的文本,并获取当前拼音字符串。
步骤102,对文本进行切词,获取文本中的多个分词,以及对当前拼音字符串进行汉字编码。
在实际应用中,用户可以根据需要在即时通讯应用程序的对话输入框、或者是搜索应用程序的搜索输入框等位置输入文本。
可选地,获取用户在输入框中输入光标前的文本,可以理解的是,该文本可以是一个单词、或者是一句话、还是一段话等等。
从而,通过切词模型或者切词算法对文本进行切词处理,得到文本对应的多个分词,比如文本为“小明的”,对文本进行切词后得到“小明”、“的”。
可选地,获取用户在输入的拼音字符串,可以理解的是,该拼音字符串可以是一个单词的拼音字符串、或者是一句话的拼音字符串、还是一段话的拼音字符串等等。
可选地,对当前输入界面中的当前拼音字符串进行汉字编码可以得到当前拼音字符串对应的汉字即文本信息。
步骤103,检测多个分词中是否包括第一关键词,以及检测在汉字编码后是否包括关系链,若获知包括第一关键词和关系链,则查询预设的知识图谱数据库获取与第一关键词和关系链对应的第二关键词。
步骤104,将关系链对应的汉字编码和第二关键词展示在云预测栏。
可选地,在获取多个分词后,可以检测多个分词中是否包括第一关键词,举例说明如下:
第一种示例,通过查询预设的知识图谱数据库中是否包括第一关键词。
第二种示例,通过预设实体识别算法对多个分词进行识别,获取对应的多个实体,若多个实体在预设的关系链词库中匹配到第一关键词,则确定多个分词中包括第一关键词。比如文本为“小明的”,对文本进行切词后得到“小明”、“的”,通过预设实体识别算法对多个分词进行识别得到实体“小明”,接着在预设的关系链词库中匹配到第一关键词“小明”。
也就是说,可以通过预设的知识图谱数据库直接查询,还可以通过设置关系链词库进行查询。
同理,对当前输入界面中的当前拼音字符串进行汉字编码可以得到当前拼音字符串对应的汉字后,可以通过预设的知识图谱数据库直接查询预设的知识图谱数据库中是否包括关系链、或者是对当前拼音字符串对应的汉字进行识别,获取对应的多个实体,在多个实体在预设的关系链词库中匹配到关系链。
在本申请实施例中,知识图谱则是基于知识本身,将互联网所有的知识积累起来,真正的理解真实世界,将“信息”搜集上升成为了“知识”积累,用知识理解世界。
可选地,在查询预设的知识图谱数据库获取与第一关键词和关系链对应的第二关键词之前,需要生成预设的知识图谱数据库,具体如图2所示:
步骤201,获取多个知识词条。
步骤202,对多个知识词条进行识别,获取每个知识词条中的关键词和关系链。
步骤203,将多个关键词和多个关系链按照预设的方式进行存储生成预设的知识图谱数据库。
具体地,将互联网所有的知识词条进行收集并识别每个知识词条中的关键词和关系链,将多个关键词和多个关系链按照预设的方式进行存储生成预设的知识图谱数据库,比如“小明的老婆小红”进行识别得到关键词“小明”和“小红”,以及关系链“老婆”,从而将“小明”、“老婆”和“小红”以映射表等方式进行存储生成预设的知识图谱数据库。
因此,可以查询预设的知识图谱数据库获取与第一关键词和关系链对应的第二关键词,并将关系链对应的汉字编码和第二关键词展示在云预测栏。
举例而言,如图3所示,获取输入框中输入光标前的文本为“小明的”,获取文本中的多个分词为“小明”、“的”,以及获取当前拼音字符串“laopo”,并对“laopo”进行汉字编码得到对应的汉字“老婆”,检测“小明”、“的”中包括第一关键词“小明”和检测汉字“老婆”包括关系链“老婆”,查询预设的知识图谱数据库获取与“小明”和“老婆”对应的第二关键词“小红”,将“老婆”“小红”展示在云预测栏。
本实施例的基于知识图谱的输入预测方法中,通过获取输入框中输入光标前的文本,并获取当前拼音字符串,对文本进行切词,获取文本中的多个分词,以及获取当前拼音字符串,并对当前拼音字符串进行汉字编码,检测多个分词中是否包括第一关键词,以及检测在汉字编码后是否包括关系链,若获知包括第一关键词和关系链,则查询预设的知识图谱数据库获取与第一关键词和关系链对应的第二关键词,最后将关系链对应的汉字编码和第二关键词展示在云预测栏。由此,针对用户的输入文本,进行语义分析和理解,以及通过知识图谱数据库进行词语的联想,能够快速的给出合理的输入推荐,极大地提高了用户的沟通效率。
基于上述实施例,还可以理解的是,多个分词中关系链为多个的情况,作为一种可能实现方式,关系链包括:第一关系链和第二关系链,根据第一关键词和第一关系链在预设的知识图谱数据库中获取对应的第三关键词,根据第三关键词和第二关系链在预设的知识图谱数据库中获取对应的第二关键词。
举例而言,获取输入框中输入光标前的文本为“小明的老婆的妈妈”,获取文本中的多个分词为“小明”、“的”,以及获取当前拼音字符串“laopodemama”,并对“laopodemama”进行汉字编码得到对应的汉字“老婆的妈妈”,检测“小明”、“的”中包括第一关键词“小明”和汉字“老婆的妈妈”包括关系链“老婆”和“妈妈”,查询预设的知识图谱数据库获取与“小明”和“老婆”对应的第三关键词“小红”,接着获取“小红”和“妈妈”对应的第二关键词“小丽”,将“老婆的妈妈小丽”展示在云预测栏。进一步进行语义分析和理解,并快速的给出合理的输入推荐,提升了输入推荐的灵活性,极大地提高了用户的沟通效率。
基于上述实施例,还可以理解的是,在查询预设的知识图谱数据库获取与第一关键词和关系链对应的第二关键词之后,可以根据第一关键词和第二关键词在预设的热点词库库中匹配到第四关键词,将第四关键词展示在预测栏的第二预设位置。上述中的热点词库为预先获取网络中点击量或搜索量大于预设阈值的词语,并根据点击量或搜索量进行热点词排序。将根据第一关键词和第二关键词匹配到的热点词中排序第一的热点词定为第四关键词,或将排序靠前的N个热点词定为第四关键词。
举例而言,获取输入框中输入光标前的文本为“小明的”,获取文本中的多个分词为“小明”和“的”,以及获取当前拼音字符串“laopo”,并对“laopo”进行汉字编码得到对应的汉字“老婆”,检测“小明”、“的”中包括第一关键词“小明”和检测汉字“老婆”包括关系链“老婆”,查询预设的知识图谱数据库获取与“小明”和“老婆”对应的第二关键词“小红”,将“小明”和“小红”在预设的热点词库库中匹配到第四关键词“小花”,将“小花”展示在预测栏的第二预设位置,比如在预测栏的第二选位置,进一步满足用户输入需求。
为了实现上述实施例,本申请还提出一种基于知识图谱的输入预测装置。
图4为本申请实施例提供的一种基于知识图谱的输入预测装置的结构示意图。
如图4所示,该装置包括:获取模块41、获取编码模块42、检测模块43、查询获取模块44和展示模块45。
其中,获取模块41,用于获取输入框中输入光标前的文本,并获取当前拼音字符串。
获取编码模块42,用于对文本进行切词,获取文本中的多个分词,以及对当前拼音字符串进行汉字编码。
检测模块43,用于检测多个分词中是否包括第一关键词,以及检测在汉字编码后是否包括关系链。
查询获取模块44,用于若获知包括第一关键词和关系链,则查询预设的知识图谱数据库获取与第一关键词和关系链对应的第二关键词。
展示模块45,用于将关系链对应的汉字编码和第二关键词展示在云预测栏。
基于上述实施例,本申请实施例还提供了一种基于知识图谱的输入预测装置的可能的实现方式,图5为本申请实施例所提供的另一种基于知识图谱的输入预测装置的结构示意图,在图4的基础上,所述装置还包括:第一获取模块46、第二获取模块47和生成模块48。
其中,第一获取模块46,用于获取多个知识词条。
第二获取模块47,用于对多个知识词条进行识别,获取每个知识词条中的关键词和关系链。
生成模块48,用于将多个关键词和多个关系链按照预设的方式进行存储生成预设的知识图谱数据库。
基于上述实施例,本申请实施例还提供了一种基于知识图谱的输入预测装置的可能的实现方式,检测模块43,具体用于:通过预设实体识别算法对多个分词进行识别,获取对应的多个实体;若多个实体在预设的关系链词库中匹配到第一关键词,则确定多个分词中包括第一关键词。
基于上述实施例,本申请实施例还提供了一种基于知识图谱的输入预测装置的可能的实现方式,关系链包括:第一关系链和第二关系链;查询获取模块44,具体用于:根据第一关键词和第一关系链在预设的知识图谱数据库中获取对应的第三关键词;根据第三关键词和第二关系链在预设的知识图谱数据库中获取对应的第二关键词。
本申请实施例还提供了一种基于知识图谱的输入预测装置的可能的实现方式,图6为本申请实施例所提供的又一种基于知识图谱的输入预测装置的结构示意图,在图4的基础上,所述装置还包括:匹配模块49。
匹配模块49,用于根据第一关键词和第二关键词在预设的热点词库库中匹配到第四关键词。
展示模块45,还用于将第四关键词展示在预测栏的第二预设位置。
需要说明的是,前述对方法实施例的解释说明也适用于该实施例的装置,此处不再赘述。
本实施例的基于知识图谱的输入预测装置中,通过获取输入框中输入光标前的文本,并获取当前拼音字符串;对文本进行切词,获取文本中的多个分词,并获取当前拼音字符串,以及对当前拼音字符串进行汉字编码,检测多个分词中是否包括第一关键词,以及检测在汉字编码后是否包括关系链,若获知包括第一关键词和关系链,则查询预设的知识图谱数据库获取与第一关键词和关系链对应的第二关键词,最后将关系链对应的汉字编码和第二关键词展示在云预测栏。由此,针对用户的输入文本,进行语义分析和理解,以及通过知识图谱数据库进行词语的联想,能够快速的给出合理的输入推荐,极大地提高了用户的沟通效率。
为了实现上述实施例,本申请还提出一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行该程序时,实现如前述方法实施例所述的基于知识图谱的输入预测方法。
本申请实施例还提供一种电子设备,电子设备包含前述任一实施例所述的装置。
图7为本申请电子设备一个实施例的结构示意图,可以实现本申请图1-2所示方法实施例的流程,如图7所示,上述电子设备可以包括:壳体91、处理器92、存储器93、电路板94和电源电路95,其中,电路板94安置在壳体91围成的空间内部,处理器92和存储器93设置在电路板94上;电源电路95,用于为上述电子设备的各个电路或器件供电;存储器93用于存储可执行程序代码;处理器92通过读取存储器93中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行前述任一实施例所述的视频生成方法。
处理器92对上述步骤的具体执行过程以及处理器92通过运行可执行程序代码来进一步执行的步骤,可以参见本申请图1-2所示方法实施例的描述,在此不再赘述。
该电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、***总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子设备。
为了实现上述实施例,本申请还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现如前述方法实施例所述的基于知识图谱的输入预测方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种基于知识图谱的输入预测方法,其特征在于,包括以下步骤:
获取输入框中输入光标前的文本,并获取当前拼音字符串;
对所述文本进行切词,获取所述文本中的多个分词,以及对所述当前拼音字符串进行汉字编码;
检测所述多个分词中是否包括第一关键词,以及检测在所述汉字编码后是否包括关系链;
若获知包括所述第一关键词和所述关系链,则查询预设的知识图谱数据库获取与所述第一关键词和所述关系链对应的第二关键词;
将所述关系链对应的汉字编码和所述第二关键词展示在云预测栏。
2.如权利要求1所述的方法,其特征在于,在所述查询预设的知识图谱数据库获取与所述第一关键词和所述关系链对应的第二关键词之前,还包括:
获取多个知识词条;
对所述多个知识词条进行识别,获取每个知识词条中的关键词和关系链;
将多个关键词和多个关系链按照预设的方式进行存储形成预设的知识图谱数据库。
3.如权利要求1所述的方法,其特征在于,所述检测所述多个分词中是否包括第一关键词,包括:
通过预设实体识别算法对所述多个分词进行识别,获取对应的多个实体;
若所述多个实体在预设的关系链词库中匹配到第一关键词,则确定所述多个分词中包括第一关键词。
4.如权利要求1所述的方法,其特征在于,所述关系链包括:第一关系链和第二关系链;
所述查询预设的知识图谱数据库获取与所述第一关键词和所述关系链对应的第二关键词,包括:
根据所述第一关键词和所述第一关系链在预设的知识图谱数据库中获取对应的第三关键词;
根据所述第三关键词和所述第二关系链在预设的知识图谱数据库中获取对应的第二关键词。
5.如权利要求1所述的方法,其特征在于,在所述查询预设的知识图谱数据库获取与所述第一关键词和所述关系链对应的第二关键词之后,还包括:
根据所述第一关键词和所述第二关键词在预设的热点词库库中匹配到第四关键词;
将所述第四关键词展示在预测栏的第二预设位置。
6.一种基于知识图谱的输入预测装置,其特征在于,所述装置包括:
获取模块,用于获取输入框中输入光标前的文本,并获取当前拼音字符串;
获取编码模块,用于对所述文本进行切词,获取所述文本中的多个分词,以及对所述当前拼音字符串进行汉字编码;
检测模块,用于检测所述多个分词中是否包括第一关键词,以及检测在所述汉字编码后是否包括关系链;
查询获取模块,用于若获知包括所述第一关键词和所述关系链,则查询预设的知识图谱数据库获取与所述第一关键词和所述关系链对应的第二关键词;
展示模块,用于将所述关系链对应的汉字编码和所述第二关键词展示在云预测栏。
7.如权利要求6所述的装置,其特征在于,还包括:
第一获取模块,用于获取多个知识词条;
第二获取模块,用于对所述多个知识词条进行识别,获取每个知识词条中的关键词和关系链;
生成模块,用于将多个关键词和多个关系链按照预设的方式进行存储生成预设的知识图谱数据库。
8.如权利要求6所述的装置,其特征在于,所述检测模块,具体用于:
通过预设实体识别算法对所述多个分词进行识别,获取对应的多个实体;
若所述多个实体在预设的关系链词库中匹配到第一关键词,则确定所述多个分词中包括第一关键词。
9.如权利要求6所述的装置,其特征在于,所述关系链包括:第一关系链和第二关系链;
所述查询获取模块,具体用于:
根据所述第一关键词和所述第一关系链在预设的知识图谱数据库中获取对应的第三关键词;
根据所述第三关键词和所述第二关系链在预设的知识图谱数据库中获取对应的第二关键词。
10.如权利要求6所述的装置,其特征在于,还包括:
匹配模块,用于根据所述第一关键词和所述第二关键词在预设的热点词库库中匹配到第四关键词;
所述展示模块,还用于将所述第四关键词展示在预测栏的第二预设位置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811621360.8A CN109656385B (zh) | 2018-12-28 | 2018-12-28 | 基于知识图谱的输入预测方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811621360.8A CN109656385B (zh) | 2018-12-28 | 2018-12-28 | 基于知识图谱的输入预测方法、装置和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109656385A true CN109656385A (zh) | 2019-04-19 |
CN109656385B CN109656385B (zh) | 2022-12-09 |
Family
ID=66117831
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811621360.8A Active CN109656385B (zh) | 2018-12-28 | 2018-12-28 | 基于知识图谱的输入预测方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109656385B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110096599A (zh) * | 2019-04-30 | 2019-08-06 | 长沙知了信息科技有限公司 | 知识图谱的生成方法及装置 |
CN110941694A (zh) * | 2019-10-14 | 2020-03-31 | 珠海格力电器股份有限公司 | 知识图谱的搜索定位方法、***、电子设备和存储介质 |
CN111353047A (zh) * | 2019-12-30 | 2020-06-30 | 常熟鑫沐奇宝软件开发有限公司 | 一种基于汉字造字方法生成人工智能知识图谱的方法 |
CN112507129B (zh) * | 2020-12-07 | 2023-09-08 | 云南电网有限责任公司普洱供电局 | 配电网作业文件的内容变动处理方法及相关设备 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01260538A (ja) * | 1988-04-11 | 1989-10-17 | Nippon Telegr & Teleph Corp <Ntt> | 知識ベースシステムにおける経験知識の作成装置 |
WO2005091120A1 (fr) * | 2004-03-19 | 2005-09-29 | Dong Li | Procede d'introduction d'ecriture manuscrite et dispositif de terminal portable |
CN104142938A (zh) * | 2013-05-07 | 2014-11-12 | 腾讯科技(深圳)有限公司 | 一种微博的数据处理方法、装置及*** |
CN106293114A (zh) * | 2015-06-02 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 预测用户待输入词的方法及装置 |
CN106527757A (zh) * | 2016-10-28 | 2017-03-22 | 上海智臻智能网络科技股份有限公司 | 一种输入纠错方法及装置 |
CN106873801A (zh) * | 2017-02-28 | 2017-06-20 | 百度在线网络技术(北京)有限公司 | 用于生成输入法词库中的词条组合的方法和装置 |
CN106896935A (zh) * | 2017-02-22 | 2017-06-27 | 李晓明 | 输入法 |
CN107169010A (zh) * | 2017-03-31 | 2017-09-15 | 北京奇艺世纪科技有限公司 | 一种推荐搜索关键词的确定方法及装置 |
CN107358315A (zh) * | 2017-06-26 | 2017-11-17 | 深圳市金立通信设备有限公司 | 一种信息预测方法及终端 |
CN107704634A (zh) * | 2017-11-04 | 2018-02-16 | 辽宁工程技术大学 | 一种形成知识和构建知识链的方法 |
CN107765883A (zh) * | 2016-08-22 | 2018-03-06 | 富士通株式会社 | 输入法的候选词语的排序方法和排序设备 |
CN107908671A (zh) * | 2017-10-25 | 2018-04-13 | 南京擎盾信息科技有限公司 | 基于法律数据的知识图谱构建方法及*** |
CN108121455A (zh) * | 2016-11-29 | 2018-06-05 | 渡鸦科技(北京)有限责任公司 | 识别纠正方法及装置 |
CN109086408A (zh) * | 2018-08-02 | 2018-12-25 | 腾讯科技(深圳)有限公司 | 文本生成方法、装置、电子设备及计算机可读介质 |
-
2018
- 2018-12-28 CN CN201811621360.8A patent/CN109656385B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01260538A (ja) * | 1988-04-11 | 1989-10-17 | Nippon Telegr & Teleph Corp <Ntt> | 知識ベースシステムにおける経験知識の作成装置 |
WO2005091120A1 (fr) * | 2004-03-19 | 2005-09-29 | Dong Li | Procede d'introduction d'ecriture manuscrite et dispositif de terminal portable |
CN104142938A (zh) * | 2013-05-07 | 2014-11-12 | 腾讯科技(深圳)有限公司 | 一种微博的数据处理方法、装置及*** |
CN106293114A (zh) * | 2015-06-02 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 预测用户待输入词的方法及装置 |
CN107765883A (zh) * | 2016-08-22 | 2018-03-06 | 富士通株式会社 | 输入法的候选词语的排序方法和排序设备 |
CN106527757A (zh) * | 2016-10-28 | 2017-03-22 | 上海智臻智能网络科技股份有限公司 | 一种输入纠错方法及装置 |
CN108121455A (zh) * | 2016-11-29 | 2018-06-05 | 渡鸦科技(北京)有限责任公司 | 识别纠正方法及装置 |
CN106896935A (zh) * | 2017-02-22 | 2017-06-27 | 李晓明 | 输入法 |
CN106873801A (zh) * | 2017-02-28 | 2017-06-20 | 百度在线网络技术(北京)有限公司 | 用于生成输入法词库中的词条组合的方法和装置 |
CN107169010A (zh) * | 2017-03-31 | 2017-09-15 | 北京奇艺世纪科技有限公司 | 一种推荐搜索关键词的确定方法及装置 |
CN107358315A (zh) * | 2017-06-26 | 2017-11-17 | 深圳市金立通信设备有限公司 | 一种信息预测方法及终端 |
CN107908671A (zh) * | 2017-10-25 | 2018-04-13 | 南京擎盾信息科技有限公司 | 基于法律数据的知识图谱构建方法及*** |
CN107704634A (zh) * | 2017-11-04 | 2018-02-16 | 辽宁工程技术大学 | 一种形成知识和构建知识链的方法 |
CN109086408A (zh) * | 2018-08-02 | 2018-12-25 | 腾讯科技(深圳)有限公司 | 文本生成方法、装置、电子设备及计算机可读介质 |
Non-Patent Citations (1)
Title |
---|
梁文娟: "汉字语法语义智能输入法搭配库设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110096599A (zh) * | 2019-04-30 | 2019-08-06 | 长沙知了信息科技有限公司 | 知识图谱的生成方法及装置 |
CN110096599B (zh) * | 2019-04-30 | 2023-03-21 | 长沙知了信息科技有限公司 | 知识图谱的生成方法及装置 |
CN110941694A (zh) * | 2019-10-14 | 2020-03-31 | 珠海格力电器股份有限公司 | 知识图谱的搜索定位方法、***、电子设备和存储介质 |
CN111353047A (zh) * | 2019-12-30 | 2020-06-30 | 常熟鑫沐奇宝软件开发有限公司 | 一种基于汉字造字方法生成人工智能知识图谱的方法 |
CN112507129B (zh) * | 2020-12-07 | 2023-09-08 | 云南电网有限责任公司普洱供电局 | 配电网作业文件的内容变动处理方法及相关设备 |
Also Published As
Publication number | Publication date |
---|---|
CN109656385B (zh) | 2022-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109508391A (zh) | 基于知识图谱的输入预测方法、装置和电子设备 | |
CN109656385A (zh) | 基于知识图谱的输入预测方法、装置和电子设备 | |
CN109657213B (zh) | 文本相似度检测方法、装置和电子设备 | |
CN110727862B (zh) | 一种商品搜索的查询策略的生成方法及装置 | |
CN111078865B (zh) | 文本标题生成方法和装置 | |
CN110188362A (zh) | 文本处理方法及装置 | |
CN111522994A (zh) | 用于生成信息的方法和装置 | |
CN110222194B (zh) | 基于自然语言处理的数据图表生成方法和相关装置 | |
CN107507028A (zh) | 用户偏好确定方法、装置、设备及存储介质 | |
CN112528001B (zh) | 一种信息查询方法、装置及电子设备 | |
CN108256044A (zh) | 直播间推荐方法、装置及电子设备 | |
CN105630763A (zh) | 用于提及检测中的消歧的方法和*** | |
CN112988784B (zh) | 数据查询方法、查询语句生成方法及其装置 | |
CN115062134B (zh) | 知识问答模型训练及知识问答方法、装置和计算机设备 | |
CN110874532A (zh) | 提取反馈信息的关键词的方法和装置 | |
CN110069769A (zh) | 应用标签生成方法、装置及存储设备 | |
CN115098556A (zh) | 用户需求匹配方法、装置、电子设备及存储介质 | |
CN109508390A (zh) | 基于知识图谱的输入预测方法、装置和电子设备 | |
CN102999556B (zh) | 文字搜索方法、装置以及终端设备 | |
CN112925912A (zh) | 文本处理方法、同义文本召回方法及装置 | |
CN110851629A (zh) | 一种图像检索的方法 | |
CN112989011B (zh) | 数据查询方法、数据查询装置和电子设备 | |
CN112528646B (zh) | 词向量生成方法、终端设备及计算机可读存储介质 | |
WO2022246162A1 (en) | Content generation using target content derived modeling and unsupervised language modeling | |
CN115203206A (zh) | 数据内容搜索方法、装置、计算机设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |