CN113032677A - 一种基于人工智能的查询信息处理方法和装置 - Google Patents
一种基于人工智能的查询信息处理方法和装置 Download PDFInfo
- Publication number
- CN113032677A CN113032677A CN202110354254.3A CN202110354254A CN113032677A CN 113032677 A CN113032677 A CN 113032677A CN 202110354254 A CN202110354254 A CN 202110354254A CN 113032677 A CN113032677 A CN 113032677A
- Authority
- CN
- China
- Prior art keywords
- query
- user
- artificial intelligence
- information processing
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Fuzzy Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于人工智能的查询信息处理方法和装置,属于人工智能信息处理技术领域,包括以下步骤:S1、获取用户输入的查询语句;S2、将用户的查询语句请求分解成若干关键词进行匹配;S3、进行关键词或关键词的同义词的查询匹配;S4、根据关键词或关键词的同义词的查询匹配结果,确定至少一个与所述查询语句相匹配的在预设知识库中存在的近似查询语句。该基于人工智能的查询信息处理方法和装置,通过利用人工智能技术,它将信息查询从目前基于关键词层面提高到基于知识层面,对知识有一定的理解与处理能力,明确和缩小了查询范围,减少了对无用信息的查询,同时由于有知识库为背景,使得信息查询更具有智能性。
Description
技术领域
本发明属于人工智能信息处理技术领域,具体为一种基于人工智能的查询信息处理方法和装置。
背景技术
随着网络的飞速发展,网上资源也日新月异,呈***性增长趋势。面对如此浩瀚多样的信息资源,计算机技术,通信技术,信息的查询处理技术的快速发展,手工查询的“手翻、眼看、大脑判断”的处理方式已经很难适应当今信息的发展速度,因此,信息查询处理开始从手工查询处理过渡到计算机人工智能的查询处理。
信息的查询处理,是以科学的方法从有序的信息集合中查询出所需的信息的一种查询方式,是人类为了合理的分发情报和充分的利用情报而采取的一种重要的交流方式,于是乎,信息查询已经成为现代社会信息化和个汇总应用关系的关键。
现有技术中,查询信息处理方法基于输入的查询语句进行查询,因而查询结果容易受到查询语句中,与查询意图无关的查询词的影响,而导致查询结果不准确。
发明内容
针对现有技术的不足,本发明提供了一种基于人工智能的查询信息处理方法和装置,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于人工智能的查询信息处理方法,包括以下步骤:
S1、获取用户输入的用于查询信息的查询语句;
S2、将用户的查询语句请求分解成若干关键词,根据关键词计算出Web文档跟用户请求的匹配程度;
S3、根据预设的用户反馈机制记录该用户的查询踪迹,在结合用户以往的个性化查询信息来配合进行关键词或关键词的同义词的查询匹配;
S4、根据关键词或关键词的同义词的查询匹配结果,确定至少一个与所述查询语句相匹配的在预设知识库中存在的近似查询语句;
S5、运用预设的知识库和数据库存放用户输入的初始查询语句以及在查询信息处理过程中得到的中间结果、最终结果、近似查询语句匹配的依存关系;
S6、确定预设知识库中存在的近似查询语句的查询结果,并经过信息转换,将近似查询语句的表示形式转换为查询语句的表示形式;
S7、将转换后的查询语句的表示形式反馈给查询信息的查询语句对应的查询结果。
进一步优化本技术方案,所述S2中,匹配程度分为两种类型:一种是根据分解成的关键词在文档中出现的频率确定它对用户请求的匹配程度;另一种是计算分解成的关键词出现次数和Web文档中总词数之比。
进一步优化本技术方案,所述S2中,分解关键词时,应用人工智能技术中的自然语言理解能力进行自然语言智能查询,并对查询语句中的无效片段进行删除,提取剩余语句中的有效关键词。
进一步优化本技术方案,所述S3中,获取用户的个性化查询信息包括三种方法,分别为基于文本内容分析的方法,通过获取用户的查询历史和访问网页的文本信息;基于点击流量的方法,通过获取能对间接反映用户个性化需求信息;基于超链接分析的方法,通过获取网页的标准PageRank值来反映用户的个性化信息需求。
进一步优化本技术方案,所述S6中,将查询语句的表示形式以数据库信息的模式经编辑和编译送入知识库中,基于人工智能的机器学习能力对该次查询信息处理过程进行学习并检测,检测该次查询信息处理中是否出现知识错误。
一种基于人工智能的查询信息处理装置,所述基于人工智能的查询信息处理装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的查询信息处理程序,所述查询信息处理程序被所述处理器执行时实现如上述的基于人工智能的查询信息处理方法的步骤。
进一步优化本技术方案,所述处理器中内置有预设的知识库和数据库,所述知识库用于存储解决用户查询信息中需求所需的原理性知识、人工智能学习的专家经验性知识以及有关的事实;所述数据库用于存储每次查询信息处理程序在处理过程中的得到的中间结果、最终结果以及运行信息。
进一步优化本技术方案,所述知识库内置有查询模块,所述查询模块利用知识库中的知识,按一定的推理策略解决用户的查询信息问题。
一种计算机可读存储介质,所述计算机可读存储介质上存储有查询信息处理程序,所述查询信息处理程序被处理器执行时实现如上述的基于人工智能的查询信息处理方法的步骤。
与现有技术相比,本发明提供了一种基于人工智能的查询信息处理方法和装置,具备以下有益效果:
该基于人工智能的查询信息处理方法和装置,通过利用人工智能技术,它将信息查询从目前基于关键词层面提高到基于知识层面,对知识有一定的理解与处理能力,明确和缩小了查询范围,减少了对无用信息的查询,同时由于有知识库为背景,使得信息查询更具有智能性。
附图说明
图1为本发明提出的一种基于人工智能的查询信息处理方法和装置的流程示意图。
具体实施方式
下面将结合本发明的实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
请参阅图1,一种基于人工智能的查询信息处理方法,包括以下步骤:
S1、获取用户输入的用于查询信息的查询语句;
S2、将用户的查询语句请求分解成若干关键词,根据关键词计算出Web文档跟用户请求的匹配程度;
S3、根据预设的用户反馈机制记录该用户的查询踪迹,在结合用户以往的个性化查询信息来配合进行关键词或关键词的同义词的查询匹配;
其中,用户反馈机制来完善查询机制,提高查询的命中率,同时也可以提供面向个人的特殊查询服务,这种方式是记录该用户的查询踪迹,从而在用户再次登录时结合以往的用户查询记录来配合提供相关的查询服务,并且可以通过对用户的反馈意见进行跟踪,获取用户对结果的评价,以便提高查询质量。
S4、根据关键词或关键词的同义词的查询匹配结果,确定至少一个与所述查询语句相匹配的在预设知识库中存在的近似查询语句;
S5、运用预设的知识库和数据库存放用户输入的初始查询语句以及在查询信息处理过程中得到的中间结果、最终结果、近似查询语句匹配的依存关系;
S6、确定预设知识库中存在的近似查询语句的查询结果,并经过信息转换,将近似查询语句的表示形式转换为查询语句的表示形式;
S7、将转换后的查询语句的表示形式反馈给查询信息的查询语句对应的查询结果。
具体的,所述S2中,匹配程度分为两种类型:一种是根据分解成的关键词在文档中出现的频率确定它对用户请求的匹配程度;另一种是计算分解成的关键词出现次数和Web文档中总词数之比。
具体的,所述S2中,分解关键词时,应用人工智能技术中的自然语言理解能力进行自然语言智能查询,并对查询语句中的无效片段进行删除,提取剩余语句中的有效关键词。
具体的,所述S3中,获取用户的个性化查询信息包括三种方法,分别为基于文本内容分析的方法、基于点击流量的方法和基于超链接分析的方法。基于文本内容分析的方法通过获取用户的查询历史和访问网页等文本信息,甚至有时还能结合用户主动提交的,反应自身兴趣的关键词来得到个性化查询结果。而基于点击流量的分析方法则使用了一些间接反映用户个性化需求信息的方法,往往能更有效地提供个性化查询的服务。再如基于超链接的个性化查询方法,它主要利用修改网页的标准PageRank值来反映用户的个性化信息需求。
具体的,所述S6中,将查询语句的表示形式以数据库信息的模式经编辑和编译送入知识库中,基于人工智能的机器学习能力对该次查询信息处理过程进行学习并检测,检测该次查询信息处理中是否出现知识错误。
实施例二:
一种基于人工智能的查询信息处理装置,所述基于人工智能的查询信息处理装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的查询信息处理程序,所述查询信息处理程序被所述处理器执行时实现如实施例一中所述的基于人工智能的查询信息处理方法的步骤。
具体的,所述处理器中内置有预设的知识库和数据库,所述知识库用于存储解决用户查询信息中需求所需的原理性知识、人工智能学习的专家经验性知识以及有关的事实;所述数据库用于存储每次查询信息处理程序在处理过程中的得到的中间结果、最终结果以及运行信息。
具体的,所述知识库内置有查询模块,所述查询模块利用知识库中的知识,按一定的推理策略解决用户的查询信息问题。
一种计算机可读存储介质,所述计算机可读存储介质上存储有查询信息处理程序,所述查询信息处理程序被处理器执行时实现如上述的基于人工智能的查询信息处理方法的步骤。
本发明的有益效果是:该基于人工智能的查询信息处理方法和装置,通过利用人工智能技术,它将信息查询从目前基于关键词层面提高到基于知识层面,对知识有一定的理解与处理能力,明确和缩小了查询范围,减少了对无用信息的查询,同时由于有知识库为背景,使得信息查询更具有智能性。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (9)
1.一种基于人工智能的查询信息处理方法,其特征在于,包括以下步骤:
S1、获取用户输入的用于查询信息的查询语句;
S2、将用户的查询语句请求分解成若干关键词,根据关键词计算出Web文档跟用户请求的匹配程度;
S3、根据预设的用户反馈机制记录该用户的查询踪迹,在结合用户以往的个性化查询信息来配合进行关键词或关键词的同义词的查询匹配;
S4、根据关键词或关键词的同义词的查询匹配结果,确定至少一个与所述查询语句相匹配的在预设知识库中存在的近似查询语句;
S5、运用预设的知识库和数据库存放用户输入的初始查询语句以及在查询信息处理过程中得到的中间结果、最终结果、近似查询语句匹配的依存关系;
S6、确定预设知识库中存在的近似查询语句的查询结果,并经过信息转换,将近似查询语句的表示形式转换为查询语句的表示形式;
S7、将转换后的查询语句的表示形式反馈给查询信息的查询语句对应的查询结果。
2.根据权利要求1所述的一种基于人工智能的查询信息处理方法,其特征在于,所述S2中,匹配程度分为两种类型:一种是根据分解成的关键词在文档中出现的频率确定它对用户请求的匹配程度;另一种是计算分解成的关键词出现次数和Web文档中总词数之比。
3.根据权利要求1所述的一种基于人工智能的查询信息处理方法,其特征在于,所述S2中,分解关键词时,应用人工智能技术中的自然语言理解能力进行自然语言智能查询,并对查询语句中的无效片段进行删除,提取剩余语句中的有效关键词。
4.根据权利要求1所述的一种基于人工智能的查询信息处理方法,其特征在于,所述S3中,获取用户的个性化查询信息包括三种方法,分别为基于文本内容分析的方法,通过获取用户的查询历史和访问网页的文本信息;基于点击流量的方法,通过获取能对间接反映用户个性化需求信息;基于超链接分析的方法,通过获取网页的标准PageRank值来反映用户的个性化信息需求。
5.根据权利要求1所述的一种基于人工智能的查询信息处理方法,其特征在于,所述S6中,将查询语句的表示形式以数据库信息的模式经编辑和编译送入知识库中,基于人工智能的机器学习能力对该次查询信息处理过程进行学习并检测,检测该次查询信息处理中是否出现知识错误。
6.一种基于人工智能的查询信息处理装置,其特征在于,所述基于人工智能的查询信息处理装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的查询信息处理程序,所述查询信息处理程序被所述处理器执行时实现如权利要求1至5中任一项所述的基于人工智能的查询信息处理方法的步骤。
7.根据权利要求6所述的一种基于人工智能的查询信息处理装置,其特征在于,所述处理器中内置有预设的知识库和数据库,所述知识库用于存储解决用户查询信息中需求所需的原理性知识、人工智能学习的专家经验性知识以及有关的事实;所述数据库用于存储每次查询信息处理程序在处理过程中的得到的中间结果、最终结果以及运行信息。
8.根据权利要求7所述的一种基于人工智能的查询信息处理装置,其特征在于,所述知识库内置有查询模块,所述查询模块利用知识库中的知识,按一定的推理策略解决用户的查询信息问题。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有查询信息处理程序,所述查询信息处理程序被处理器执行时实现如权利要求1至8中任一项所述的基于人工智能的查询信息处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110354254.3A CN113032677A (zh) | 2021-04-01 | 2021-04-01 | 一种基于人工智能的查询信息处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110354254.3A CN113032677A (zh) | 2021-04-01 | 2021-04-01 | 一种基于人工智能的查询信息处理方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113032677A true CN113032677A (zh) | 2021-06-25 |
Family
ID=76453823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110354254.3A Pending CN113032677A (zh) | 2021-04-01 | 2021-04-01 | 一种基于人工智能的查询信息处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113032677A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106446018A (zh) * | 2016-08-29 | 2017-02-22 | 北京百度网讯科技有限公司 | 基于人工智能的查询信息处理方法和装置 |
CN108052659A (zh) * | 2017-12-28 | 2018-05-18 | 北京百度网讯科技有限公司 | 基于人工智能的搜索方法、装置和电子设备 |
CN109710732A (zh) * | 2018-11-19 | 2019-05-03 | 东软集团股份有限公司 | 信息查询方法、装置、存储介质和电子设备 |
CN109739964A (zh) * | 2018-12-27 | 2019-05-10 | 北京拓尔思信息技术股份有限公司 | 知识数据提供方法、装置、电子设备和存储介质 |
US20200073882A1 (en) * | 2018-08-31 | 2020-03-05 | Accenture Global Solutions Limited | Artificial intelligence based corpus enrichment for knowledge population and query response |
CN112528001A (zh) * | 2020-12-23 | 2021-03-19 | 北京百度网讯科技有限公司 | 一种信息查询方法、装置及电子设备 |
-
2021
- 2021-04-01 CN CN202110354254.3A patent/CN113032677A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106446018A (zh) * | 2016-08-29 | 2017-02-22 | 北京百度网讯科技有限公司 | 基于人工智能的查询信息处理方法和装置 |
CN108052659A (zh) * | 2017-12-28 | 2018-05-18 | 北京百度网讯科技有限公司 | 基于人工智能的搜索方法、装置和电子设备 |
US20200073882A1 (en) * | 2018-08-31 | 2020-03-05 | Accenture Global Solutions Limited | Artificial intelligence based corpus enrichment for knowledge population and query response |
CN109710732A (zh) * | 2018-11-19 | 2019-05-03 | 东软集团股份有限公司 | 信息查询方法、装置、存储介质和电子设备 |
CN109739964A (zh) * | 2018-12-27 | 2019-05-10 | 北京拓尔思信息技术股份有限公司 | 知识数据提供方法、装置、电子设备和存储介质 |
CN112528001A (zh) * | 2020-12-23 | 2021-03-19 | 北京百度网讯科技有限公司 | 一种信息查询方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8332434B2 (en) | Method and system for finding appropriate semantic web ontology terms from words | |
Ogilvie et al. | Combining document representations for known-item search | |
US7792829B2 (en) | Table querying | |
US20040111412A1 (en) | Method and apparatus for ranking web page search results | |
WO2007038713A2 (en) | Search engine determining results based on probabilistic scoring of relevance | |
Krishnan et al. | Leveraging semantic resources in diversified query expansion | |
Maidel et al. | Ontological content‐based filtering for personalised newspapers: A method and its evaluation | |
Thomas et al. | ONTOSEARCH2: Searching Ontologies Semantically. | |
Zhang et al. | A graph based document retrieval method | |
Hu et al. | Diversifying query suggestions by using topics from wikipedia | |
Grosky et al. | Emergent semantics and the multimedia semantic web | |
Chen et al. | A unified framework for web link analysis | |
Gao et al. | Semantic mapping from natural language questions to OWL queries | |
Bhopale et al. | Transformer based contextual text representation framework for intelligent information retrieval | |
Ustinovskiy et al. | An optimization framework for weighting implicit relevance labels for personalized web search | |
CN113032677A (zh) | 一种基于人工智能的查询信息处理方法和装置 | |
Dou et al. | Low-cost, bottom-up measures for evaluating search result diversification | |
Cheng | Knowledgescapes: A probabilistic model for mining tacit knowledge for information retrieval | |
Stojanovic | On the conceptualisation of the query refinement task | |
Ungrangsi et al. | SQORE-based ontology retrieval system | |
Plansangket | New weighting schemes for document ranking and ranked query suggestion | |
Robin et al. | Can ontologies improve web search engine effectiveness before the advent of the semantic web? | |
Srikantaiah et al. | Ranking search engine result pages based on trustworthiness of websites | |
Chen et al. | A novel user profile learning approach with fuzzy constraint for news retrieval | |
Chinedu-Eneh et al. | Elephant: LLM System for Accurate Recantations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210625 |