CN117235242A - 一种基于智能问答数据库的热点信息筛选方法及*** - Google Patents
一种基于智能问答数据库的热点信息筛选方法及*** Download PDFInfo
- Publication number
- CN117235242A CN117235242A CN202311516599.XA CN202311516599A CN117235242A CN 117235242 A CN117235242 A CN 117235242A CN 202311516599 A CN202311516599 A CN 202311516599A CN 117235242 A CN117235242 A CN 117235242A
- Authority
- CN
- China
- Prior art keywords
- question
- answer
- hot spot
- user
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012216 screening Methods 0.000 title claims abstract description 47
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000010219 correlation analysis Methods 0.000 claims abstract description 17
- 230000000875 corresponding effect Effects 0.000 claims description 35
- 230000002452 interceptive effect Effects 0.000 claims description 35
- 230000006870 function Effects 0.000 claims description 16
- 238000003058 natural language processing Methods 0.000 claims description 15
- 238000004458 analytical method Methods 0.000 claims description 14
- 238000005516 engineering process Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 14
- 238000001914 filtration Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 5
- 230000002596 correlated effect Effects 0.000 claims description 5
- 238000004140 cleaning Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 6
- 230000003993 interaction Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 238000012163 sequencing technique Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010921 in-depth analysis Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出了一种基于智能问答数据库的热点信息筛选方法、***及电子设备,涉及信息筛选领域。采集大量热点信息,并通过热点信息获取多组相匹配的查询问题和答案结果构成的问答对,基于问答对构建智能问答数据库;根据用户输入的问题提取关键词,利用关键词分别与该用户的历史浏览信息进行相关性分析,根据相关性分析结果得到关键词的第一权重;搜索各个关键词匹配的问答对,从而得到问答对相应的热点信息,基于第一权重对热点信息进行筛选和排序;根据用户交互操作得到新的答案结果,并将问题与新的答案结果作为新的问答对上传到智能问答数据库中。本发明解决了信息筛选***的筛选效果不佳和信息质量不高的问题。
Description
技术领域
本发明涉及信息筛选领域,具体而言,涉及一种基于智能问答数据库的热点信息筛选方法及***。
背景技术
信息筛选***大多为基于关键词匹配或简单规则的过滤器,无法提供精准的信息服务。现有的在线咨询服务缺陷主要有:1、筛选效果不佳:这些***只能根据关键词的字面意思直接筛选,无法准确地把握用户的需求,导致筛选效果不佳。2、信息质量不高:这些***无法对信息进行深入分析和理解,只能根据表面信息进行筛选,导致所筛选出的信息质量不高。
发明内容
本发明的目的在于提供一种基于智能问答数据库的热点信息筛选方法、***及电子设备,其利用智能问答数据库和自然语言处理技术,能够更准确地把握用户需求,从而解决了现有信息筛选***的筛选效果不佳和信息质量不高的问题。
为解决上述技术问题,本发明采用的技术方案为:
第一方面:本申请提出一种基于智能问答数据库的热点信息筛选方法,包括如下步骤,步骤S1:采集大量热点信息,通过大量热点信息获取多组匹配的问答对,每组所述问答对均包括查询问题和答案结果,为每组问答对确定第一问题类型和至少一个索引关键词,通过所述索引关键词能够匹配到对应问答对,构建智能问答数据库以存储多组所述问答对。
步骤S2:收集用户输入的问题同时获取该用户的历史浏览信息,采用自然语言处理技术对用户输入的问题进行分析处理,提取多个查询关键词并确定该用户输入的问题所属的第二问题类型,将多个查询关键词分别与该用户的历史浏览信息进行相关性分析,分别得到各个查询关键词与该用户的历史浏览信息的相关性,根据相关性分析结果得到多个查询关键词的第一权重;以查询关键词为索引关键词检索到对应的多组问答对,各个问答对根据与用户输入问题的对应关键词数量及所述对应关键词的第一权重进行计算得到问答对的第二权重。
步骤S3:基于每个查询关键词和所述第二问题类型从所述智能问答数据库中搜索匹配的问答对,所述匹配的问答对所属的第一问题类型与所述第二问题类型相同;根据各所述匹配的问答对获取对应数据来源的所述热点信息,从数据库中获取所述热点信息的咨询热度,所述咨询热度与在过去一段时间所述热点信息被不同用户查询的次数成正相关,根据所述咨询热度得到所述热点信息的第三权重;通过问答对的第二权重和热点信息的第三权重得到每条热点信息的排序值,筛选排序值超过预设阈值的热点信息;
根据所述排序值对筛选出的所述热点信息进行排序。
步骤S4:根据排序向用户展示各所述热点信息,同时向用户提供交互式操作功能,根据用户交互式操作从一个或多个所述热点信息中选择所需的信息作为用户输入问题所匹配的新的答案结果,并将所述用户输入的问题和所述新的答案结果作为新的问答对上传到所述智能问答数据库中。
进一步地,上述步骤S1中,具体包括如下步骤,S101:收集热点数据:S102:对所述热点数据进行清洗和预处理;S103:将清洗和预处理后的数据中的问题和对应答案进行配对;S104:对每个配对结果进行索引;S105:定期对数据库进行维护和更新。
进一步地,上述步骤S2中,所述自然语言处理技术包括自然词法分析、语法分析和语义分析中的任意一种或多种。
进一步地,上述步骤S4中,具体包括如下步骤,步骤S401:设计用户界面,所述用户界面包括展示界面及交互界面;步骤S402:将通过排序值进行排序后的热点信息通过展示界面向用户展示,并通过交互界面提供的交互式操作功能,从展示的热点信息中选择所需的信息。
进一步地,上述步骤S4中,还包括如下步骤,步骤S404:根据用户交互式操作的数据分析用户偏好,从而根据用户偏好提供热点信息的个性化推荐服务。
进一步地,上述步骤S402中,所述热点信息采用图表、列表或卡片方式进行展示。***采用不同方式进行展示热点信息,便于用户更直观地统计信息。
进一步地,上述步骤S403中,所述交互式操作包括搜索、排序、过滤、标记和分享中的任意一种或多种。用户通过各项交互式操作,能够进一步对答案结果进行确认和更新。
进一步地,上述步骤S402中,所述用户界面通过文本、图片、视频和音频中的任意多种维度进行展示。
第二方面:本申请提出一种基于智能问答数据库的热点信息筛选***,所述***包括智能问答数据库、数据库构建模块、查询问题分析模块、查询结果排序模块以及交互展示模块。
所述数据库构建模块,用于采集大量热点信息,通过大量热点信息获取多组匹配的问答对,每组所述问答对均包括查询问题和答案结果,为每组问答对确定第一问题类型和至少一个索引关键词,通过所述索引关键词能够匹配到对应问答对,构建智能问答数据库以存储多组所述问答对;
所述查询问题分析模块,收集用户输入的问题同时获取该用户的历史浏览信息,采用自然语言处理技术对用户输入的问题进行分析处理,提取多个查询关键词并确定该用户输入的问题所属的第二问题类型,将多个查询关键词分别与该用户的历史浏览信息进行相关性分析,分别得到各个查询关键词与该用户的历史浏览信息的相关性,根据相关性分析结果得到多个查询关键词的第一权重;以查询关键词为索引关键词检索到对应的多组问答对,各个问答对根据与用户输入问题的对应关键词数量及所述对应关键词的第一权重进行计算得到问答对的第二权重;
所述查询结果排序模块,基于每个查询关键词和所述第二问题类型从所述智能问答数据库中搜索匹配的问答对,所述匹配的问答对所属的第一问题类型与所述第二问题类型相同;根据各所述匹配的问答对获取对应数据来源的所述热点信息,从数据库中获取所述热点信息的咨询热度,所述咨询热度与在过去一段时间所述热点信息被不同用户查询的次数成正相关,根据所述咨询热度得到所述热点信息的第三权重;通过问答对的第二权重和热点信息的第三权重得到每条热点信息的排序值,筛选排序值超过预设阈值的热点信息;根据所述排序值对筛选出的所述热点信息进行排序;
所述交互展示模块,根据排序向用户展示各所述热点信息,同时向用户提供交互式操作功能,根据用户交互式操作从一个或多个所述热点信息中选择所需的信息作为用户输入问题所匹配的新的答案结果,并将所述用户输入的问题和所述新的答案结果作为新的问答对上传到所述智能问答数据库中。
第三方面:本申请提出一种电子设备,包括处理器和存储器,所述存储器中存储有计算机指令,所述计算机指令在被所述处理器执行时能够实现如第一方面中任一项所述的方法。
相对于现有技术,本发明至少具有如下优点或有益效果:
本申请提供一种基于智能问答数据库的热点信息筛选方法、***及电子设备,其通过构建智能问答数据库,存储多组匹配后的查询问题和答案结果;并采用自然语言处理技术将用户输入的问题进行分析和处理,从而提取多个关键词,利用多个关键词分别与该用户的历史浏览信息进行相关性分析,得到各关键词的第一权重;从智能问答数据库中搜索各个关键词匹配得到多个答案结果对应的热点信息,基于所述第一权重得到各个热点信息的排序值。从智能问答数据库中提取出相关热点信息,并进行筛选和过滤,以提供更加精准和实用的信息服务;向用户展示筛选后的热点信息,并提供交互式操作功能,以便用户更好地获取所需信息。本发明通过构建智能问答数据库,利用自然语言处理技术,能够更准确地把握用户需求,从而解决现有信息筛选***的筛选效果不佳和信息质量不高的问题。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例1基于智能问答数据库的热点信息筛选方法的流程图;
图2为本发明实施例1步骤S1的流程图;
图3为本发明实施例1步骤S3的流程图;
图4为本发明实施例1步骤S4的流程图;
图5为本发明实施例2电子设备的原理图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
请参阅图1~图4,图1~图4所示为本申请实施例提供的基于智能问答数据库的热点信息筛选方法的示意图。
本申请提出一种基于智能问答数据库的热点信息筛选方法,包括如下步骤,
步骤S1:采集大量热点信息,通过大量热点信息获取多组匹配的问答对,每组所述问答对均包括查询问题和答案结果,为每组问答对确定第一问题类型和至少一个索引关键词,通过所述索引关键词能够匹配到对应问答对,构建智能问答数据库以存储多组所述问答对。
步骤S2:收集用户输入的问题同时获取该用户的历史浏览信息,采用自然语言处理技术对用户输入的问题进行分析处理,提取多个查询关键词并确定该用户输入的问题所属的第二问题类型,将多个查询关键词分别与该用户的历史浏览信息进行相关性分析,分别得到各个查询关键词与该用户的历史浏览信息的相关性,根据相关性分析结果得到多个查询关键词的第一权重;以查询关键词为索引关键词检索到对应的多组问答对,各个问答对根据与用户输入问题的对应关键词数量及所述对应关键词的第一权重进行计算得到问答对的第二权重。
步骤S3:基于每个查询关键词和所述第二问题类型从所述智能问答数据库中搜索匹配的问答对,所述匹配的问答对所属的第一问题类型与所述第二问题类型相同;根据各所述匹配的问答对获取对应数据来源的所述热点信息,从数据库中获取所述热点信息的咨询热度,所述咨询热度与在过去一段时间所述热点信息被不同用户查询的次数成正相关,根据所述咨询热度得到所述热点信息的第三权重;通过问答对的第二权重和热点信息的第三权重得到每条热点信息的排序值,筛选排序值超过预设阈值的热点信息;
根据所述排序值对筛选出的所述热点信息进行排序。
进一步说明,问答对的第二权重和热点信息的排序值的算法如下:
假设数据库中的热点信息包括H1、H2、H3,从H1能够提取出问答对QA1、QA2,从H2中能够提取到问答对QA3、QA4,从H3中能够提取出问答对QA5、QA6;
其中QA1关联有索引关键词K1、K2,QA2关联有索引关键词K2、K3,QA3关联有索引关键词K3、K4,QA4关联有索引关键词K4、K5,QA5关联有索引关键词K5、K6,QA6关联有索引关键词K6、K1;
从用户输入的问题中提取出搜索关键词K1和K2,则根据对应索引关键词检索到的问答对为QA1、QA2、QA6,上述问答对对应的热点信息为H1、H3;
此时,H1与K1、K2以及找到的问答对QA1、QA2均相关,H3与K1以及问答对QA6相关,计算QA1、QA2、QA6的权重为:
WQA1=(WK1+WK2);
WQA2=WK2;
WQA6=WK1,
其中WK1、WK2为关键词的第一权重,WQA1、WQA2、WQA6为问答对的第二权重;
在需要对H1、H3排序时,可以通过计算得到H1、H3的排序值为:
P1=WH1*(WQA1+WQA2);
P3=WH3*WQA6,
其中P1、P3为H1、H3的排序值,WH1、WH3是热点信息的权重值。
步骤S4:根据排序向用户展示各所述热点信息,同时向用户提供交互式操作功能,根据用户交互式操作从一个或多个所述热点信息中选择所需的信息作为用户输入问题所匹配的新的答案结果,并将所述用户输入的问题和所述新的答案结果作为新的问答对上传到所述智能问答数据库中。
可选的,实现上述基于智能问答数据库的热点信息筛选方法的***包括智能问答数据库、信息筛选模块和用户界面。其中,智能问答数据库包含大量问答对,所述问答对是根据多方面采集到的热点信息预置的,所述问答对均设置有索引关键词,根据索引关键词进行查询和匹配。在构建数据库时,可以利用爬虫技术从各种网站和社交媒体上获取数据,并通过自动化的方式进行维护和更新。信息筛选模块利用自然语言处理技术,对用户提出的问题进行分析和处理,具体为,针对用户提出的问题提取多个查询关键词,并且多个查询关键词与用户最近浏览信息进行相关性分析,从而根据相关性分析结果得到多个查询关键词的第一权重。从所述智能数据库中搜索各个查询关键词匹配的所述问答对,进而根据问答对找到对应的热点信息,通过预设规则得到各个热点信息的排序值,根据排序值对热点信息进行排序和筛选。可选的,通过用户界面向用户展示经过筛选后的结果,其中可以采用如网页、APP等方式,并提供交互式操作功能更新智能问答数据库,以便用户更好地获取所需信息。
本发明通过构建智能问答数据库、问题分析、筛选与过滤以及信息展示等方法,提供了高效、准确、个性化的信息服务,为用户提供了更好的使用体验和价值。通过智能问答数据库的构建以及对问题的分析处理,可以提供快速、准确的答案,帮助用户快速获取所需信息,节省了用户的时间和精力。其次,通过筛选与过滤的方法,可以从大量的数据中提取出与用户需求相关的精准信息,减少了信息的冗余和噪声,提供了更有价值的内容。通过结合用户反馈和行为数据持续更新智能问答数据库中用户输入查询问题和得到的智能数据库中答案结果的问答对,提高智能问答和信息展示的准确性和覆盖率。
进一步地,在本发明中,上述步骤S1中,具体包括如下步骤,S101:收集热点数据:S102:对所述热点数据进行清洗和预处理;S103:将清洗和预处理后的数据中的问题和对应答案进行配对;S104:对每个配对结果进行索引;S105:定期对数据库进行维护和更新。
在***中构建一个智能问答数据库,该数据库可以从各种网站、社交媒体、论坛、博客和新闻等渠道收集与热点话题相关的数据,包括问题和答案等信息。并且,对收集到的数据进行清洗和预处理,包括去除重复数据、去除垃圾数据、对数据进行分类和标注等。将清洗和预处理后的数据构建成问答对,即将问题和对应的答案进行配对。并确定问答对的索引关键词和问题类型,当用户输入信息的查询关键词与索引关键词相同或相似时快速地进行查询和匹配。根据用户输入问题确认问题类型便于缩小查找范围,比如问题类型可以根据方式分类为提问类、描述类和命令类等,可以根据内容分类为生活常识、医学、情感和娱乐类等。其中,数据库中问答对的存储位置可以根据问答对顺序进行依次排列。定期对数据库进行维护和更新,包括添加新的数据、删除过期的数据、以及对数据进行更新等。
进一步地,在本发明中,上述步骤S2中,所述自然语言处理技术包括自然词法分析、语法分析和语义分析中的任意一种或多种。
进一步地,在本发明中,上述步骤S4中,具体包括如下步骤,步骤S401:设计用户界面,所述用户界面包括展示界面及交互界面;步骤S402:将通过排序值进行排序后的热点信息通过展示界面向用户展示,并通过交互界面提供的交互式操作功能,从展示的热点信息中选择所需的信息。
可选的,用户界面还包括输入区域,用户在输入区域输入问题,使用自然语言处理技术,对用户输入的问题进行分析处理,提取多个查询关键词,利用各个查询关键词与近期采集的当前用户端的历史浏览信息进行相关性分析,利用相关性高低得到各个查询关键词的第一权重大小。
可选的,***将处理后的热点信息通过用户界面向用户展示,并提供交互式操作功能,以便用户更好地获取所需信息。
进一步地,在本发明中,上述步骤S4中,还包括如下步骤,步骤S404:根据用户交互式操作的数据分析用户偏好,从而根据用户偏好提供热点信息的个性化推荐服务。
进一步地,在本发明中,上述步骤S402中,所述热点信息采用图表、列表或卡片方式进行展示。***采用不同方式进行展示热点信息,便于用户更直观地统计信息。
进一步地,在本发明中,上述步骤S403中,所述交互式操作包括搜索、排序、过滤、标记和分享中的任意一种或多种。用户通过各项交互式操作,能够进一步对答案结果进行确认和更新。
进一步地,在本发明中,上述步骤S402中,所述用户界面通过文本、图片、视频和音频中的任意多种维度进行展示。
***通过可视化界面实现多种信息的综合展示,便于用户快速获取结果。通过文本、图片和视频多维度信息展示的设计,丰富了用户界面的多样化,可以更全面地呈现所需信息。
请参阅图5,图5为本申请实施例提供的电子设备的一种示意性结构框图。电子设备包括存储器101、处理器102和通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块,如本申请实施例1所提供的实现基于智能问答数据库的热点信息筛选方法对应的程序指令/模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。
其中,存储器101可以是但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,上述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
综上所述,本申请实施例提供的一种基于智能问答数据库的热点信息筛选方法及设备:通过构建智能问答数据库,存储多组匹配后的查询问题和答案结果;并采用自然语言处理技术将用户输入的问题进行分析和处理,从而提取多个关键词,利用多个关键词分别与该用户的历史浏览信息进行相关性分析,得到各关键词的第一权重;从智能问答数据库中搜索各个关键词匹配得到多个答案结果对应的热点信息,基于所述第一权重得到各个热点信息的排序值。从智能问答数据库中提取出相关热点信息,并进行筛选和过滤,以提供更加精准和实用的信息服务;向用户展示筛选后的热点信息,并提供交互式操作功能,以便用户更好地获取所需信息。本发明通过构建智能问答数据库,利用自然语言处理技术,能够更准确地把握用户需求,从而解决现有信息筛选***的筛选效果不佳和信息质量不高的问题。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (9)
1.一种基于智能问答数据库的热点信息筛选方法,其特征在于,包括如下步骤:
步骤S1:采集大量热点信息,通过大量热点信息获取多组匹配的问答对,每组所述问答对均包括查询问题和答案结果,为每组问答对设置第一问题类型和至少一个索引关键词,通过所述索引关键词能够匹配到对应问答对,构建智能问答数据库以存储多组所述问答对;
步骤S2:收集用户输入的问题同时获取该用户的历史浏览信息,采用自然语言处理技术将用户输入的问题进行分析处理,提取至少一个查询关键词并确定该用户输入的问题所属的第二问题类型,将所述至少一个查询关键词中的每个查询关键词分别与该用户的历史浏览信息进行相关性分析,分别得到各个查询关键词与该用户历史浏览信息的相关性,根据相关性分析结果得到每个关键词的第一权重;以查询关键词为索引关键词检索到对应的多组问答对,各个问答对根据与用户输入问题的对应关键词数量及所述对应关键词的第一权重进行计算得到问答对的第二权重;
步骤S3:基于每个查询关键词和所述第二问题类型从所述智能问答数据库中搜索匹配的问答对,所述匹配的问答对所属的第一问题类型与所述第二问题类型相同;根据各所述匹配的问答对获取对应数据来源的所述热点信息,从数据库中获取所述热点信息的咨询热度,所述咨询热度与在过去一段时间所述热点信息被不同用户查询的次数成正相关,根据所述咨询热度得到所述热点信息的第三权重;通过关键词的第一权重、问答对的第二权重和热点信息的第三权重得到每条热点信息的排序值,筛选排序值超过预设阈值的热点信息;根据所述排序值对筛选出的所述热点信息进行排序;
步骤S4:根据排序向用户展示各所述热点信息,同时向用户提供交互式操作功能,根据用户交互式操作从一个或多个所述热点信息中选择所需的信息作为用户输入的问题所匹配的新的答案结果,并将所述用户输入的问题和相匹配的所述新的答案结果作为新的问答对上传到所述智能问答数据库中。
2.如权利要求1所述的一种基于智能问答数据库的热点信息筛选方法,其特征在于,步骤S1中,具体包括如下步骤:
S101:收集热点数据;
S102:对所述热点数据进行清洗和预处理;
S103:将清洗和预处理后的数据中的问题和对应答案进行配对;
S104:对每个配对结果确定第一问题类型和建立索引;
S105:定期对数据库进行维护和更新。
3.如权利要求1所述的一种基于智能问答数据库的热点信息筛选方法,其特征在于,步骤S2中,所述自然语言处理技术包括自然词法分析、语法分析和语义分析中的任意一种或多种。
4.如权利要求1所述的一种基于智能问答数据库的热点信息筛选方法,其特征在于,步骤S4中,具体包括如下步骤:
步骤S401:设计用户界面,所述用户界面包括展示界面及交互界面;
步骤S402:将通过排序值进行排序后的热点信息通过展示界面向用户展示;
步骤S403:通过交互界面提供的交互式操作功能,从展示的热点信息中选择所需的信息,将所述所需的信息作为用户输入的问题所匹配的新的答案结果,并将所述用户输入的问题和相匹配的所述新的答案结果作为新的问答对上传到所述智能问答数据库中。
5.如权利要求4所述的一种基于智能问答数据库的热点信息筛选方法,其特征在于,步骤S4中,还包括如下步骤,步骤S404:根据用户交互式操作的数据分析用户偏好,从而根据用户偏好提供热点信息的个性化推荐服务。
6.如权利要求5所述的一种基于智能问答数据库的热点信息筛选方法,其特征在于,步骤S402中,所述热点信息采用图表、列表或卡片方式进行展示。
7.如权利要求5所述的一种基于智能问答数据库的热点信息筛选方法,其特征在于,步骤S403中,所述交互式操作包括搜索、排序、过滤、标记和分享中的任意一种或多种。
8.一种基于智能问答数据库的热点信息筛选***,所述***包括智能问答数据库、数据库构建模块、查询问题分析模块、查询结果排序模块以及交互展示模块;
所述数据库构建模块,用于采集大量热点信息,通过大量热点信息获取多组匹配的问答对,每组所述问答对均包括查询问题和答案结果,为每组问答对确定第一问题类型和至少一个索引关键词,通过所述索引关键词能够匹配到对应问答对,构建智能问答数据库以存储多组所述问答对;
所述查询问题分析模块,收集用户输入的问题同时获取该用户的历史浏览信息,采用自然语言处理技术对用户输入的问题进行分析处理,提取多个查询关键词并确定该用户输入的问题所属的第二问题类型,将多个查询关键词分别与该用户的历史浏览信息进行相关性分析,分别得到各个查询关键词与该用户的历史浏览信息的相关性,根据相关性分析结果得到多个查询关键词的第一权重;以查询关键词为索引关键词检索到对应的多组问答对,各个问答对根据与用户输入问题的对应关键词数量及所述对应关键词的第一权重进行计算得到问答对的第二权重;
所述查询结果排序模块,基于每个查询关键词和所述第二问题类型从所述智能问答数据库中搜索匹配的问答对,所述匹配的问答对所属的第一问题类型与所述第二问题类型相同;根据各所述匹配的问答对获取对应数据来源的所述热点信息,从数据库中获取所述热点信息的咨询热度,所述咨询热度与在过去一段时间所述热点信息被不同用户查询的次数成正相关,根据所述咨询热度得到所述热点信息的第三权重;通过关键词的第一权重、问答对的第二权重和热点信息的第三权重得到每条热点信息的排序值,筛选排序值超过预设阈值的热点信息;根据所述排序值对筛选出的所述热点信息进行排序;
所述交互展示模块,根据排序向用户展示各所述热点信息,同时向用户提供交互式操作功能,根据用户交互式操作从一个或多个所述热点信息中选择所需的信息作为用户输入问题所匹配的新的答案结果,并将所述用户输入的问题和所述新的答案结果作为新的问答对上传到所述智能问答数据库。
9.一种电子设备,包括处理器和存储器,所述存储器中存储有计算机指令,其特征在于,所述计算机指令在被所述处理器执行时能够实现如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311516599.XA CN117235242B (zh) | 2023-11-15 | 2023-11-15 | 一种基于智能问答数据库的热点信息筛选方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311516599.XA CN117235242B (zh) | 2023-11-15 | 2023-11-15 | 一种基于智能问答数据库的热点信息筛选方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117235242A true CN117235242A (zh) | 2023-12-15 |
CN117235242B CN117235242B (zh) | 2024-02-06 |
Family
ID=89093370
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311516599.XA Active CN117235242B (zh) | 2023-11-15 | 2023-11-15 | 一种基于智能问答数据库的热点信息筛选方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117235242B (zh) |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050165811A1 (en) * | 1999-09-22 | 2005-07-28 | Lg Electronics Inc. | Method of generating user profile based on user preference and multimedia data browsing system using the same |
WO2007107095A1 (fr) * | 2006-03-17 | 2007-09-27 | Tencent Technology (Shenzhen) Company Limited | Procédé de distribution d'informations publicitaires et serveur de distribution d'informations publicitaires et moteur de recherche |
KR20070102033A (ko) * | 2006-04-13 | 2007-10-18 | 엘지전자 주식회사 | 문서검색 시스템 및 그 방법 |
CN101364955A (zh) * | 2008-09-28 | 2009-02-11 | 杭州电子科技大学 | 一种分析和提取电子邮件客户端证据的方法 |
US20090248674A1 (en) * | 2008-03-27 | 2009-10-01 | Kabushiki Kaisha Toshiba | Search keyword improvement apparatus, server and method |
CN102567326A (zh) * | 2010-12-14 | 2012-07-11 | ***通信集团湖南有限公司 | 一种信息搜索、及信息搜索排序装置和方法 |
CN102737022A (zh) * | 2011-03-31 | 2012-10-17 | 百度在线网络技术(北京)有限公司 | 获取和搜索相关知识信息的方法及装置 |
CN103955470A (zh) * | 2014-03-28 | 2014-07-30 | 华为技术有限公司 | 热点话题推送方法和装置 |
CN104598445A (zh) * | 2013-11-01 | 2015-05-06 | 腾讯科技(深圳)有限公司 | 自动问答***和方法 |
CN109871483A (zh) * | 2019-01-22 | 2019-06-11 | 珠海天燕科技有限公司 | 一种推荐信息的确定方法及装置 |
CN110069614A (zh) * | 2019-04-28 | 2019-07-30 | 北京车薄荷科技有限公司 | 一种问答交互方法及装置 |
AU2021102702A4 (en) * | 2021-05-20 | 2021-11-18 | Kumar, Rakesh Mr. | A process for query reformulation system using rank aggregation and genetic approach |
CN114020892A (zh) * | 2021-11-05 | 2022-02-08 | 中国平安人寿保险股份有限公司 | 基于人工智能的答案选取方法、装置、电子设备及介质 |
CN115516447A (zh) * | 2020-05-12 | 2022-12-23 | 深圳市欢太科技有限公司 | 热点新闻意图识别方法、装置、设备及可读存储介质 |
CN116108149A (zh) * | 2022-12-13 | 2023-05-12 | 中国建设银行股份有限公司 | 智能问答方法及其装置、设备、介质及产品 |
-
2023
- 2023-11-15 CN CN202311516599.XA patent/CN117235242B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050165811A1 (en) * | 1999-09-22 | 2005-07-28 | Lg Electronics Inc. | Method of generating user profile based on user preference and multimedia data browsing system using the same |
WO2007107095A1 (fr) * | 2006-03-17 | 2007-09-27 | Tencent Technology (Shenzhen) Company Limited | Procédé de distribution d'informations publicitaires et serveur de distribution d'informations publicitaires et moteur de recherche |
KR20070102033A (ko) * | 2006-04-13 | 2007-10-18 | 엘지전자 주식회사 | 문서검색 시스템 및 그 방법 |
US20090248674A1 (en) * | 2008-03-27 | 2009-10-01 | Kabushiki Kaisha Toshiba | Search keyword improvement apparatus, server and method |
CN101364955A (zh) * | 2008-09-28 | 2009-02-11 | 杭州电子科技大学 | 一种分析和提取电子邮件客户端证据的方法 |
CN102567326A (zh) * | 2010-12-14 | 2012-07-11 | ***通信集团湖南有限公司 | 一种信息搜索、及信息搜索排序装置和方法 |
CN102737022A (zh) * | 2011-03-31 | 2012-10-17 | 百度在线网络技术(北京)有限公司 | 获取和搜索相关知识信息的方法及装置 |
CN104598445A (zh) * | 2013-11-01 | 2015-05-06 | 腾讯科技(深圳)有限公司 | 自动问答***和方法 |
CN103955470A (zh) * | 2014-03-28 | 2014-07-30 | 华为技术有限公司 | 热点话题推送方法和装置 |
CN109871483A (zh) * | 2019-01-22 | 2019-06-11 | 珠海天燕科技有限公司 | 一种推荐信息的确定方法及装置 |
CN110069614A (zh) * | 2019-04-28 | 2019-07-30 | 北京车薄荷科技有限公司 | 一种问答交互方法及装置 |
CN115516447A (zh) * | 2020-05-12 | 2022-12-23 | 深圳市欢太科技有限公司 | 热点新闻意图识别方法、装置、设备及可读存储介质 |
AU2021102702A4 (en) * | 2021-05-20 | 2021-11-18 | Kumar, Rakesh Mr. | A process for query reformulation system using rank aggregation and genetic approach |
CN114020892A (zh) * | 2021-11-05 | 2022-02-08 | 中国平安人寿保险股份有限公司 | 基于人工智能的答案选取方法、装置、电子设备及介质 |
CN116108149A (zh) * | 2022-12-13 | 2023-05-12 | 中国建设银行股份有限公司 | 智能问答方法及其装置、设备、介质及产品 |
Non-Patent Citations (3)
Title |
---|
张红梅;勾丹;: "SciFinder Scholar数据库检索技巧", 沈阳药科大学学报, no. 06, pages 498 - 502 * |
李敏;陶宏才;: "基于关键词抽取的网络博客自动文摘算法的研究", 成都信息工程大学学报, no. 02, pages 158 - 162 * |
黄莺;: "基于相关反馈的特征融合图像检索优化策略初探", 数字图书馆论坛, no. 02, pages 45 - 50 * |
Also Published As
Publication number | Publication date |
---|---|
CN117235242B (zh) | 2024-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9990368B2 (en) | System and method for automatic generation of information-rich content from multiple microblogs, each microblog containing only sparse information | |
CN104809108B (zh) | 信息监测分析*** | |
CN107526807B (zh) | 信息推荐方法及装置 | |
US9424319B2 (en) | Social media based content selection system | |
US20150205580A1 (en) | Method and System for Sorting Online Videos of a Search | |
EP2560111A2 (en) | Systems and methods for facilitating the gathering of open source intelligence | |
US20150058320A1 (en) | Method and system for hybrid information query | |
KR101695011B1 (ko) | 토픽별 오피니언과 소셜 영향력자를 기반으로 토픽을 탐지하고 추적하는 시스템 및 방법 | |
CN106557558B (zh) | 一种数据分析方法及装置 | |
CN110704674A (zh) | 一种视频播放完整度预测方法及装置 | |
US10387805B2 (en) | System and method for ranking news feeds | |
KR101925950B1 (ko) | 컨텐츠에 대한 유입검색어 및 연관검색어 기반의 컨텐츠 추천방법 및 추천장치 | |
KR101566616B1 (ko) | 빅데이터 처리를 통한 광고의사결정시스템 및 방법 | |
CN105512300B (zh) | 信息过滤方法及*** | |
CN104933171A (zh) | 兴趣点数据关联方法和装置 | |
CN115098777A (zh) | 一种基于数据分析的用户个性化推荐方法和*** | |
CN104809253B (zh) | 互联网数据分析*** | |
CN117235242B (zh) | 一种基于智能问答数据库的热点信息筛选方法及*** | |
Sathick et al. | A generic framework for extraction of knowledge from social web sources (social networking websites) for an online recommendation system | |
KR101568800B1 (ko) | 실시간 이슈 검색어 선별 방법 및 시스템 | |
CN111026940A (zh) | 一种面向电网电磁环境的网络舆情及风险信息监测***、电子设备 | |
Putri et al. | Content-based filtering model for recommendation of Indonesian legal article study case of klinik hukumonline | |
US20190197069A1 (en) | Social Media Based Content Selection System | |
Kiomourtzis et al. | NOMAD: Linguistic Resources and Tools Aimed at Policy Formulation and Validation. | |
CN111382331A (zh) | 一种基于大数据的处理舆情话题的方法、装置和*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |