CN105955988B - 信息搜索方法和装置 - Google Patents
信息搜索方法和装置 Download PDFInfo
- Publication number
- CN105955988B CN105955988B CN201610244776.7A CN201610244776A CN105955988B CN 105955988 B CN105955988 B CN 105955988B CN 201610244776 A CN201610244776 A CN 201610244776A CN 105955988 B CN105955988 B CN 105955988B
- Authority
- CN
- China
- Prior art keywords
- search
- keyword
- information
- word
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了信息搜索方法和装置。所述方法的一具体实施方式包括:接收用户输入的搜索词;若预设的关键词表中不包含所述搜索词,则确定所述搜索词与所述关键词表中的各关键词在同一次搜索中出现的概率,其中,所述关键词表包括多个搜索对象以及与各搜索对象相关联的至少一个关键词;当所述概率大于预设阈值时,获取与该概率对应的关键词;将与所述关键词相关联的搜索对象和/或该搜索对象的从属模块发送给所述用户。该实施方式通过确定搜索词与各搜索对象的关键词在同一次搜索中出现的概率大于预设阈值,即可搜索到目标信息提高了信息搜索的准确率。
Description
技术领域
本申请涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及信息搜索方法和装置。
背景技术
随着互联网技术的发展,人们越来越习惯从网络中获取视频、新闻等信息资讯,基于关键词的网络信息搜索成人们获取信息的主要方式。通常情况下,用户搜索信息时可能不仅限于希望了解信息的龙去脉以及背景真相,还往往希望发表个人看法、见解等,因此用户希望在搜索相关信息的同时还可以获得信息的相关评论等从属功能模块。例如,对于重大社会新闻、体育赛事活动等热点事件,用户希望可以通过评论模块参与互动、发表个人意见,又或者对于视频信息等,用户向可以通过弹幕等从属模块给出对视频的相关评价。
但是,目前用户在在搜索信息时,只有在输入的搜索词命中目标信息的关键词的条件下,才可以召回目标信息及其评论功能等从属模块,信息搜索的准确率低。
发明内容
本申请的目的在于提出一种改进的信息搜索方法和装置,来解决以上背景技术部分提到的技术问题。
第一方面,本申请提供了一种信息搜索方法,所述方法包括:接收用户输入的搜索词;若预设的关键词表中不包含所述搜索词,则确定所述搜索词与所述关键词表中的各关键词在同一次搜索中出现的概率,其中,所述关键词表包括多个搜索对象以及与各搜索对象相关联的至少一个关键词;当所述概率大于预设阈值时,获取与该概率对应的关键词;将与所述关键词相关联的搜索对象和/或该搜索对象的从属模块发送给所述用户。
在一些实施例中,所述方法还包括:若所述预设的关键词表中包含所述搜索词,则将与所述搜索词匹配的关键词相关联的搜索对象和/或搜索对象的从属模块发送给所述用户。
在一些实施例中,所述方法还包括:将所述搜索对象与该搜索对象的从属模块相关联。
在一些实施例中,所述方法还包括:通过如下步骤获得所述预设的关键词表:获取各所述搜索对象的至少一个描述信息;从所述描述信息中提取至少一个关键词;将所述搜索对象和从该搜索对象的描述信息中提取的所述关键词相关联,生成所述预设的关键词表。
在一些实施例中,所述确定所述搜索词与各所述关键词在同一次搜索中出现的概率,包括:从搜索日志中获取所述搜索词出现的次数;从搜索日志中获取所述搜索词与所述关键词表中的各关键词在同一次搜索中出现的次数;将所述搜索词与所述关键词表中的各关键词在同一次搜索中出现的次数和所述搜索词出现的次数相除,确定所述搜索词与各所述关键词在同一次搜索中出现的概率。
第二方面,本申请提供了一种信息搜索装置,所述装置包括:接收单元,配置用于接收用户输入的搜索词;概率确定单元,配置用于若预设的关键词表中不包含所述搜索词,则确定所述搜索词与所述关键词表中的各关键词在同一次搜索中出现的概率,其中,所述关键词表包括多个搜索对象以及与各搜索对象相关联的至少一个关键词;获取单元,配置用于当所述概率大于预设阈值时,获取与该概率对应的关键词;第一发送单元,配置用于将与所述关键词相关联的搜索对象和/或该搜索对象的从属模块发送给所述用户。
在一些实施例中,所述装置还包括:第二发送单元,配置用于若所述预设的关键词表中包含所述搜索词,则将与所述搜索词匹配的关键词相关联的搜索对象和/或搜索对象的从属模块发送给所述用户。
在一些实施例中,所述装置还包括:关联单元,配置用于将所述搜索对象与该搜索对象的从属模块相关联。
在一些实施例中,所述装置还包括:关键词表获得单元,配置用于通过如下步骤获得所述预设的关键词表,所述步骤包括:获取各所述搜索对象的至少一个描述信息;从所述描述信息中提取至少一个关键词;将所述搜索对象和从该搜索对象的描述信息中提取的所述关键词相关联,生成所述预设的关键词表。
在一些实施例中,所述概率确定单元配置还用于:从搜索日志中获取所述搜索词出现的次数;从搜索日志中获取所述搜索词与所述关键词表中的各关键词在同一次搜索中出现的次数;将所述搜索词与所述关键词表中的各关键词在同一次搜索中出现的次数和所述搜索词出现的次数相除,确定所述搜索词与各所述关键词在同一次搜索中出现的概率。
本申请提供的信息搜索方法和装置,通过确定预设的关键词表中不存在用户输入的搜索词,之后确定搜索词与关键词表中的各关键词在同一次搜索中出现的概率,如果存在概率大于预设阈值,则获取该概率对应的关键词,最后将与该关键词相关联的搜索对象和/或搜索对象的从属模块发送给所述用户,从而使得搜索词在没有命中搜索对象的关键词的情况下也可以准确的搜索到搜索对象和/或该搜索对象的从属模块,提高了信息搜索的准确率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性***架构图;
图2是根据本申请的信息搜索方法的一个实施例的流程图;
图3是根据本申请的信息搜索方法的一个应用场景的示意图;
图4是根据本申请的信息搜索方法的又一个实施例的流程图;
图5是根据本申请的信息搜索装置的一个实施例的结构示意图;
图6是适于用来实现本申请实施例的终端设备或服务器的计算机***的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的信息搜索方法或信息搜索装置的实施例的示例性***架构100。
如图1所示,***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如搜索类应用、网页浏览器应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上的搜索类应用、网页浏览器应用等提供支持的后台服务器。服务器可以对接收到的数据进行存储、分析等处理,并将处理结果反馈给终端设备。
需要说明的是,本申请实施例所提供的信息搜索方法一般可以由服务器105执行,相应地,信息搜索装置一般设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的信息搜索方法的一个实施例的流程200。所述的信息搜索方法,包括以下步骤:
步骤201,接收用户输入的搜索词。
在本实施例中,信息搜索方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式从用户利用其进行信息搜索的终端接收输入的搜索词。这里的搜索词与用户期望得到的搜索对象相关,用于搜索用户需要的信息。需要指出的是,上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。
在一些应用场景中,用户可以利用终端上安装的搜索引擎来搜索信息,这时,用户可以通过在搜索引擎的搜索框内直接输入与目标信息相关的搜索词,向本实施例的信息搜索方法运行其上的电子设备发起信息搜索的请求。通常,网络中的新闻、图片、论文、视频等已经做过分类处理,分为新闻类、图片类、学术论文类等,而搜索引擎可以根据输入的搜索词判断出该词所属的类别,这可以进一步的缩小信息搜索的范围,提高信息搜索的准确率。
步骤202,若预设的关键词表中不包含搜索词,则确定搜索词与关键词表中的各关键词在同一次搜索中出现的概率。
在本实施例中,信息搜索方法运行其上的电子设备(例如图1所示的服务器)可以预先存储多个搜索对象以及与各搜索对象相关联的至少一个关键词,并根据其生成关键词表。而后基于步骤201中得到的搜索词,上述电子设备可以首先判断上述关键词表中是否包含该搜索词,如果在上述的关键词表中不包含搜索词,则可以进一步地确定该搜索词与上述关键词表中的各关键词在同一次搜索中出现的概率。这里的关键词表至少可以包括多个搜索对象以及与各搜索对象相关联的至少一个关键词,搜索对象可以包括新闻、视频、图片等。
通常,用户在进行信息搜索时前后会输入不同的搜索词搜索相关的信息,以期望找到准确的信息,因此在同一次搜索中输入的搜索词之间通常会有较高的关联性,用于搜索同一搜索对象。因此,如果从搜索日志获得上述搜索词和关键词搜索在同一次搜索中出现的概率大于阈值,则可以认为该关键词对应的搜索对象和/或搜索对象的从属模块即是用户期望通过搜索词获取的信息内容。
步骤203,当搜索词与上述关键词表中的各关键词在同一次搜索中出现的概率大于预设阈值时,获取与该概率对应的关键词。
在本实施例中,信息搜索方法运行其上的电子设备获取步骤202确定的搜索词与上述关键词表中的各关键词在同一次搜索中出现的概率,之后判断上述概率是否大于预设的阈值。若存在搜索词与上述关键词表中的一个关键词在同一次搜索中出现的概率大于预设的阈值,即该搜索词与该关键词经常在同一次搜索中出现,这可以说明该搜索词和该关键词适用于搜索同一个搜索对象,此时可以获取上述概率对应的关键词。
步骤204,将与关键词相关联的搜索对象和/或该搜索对象的从属模块发送给用户。
在本实施例中,基于步骤204获取的关键词,本实施例的信息搜索方法运行其上的电子设备可以获取与该关键词相关联的搜索对象或者搜索对象以及该搜索对象的从属模块。这里,可以将搜索对象作为主模块,而与该搜索对象相关的其它功能模块作为从属模块。例如,搜索对象可以为热点新闻,这时的新闻主体可以认为是主模块,而该新闻的相关评论功能模块等则可以认为是该新闻的从属模块。再例如,搜索对象可以为视频,这时的视频主体可以认为是主模块,而该视频的相关弹幕功能模块则可以认为是该视频的从属模块。
继续参见图3,图3是根据本实施例的信息搜索方法的应用场景的一个示意图。在图3的应用场景中,用户首先在搜索引擎的搜索框中输入一个搜索词如“滨海新区***事故”,如图3所示,用于搜索“天津滨海新区塘沽***事件”的热点新闻;之后服务器可以获取上述搜索词,再将其与预先设置的关键词表相匹配,如果针对上述热点新闻,关键词表中存储的关键词为“天津***事件”和“塘沽***事件”,显然上述搜索词“滨海新区***事故”不在关键词表中。因此需要进一步地确定搜索词“滨海新区***事故”与“天津***事件”和“塘沽***事件”在同一次搜索中出现的概率;若发现“滨海新区***事故”与“天津***事件”同一次搜索中出现的概率大于预设的阈值,则可以确定搜索词“滨海新区***事故”与关键词“天津***事件”可以用于搜索同一热点新闻,上述服务器可以获取关键词“天津***事件”,并发送相关搜索结果,用户点击搜索页面中的“信息1”,后台服务器可以将上述热点新闻和该热点新闻从属的评论功能模块发送给用户,如图3所示。
本申请的上述实施例提供的方法,在搜索词不能命中关键词时,确定搜索词与关键词表中的各关键词在同一次搜索中出现的概率,若存在概率大于预设阈值,则获取该概率对应的关键词,而后将与该关键词相关联的搜索对象和/或搜索对象的从属模块发送给上述用户,从而使得搜索词在没有命中搜索对象的关键词时也可以准确地搜索到搜索对象和/或该搜索对象的从属模块,提高了信息搜索的准确率。
进一步参考图4,其示出了信息搜索方法的又一个实施例的流程400。该信息搜索方法的流程400,包括以下步骤:
步骤401,接收用户输入的搜索词。
在本实施例中,信息搜索方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式从用户利用其进行信息搜索的终端接收输入的搜索词。这里的搜索词与目标信息相关,用于搜索用户需要的目标信息。
步骤402,生成预设的关键词表。
在本实施例中,信息搜索方法运行其上的电子设备可以预先从网络等获取各搜索对象的至少一个描述信息,之后通过各种手段从上述获取的搜索对象的描述信息中提取该搜索对象的至少一个关键词,而后以将上述搜索对象和各搜索对象的描述信息中提取到的关键词相关联,最后生成上述预设的关键词表。
在本实施例的一些可选的实现方式中,可以对上述获取的搜索对象的描述信息进行分析,从而提取出一个或多个关键词。这里,对上述搜索对象的描述信息的分析方式可以是统计分析方式。例如,可以对上述内容中存在的各个词语的出现频率进行统计和排序,之后,再选取出现频率排序靠前的一个或多个词语作为待提取的关键词。本领域技术人员可以理解的是,还可以综合采用统计分析和语义分析相结合的方式来提取关键词。
步骤403,判断预设的关键词表中是否包含搜索词。
在本实施例中,基于步骤401和步骤402获取的搜索词和各搜索对象的关键词表,本实施例的信息搜索方法运行其上的电子设备可以判断在上述关键词表中是否包含该搜索词,如果上述关键词表中包含上述搜索词,则转到步骤404;如果上述关键词表中不包含上述搜索词,则转到步骤405。这里的关键词表至少可以包括多个搜索对象以及与各搜索对象相关联的至少一个关键词,其中,搜索对象可以包括新闻、视频、图片等。
步骤404,将与搜索词相关联的搜索对象和/或搜索对象的从属模块发送给用户。
在本实施例中,基于步骤403确定的上述关键词表中包含搜索词,本实施例的信息搜索方法运行其上的电子设备可以将与该搜索词相关联的搜索对象和/或该搜索对象的例如评论功能模块等从属模块发送给用户。以便于用户在了解例如新闻、视频等搜索对象的同时,还可以就搜索对象发表相关的评论等。
步骤405,从搜索日志中获取搜索词出现的次数。
在本实施例中,基于步骤403确定的上述关键词表中不包含搜索词,本实施例的信息搜索方法运行其上的电子设备可以从搜索日志中获取该搜索词出现的次数。例如,用户输入的搜索词为“滨海新区***事故”,上述电子设备可以从历史搜索日志中获取用户在搜索引擎中输入“滨海新区***事故”的总次数。
步骤406,从搜索日志中获取搜索词与关键词表中的各关键词在同一次搜索中出现的次数。
在本实施例中,信息搜索方法运行其上的电子设备可以从历史搜索日志中继续获取搜索词与关键词表中的各关键词在同一次搜索中出现的次数。这里,可以通过历史搜索日志获取不同用户的搜索记录,进而在所获取的搜索记录中确定搜索词与关键词表中的各关键词在同一次搜索中出现的次数,以计算搜索词与关键词表中的各关键词在同一次搜索中出现的频率。
步骤407,将搜索词与关键词表中的各关键词在同一次搜索中出现的次数和搜索词出现的次数相除,确定搜索词与各关键词在同一次搜索中出现的概率。
在本实施例中,基于步骤405获取的搜索词出现的次数和步骤406中获取的搜索词与关键词表中的各关键词在同一次搜索中出现的次数,本实施例的信息搜索方法运行其上的电子设备可以将搜索词与关键词表中的各关键词在同一次搜索中出现的次数和搜索词出现的次数相除,计算获得搜索词与各关键词在同一次搜索中出现的概率。
步骤408,当搜索词与关键词表中的各关键词在同一次搜索中出现的概率大于预设阈值时,获取与该概率对应的关键词。
在本实施例中,基于步骤407获得的搜索词与各关键词在同一次搜索中出现的概率,本实施例的信息搜索方法运行其上的电子设备可以获取大于预设阈值的概率对应的关键词。需要说明的是,这里的预设阈值可以根据需求进行人为设定,或者还可以不设置阈值,而直接获取最大概率对应的关键词。
步骤409,将与关键词相关联的搜索对象和/或该搜索对象的从属模块发送给用户。
在本实施例中,基于步骤408确定的与搜索词在同一次搜索中出现的概率大于预设阈值的关键词,本实施例的信息搜索方法运行其上的电子设备可以将与该关键词相关联的搜索对象和/或该搜索对象的例如评论功能模块等从属模块发送给用户。以便于用户在了解例如新闻、视频等搜索对象的同时,还可以就搜索对象发表相关的评论等。
从图4可以看出,与图2对应的实施例相比,本实施例提供的信息检索流程400突出了确定搜索词与各关键词在同一次检索中出现的概率的步骤,之后通过确定搜索词与关键词在同一搜索中出现的概率大于阈值,可以获取目标搜索对象,提高了信息搜索的准确率;并且该实施例可以不用将搜索词人工配置到关键词表,也可以搜索到目标搜索对象,提高了信息搜索的响应速度。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种信息搜索装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例所述的信息搜索装置500包括:接收单元501、概率确定单元502、获取单元503和第一发送单元504。其中,接收单元501配置用于接收用户输入的搜索词;概率确定单元502配置用于若预设的关键词表中不包含上述搜索词,则确定该搜索词与上述关键词表中的各关键词在同一次搜索中出现的概率,其中,关键词表包括多个搜索对象以及与各搜索对象相关联的至少一个关键词;获取单元503配置用于当上述概率大于预设阈值时,获取与该概率对应的关键词;第一发送单元504配置用于将与上述关键词相关联的搜索对象和/或该搜索对象的从属模块发送给上述用户。
在本实施例中,信息搜索装置500的接收单元501可以通过有线连接方式或者无线连接方式从用户利用其进行信息搜索的终端接收输入的搜索词。
在本实施例中,基于接收单元501得到的搜索词,上述概率确定单元502可以首先判断预设的关键词表中是否包含上述搜索词;在确定关键词表中不包含该搜索词之后再利用各种分析手段计算搜索词与关键词表中的各关键词在同一次搜索中出现的概率;而后获取单元503基于搜索词与关键词在同一次搜索中出现的概率大于预设阈值,获取上述关键词;最后第一发送单元504将与上述关键词相关联的搜索对象和/或该搜索对象的从属模块发送给上述用户。
在本实施例的一些可选的实现方式中,上述信息搜索装置500还可以包括:第二发送单元(未示出),配置用于若预设的关键词表中包含上述搜索词,则将与该搜索词匹配的关键词相关联的搜索对象和/或搜索对象的从属模块发送给上述用户。
在本实施例的一些可选的实现方式中,上述信息搜索装置500还可以包括:关联单元(未示出),配置用于将搜索对象与该搜索对象的从属模块相关联。
在本实施例的一些可选的实现方式中,上述信息搜索装置500还可以包括:关键词表获得单元(未示出),配置用于通过如下步骤获得预设的关键词表,上述步骤包括:获取各上述搜索对象的至少一个描述信息;从上述描述信息中提取至少一个关键词;将搜索对象和从该搜索对象的描述信息中提取的关键词相关联,生成上述预设的关键词表。
在本实施例的一些可选的实现方式中,上述概率确定单元502配置还用于:从搜索日志中获取上述搜索词出现的次数;从搜索日志中获取上述搜索词与关键词表中的各关键词在同一次搜索中出现的次数;将上述搜索词与关键词表中的各关键词在同一次搜索中出现的次数和搜索词出现的次数相除,确定上述搜索词与各关键词在同一次搜索中出现的概率。
本领域技术人员可以理解,上述信息搜索装置500还包括一些其他公知结构,例如处理器、存储器等,为了不必要地模糊本公开的实施例,这些公知的结构在图5中未示出。
下面参考图6,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机***600的结构示意图。
如图6所示,计算机***600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有***600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
附图中的流程图和框图,图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括接收单元、概率确定单元、获取单元和第一发送单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,接收单元还可以被描述为“接收用户输入的搜索词的单元”。
作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:接收用户输入的搜索词;若预设的关键词表中不包含所述搜索词,则确定所述搜索词与所述关键词表中的各关键词在同一次搜索中出现的概率,其中,所述关键词表包括多个搜索对象以及与各搜索对象相关联的至少一个关键词;当所述概率大于预设阈值时,获取与该概率对应的关键词;将与所述关键词相关联的搜索对象和/或该搜索对象的从属模块发送给所述用户。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种信息搜索方法,其特征在于,所述方法包括:
接收用户输入的搜索词;
若预设的关键词表中不包含所述搜索词,则从搜索日志中确定所述搜索词与所述关键词表中的各关键词作为不同的搜索词在同一次搜索中出现的概率,其中,所述关键词表包括多个搜索对象以及与各搜索对象相关联的至少一个关键词;
当所述概率大于预设阈值时,获取与该概率对应的关键词;
将与所述关键词相关联的搜索对象和/或该搜索对象的从属模块发送给所述用户。
2.根据权利要求1所述的信息搜索方法,其特征在于,所述方法还包括:
若所述预设的关键词表中包含所述搜索词,则将与所述搜索词匹配的关键词相关联的搜索对象和/或搜索对象的从属模块发送给所述用户。
3.根据权利要求2所述的信息搜索方法,其特征在于,所述方法还包括:
将所述搜索对象与该搜索对象的从属模块相关联。
4.根据权利要求1-3之一所述的信息搜索方法,其特征在于,所述方法还包括:
通过如下步骤获得所述预设的关键词表:
获取各所述搜索对象的至少一个描述信息;
从所述描述信息中提取至少一个关键词;
将所述搜索对象和从该搜索对象的描述信息中提取的所述关键词相关联,生成所述预设的关键词表。
5.根据权利要求4所述的信息搜索方法,其特征在于,所述确定所述搜索词与各所述关键词在同一次搜索中出现的概率,包括:
从搜索日志中获取所述搜索词出现的次数;
从搜索日志中获取所述搜索词与所述关键词表中的各关键词在同一次搜索中出现的次数;
将所述搜索词与所述关键词表中的各关键词在同一次搜索中出现的次数和所述搜索词出现的次数相除,确定所述搜索词与各所述关键词在同一次搜索中出现的概率。
6.一种信息搜索装置,其特征在于,包括:
接收单元,配置用于接收用户输入的搜索词;
概率确定单元,配置用于若预设的关键词表中不包含所述搜索词,则从搜索日志中确定所述搜索词与所述关键词表中的各关键词作为不同的搜索词在同一次搜索中出现的概率,其中,所述关键词表包括多个搜索对象以及与各搜索对象相关联的至少一个关键词;
获取单元,配置用于当所述概率大于预设阈值时,获取与该概率对应的关键词;
第一发送单元,配置用于将与所述关键词相关联的搜索对象和/或该搜索对象的从属模块发送给所述用户。
7.根据权利要求6所述的信息搜索装置,其特征在于,所述装置还包括:
第二发送单元,配置用于若所述预设的关键词表中包含所述搜索词,则将与所述搜索词匹配的关键词相关联的搜索对象和/或搜索对象的从属模块发送给所述用户。
8.根据权利要求7所述的信息搜索装置,其特征在于,所述装置还包括:
关联单元,配置用于将所述搜索对象与该搜索对象的从属模块相关联。
9.根据权利要求6-8之一所述的信息搜索装置,其特征在于,所述装置还包括:
关键词表获得单元,配置用于通过如下步骤获得所述预设的关键词表,所述步骤包括:
获取各所述搜索对象的至少一个描述信息;
从所述描述信息中提取至少一个关键词;
将所述搜索对象和从该搜索对象的描述信息中提取的所述关键词相关联,生成所述预设的关键词表。
10.根据权利要求9所述的信息搜索装置,其特征在于,所述概率确定单元配置还用于:
从搜索日志中获取所述搜索词出现的次数;
从搜索日志中获取所述搜索词与所述关键词表中的各关键词在同一次搜索中出现的次数;
将所述搜索词与所述关键词表中的各关键词在同一次搜索中出现的次数和所述搜索词出现的次数相除,确定所述搜索词与各所述关键词在同一次搜索中出现的概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610244776.7A CN105955988B (zh) | 2016-04-19 | 2016-04-19 | 信息搜索方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610244776.7A CN105955988B (zh) | 2016-04-19 | 2016-04-19 | 信息搜索方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105955988A CN105955988A (zh) | 2016-09-21 |
CN105955988B true CN105955988B (zh) | 2020-05-08 |
Family
ID=56917641
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610244776.7A Active CN105955988B (zh) | 2016-04-19 | 2016-04-19 | 信息搜索方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105955988B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106921749A (zh) * | 2017-03-31 | 2017-07-04 | 北京京东尚科信息技术有限公司 | 用于推送信息的方法和装置 |
CN107330672B (zh) * | 2017-07-03 | 2021-02-26 | 北京拉勾科技有限公司 | 一种基于相似度的信息处理方法、装置及计算设备 |
CN114138798B (zh) * | 2022-01-29 | 2022-05-10 | 阿里巴巴达摩院(杭州)科技有限公司 | 查询结果命中概率估计***、方法、电子设备及介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009031931A (ja) * | 2007-07-25 | 2009-02-12 | Univ Waseda | 検索語クラスタリング装置、検索語クラスタリング方法、検索語クラスタリングプログラム及び記録媒体 |
CN102930054A (zh) * | 2012-11-19 | 2013-02-13 | 北京奇虎科技有限公司 | 数据搜索方法及*** |
CN103279486B (zh) * | 2013-04-24 | 2019-03-08 | 百度在线网络技术(北京)有限公司 | 一种提供相关搜索的方法和装置 |
CN104933081B (zh) * | 2014-03-21 | 2018-06-29 | 阿里巴巴集团控股有限公司 | 一种搜索建议提供方法及装置 |
CN104933183B (zh) * | 2015-07-03 | 2018-02-06 | 重庆邮电大学 | 一种融合词向量模型和朴素贝叶斯的查询词改写方法 |
CN105354259A (zh) * | 2015-10-22 | 2016-02-24 | 百度在线网络技术(北京)有限公司 | 移动搜索方法和装置 |
-
2016
- 2016-04-19 CN CN201610244776.7A patent/CN105955988B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN105955988A (zh) | 2016-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107679211B (zh) | 用于推送信息的方法和装置 | |
US10783206B2 (en) | Method and system for recommending text content, and storage medium | |
US11797620B2 (en) | Expert detection in social networks | |
US11036744B2 (en) | Personalization of news articles based on news sources | |
US11238058B2 (en) | Search and retrieval of structured information cards | |
US9235653B2 (en) | Discovering entity actions for an entity graph | |
CN110069698B (zh) | 信息推送方法和装置 | |
CN108572990B (zh) | 信息推送方法和装置 | |
US20150347594A1 (en) | Multi-domain search on a computing device | |
US20140095308A1 (en) | Advertisement distribution apparatus and advertisement distribution method | |
CN106959976B (zh) | 一种搜索处理方法以及装置 | |
US11423096B2 (en) | Method and apparatus for outputting information | |
JP2019145093A (ja) | 情報を生成するための方法及び装置 | |
CN106878041B (zh) | 日志信息处理方法、装置及*** | |
CN107977379B (zh) | 用于挖掘信息的方法和装置 | |
CN113806588B (zh) | 搜索视频的方法和装置 | |
CN105955988B (zh) | 信息搜索方法和装置 | |
US20150052126A1 (en) | Method and system for recommending relevant web content to second screen application users | |
CN110750707A (zh) | 关键词推荐方法、装置和电子设备 | |
CN110750708A (zh) | 关键词推荐方法、装置和电子设备 | |
CN110245357B (zh) | 主实体识别方法和装置 | |
CN112182390A (zh) | 一种函件推送方法、装置、计算机设备及存储介质 | |
CN117421389A (zh) | 一种基于智能模型的技术趋势确定方法及*** | |
WO2016155384A1 (zh) | 一种搜索优化方法、装置和*** | |
CN108363707B (zh) | 用于生成网页的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |