CN1983255A - 一种互联网搜索方法 - Google Patents
一种互联网搜索方法 Download PDFInfo
- Publication number
- CN1983255A CN1983255A CNA2006100119162A CN200610011916A CN1983255A CN 1983255 A CN1983255 A CN 1983255A CN A2006100119162 A CNA2006100119162 A CN A2006100119162A CN 200610011916 A CN200610011916 A CN 200610011916A CN 1983255 A CN1983255 A CN 1983255A
- Authority
- CN
- China
- Prior art keywords
- classification
- search
- information
- drop
- down list
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种互联网搜索方法,包括:对互联网信息进行树状分类,并在数据库中为分类树中的每一层分类建立关系表;为每个分类建立一个或多个关键词,并设定每个关键词的各项属性,建立关键词库;为信息建立栏目;对互联网上的站点进行分析,使网站中的网页与分类以及栏目进行关联,建立网页映射库;获取网页的内容,根据网页中每条信息的标题、内容及所处环境、分类关键词库、网页映射库,确定每条信息的分类归属,栏目归属,发生时间及所在地;把每一条搜索结果与结果数据库中现有的结果进行比较,若该结果是新的,则把它加入结果数据库;展示用户搜索的结果。本发明使得搜索结果更准确,更全面,更人性化。
Description
技术领域
本发明涉及一种互联网搜索的方法,特别涉及一种模拟人类思维,充分考虑了世间万物之间的关系,词与词之间的关系,以及信息发生的环境,从而使搜索结果更准确,更全面,更人性化的互联网搜索方法。
背景技术
互联网发展日新月异,网上信息***性增长,搜索引擎成了人们从信息海洋中检索信息的最佳工具,Google、百度等搜索引擎成了其中出色代表。但是,这些搜索引擎都存在着以下一些突出的缺点:
1、仅凭搜索关键词来检索信息,没有考虑词与词之间的关系,没有考虑信息发生的环境,从而搜索结果的准确率很低,存在着大量无效冗余信息。
2、没有考虑到信息之间的包容关系,搜索结果不全面。
3、没有充分考虑时间性,不能让客户在第一时间看到最新的信息。
4、没有对信息进行分类,从而不具有信息分类导航功能,不能让用户按信息层次来查询信息。
5、没有对信息进行分类,从而不具备用户自定义分类搜索能力,不能让用户自定义搜索首页,不能让用户一打开浏览器就能自己最感兴趣的信息。
6、搜索结果笼统,检索时没有考虑到搜索词所代表的信息主体的特性,从而不能让用户从信息主体的各个侧面来进行全面了解。
发明内容
本发明的目的是克服现有搜索方法搜索准确率低、存在着大量无效冗余信息、不全面、用户查询信息不方便的缺陷,提供一种更准确、更全面、无效信息更少、用户查询更方便的互联网搜索方法。
为了实现上述目的,本发明提供了一种互联网搜索方法,具体包括以下步骤:
1)、对互联网信息进行树状分类,并在数据库中为分类树中的每一层分类建立关系表;
2)、为步骤1)得到的每个分类建立一个或多个关键词,并设定每个关键词的各项属性,从而建立关键词库;
3)、按信息的特性为信息建立栏目;
4)、对互联网上的站点进行分析,使网站中的网页与步骤1)中所得到的相应分类以及步骤3)中所得到的栏目进行关联,从而建立网页映射库;
5)、获取网页的内容,根据网页中每条信息的标题、内容及所处的环境,配合步骤2)得到的分类关键词库、步骤4)得到的网页映射库,确定每条信息的分类归属关系,栏目归属关系,发生时间以及所在地;
6)、把步骤5)得到的每一条搜索结果与结果数据库中现有的结果进行比较,若该结果是新的,则把它加入结果数据库;
7)、展示用户搜索的结果。
上述技术方案中,在所述的步骤1)中,在对所述的互联网信息进行树状分类时,范围最大的分类位于树的顶层,范围较小的分类处于范围较大分类的下一层,依次类推,分类树的最后一层为范围最小的分类。
上述技术方案中,在所述的步骤1)中,所述关系表包括分类的标识号、分类的名称、分类的地址和上层标识号,表与表之间通过标识号进行关联;所述的分类的地址为全局唯一。
上述技术方案中,在所述的步骤2)中,所述的关键词对应一个分类,关键词与分类间通过分类地址产生关联;所述的关键词的属性包括地名、别名。
上述技术方案中,在所述的步骤3)中,所述的栏目包括新闻、行情、评论、论坛、知识、音乐、影视、下载、报价、导购、供应、求购、二手、加工、招商、招标、词典、地图。
上述技术方案中,在所述的步骤7)中,当展示搜索的结果时,展示窗口分为左右两部分,左边部分用于导航页,右边部分作为用户搜索结果的结果展示页。
在所述的导航页上包括文本搜索框、分类导航目录、历史搜索记录下拉列表、自定义搜索下拉列表框和自定义首页;其中:
所述的文本搜索框可使用户在文本框中键入搜索关键词直接进行搜索;
所述的分类导航目录包括至少二个平行的下拉列表框,每个下拉列表对应***分类的一层,每个下拉列表前设置一个单选按钮,所述下拉列表按分类大小进行平行排列,每个下拉列表当前选定内容的改变都可引起下方下拉列表内容的改变,点击每层下拉列表前的单选按钮可设置当前从哪一层分类开始搜索及当前的搜索分类;
所述的历史搜索记录下拉列表记录用户的最近搜索分类;
所述的自定义搜索下拉列表框显示用户自定义的搜索分类;
所述的自定义首页功能,是把当前选定的分类名称或分类地址记录进用户端Cookie记录,并同时改写浏览器起始页地址,使用户一打开浏览器就看到自己最感兴趣的信息。
所述的结果展示页分为上下两部分,最上部分用来展示跟当前搜索相关的栏目列表,下方部分用来展示当前选定栏目的结果信息。
本发明的优点在于:
1、与现有的搜索引擎相比,采用本发明的搜索方法使得搜索结果的准确率大大提高,冗余信息大大减少。
2、本发明的搜索方法所展示信息是逻辑的包容性信息,不再是仅仅包容关键字的信息,因此搜索结果更全面。
3、本发明的搜索方法可让用户从搜索分类的各个侧面进行了解,从而能让用户更深入地了解事物。
4、采用本发明搜索方法,用户可以选用分类导航栏目来查看结果,不必每一次搜索都要用键盘键入搜索关键字。
5、用户可以把自己感兴趣的分类进行预先自定义,从而方便了将来的搜索。
6、用户可以把自己最感兴趣的分类信息定义为首页,以后打开浏览器就能看到自己最感兴趣的内容。
7、本发明的互联网搜索方法的时间性更强,用户第一时间看到的是最新信息。
附图说明
图1为实施例中树状分类的示意图;
图2为本发明的互联网搜索方法的流程图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步说明。
本发明的互联网搜索方法具体包括以下步骤:
步骤10、对互联网信息进行树状分类,并在数据库中为分类树中的每一层分类建立关系表。互联网上的信息种类繁多、数量庞大,对信息的分类有助于实现对信息的管理,从而方便对信息做进一步的检索。本步骤包括子步骤11和子步骤12。
步骤11、根据行业的标准和用户的习惯,对互联网信息进行树状分类,范围最大的分类位于树的顶层,范围较小的分类处于范围较大分类的下一层,依次类推,分类树的最后一层为范围最小的分类。
在一个实施例中,可将分类树的第一层分为“行业”、“科技”、“政治”、“军事”、“社会”、“财经”、“娱乐”、“旅游”、“教育文化”、“求职招聘”等,然后对第一层中的各个分类进行进一步划分,如将“行业”进一步划分为“机械”、“化工”、“IT”等,将“军事”进一步划分为“海军”、“陆军”、“空军”等,而“机械”、“化工”等第二层的类也可以进行进一步的划分。
为了说明的方便,在本实施例中,对信息所分的分类进行简化,假设分类树的第一层只包含“行业”和“军事”两类,在“行业”中包括“机械”和“IT”,在“军事”中只包含有“海军”和“陆军”,而第二层的类“IT”进一步包含第三层类“硬件”和“软件”,第三层类“硬件”还包含有第四层类“CPU”。对上述信息所包含的分类进行树状分类后,分类后的树如图1所示。应当说明,在本实施例中第三层和第四层只包含了很少的类,这种处理只是为了说明的方便,一般情况下,类在树中所占据的层次越低,则所包含类的数目应该越多。
步骤12、在数据库中为分类建立关系表,每一个表对应一层分类,表与表之间应用ID号进行关联。在添加分类的过程中,***为分类添加一个全局唯一的地址。
在本实施例中,如图1所示,信息分为三层,因此需要用四个表来表示。第一层的类如表1所示,第二层的类如表2所示,第三层的类如表3所示,第四层的类
如表4所示。图1中为每个分类标明了其分类的地址。
ID | 名称 | 地址 | 上层ID |
1 | 行业 | 1. | 0 |
2 | 军事 | 2. | 0 |
表1
ID | 名称 | 地址 | 上层ID |
1 | IT | 1.1 | 1 |
2 | 机械 | 1.2 | 1 |
3 | 陆军 | 2.1 | 2 |
4 | 海军 | 2.2 | 2 |
表2
ID | 名称 | 地址 | 上层ID |
1 | 硬件 | 1.1.1 | 1 |
2 | 软件 | 1.1.2 | 1 |
表3
ID | 名称 | 地址 | 上层ID |
1 | CPU | 1.1.1.1 | 1 |
表4
在上述表格中,每个表格都包含有四项属性,分别为ID、名称、地址和上层ID。其中的ID是由***自动进行分配的,名称表示了各个分类的名称,地址是分类在添加时由***自动生成的,该地址是全局唯一的。上层ID表示了当前分类与上层表中的哪一个分类相关联,在表1中,由于该表所表示的分类位于分类树的第一层,所以其上层ID这一项设为0。
步骤20、根据分类的信息,建立关键词库。根据信息分类,建立搜索关键词库,为每个分类建立一个或多个关键词,并设定每个关键词各项属性,从而使关键词与分类、关键词与关键词之间产生合理的逻辑关系。在建立关键词库的过程中,每个关键词在添加时都对应一个分类,关键词与分类间使用分类地址来产生关联。
在本实施例中,假设首先将关键词“IT”、“信息产业”添加到关键词库中,则添加后的项如表5所示。
ID | 名称 | 地址 | 地名 | 别名 |
1 | IT | 1.1 | 0 | 0 |
2 | 信息产业 | 1.1 | 0 | 1 |
表5
在上表中,关键词“IT”属于分类“IT”中,因此它的地址与表2中类IT的地址相同,而且关键词“IT”既不是地名,也不是类“IT”的别名,所以这两项都为假,用“0”来表示。关键词“信息产业”是关键词“IT”的中文译名,因此它也属于类“IT”中,它的地址与表2中类IT的地址相同。由于它是类“IT”的别名,所以属性别名为真,用“1”来表示。在实际使用中,关键词的属性不仅仅包含以上几种,还可以包括“人名”等,在本实施例中,为了说明的方便,不对其做进一步的说明。
步骤30、为信息建立栏目。根据互联网用户的习惯,还可以按照信息的特性来建立栏目。在一个实施例中,可建立如“新闻”、“行情”、“评论”、“论坛”、“知识”、“音乐”、“影视”、“下载”、“报价”、“导购”、“供应”、“求购”、“二手”、“加工”、“招商”、“招标”、“词典”、“地图”等栏目。所建立的栏目可以用一个表来表示,在表中,每添加一个栏目就可以自动产生一个ID号,利用该ID号可以在后续操作中对搜索结果进行栏目标识。
如表6所示,为本实施例中用于表示栏目的表。
ID | 名称 |
1 | 新闻 |
2 | 行情 |
3 | 评论 |
4 | 论坛 |
5 | 知识 |
6 | 音乐 |
7 | 影视 |
8 | 下载 |
9 | 报价 |
10 | 导购 |
11 | 供应 |
12 | 求购 |
13 | 二手 |
14 | 加工 |
15 | 招商 |
16 | 招标 |
17 | 词典 |
18 | 地图 |
表6
步骤40、建立网页映射库。
步骤41、建立一个网站数据表,维护人员把各个站点加入其中,表中包含域名和站点名等字段。
步骤42、维护人员分析各个网站,把相关的网页记录下来,并把它们与前述步骤中的分类与栏目进行关联。
在本实施例中,假如维护人员从一个论坛上找到一个关于IT信息的网页,则在数据库中对该网页的记录如下:
ID | 分类地址 | 栏目 | 网页地址 |
1 | 1.1 | 4 | http://www.it.com.cn/forum |
表7
步骤50、获取网页的内容,根据网页中每条信息的标题、内容及所处的环境,配合分类关键词库、网页映射库,确定每条信息的分类归属关系,栏目归属关系,发生时间以及所在地等。比如,在该网页中寻找到以下条信息:
标题为“供应英特尔CPU”,则可以确定它是属于“CPU”这个分类,用分类地址1.1.1.1标识。如果标题的信息不足以准确判定它的归属,进一步分析内容。以分类地址对其进行标识。
开发识别地名子程序,从每条信息的内容中检索出信息所在地,如果没有,则把数据库中相应字段设置为空。假设“供应英特尔CPU”的信 息来源于上海,则本条信息所在地就为上海。
开发识别时间子程序,从每条信息的内容中检索出时间。假设“供应英特尔CPU”的信息的发布时间为2006年4月1日,则检索出的时间即为2006年4月1日。
将网页中的每条信息做处理后,与结果数据库中现有的信息进行比较,若信息为新的信息,则把新的信息加入结果数据库。
将“供应英特尔CPU”这一条目信息以表8的形式添加到结果数据库中。
ID | 分类地址 | 栏目 | 标题 | 链接地址 | 所在地 | 时间 |
1 | 1.1.1.1 | 11 | 供应英特尔CPU | http://mb.zol.com.cn/28/285855.html | 上海 | 2006-4-1 |
表8
步骤60、展示搜索的结果。
A.把展示窗口分为左右两部分,左边部分占窗口宽度的五分之一左右,用于导航页;右边部分作为用户搜索结果的展示页。
B.在导航页上依次建立以下搜索模块:
建立分类导航目录。设计几个平行的下拉列表框,每个列表框前加一个单选按钮。每个下拉列表对应***分类的一层,这些下拉列表按分类大小进行平行排列,每个下拉列表当前选定内容的改变都可引起下方几个下拉列表内容的改变。点击每层下拉列表前的单选按钮来设置当前从哪一层分类开始搜索,及当前的搜索分类。
建立历史搜索记录下拉列表框。程序应用用户端Cookie记录来记录用户的后几次搜索,以后用户每次打开导航页时程序都会自动从用户端Cookie记录中读取相应记录加入下拉列表。
建立自定义搜索下拉列表框。开发自定义搜索网页,网页中设计多个文本框。用户可以在这些文本框中键入自己感兴趣的分类,程序把这些分 类记入用户端Cookie记录。以后用户每次打开导航页程序都会自动从用户端Cookie记录读取相应记录加入该下拉列表。
建立自定义首页功能。在搜索文本框与分类导航目录下的提交按钮旁分别加一个“定义首页”链接按钮,用户点击该按钮后,程序自动把当前的分类信息记录进用户端Cookie记录,并同时改写浏览器起始页地址,将来用户一打开浏览器就可以看到自己最感兴趣的信息,从而为他带来了极大的便利。
C.把结果展示页分为上下两部分,最上部分用来展示跟当前搜索相关的栏目列表,下方部分用来展示当前选定栏目的结果信息。
用户提交搜索后,程序根据用户提交内容,配合语法,配合分类关键词库,确定用户的当前搜索与哪个分类相关,进一步分析在哪些栏目中存在与本次搜索相关的信息,把这些有结果的栏目依次排列,并在下方展示第一个栏目的内容。
Claims (8)
1、一种互联网搜索方法,包括以下步骤:
1)、对互联网信息进行树状分类,并在数据库中为分类树中的每一层分类建立关系表;
2)、为步骤1)得到的每个分类建立一个或多个关键词,并设定每个关键词的各项属性,从而建立关键词库;
3)、按信息的特性为信息建立栏目;
4)、对互联网上的站点进行分析,使网站中的网页与步骤1)中所得到的相应分类以及步骤3)中所得到的栏目进行关联,从而建立网页映射库;
5)、获取网页的内容,根据网页中每条信息的标题、内容及所处的环境,配合步骤2)得到的分类关键词库、步骤4)得到的网页映射库,确定每条信息的分类归属关系,栏目归属关系,发生时间以及所在地;
6)、把步骤5)得到的每一条搜索结果与结果数据库中现有的结果进行比较,若该结果是新的,则把它加入结果数据库;
7)、展示用户搜索的结果。
2、根据权利要求1所述的互联网搜索方法,其特征在于,在所述的步骤1)中,在对所述的互联网信息进行树状分类时,范围最大的分类位于树的顶层,范围较小的分类处于范围较大分类的下一层,依次类推,分类树的最后一层为范围最小的分类。
3、根据权利要求1所述的互联网搜索方法,其特征在于,在所述的步骤1)中,所述关系表包括分类的标识号、分类的名称、分类的地址和上层标识号,表与表之间通过标识号进行关联;所述的分类的地址为全局唯一。
4、根据权利要求3所述的互联网搜索方法,其特征在于,在所述的步骤2)中,所述的关键词对应一个分类,关键词与分类间通过分类的地址产生关联;所述的关键词的属性包括地名、别名。
5、根据权利要求1所述的互联网搜索方法,其特征在于,在所述的步骤3)中,所述的栏目包括新闻、行情、评论、论坛、知识、音乐、影视、下载、报价、导购、供应、求购、二手、加工、招商、招标、词典、地图。
6、根据权利要求1所述的互联网搜索方法,其特征在于,在所述的步骤7)中,当展示搜索的结果时,展示窗口分为左右两部分,左边部分用于导航页,右边部分作为用户搜索结果的结果展示页。
7、根据权利要求6所述的互联网搜索方法,其特征在于,在所述的导航页上包括文本搜索框、分类导航目录、历史搜索记录下拉列表、自定义搜索下拉列表框和自定义首页;其中:
所述的文本搜索框可使用户在文本框中键入搜索关键词直接进行搜索;
所述的分类导航目录包括至少二个平行的下拉列表框,每个下拉列表对应***分类的一层,每个下拉列表前设置一个单选按钮,所述下拉列表按分类大小进行平行排列,每个下拉列表当前选定内容的改变都可引起下方下拉列表内容的改变,点击每层下拉列表前的单选按钮可设置当前从哪一层分类开始搜索及当前的搜索分类;
所述的历史搜索记录下拉列表记录用户的最近搜索分类;
所述的自定义搜索下拉列表框显示用户自定义的搜索分类;
所述的自定义首页功能,是把当前选定的分类名称或分类地址记录进用户端Cookie记录,并同时改写浏览器起始页地址,使用户一打开浏览器就看到自己最感兴趣的信息。
8、根据权利要求6所述的互联网搜索方法,其特征在于,所述的搜索结果展示页分为上下两部分,最上部分用来展示跟当前搜索相关的栏目列表,下方部分用来展示当前选定栏目的结果信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2006100119162A CN1983255A (zh) | 2006-05-17 | 2006-05-17 | 一种互联网搜索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2006100119162A CN1983255A (zh) | 2006-05-17 | 2006-05-17 | 一种互联网搜索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1983255A true CN1983255A (zh) | 2007-06-20 |
Family
ID=38165795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2006100119162A Pending CN1983255A (zh) | 2006-05-17 | 2006-05-17 | 一种互联网搜索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1983255A (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101930477A (zh) * | 2010-09-17 | 2010-12-29 | 无锡诺宝科技发展有限公司 | 基于标准三层分类的网页信息挖掘方法 |
CN101950291A (zh) * | 2010-07-14 | 2011-01-19 | 张康德 | 一种数据库的搜索引擎方法 |
CN102073684A (zh) * | 2010-12-22 | 2011-05-25 | 百度在线网络技术(北京)有限公司 | 搜索日志的挖掘方法和装置以及页面搜索的方法和装置 |
CN102332025A (zh) * | 2011-09-29 | 2012-01-25 | 奇智软件(北京)有限公司 | 一种智能垂直搜索方法和*** |
CN101404009B (zh) * | 2008-10-31 | 2012-01-25 | 金蝶软件(中国)有限公司 | 一种数据分类过滤方法、***及设备 |
CN102339311A (zh) * | 2011-09-19 | 2012-02-01 | 百度在线网络技术(北京)有限公司 | 在用户设备上基于查询分类搜索网页内容的方法与设备 |
CN103314371A (zh) * | 2010-12-31 | 2013-09-18 | 肖岩 | 一种检索的方法和*** |
CN103631791A (zh) * | 2012-08-22 | 2014-03-12 | 腾讯科技(深圳)有限公司 | 信息聚合归类的显示方法及*** |
CN104063513A (zh) * | 2011-09-29 | 2014-09-24 | 北京奇虎科技有限公司 | 一种智能垂直搜索方法和*** |
CN104063514A (zh) * | 2011-09-29 | 2014-09-24 | 北京奇虎科技有限公司 | 垂直搜索方法 |
CN104391944A (zh) * | 2014-11-25 | 2015-03-04 | 中国民生银行股份有限公司 | 产品方案推送方法及装置 |
CN104615603A (zh) * | 2013-11-05 | 2015-05-13 | 北京四维图新科技股份有限公司 | 一种车载导航设备关键词库建立方法及装置 |
CN101876981B (zh) * | 2009-04-29 | 2015-09-23 | 阿里巴巴集团控股有限公司 | 一种构建知识库的方法及装置 |
CN105183828A (zh) * | 2015-08-28 | 2015-12-23 | 中国电信股份有限公司湖北号百信息服务分公司 | 一种商品链接导航***及其导航方法 |
CN105740289A (zh) * | 2014-12-11 | 2016-07-06 | 阿里巴巴集团控股有限公司 | 文本的归类方法及*** |
CN106682030A (zh) * | 2015-11-10 | 2017-05-17 | 阿里巴巴集团控股有限公司 | 信息处理方法及装置 |
CN106776654A (zh) * | 2015-11-24 | 2017-05-31 | 北京国双科技有限公司 | 一种数据搜索方法及装置 |
-
2006
- 2006-05-17 CN CNA2006100119162A patent/CN1983255A/zh active Pending
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101404009B (zh) * | 2008-10-31 | 2012-01-25 | 金蝶软件(中国)有限公司 | 一种数据分类过滤方法、***及设备 |
CN101876981B (zh) * | 2009-04-29 | 2015-09-23 | 阿里巴巴集团控股有限公司 | 一种构建知识库的方法及装置 |
CN101950291A (zh) * | 2010-07-14 | 2011-01-19 | 张康德 | 一种数据库的搜索引擎方法 |
CN101930477A (zh) * | 2010-09-17 | 2010-12-29 | 无锡诺宝科技发展有限公司 | 基于标准三层分类的网页信息挖掘方法 |
CN102073684A (zh) * | 2010-12-22 | 2011-05-25 | 百度在线网络技术(北京)有限公司 | 搜索日志的挖掘方法和装置以及页面搜索的方法和装置 |
CN102073684B (zh) * | 2010-12-22 | 2014-08-13 | 百度在线网络技术(北京)有限公司 | 搜索日志的挖掘方法、时效性需求识别的方法及对应装置 |
CN103314371A (zh) * | 2010-12-31 | 2013-09-18 | 肖岩 | 一种检索的方法和*** |
CN102339311B (zh) * | 2011-09-19 | 2014-09-24 | 百度在线网络技术(北京)有限公司 | 在用户设备上基于查询分类搜索网页内容的方法与设备 |
CN102339311A (zh) * | 2011-09-19 | 2012-02-01 | 百度在线网络技术(北京)有限公司 | 在用户设备上基于查询分类搜索网页内容的方法与设备 |
CN104063514A (zh) * | 2011-09-29 | 2014-09-24 | 北京奇虎科技有限公司 | 垂直搜索方法 |
CN102332025B (zh) * | 2011-09-29 | 2014-08-27 | 奇智软件(北京)有限公司 | 一种智能垂直搜索方法和*** |
CN102332025A (zh) * | 2011-09-29 | 2012-01-25 | 奇智软件(北京)有限公司 | 一种智能垂直搜索方法和*** |
CN104063513A (zh) * | 2011-09-29 | 2014-09-24 | 北京奇虎科技有限公司 | 一种智能垂直搜索方法和*** |
CN104063514B (zh) * | 2011-09-29 | 2018-06-01 | 北京奇虎科技有限公司 | 垂直搜索方法 |
CN103631791A (zh) * | 2012-08-22 | 2014-03-12 | 腾讯科技(深圳)有限公司 | 信息聚合归类的显示方法及*** |
CN103631791B (zh) * | 2012-08-22 | 2017-04-12 | 腾讯科技(深圳)有限公司 | 信息聚合归类的显示方法及*** |
CN104615603B (zh) * | 2013-11-05 | 2018-05-29 | 北京四维图新科技股份有限公司 | 一种车载导航设备关键词库建立方法及装置 |
CN104615603A (zh) * | 2013-11-05 | 2015-05-13 | 北京四维图新科技股份有限公司 | 一种车载导航设备关键词库建立方法及装置 |
CN104391944A (zh) * | 2014-11-25 | 2015-03-04 | 中国民生银行股份有限公司 | 产品方案推送方法及装置 |
CN105740289A (zh) * | 2014-12-11 | 2016-07-06 | 阿里巴巴集团控股有限公司 | 文本的归类方法及*** |
CN105183828A (zh) * | 2015-08-28 | 2015-12-23 | 中国电信股份有限公司湖北号百信息服务分公司 | 一种商品链接导航***及其导航方法 |
CN106682030A (zh) * | 2015-11-10 | 2017-05-17 | 阿里巴巴集团控股有限公司 | 信息处理方法及装置 |
CN106776654A (zh) * | 2015-11-24 | 2017-05-31 | 北京国双科技有限公司 | 一种数据搜索方法及装置 |
CN106776654B (zh) * | 2015-11-24 | 2021-01-22 | 北京国双科技有限公司 | 一种数据搜索方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1983255A (zh) | 一种互联网搜索方法 | |
US9317613B2 (en) | Large scale entity-specific resource classification | |
CN102053983B (zh) | 一种垂直搜索的查询方法、***和装置 | |
US8271495B1 (en) | System and method for automating categorization and aggregation of content from network sites | |
US20130060769A1 (en) | System and method for identifying social media interactions | |
WO2001063486A2 (en) | Method and system for extracting, analyzing, storing, comparing and reporting on data stored in web and/or other network repositories and apparatus to detect, prevent and obfuscate information removal from information servers | |
Dou et al. | Automatically mining facets for queries from their search results | |
CN108664637B (zh) | 一种检索方法及*** | |
EP2729886A1 (en) | Systems and methods for natural language searching of structured data | |
WO2011008848A2 (en) | Activity based users' interests modeling for determining content relevance | |
WO2006108069A2 (en) | Searching through content which is accessible through web-based forms | |
CN101655862A (zh) | 信息对象搜索的方法和装置 | |
CN105512180A (zh) | 一种搜索推荐方法及装置 | |
US20150161116A1 (en) | Searching based on audio and/or visual features of documents | |
CN103838798A (zh) | 页面分类***及页面分类方法 | |
CN114090861A (zh) | 一种基于知识图谱的教育领域搜索引擎构建方法 | |
CN112035723A (zh) | 资源库的确定方法和装置、存储介质及电子装置 | |
CN114090877A (zh) | 职位信息推荐方法、装置、电子设备及存储介质 | |
Ajoudanian et al. | Deep web content mining | |
Kowsher et al. | Banglalm: Data mining based bangla corpus for language model research | |
CN109948015B (zh) | 一种元搜索列表结果抽取方法及*** | |
Wanjari et al. | Automatic news extraction system for Indian online news papers | |
CN114238735A (zh) | 一种互联网数据智能采集方法 | |
Yamada et al. | Linkify: enhancing text reading experience by detecting and linking helpful entities to users | |
CN113468410A (zh) | 一种智能化对搜索结果和搜索引擎进行优化的*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |