CN102023991A - 在终端上更新索引并基于其对搜索结果排序的方法及装置 - Google Patents

在终端上更新索引并基于其对搜索结果排序的方法及装置 Download PDF

Info

Publication number
CN102023991A
CN102023991A CN2009101756759A CN200910175675A CN102023991A CN 102023991 A CN102023991 A CN 102023991A CN 2009101756759 A CN2009101756759 A CN 2009101756759A CN 200910175675 A CN200910175675 A CN 200910175675A CN 102023991 A CN102023991 A CN 102023991A
Authority
CN
China
Prior art keywords
file
index
search results
timestamp
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009101756759A
Other languages
English (en)
Inventor
白洛
纪中伟
李斌
翁儒复
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN2009101756759A priority Critical patent/CN102023991A/zh
Priority to US13/497,465 priority patent/US20120317105A1/en
Priority to EP10788971A priority patent/EP2482199A4/en
Priority to PCT/CN2010/074326 priority patent/WO2010145575A1/zh
Publication of CN102023991A publication Critical patent/CN102023991A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/328Management therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种在终端上更新索引并基于其对搜索结果排序的方法,包括以下步骤:检索文件是否有修改;当文件存在修改时,对新文件进行增量索引,生成新的索引文件,其中增量索引中包含对所述文件的历史选中次数;将生成的新的索引文件合并到原有的索引文件中;获取用户输入的关键字;查询与关键字有关的搜索结果,根据搜索结果与关键字之间的相关度以及所述文件的历史选中次数来对所述搜索结果进行排序并显示给用户,通过本发明,可以时时地自动更新手机本地索引表,占用较少手机资源和能源,搜索结果更加人性化,提高了移动终端用户的使用体验。

Description

在终端上更新索引并基于其对搜索结果排序的方法及装置
技术领域
本发明涉及基于移动终端的信息检索领域,特别是涉及一种移动终端的本地搜索方法及装置。
背景技术
随着通讯产业的不断发展,各种移动终端的使用频度以及广度都有较大的提升。并且伴随硬件设备价格的下降,各种功能强大的移动终端逐步进入百姓家庭,不仅成为人们日常交流的主要工具之一,而且还是娱乐休闲、或者办公的必备物品。
移动终端的处理能力以及容量都在与日俱增,同时还支持更大容量的存储卡等外设。用户越来越倾向于将各种文本文件、多媒体数据存放在移动终端中;此外,现代的移动终端大部分都支持用户将短信、彩信、联系人、邮件等内容存储在除SIM空间以外的存储空间中,这样用户可以将海量的信息存放在移动终端上而不需要进行删除,达到永久可用的目的。
正是由于移动终端数据存储容量的提升,即给用户带来了更为贴身的用户体验,但同时也使得用户查找相关的信息变得相对复杂和困难。因此,在移动终端上进行桌面搜索将极大地提高用户查找本地信息的速度。
智能移动终端的处理能力虽然不断提升,但其固有特点使得现有的网络搜索引擎技术、以及个人电脑所采用的桌面搜索技术很难直接应用到嵌入式的移动终端中。由于移动终端的电池容量有限,不能长时间的运行某个特别耗能的后台程序,每次进行本地检索都完成一次新的全文索引需要耗费较大的能源和***资源。
通常,相关性是搜索引擎进行排序的一个重要依据。一般搜索得到结果,都是按照相关性进行降序排列。这种方式在Web网上非常常见。但在嵌入式***中,由于用户使用的资源本身有限,需要查询的信息也绝大部分是用户会反复使用到的资源,比如某条短信的发件人信息,某个邮件的内容,某一首经常播放的歌曲等等。
因此,一种简化本地搜索过程的本地索引建立及维护方法就是亟待解决的问题。此外,在结合传统的按照相关度对搜索结果进行排序的基础上,进一步按照移动终端用户经常访问的频率来对搜索结果排序进行改进,改善检索效果,使搜索过程更贴近用户使用习惯,增强用户使用体验。
发明内容
针对目前等问题而提出本发明,为此,本发明的主要目的在于提供一种的方法,以解决上述问题。
本发明提出了一种在终端上更新索引并基于其对搜索结果排序的方法,包括以下步骤:检索文件是否有修改;当文件存在修改时,对改变的文件进行增量索引,生成新的索引文件,其中增量索引中包含对所述文件的历史选中次数;将生成的新的索引文件合并到原有的索引文件中;获取用户输入的关键字;查询与关键字有关的搜索结果,根据搜索结果与关键字之间的相关度以及所述文件的历史选中次数来对搜索结果进行排序并显示给用户。
其中,在根据搜索结果与关键字之间的相关度以及所述文件的历史选中次数来对搜索结果进行排序并显示给用户的步骤之后,还包括以下步骤:记录用户选中所述文件的次数,并更新所述文件的历史选中次数。
其中,在检索文件是否有修改的步骤中,具体包括以下步骤:将现有文件的时间戳和前一次建立索引时所保留的文件的时间戳进行比较,如果现有文件的时间戳与前一次建立索引时所保留的文件的时间戳一样,则判断文件没有被修改,如果现有文件的时间戳与前一次建立索引时所保留的文件的时间戳不一样,则判断文件有修改。
其中,在检索文件是否有修改的步骤中,以预定的检索周期检索文件是否有修改。
其中,定期地或者在检测到手机空闲时或者在新的索引文件达到预定数量时将新的索引文件合并到原有的索引文件中。
其中,在定期地将新的索引文件合并到原有的索引文件中的过程中,合并周期与用户设定的检索周期相同。
其中,在生成新的索引文件之后,将所生成的新的索引文件暂存在终端内存中,并在将所生成的新的索引文件合并到原有的索引文件中之后,释放存储新的索引文件的终端内存。
本发明还提出了一种在终端上更新索引并基于其对搜索结果排序的装置,包括:检索单元,检索文件是否有修改;生成单元,当所述文件存在修改时,对改变的文件进行增量索引,生成新的索引文件,其中所述增量索引中包含对所述文件的历史选中次数;合并单元,将生成的新的索引文件合并到原有的索引文件中;获取单元,获取用户输入的查询关键字;查询单元,查询与关键字有关的搜索结果,根据搜索结果与关键字之间的相关度以及所述文件的历史选中次数来对所述搜索结果进行排序;显示单元,将排序的所述搜索结果显示给用户。
其中,装置还包括:记录单元,记录用户选中所述文件的次数;更新单元,更新所述文件的所述历史选中次数。
其中,装置还包括:比较单元,将现有文件的时间戳和前一次建立索引时所保留的文件的时间戳进行比较,如果现有文件的时间戳与前一次建立索引时所保留的文件的时间戳一样,则判断所述文件没有被修改,如果现有文件的时间戳与前一次建立索引时所保留的文件的时间戳不一样,则判断文件有修改。
通过本发明,可以时时地自动更新手机本地索引表,以便满足不时的本地搜索需求,并且占用较少手机资源和能源。并且搜索结果更加人性化。提高了移动终端用户的使用体验。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明优选实施例的建立本地全文索引的流程示意图。
图2是本发明优选实施例的索引文件目录结构。
图3是本发明优选实施例的增量索引示意图。
图4是本发明优选实施例的索引文件结构。
图5是本发明优选实施例的搜索结果排序的流程示意图。
图6是根据本发明的装置。
具体实施方式
本发明的主要目的在于提供一种移动终端的本地搜索的方法。包括索引更新方法和搜索结果的排序方法。
本发明解决其技术问题采用的技术方案如下:
一种移动终端的索引更新方法,主要包括以下步骤:
步骤1,定时进行检索,查看文件是否有修改,通过对比现有文件的时间戳和第一次建立索引时所保留的文件元信息中的时间戳进行对比,如果现有文件的时间戳比第一次建立索引时所保留的文件元信息中的时间戳更新,那么执行步骤2,否则结束。
步骤2,对新文件进行增量索引,生成新的索引文件。
步骤3,将该含有增量信息的索引文件合并到原先的大索引文件中。
一种移动终端的搜索结果排序方法,主要包括以下步骤:
(1)移动终端上的搜索引擎对移动终端存储介质上的文本、短信、联系人、邮件、图片、视频、音频等其它各种包含文本信息的文件进行分析,并对其建立全文索引。
(2)移动终端的本地搜索:搜索引擎的用户界面接受用户的查询请求,读取查询请求所对应的全文索引,将最贴近用户搜索要求的查询结果反馈给用户。并同时在索引表中记录用户选中某条搜索结果的次数。
(3)移动终端的多次搜索:搜索引擎的用户界面接受用户的查询请求,读取查询请求所对应的全文索引。将搜索结果与搜索内容的相关度,并对搜索结果的历史选中次数进行排序。将搜索结果的相关度为第一优先级,历史选中次数为第二优先级,对结果进行降序排列,并反馈给用户。即,当搜索到具有相关性的文件时,才对具有相关性的文件将搜索结果和历史选中次数进行权重计算,并根据结果进行排序。
通过本发明,可以时时地自动更新手机本地索引表,以便满足不时的本地搜索需求,并且占用较少手机资源和能源。并且搜索结果更加人性化。提高了移动终端用户的使用体验。
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1是根据本发明的建立本地全文索引的流程示意图。具体包括以下步骤:
步骤S101,根据用户输入,确认需要索引的信息范围。这样可以减少不必要的索引时间,增加有效搜索次数,并在某些情况下保护用户在移动终端上的私密信息不被搜索。
步骤S102,根据步骤S101所确定的信息范围,建立文件元信息。包括文件建立或修改的时间戳、以及文件类型等。
步骤S103,根据步骤S101所确定的信息范围,对文件的文本信息进行分析,包括文件名、文件中的文本信息,以及多媒体文件的文本注释等信息。并将这些信息和数据存储在一个纯文本或XML文档结构中,可以很灵活的嵌入到移动设备的程序中。
步骤S104,建立全文索引,索引过程为读取文件名,将文件分路径和内容2个字段进行存储,并对内容进行全文索引。内容包括多个字段,并针对不同字段属性和数据输出的续签,对字段选择不同的索引规则和存储规则,比如对标题需要进行切分词的操作,而对日期只存储而不进行切分词操作。
本发明中,所更新的不是整个索引文件,而是在需要增加索引中的信息时,不断创建新的索引文件,然后在手机空闲时,定期地将这些新的小索引文件合并到原先的大索引文件中,即增量索引,这样在不影响搜索查询效率的前提下,提高了索引的效率。创建新的索引文件的优势之一是如果原先的索引文件在意外损坏的情况下,用户还可以通过查询新创建的索引文件得到近期的搜索结果。另外重新从原始数据进行索引只需要索引最近一次创建新索引文件之前的原始数据即可,节省了索引时间。另外,将小索引文件合并到原先大索引文件的合并周期与用户设定的索引周期相同,因为只有在索引文件有变化的情况下,才有必要将新增的索引文件合并到原先的大索引文件中。并且保证合并过程不在索引过程中进行,因为这样会消耗大量的CPU时间,使得索引效率低下,并影响用户的手机操作体验。因此需要在索引过程结束后,并且用户在较长一段时间内没有操作手机的情况下,进行合并操作,这里设定的合并时间点为用户停止操作手机后的半个小时。在这里,利用了Lucene自带的增量索引机制,通过段的使用,在内存中快速将新的索引信息合并到原先的大索引文件中,然后再将更新后的大索引文件写入磁盘,接着删除不需要的小索引文件。
具体而言,本发明的更新维护方法包括:
步骤S105,定时进行检索,查看文件是否有修改,通过对比现有文件的时间戳和第一次建立索引时所保留的文件元信息中的时间戳进行对比,如果现有文件的时间戳比第一次建立索引时所保留的文件元信息中的时间戳更新,那么执行步骤S106,否则根据检索周期继续执行S105步骤。
步骤S106,对新文件进行增量索引,生成新的索引文件。
步骤S107,将该含有增量信息的索引文件合并到原先的大索引文件中。
进一步地,步骤S105中的检索周期可以由用户设定,也可以是每小时,每日,每周,每月。
进一步地,步骤S106中所述增量索引形成的索引文件可以暂存在内存中,以减少CPU读取和处理的工作量与时间。
进一步地,步骤S107中所述的合并工作,在手机空闲时进行。
进一步地,索引文件合并完之后释放原本占用的内存空间。
图2是本发明优选实施例的索引文件目录结构:
201索引文件的读写权限。
202索引文件的创建者。
203索引文件的最后修改者。
204索引文件大小,单位是字节。
205索引文件最后的修改日期。
206索引文件最后的修改时间。
207索引文件的名称。
索引由一个或多个段组成。而每个段又由多个索引文件组成。属于同一个段的索引文件具有相同的前缀名以及不同的后缀名。在图3中索引文件目录由2个段组成,分别为_movie和_email。
图3是本发明优选实施例的增量索引示意图:
301是索引目录中含有2个段的示意图,分别为_movie和_movie2。在索引合并周期到来时,可以对相同类别的段进行合并,减少索引文件,以此减少IO次数,提高搜索性能。
302是合并_movie和_movie2以后的索引目录结构。可以看到主要的索引文件类型保持不变。但每个文件的大小已经增大,并且在索引文件完全合并后,原先的小索引文件将被删除。
图4是根据本发明的索引文件结构示意图。在本实施例中专门针对嵌入式设备的本地搜索特性和特定的搜索结果,对4个索引文件中的内容进行了一定的定制。
在本实施例中,采用了4个子索引文件来存储索引信息,这样的粒度划分有利于性能的最大化和资源利用的最小化。例如,如果某个域没有被索引,通过操作可以很快地基于.fnm文件中的索引标记从查询中完全去除整个域。而如果项本身不出现,则不需要查找位置信息。
其中.fnm文件存储了段中相关的文档包含的所有的域名。其中每个域都被标记过,以此来反映它是否被索引过。本实施例中所采用的域包括:修改时间,是否被修改过,文件标题,文件路径,文件所属类别,文件内容等信息。
.tis文件保存了段中的所有项(由域名和值构成的元组),即分词后的词条。每个项条目包含了它的文档频率,即Value所对应的条目在多少个文档中出现过。这里以Value为“中兴”为例,表示“中兴”在5篇文档中出现过。
.frq文件保存了每个项在文档中的出现频率。这里以.tis文件中的“中兴”为例,结合.frq文件,表示“中兴”分别出现在“3G在中国.txt”、“Sina.html”、“中兴宣传信息”、“来自小新.txt”,“XX的歌词.txt”这5个文件中;而在“3G在中国.txt”中出现了12次“中兴”,在“Sina.html”中出现了15次“中兴”,依次类推。对应“3G在中国.txt”文件,被用户历史选中的次数为5次,而在“Sina.html”中,被用户历史选中的次数100。
.prx文件列出了文档中每个项的位置,以及显示在搜索结果列表中被用户选中后的次数。这里以“中兴”为例,表示“中兴”在“来自小新.txt”中,以二元分词划分后的分词列表中,排在第3位和第8位。
图5是根据本发明的搜索结果排序的流程示意图。具体包括以下步骤:
步骤S501,根据用户输入的信息,在全文索引中进行检索,并得到检索结果集。
步骤S502,根据文件中出现搜索项的频率来对检索结果进行权重计算。设搜索项在文件n中出现的次数为Wn,总次数为WF。本发明以搜索项“中兴”为例。文件1为“3G在中国.txt”,文件2为“Sina.html”,文件3为“中兴宣传信息.wmv”,文件4为“来自小新.txt”,文件5为“XX的歌词.txt”,对应的Wn分别为W1=12,W2=15,W3=36,W4=2,W5=3。
Figure B2009101756759D0000101
那么每个文件对应的权重Wnf=Wn/WF。在本发明实施例中,W1f=12/68,W2f=15/68,W3f=36/68,依此类推。初步得到的排序为W3f>W2f>W1f>W5f>W4f
步骤S503,根据用户历史选中文件的次数进行权重计算。设用户历史选中某个文件n的次数为Hn,历史选中搜索项的总次数为HF。在本发明实施例中,以搜索项“中兴”为例。文件所对应的Hn分别为H1=5,H2=100,H3=6,H4=7,H5=4。
Figure B2009101756759D0000111
那么每个文件被历史选中的权重为Hnf=Hn/HF。在本发明实施例中,Hn1=5/122,Hn2=100/122,Hn3=6/122,依此类推。以此得到的排序为H2f>H4f>H3f>H1f>H5f
步骤S504,根据搜索项在文件中出现频率得到的权重Wn和文件被用户历史选中次数的权重Hn,计算该文件的总权重Sn。计算公式为Sn=Wnf+Hnf。根据此公式得到的Sn分别为S1=0.217,S2=1.041,S3=0.578,S4=0.086,S5=0.077,其降序排序为S2>S3>S1>S4>S5。
S505,根据Sn的降序顺序,将搜索结果以列表方式反馈给用户。在本发明实施例中,其顺序依次为“Sina.html”,“中兴宣传信息.wmv”,“3G在中国.txt”,“来自小新.txt”,“XX的歌词.txt”。
S506,根据用户选择,将其选中的文件在.frq表格中的SelectFrequency这个字段数值增加1。
从以上分析可以看到,最终的排序结果,与单独按照搜索项在文件中出现的频率进行排序,或者以用户历史选中文件的次数进行排序,都不一样。从排序结果可以看到,虽然文件“中兴宣传信息.wmv”包含搜索项的频率很高,但是由于用户平时查看文件“Sina.html”的次数更多,可以推测用户是想通过搜索“中兴”来查找自己以往最感兴趣、最喜欢浏览的文件和内容是“Sina.html”,而不是“中兴宣传信息.wmv”。
通过本发明,可以时时地自动更新手机本地索引表,以便满足不时的本地搜索需求,并且占用较少手机资源和能源。提高了移动终端用户的使用体验。
此外,对于搜索结果的处理方式,除了考虑了一般情况下的相关度算法,即搜索项在文件中出现频率这个因素;此外还考虑到了移动终端用户的使用习惯,考虑其历史选中某个文件的次数,并作为相关度需要考察的因素之一。使得搜索结果更贴近用户所需。
另外,本发明还提出了一种在终端上更新索引并基于其对搜索结果排序的装置。图6示出了根据本发明的装置。如图6所示,该装置包括:检索单元,检索文件是否有修改;生成单元,当文件存在修改时,对改变的文件进行增量索引,生成新的索引文件,其中所述增量索引中包含对文件的历史选中次数;合并单元,将生成的新的索引文件合并到原有的索引文件中;获取单元,获取用户输入的查询关键字;查询单元,查询与关键字有关的搜索结果,根据搜索结果与关键字之间的相关度以及文件的历史选中次数来对所述搜索结果进行排序;显示单元,将排序的搜索结果显示给用户;记录单元,记录用户选中文件的次数;更新单元,更新文件的所述历史选中次数。
该装置还包括:比较单元,将现有文件的时间戳和前一次建立索引时所保留的文件的时间戳进行比较,如果现有文件的时间戳与前一次建立索引时所保留的文件的时间戳一样,则判断所述文件没有被修改,如果现有文件的时间戳与前一次建立索引时所保留的文件的时间戳不一样,则判断所述文件有修改。
检索单元以预定的检索周期检索文件是否有修改。
合并单元定期地或者在检测到手机空闲时或者在新的索引文件达到预定数量时将所述新的索引文件合并到原有的索引文件中。
领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种在终端上更新索引并基于其对搜索结果排序的方法,其特征在于,所述方法包括以下步骤:
检索文件是否有修改;
当所述文件存在修改时,对改变的文件进行增量索引,生成新的索引文件,其中所述增量索引中包含对所述文件的历史选中次数;
将生成的新的索引文件合并到原有的索引文件中;
获取用户输入的关键字;
查询与关键字有关的搜索结果,根据搜索结果与关键字之间的相关度以及所述文件的历史选中次数来对所述搜索结果进行排序并显示给用户。
2.根据权利要求1所述的方法,其特征在于,在根据搜索结果与关键字之间的相关度以及所述文件的历史选中次数来对所述搜索结果进行排序并显示给用户的步骤之后,还包括以下步骤:
记录用户选中所述文件的次数,并更新所述文件的所述历史选中次数。
3.根据权利要求1所述的方法,其特征在于,在检索文件是否有修改的步骤中,具体包括以下步骤:
将现有文件的时间戳和前一次建立索引时所保留的文件的时间戳进行比较,
如果现有文件的时间戳与前一次建立索引时所保留的文件的时间戳一样,则判断所述文件没有被修改,
如果现有文件的时间戳与前一次建立索引时所保留的文件的时间戳不一样,则判断所述文件有修改。
4.根据权利要求1所述的方法,其特征在于,在检索文件是否有修改的步骤中,以预定的检索周期检索文件是否有修改。
5.根据权利要求1所述的方法,其特征在于,定期地或者在检测到手机空闲时或者在新的索引文件达到预定数量时将所述新的索引文件合并到原有的索引文件中。
6.根据权利要求5所述的方法,其特征在于,在定期地将所述新的索引文件合并到原有的索引文件中的过程中,合并周期与用户设定的检索周期相同。
7.根据权利要求1所述的方法,其特征在于,在生成新的索引文件之后,将所生成的新的索引文件暂存在终端内存中,并在将所生成的新的索引文件合并到原有的索引文件中之后,释放存储新的索引文件的终端内存。
8.一种在终端上更新索引并基于其对搜索结果排序的装置,其特征在于,包括:
检索单元,检索文件是否有修改;
生成单元,当所述文件存在修改时,对改变的文件进行增量索引,生成新的索引文件,其中所述增量索引中包含对所述文件的历史选中次数;
合并单元,将生成的新的索引文件合并到原有的索引文件中;
获取单元,获取用户输入的查询关键字;
查询单元,查询与关键字有关的搜索结果,根据搜索结果与关键字之间的相关度以及所述文件的历史选中次数来对所述搜索结果进行排序;
显示单元,将排序的所述搜索结果显示给用户。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
记录单元,记录用户选中所述文件的次数;
更新单元,更新所述文件的所述历史选中次数。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
比较单元,将现有文件的时间戳和前一次建立索引时所保留的文件的时间戳进行比较,
如果现有文件的时间戳与前一次建立索引时所保留的文件的时间戳一样,则判断所述文件没有被修改,
如果现有文件的时间戳与前一次建立索引时所保留的文件的时间戳不一样,则判断所述文件有修改。
CN2009101756759A 2009-09-21 2009-09-21 在终端上更新索引并基于其对搜索结果排序的方法及装置 Pending CN102023991A (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN2009101756759A CN102023991A (zh) 2009-09-21 2009-09-21 在终端上更新索引并基于其对搜索结果排序的方法及装置
US13/497,465 US20120317105A1 (en) 2009-09-21 2010-06-23 Method and Apparatus for Updating Index and Sequencing Search Results Based on Updated Index in Terminal
EP10788971A EP2482199A4 (en) 2009-09-21 2010-06-23 METHOD AND DEVICE FOR UPDATING THE INDEX IN A FINAL DEVICE AND FOR SEQUENCING SEARCH RESULTS BASED ON AN UPDATED INDEX
PCT/CN2010/074326 WO2010145575A1 (zh) 2009-09-21 2010-06-23 在终端上更新索引并基于其对搜索结果排序的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009101756759A CN102023991A (zh) 2009-09-21 2009-09-21 在终端上更新索引并基于其对搜索结果排序的方法及装置

Publications (1)

Publication Number Publication Date
CN102023991A true CN102023991A (zh) 2011-04-20

Family

ID=43355874

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101756759A Pending CN102023991A (zh) 2009-09-21 2009-09-21 在终端上更新索引并基于其对搜索结果排序的方法及装置

Country Status (4)

Country Link
US (1) US20120317105A1 (zh)
EP (1) EP2482199A4 (zh)
CN (1) CN102023991A (zh)
WO (1) WO2010145575A1 (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102193999A (zh) * 2011-05-09 2011-09-21 北京百度网讯科技有限公司 一种对搜索结果进行排序的方法及设备
CN102323937A (zh) * 2011-08-31 2012-01-18 百度在线网络技术(北京)有限公司 一种提供搜索结果的方法与设备
CN102591977A (zh) * 2012-01-04 2012-07-18 北京百度网讯科技有限公司 一种对搜索结果进行排序的方法以及***
CN102799611A (zh) * 2012-06-06 2012-11-28 新浪网技术(中国)有限公司 邮箱索引建立方法及***、邮箱搜索方法及***
CN102968464A (zh) * 2012-11-08 2013-03-13 广东电子工业研究院有限公司 一种基于索引的本地资源快速检索***及其检索方法
CN103207872A (zh) * 2012-01-17 2013-07-17 深圳市快播科技有限公司 一种实时索引方法和服务器
CN103577454A (zh) * 2012-08-01 2014-02-12 华为技术有限公司 一种文件合并方法和装置
CN103631793A (zh) * 2012-08-22 2014-03-12 百度在线网络技术(北京)有限公司 一种用于对搜索结果进行排序的方法、装置与设备
CN103688255A (zh) * 2011-06-30 2014-03-26 诺基亚公司 用于提供用户修正的搜索结果的方法和装置
CN104063454A (zh) * 2014-06-24 2014-09-24 北京奇虎科技有限公司 一种挖掘用户需求的搜索推送方法和装置
CN104519321A (zh) * 2014-12-22 2015-04-15 深圳市科漫达智能管理科技有限公司 查看监控视频的方法及装置
WO2015109835A1 (zh) * 2014-01-24 2015-07-30 贝壳网际(北京)安全技术有限公司 一种搜索方法及终端设备
WO2015161550A1 (zh) * 2014-04-24 2015-10-29 中兴通讯股份有限公司 管理索引的方法、装置及计算机存储介质
CN106484770A (zh) * 2016-09-09 2017-03-08 中国互联网络信息中心 一种dns增量区域数据文件的处理方法
CN108614826A (zh) * 2016-12-12 2018-10-02 ***通信集团公司 一种数据查询方法及装置
CN110727696A (zh) * 2019-09-27 2020-01-24 上海麦克风文化传媒有限公司 一种排序结果索引方法
CN111813902A (zh) * 2020-05-21 2020-10-23 车智互联(北京)科技有限公司 智能应答方法、***及计算设备
CN113312313A (zh) * 2021-01-29 2021-08-27 淘宝(中国)软件有限公司 数据查询方法、非易失性存储介质及电子设备
CN113645348A (zh) * 2021-08-09 2021-11-12 上海传英信息技术有限公司 控制方法、移动终端及存储介质

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130297531A1 (en) 2012-05-02 2013-11-07 Imageworks Interactive Device for modifying various types of assets
CN104462558B (zh) * 2014-12-26 2017-12-08 浙江宇视科技有限公司 一种修改Lucene索引文件中词的方法及装置
CN105608204A (zh) * 2015-12-25 2016-05-25 北京奇虎科技有限公司 增量式索引列表的生成方法及装置
CN105512339A (zh) * 2015-12-31 2016-04-20 深圳市朗科科技股份有限公司 一种文件检索器及检索方法
CN106557178B (zh) * 2016-11-29 2021-03-09 百度国际科技(深圳)有限公司 用于更新输入法词条的方法及装置
CN107729566B (zh) * 2017-11-14 2021-02-23 郑州天迈科技股份有限公司 一种用于公交车载硬盘音视频数据存取的索引重建方法
RU2733482C2 (ru) 2018-11-16 2020-10-01 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для обновления базы данных поискового индекса
CN114168589A (zh) * 2021-10-28 2022-03-11 阿里巴巴(中国)有限公司 索引构建方法及装置
CN116955286B (zh) * 2023-09-19 2023-12-15 中孚安全技术有限公司 一种文件搜索与分类管理方法、***及装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5701459A (en) * 1993-01-13 1997-12-23 Novell, Inc. Method and apparatus for rapid full text index creation
US7496559B2 (en) * 2002-09-03 2009-02-24 X1 Technologies, Inc. Apparatus and methods for locating data
EP1623300A2 (en) * 2003-05-14 2006-02-08 Rhysome, Inc. Method and system for reducing information latency in a business enterprise
US8131674B2 (en) * 2004-06-25 2012-03-06 Apple Inc. Methods and systems for managing data
US7676032B2 (en) * 2004-12-23 2010-03-09 Sprint Communications Company L.P. Method and system for determining maximum transactions within a communications network
TWI273450B (en) * 2005-07-12 2007-02-11 Asustek Comp Inc Method and apparatus for searching data
US7548929B2 (en) * 2005-07-29 2009-06-16 Yahoo! Inc. System and method for determining semantically related terms
CN100561474C (zh) * 2006-01-17 2009-11-18 鸿富锦精密工业(深圳)有限公司 远程多点文件索引同步***及方法
CN100495398C (zh) * 2006-03-30 2009-06-03 国际商业机器公司 文件***中搜索排序的方法及相关搜索引擎
CN1924854B (zh) * 2006-09-18 2010-05-12 浙江大学 智能移动终端的桌面搜索方法
CN101150802A (zh) * 2006-09-19 2008-03-26 北京三星通信技术研究有限公司 移动通信终端中的搜索方法及使用该方法的装置
KR100913196B1 (ko) * 2007-12-11 2009-08-24 한국전자통신연구원 파일 갱신 시스템 및 방법
US8255386B1 (en) * 2008-01-30 2012-08-28 Google Inc. Selection of documents to place in search index

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102193999A (zh) * 2011-05-09 2011-09-21 北京百度网讯科技有限公司 一种对搜索结果进行排序的方法及设备
CN103688255B (zh) * 2011-06-30 2017-06-13 诺基亚技术有限公司 用于提供用户修正的搜索结果的方法和装置
US9679064B2 (en) 2011-06-30 2017-06-13 Nokia Technologies Oy Method and apparatus for providing user-corrected search results
CN103688255A (zh) * 2011-06-30 2014-03-26 诺基亚公司 用于提供用户修正的搜索结果的方法和装置
CN102323937A (zh) * 2011-08-31 2012-01-18 百度在线网络技术(北京)有限公司 一种提供搜索结果的方法与设备
CN102591977A (zh) * 2012-01-04 2012-07-18 北京百度网讯科技有限公司 一种对搜索结果进行排序的方法以及***
CN103207872A (zh) * 2012-01-17 2013-07-17 深圳市快播科技有限公司 一种实时索引方法和服务器
CN102799611B (zh) * 2012-06-06 2015-04-08 新浪网技术(中国)有限公司 邮箱索引建立方法及***、邮箱搜索方法及***
CN102799611A (zh) * 2012-06-06 2012-11-28 新浪网技术(中国)有限公司 邮箱索引建立方法及***、邮箱搜索方法及***
CN103577454A (zh) * 2012-08-01 2014-02-12 华为技术有限公司 一种文件合并方法和装置
CN103577454B (zh) * 2012-08-01 2019-03-01 华为技术有限公司 一种文件合并方法和装置
CN103631793B (zh) * 2012-08-22 2018-11-23 百度在线网络技术(北京)有限公司 一种用于对搜索结果进行排序的方法、装置与设备
CN103631793A (zh) * 2012-08-22 2014-03-12 百度在线网络技术(北京)有限公司 一种用于对搜索结果进行排序的方法、装置与设备
CN102968464B (zh) * 2012-11-08 2016-07-13 广东电子工业研究院有限公司 一种基于索引的本地资源快速检索***的检索方法
CN102968464A (zh) * 2012-11-08 2013-03-13 广东电子工业研究院有限公司 一种基于索引的本地资源快速检索***及其检索方法
WO2015109835A1 (zh) * 2014-01-24 2015-07-30 贝壳网际(北京)安全技术有限公司 一种搜索方法及终端设备
WO2015161550A1 (zh) * 2014-04-24 2015-10-29 中兴通讯股份有限公司 管理索引的方法、装置及计算机存储介质
CN104063454A (zh) * 2014-06-24 2014-09-24 北京奇虎科技有限公司 一种挖掘用户需求的搜索推送方法和装置
CN104519321A (zh) * 2014-12-22 2015-04-15 深圳市科漫达智能管理科技有限公司 查看监控视频的方法及装置
CN106484770A (zh) * 2016-09-09 2017-03-08 中国互联网络信息中心 一种dns增量区域数据文件的处理方法
CN106484770B (zh) * 2016-09-09 2019-08-06 中国互联网络信息中心 一种dns增量区域数据文件的处理方法
CN108614826A (zh) * 2016-12-12 2018-10-02 ***通信集团公司 一种数据查询方法及装置
CN110727696A (zh) * 2019-09-27 2020-01-24 上海麦克风文化传媒有限公司 一种排序结果索引方法
CN110727696B (zh) * 2019-09-27 2023-09-01 上海麦克风文化传媒有限公司 一种排序结果索引方法
CN111813902A (zh) * 2020-05-21 2020-10-23 车智互联(北京)科技有限公司 智能应答方法、***及计算设备
CN111813902B (zh) * 2020-05-21 2024-02-23 车智互联(北京)科技有限公司 智能应答方法、***及计算设备
CN113312313A (zh) * 2021-01-29 2021-08-27 淘宝(中国)软件有限公司 数据查询方法、非易失性存储介质及电子设备
CN113312313B (zh) * 2021-01-29 2023-09-29 淘宝(中国)软件有限公司 数据查询方法、非易失性存储介质及电子设备
CN113645348A (zh) * 2021-08-09 2021-11-12 上海传英信息技术有限公司 控制方法、移动终端及存储介质

Also Published As

Publication number Publication date
EP2482199A4 (en) 2012-12-19
EP2482199A1 (en) 2012-08-01
WO2010145575A1 (zh) 2010-12-23
US20120317105A1 (en) 2012-12-13

Similar Documents

Publication Publication Date Title
CN102023991A (zh) 在终端上更新索引并基于其对搜索结果排序的方法及装置
EP2130115B1 (en) Searching and indexing on a user device
CA2688002C (en) Managing status of search index generation in handheld book reader device
AU2005231112B2 (en) Methods and systems for structuring event data in a database for location and retrieval
US7509477B2 (en) Aggregating data from difference sources
US20110184936A1 (en) Dynamic community-based cache for mobile search
EP2130143A1 (en) Search of multiple content sources on a user device
CN102722501A (zh) 搜索引擎及其实现方法
CN101212739A (zh) 一种移动通讯终端的信息处理装置
CN101998692A (zh) 一种在移动终端上建立索引并进行混合搜索的方法及装置
CN100574340C (zh) 一种查找手机短信的方法
CN101599069A (zh) 电子文档的搜索方法及***
US20080312901A1 (en) Character input assist method, character input assist system, character input assist program, user terminal, character conversion method and character conversion program
JP2008217157A (ja) 操作履歴を利用した自動情報整理装置、方法、およびプログラム
US20090077031A1 (en) System and method for creating full-text indexes of patent documents
US20040049512A1 (en) Information processing system and information processing method
KR20090058042A (ko) 이동통신 시스템에서 컨텐츠 메타데이터를 이용한 컨텐츠검색 방법 및 장치
Mondal et al. Efficient indexing of top-k entities in systems of engagement with extensions for geo-tagged entities
Maniu et al. Efficient top-k retrieval in online social tagging networks
CN101840401A (zh) 词典辅助查询***及其方法
US20060190534A1 (en) Method and system for browsing a plurality of information items
CN107992565B (zh) 一种优化搜索引擎的方法及***
US7747638B1 (en) Techniques for selectively performing searches against data and providing search results
Washburn et al. E-mail alerts and rss feeds for distance learning administrators
Shon et al. A Study on the Relevance Improvement of Enterprise Search using Tag Information

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20110420