CN101571874A - 一种手机信息搜索排序*** - Google Patents

一种手机信息搜索排序*** Download PDF

Info

Publication number
CN101571874A
CN101571874A CNA2009100990320A CN200910099032A CN101571874A CN 101571874 A CN101571874 A CN 101571874A CN A2009100990320 A CNA2009100990320 A CN A2009100990320A CN 200910099032 A CN200910099032 A CN 200910099032A CN 101571874 A CN101571874 A CN 101571874A
Authority
CN
China
Prior art keywords
module
mobile phone
user preference
information
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2009100990320A
Other languages
English (en)
Inventor
黄鹤云
黄乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HANGZHOU SANHUANG TECHNOLOGY Co Ltd
Original Assignee
HANGZHOU SANHUANG TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HANGZHOU SANHUANG TECHNOLOGY Co Ltd filed Critical HANGZHOU SANHUANG TECHNOLOGY Co Ltd
Priority to CNA2009100990320A priority Critical patent/CN101571874A/zh
Publication of CN101571874A publication Critical patent/CN101571874A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种手机信息搜索排序***,包括索引模块、关键词匹配模块、排序模块,索引模块根据手机信息建立索引,关键词匹配模块根据用户输入的关键词与索引进行关联,排序模块根据关联程度进行排序并显示在屏幕上,特点是它还设置了用户偏好参数提取模块,自适应排序模块根据用户偏好参数提取模块与关键词匹配模块结合进行排序,自适应的修正排序将用户偏好的结果提到首条或者搜索结果首页,从而减少了用户的操作次数,既节省时间又方便了操作,提高了手机的易用性。

Description

一种手机信息搜索排序***
技术领域
本发明涉及通讯领域,尤其是手机信息自适应搜索排序***。
背景技术
随着嵌入式***、处理器以及存储器的发展,手机的性能日趋强大。强大的中央处理器允许了更多的手机程序的运行,廉价的存储器也使得手机内可存储的资料,包括短信息、联系人、音乐、视频、电子书等文件越来越多。海量的手机文件数和程序数会给用户查找文件或者寻找特定程序带来不便。因此,类似网页搜索和计算机的本地搜索,手机搜索也成为一个很有意义的研发热点。目前,国际上最主要的手机开发商以及移动运营商都非常关注手机搜索功能。全球最大手机生厂商诺基亚,就在其中高端手机Symbian操作***中内置了移动搜索程序,其出色的搜索用户体验,是Nokia在智能手机市场一直占据榜首的重要原因之一。Nokia移动搜索程序支持搜索联系人,文本消息,电子邮件等内嵌程序,相应速度较快,用户界面也较为友好。作为市场上已存在的最为优秀的一款搜索程序之一,Nokia移动搜索程序仍有相当大的改进空间,尤其是智能搜索排序算法方面,该程序没有对用户行进行智能的学***台,也是作为科研项目的最佳平台。Android平台上内置搜索框架,但由于刚发布不久,目前仅支持联系人搜索,其他的应用程序如短消息程序等目前还在实现搜索功能中。
在手机搜索的框架里,如图1所示:包括手机搜索索引模块、关键词匹配模块、排序模块三个传统模块。手机搜索索引模块是分析文件的关键属性,将分析出的结果和被分析的文件进行关联。对新来的文件,只需要进行对索引进行更新即可。索引的建立是手机搜索实现的前提条件。关键词匹配度模块则是根据用户的输入来寻找最匹配的文件或者程序。排序模块是根据匹配度的计算结果并根据一定的策略排序。这种搜索虽然能找到用户需要的信息,但由于手机屏幕较小,所需信息并非显示在首页,有的甚至于多次翻页才能看到。因此手机使用中比较费时,不够便捷。
发明内容
本发明的目的是提供一种手机用户能直接搜索到需要的结果并显示于首条或首页的手机信息搜索排序***。
本发明的手机信息搜索排序***,包括索引模块、关键词匹配模块、排序模块,索引模块根据手机信息建立索引,关键词匹配模块根据用户输入的关键词与索引进行关联,排序模块根据关联程度进行排序并显示在屏幕上,其特征在于它还包括用户偏好参数提取模块,所述的排序模块是基于关键词匹配模块和用户偏好参数提取模块进行排序的自适应排序模块。
所述的用户偏好参数提取模块所提取的参数是来自手机任意信息的包含至少一类用户偏好的参数βi,表达为βi=fi(η),i=1,2,...,M,η表示用户手机里所有信息,函数fi表示从手机信息提取表征用户偏好的参数集的过程。
所述的排序模块的排序是以匹配度参数和用户偏好参数为自变量的函数作用过程,其函数形式为f(α1,α2,..,αN,β1(t),β2(t),..,βM(t)),f为任意函数,α为匹配度参数。
所述的用户偏好参数提取模块可以从用户通话记录里根据用户的最近联系人提取用户偏好信息,包括最近联系人通话时间和通话次数,形成至少一类用户偏好参数。
所述的用户偏好参数提取模块可以从用户短消息接受和发送记录里提取用户偏好信息。
所述的用户偏好参数提取模块可以从用户过去搜索操作的反馈结果里提取用户偏好信息,形成至少一类用户偏好参数。
所述的用户偏好参数提取模块所提取的参数可以是固定的,可以是随时间变化的,可以是用户预先设定的。
由于本发明结合了用户偏好习惯,自适应的修正排序策略可以按照用户偏好习惯将搜索结果排序,将用户偏好的结果提到首条或者搜索结果首页,减少了用户的操作次数,既节省时间又方便了操作,提高了手机的易用性。
附图说明
图1:现有技术中信息搜索排序流程图
图2:本发明的信息搜索排序流程图
具体实施方式
如图2所示,本发明提供的手机信息搜索排序***,包括索引模块、关键词匹配模块、用户偏好参数提取模块和自适应排序模块,索引模块根据手机信息建立索引,关键词匹配模块根据用户输入和索引进行关联,用户偏好参数提取模块根据用户输入习惯建立参数,自适应排序模块根据关键词匹配模块的匹配度参数和用户偏好参数提取模块的用户偏好参数计算进行排序。它包含以下步骤:
步骤1:用户输入关键词。用户的关键词输入可以是通过任意方式输入,最常见的输入则是根据手机键盘输入,其他输入方式也应包括在内,例如语音输入、屏幕手写输入、触摸屏上的触摸键盘输入等等方式;
步骤2:经过索引得到匹配度、出现次数等等不反映用户个人偏好的匹配度参数。当手机收集不到任何有用的个人偏好信息的时候,以传统的排序算法排序,即:f(α1,α2,...,αN),计算得到N个不反映用户个人偏好的参数α1,α2,...,αN
步骤3:用户偏好参数提取模块提取用户偏好参数。假设M个反应用户个人偏好的参数被标记为β1,β2,...,βM,它们来自于手机的个人信息,例如通话记录、短消息记录、上一次查找结果反馈等等表达用户个人偏好的任意来源。它们可以是固定的,亦可以是随着时间而改变的。即β1(t),β2(t),...,βM(t),其中t为使用搜索的当前时刻,M可以是任意的自然数,表示参数的个数;
步骤4:基于步骤2与步骤3的匹配度和用户偏好进行排序。采用任意合理的函数f来设计排序算法:f(α1,α2,...,αN,β1(t),β2(t),...,βM(t));
步骤5:用户所需信息显示于手机屏幕的首条或首页。
下面是更为详细的实施步骤:用户输入关键词,输入关键词以后,查找索引表计算相应的参数。索引表的建立一般需要爬虫模块、数据监听模块、数据抽取模块、索引库模块以及索引策略模块。爬虫模块为第一次建立手机索引提供数据,根据手机平台提供的数据访问接口,查询得到手机的原始数据,并将原始数据提供给数据抽取模块,作为建立索引的数据源;手机索引***建立后,手机上数据的改变应该及时的反映到索引***中,此时数据监听模块感知手机数据的改变,并将该数据经过数据抽取模块,最终更新至索引库模块;索引库模块提供接口,将符合索引库格式的数据持久化到存储设备上,其中的操作包括增加、更新以及删除数据,其主要功能是分析文档数据,并将这些数据切分,与文档之间建立起反向索引的关系,以支持快速搜索;索引策略模块是根据手机平台的差异设计的,比如Symbian平台提供了可靠的数据监听接口而***的Android平台不提供,通过抽象索引策略模块,可以使我们的手机数据索引功能更加灵活,更加容易在各个手机平台上实现,取得最佳效果。当然本发明也可借助于其他方式建立索引库模块。
建立索引库以后,搜索***提取包括匹配度、出现次数等只和输入关键词有关并和用户个人偏好无关的参数。关键词匹配度的提取过程可以采用任意一种或者几种参数组成匹配度参数集合。可以包含关键词出现次数参数,它是提取关键词在待搜索文件或者词条里的出现次数;可以包含关键词出现过文章的次数参数,它是提取关键词在所有待搜索文件或词条里出现的文件数目;可以包含关键词的相似度,它是提取关键词和类似关键词信息的相似度。
出现次数又被称为术语出现频率(Terms of Frequency),它的定义为此关键词在待搜索文件里的出现次数。Lucene搜索引擎采用其的平方根作为特征之一,即:
F lucene = ( NumberOfOccurrence ) 1 2
其中参数NumberOfOccurrence为上述的特征,任何一种关于参数NumberOfOccurrence的特征,即满足如下函数关系的特征:α1=g1(NumberOfOccurrence)
函数g1应为合理的函数。另一种常见的特征α2是关键词在待搜索文件里出现的数目,如果出现的数目越多,那么其排名得分将会越高。文件频率的倒数也是一种常见的特征,它的定义是一个术语(Term)出现过待搜索文件的数目(需要解释的是关键词是由数个术语组成的)。如果出现次数越少,表示此术语越可靠和有效。Lucene采取的特征为:
F lucene = 1 + log ( NumberOfDocuments 1 + DocumentFrequency )
DocumentFrequency和NumberOfDocuments是此术语出现过的待搜索文件的数目和待搜索文件。此特征也应当被视为关于参数DocumentFrequency的一种实现。本发明考虑采用一种更加宽泛的特征定义方法,即:
α3=g3(DocumentFrequency)
任何合理的函数g3都是定义特征α3的方法。
用户个人偏好信息的提取是包含任何合理的充分并不冗余的参数集合{β1,β2,...,βM},其中M可以是任意的自然数,表示参数的个数。这些参数来自于用户手机里包含的任意信息,广义的定义可以认为:
βi=fi(η),i=1,2,..,M
其中参数η表示用户手机里所有的信息,包括本地所有的文件、程序、网页浏览记录等等信息。函数fi表示了从手机信息提取表征用户偏好的参数集的过程。下面分别从用户通话记录、短消息以及搜索结果记录里计算出用户偏好信息。
通话记录通常包含了用户最近通话的联系人、通话时间、通话状态(主叫、被叫或者未接来电)等等信息η1,可以看到,信息η1是被包含于手机信息η中的。这些信息可以从用户通话记录里解析得到。如果搜索结果里含有最近联系人名单里的联系人,通话次数PhoneTimes和通话时间PhoneLength将认为是一种信息,即用户偏好参数
β1=f1(η)≡f11)≡f1(PhoneTimes,PhoneLength)
其中参数β1是被提取的信息,它由两个参数通话次数和通话时间决定。函数f1可以是任何合理的函数,合理性在于当通话次数不同或者/而且通话时间不同的时候,取得一个不同的偏好参数β1,并通过整体函数f来改变排序结果。
短消息类似于通话记录,作为手机内的一种信息,可以用来提取用户偏好参数。如果最近发送或者接收到的短消息包含搜索结果里含有联系人或者短消息内容,短消息所包含的信息η2可以被利用来分析用户的偏好参数,和η1类似,它也是被包含于手机信息η中的。如果搜索结果包含短信息文件,那么此短信息的联系人ContactPerson、短信息发送或者接收时间TimeofMessege、短信息发送或者接收的数目NumberofMessege都可以成为计算用户偏好参数的依据。
β2=f2(η)≡f22)≡f2(ContactPerson,TimeofMessege,NumberofMessege)
用户的搜索记录也可以表示用户的个人偏好信息。用户输入搜索的关键词之后,通过索引查找和关键词匹配模块,得到了一系列的匹配结果。再根据排序当前的排序算法给出排序结果,并显示在手机显示屏上。***再根据用户的选择结果,更新排序算法。
上述实施方法并不仅限于手机,同样适合电脑的操作,也同样适用于所有具有相同功能的设备。

Claims (9)

1.一种手机信息搜索排序***,包括索引模块、关键词匹配模块、排序模块,索引模块根据手机信息建立索引,关键词匹配模块根据用户输入的关键词与索引进行关联,排序模块根据关联程度进行排序并显示在屏幕上,其特征在于它还包括用户偏好参数提取模块,所述的排序模块是基于关键词匹配模块和用户偏好参数提取模块进行排序的自适应排序模块。
2.如权利要求1所述的手机信息搜索排序***,其特征在于,所述的用户偏好参数提取模块所提取的参数是来自手机任意信息的包含至少一类用户偏好的参数βi,表达为βi=fi(η),i=1,2,...,M,η表示用户手机里所有信息,函数fi表示从手机信息提取表征用户偏好的参数集的过程。
3.如权利要求1或2所述的手机信息搜索排序***,其特征在于所述的自适应排序模块的排序是以匹配度参数和用户偏好参数为自变量的函数作用过程,其函数形式为f(α1,α2,..,αN,β1(t),β2(t),..,βM(t)),f为任意函数,α为匹配度参数。
4.如权利要求1或2所述的手机信息搜索排序***,其特征在于,所述的用户偏好参数提取模块可以从用户通话记录里根据用户的最近联系人提取用户偏好信息,包括最近联系人通话时间和通话次数,形成至少一类用户偏好参数。
5.如权利要求1或2所述的手机信息搜索排序***,其特征在于,所述的用户偏好参数提取模块可以从用户短消息接受和发送记录里提取用户偏好信息。
6.如权利要求1或2所述的手机信息搜索排序***,其特征在于,所述的用户偏好参数提取模块可以从用户过去搜索操作的反馈结果里提取用户偏好信息,形成至少一类用户偏好参数。
7.如权利要求1或2所述的手机信息搜索排序***,其特征在于,所述的用户偏好参数提取模块所提取的参数是固定的。
8.如权利要求1或2所述的手机信息搜索排序***,其特征在于,所述的用户偏好参数是随时间变化的。
9.如权利要求1或2所述的手机信息搜索排序***,其特征在于,用户偏好参数可以是用户预先设定的。
CNA2009100990320A 2009-05-31 2009-05-31 一种手机信息搜索排序*** Pending CN101571874A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2009100990320A CN101571874A (zh) 2009-05-31 2009-05-31 一种手机信息搜索排序***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2009100990320A CN101571874A (zh) 2009-05-31 2009-05-31 一种手机信息搜索排序***

Publications (1)

Publication Number Publication Date
CN101571874A true CN101571874A (zh) 2009-11-04

Family

ID=41231232

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2009100990320A Pending CN101571874A (zh) 2009-05-31 2009-05-31 一种手机信息搜索排序***

Country Status (1)

Country Link
CN (1) CN101571874A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102323937A (zh) * 2011-08-31 2012-01-18 百度在线网络技术(北京)有限公司 一种提供搜索结果的方法与设备
CN102611645A (zh) * 2012-04-12 2012-07-25 迈普通信技术股份有限公司 即时通讯客户端及其最近联系人列表生成方法
CN102801860A (zh) * 2012-08-07 2012-11-28 广东欧珀移动通信有限公司 一种添加常用联系人的方法
CN103185596A (zh) * 2011-12-30 2013-07-03 上海博泰悦臻电子设备制造有限公司 兴趣点搜索方法、兴趣点搜索装置
CN103443755A (zh) * 2012-03-19 2013-12-11 三菱电机株式会社 可编程显示器用画面数据生成装置
WO2014071624A1 (zh) * 2012-11-12 2014-05-15 东莞宇龙通信科技有限公司 终端和应用程序交互方法
CN104462573A (zh) * 2014-12-29 2015-03-25 北京奇艺世纪科技有限公司 一种视频搜索结果展示方法及装置
WO2015101132A1 (en) * 2013-12-30 2015-07-09 Tencent Technology (Shenzhen) Company Limited Method and system for presenting a listing of message logs
CN104850550A (zh) * 2014-02-13 2015-08-19 腾讯科技(深圳)有限公司 一种提示消息的排序方法和装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102323937A (zh) * 2011-08-31 2012-01-18 百度在线网络技术(北京)有限公司 一种提供搜索结果的方法与设备
CN103185596A (zh) * 2011-12-30 2013-07-03 上海博泰悦臻电子设备制造有限公司 兴趣点搜索方法、兴趣点搜索装置
CN103443755A (zh) * 2012-03-19 2013-12-11 三菱电机株式会社 可编程显示器用画面数据生成装置
CN102611645A (zh) * 2012-04-12 2012-07-25 迈普通信技术股份有限公司 即时通讯客户端及其最近联系人列表生成方法
CN102611645B (zh) * 2012-04-12 2015-05-20 迈普通信技术股份有限公司 即时通讯客户端及其最近联系人列表生成方法
CN102801860A (zh) * 2012-08-07 2012-11-28 广东欧珀移动通信有限公司 一种添加常用联系人的方法
WO2014071624A1 (zh) * 2012-11-12 2014-05-15 东莞宇龙通信科技有限公司 终端和应用程序交互方法
WO2015101132A1 (en) * 2013-12-30 2015-07-09 Tencent Technology (Shenzhen) Company Limited Method and system for presenting a listing of message logs
US10142279B2 (en) 2013-12-30 2018-11-27 Tencent Technology (Shenzhen) Company Limited Method and system for presenting a listing of message logs
CN104850550A (zh) * 2014-02-13 2015-08-19 腾讯科技(深圳)有限公司 一种提示消息的排序方法和装置
CN104462573A (zh) * 2014-12-29 2015-03-25 北京奇艺世纪科技有限公司 一种视频搜索结果展示方法及装置
CN104462573B (zh) * 2014-12-29 2019-04-12 北京奇艺世纪科技有限公司 一种视频搜索结果展示方法及装置

Similar Documents

Publication Publication Date Title
CN101571874A (zh) 一种手机信息搜索排序***
US9167070B2 (en) Widget discovery in computing devices
CN102419768B (zh) 用于文档搜索的搜索高速缓存
CN102301358B (zh) 使用社交联系的文本消歧
EP2630595B1 (en) Searching multiple data sources using a mobile computing device
US10621189B2 (en) In-application history search
JP2009037602A (ja) ナビゲーション可能な検索結果を提供する方法及びシステム
CN102439542A (zh) 电子设备的文本输入***及文本输入方法
JP6507541B2 (ja) 情報表示機器、情報表示プログラムおよび情報表示方法
TW201512865A (zh) 一種網頁數據搜索方法、裝置和系統
WO2012161928A1 (en) Techniques to automatically search selected content
WO2015027909A1 (en) Method and apparatus for obtaining hot-topic information
US20150127641A1 (en) Method and system for searching on mobile terminal
CN109543014B (zh) 人机对话方法、装置、终端及服务器
CN102890683A (zh) 信息提供方法及装置
CN110633438A (zh) 一种新闻事件处理的方法、终端、服务器及存储介质
CN110196833A (zh) 应用程序的搜索方法、装置、终端及存储介质
US20110264698A1 (en) Method for guiding operation of application program, mobile electronic device, and computer-readable medium using the method thereof
US10592572B2 (en) Application view index and search
EP3996354B1 (en) Electronic device and method for extracting and using semantic entity in text message of electronic device
WO2024036616A1 (zh) 一种基于终端的问答方法及装置
CN112925878A (zh) 数据处理方法和装置
CN112307198B (zh) 一种单文本的摘要确定方法和相关装置
CN109829157B (zh) 文本情绪呈现方法、文本情绪呈现装置以及存储介质
US20120023448A1 (en) Relational Service System and Method for Generating an Input Method

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20091104