CN104462369A - 一种导航设备的搜索自动补全方法 - Google Patents

一种导航设备的搜索自动补全方法 Download PDF

Info

Publication number
CN104462369A
CN104462369A CN201410747130.1A CN201410747130A CN104462369A CN 104462369 A CN104462369 A CN 104462369A CN 201410747130 A CN201410747130 A CN 201410747130A CN 104462369 A CN104462369 A CN 104462369A
Authority
CN
China
Prior art keywords
search
word
suggestion
frequency
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410747130.1A
Other languages
English (en)
Inventor
解威
李潍希
于航
孙浩增
朱小莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang Mxnavi Co Ltd
Original Assignee
Shenyang Mxnavi Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang Mxnavi Co Ltd filed Critical Shenyang Mxnavi Co Ltd
Priority to CN201410747130.1A priority Critical patent/CN104462369A/zh
Publication of CN104462369A publication Critical patent/CN104462369A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • G06F16/2448Query languages for particular applications; for extensibility, e.g. user defined types
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种导航设备的搜索自动补全方法,包括搜索自动补全格式的设计,自动补全数据库的编译方法,提供建议的排序打分算法,自动补全的软件功能实现;自动补全数据库格式、编译方法:自动补全数据中主要存储词和词组;词会基于搜索数据产生,通过分词器将数据分词,同时对这些词统计出现的频率,并记录词出现在搜索数据中的位置,产生了词;当词生成后,对词与词同时出现的频率大于经验阈值的结果将生成词组,判定词组产生的经验阈值与搜索数据体量有关。本发明的优点:在搜索输入的过程中,加入了搜索建议,用户可以根据搜索目的,选择搜索建议进行搜索,解决了用户搜索输入操作步骤多的问题,使用本发明的方法也会使搜索建议结果排序更加合理。

Description

一种导航设备的搜索自动补全方法
技术领域
本发明涉及车载导航设备搜索建议或搜索提示或搜索辅助功能技术领域,特别涉及了一种导航设备的搜索自动补全方法。
背景技术
用户在使用导航的搜索功能时,为了比较迅速的查找到一个地点,经常平均要输入4至5个字符,输入关键字的个数少于这个数值,通常来说会因为搜索结果太多,需要花费较多的时间去浏览这些结果而降低了用户的体验。
用户不能既快速、又输入尽可能多的字符,如下几个原因限制了用户的这个行为:用户开车过程中,想加入一个途经地,用户想在道边停车,或等信号的时候,通过简单地几个步骤快速的完成操作。但现在的拼音输入法,对于要输入4至5个字符,大约需要点击屏幕20次以上,汉字手写输入法也需要12次以上,这样想快速都难。用户对查找的地点不熟悉,只知道地点的读音,或者只知道地点名称的部分,因此也没办法输入更多的字符。
发明内容
本发明的目的是为了解决上述问题,特提供了一种导航设备的搜索自动补全方法。
本发明提供了一种导航设备的搜索自动补全方法,其特征在于:所述的导航设备的搜索自动补全方法,包括搜索自动补全格式的设计,自动补全数据库的编译方法,提供建议的排序打分算法,自动补全的软件功能实现;解决方案具体如下:
自动补全数据库格式、编译方法:
自动补全数据中主要存储词和词组;词会基于搜索数据产生,通过分词器将数据分词,同时统计词出现的频率,并记录词出现在搜索数据中的位置。当词生成后,对频率大于经验阈值的结果将生成词组,判定词组产生的经验阈值与搜索数据体量有关。判定过程通过对词之间搜索位置的匹配,例如:词A出现在文档Doc1,Doc2,Doc4,Doc5中,词B出现在在文档Doc1,Doc2,Doc3,于是词A和词B同时出现在Doc1和Doc2中,同时出现的次数是2次,当2次大于经验值,那就判定为词A和词B具有某种粘着关系,词A和词B将构成词组。在存储词A和词B时,中间需要添加一个连接符号,至于采用什么连接符号,这可以跟搜索引擎一起来制定,可以是空格AB,可以是与运算符A&B,其前提是用户容易理解这个以词组的形式给出的搜索建议。
当搜索词和词组产生后,按照一定的顺序来排序,要与查找的顺序保持一致,例如:如果按照拼音字母音序查找,那么要按照拼音音序来排列这些词。如果按照汉字来查找,推荐采用按照字符编码的顺序来排序。当这些词和词组有序后,就可以考虑制作目标数据了。具体的数据的格式可以参考下面的格式设计。在实际的使用过程中,可能会针对不同应用场景,建议词数据量的差异,为了提供性能,还会增加一些跳跃表。如果在搜素建议中,还要提供其他的信息,还会增加一些表或者字段。因此自动补全的格式不仅限于这里列出的内容,可以做必要的扩充。
建议词索引:
会对搜索建议词的首个字符建立索引,输入都是从头开始输入,建立索引是高效的。这里1、2、3字段是必选。对于输入匹配到【词首字】后,可以通过【指向建议词】字段,跳转到对应建议词的位置。对于有词组的情况,可以考虑使用4、5字段。对于用户在第一个词输入完,第二个词开始输入的情况,可以通过【下一个建议词索引】,跳转到第二个建议词索引来进行匹配。如果数据量少,也可以直接跳转到【建议词】。
表1.建议词索引的数据格式
编号 字段 值类型 是否需要
1 建议词首字 字符 必选
2 指向建议词 地址偏移 必选
3 建议词个数 整数数值 必选
4 下一个建议词个数 整数数值 可选
5 下一个建议词索引 地址偏移 可选
说明:
字段1,“Hello”建议词的首字是“H”
字段2,例如:字段1是“H”,字段2会指向第一个含有H的建议词在整个自动补全数据库中的位置
字段3,例如:字段1是“H”,字段3会给出所有含有“H”的建议词的个数
字段4,5,对于“Hello world”,字段1是“H”,字段4会指向“W”的建议词索引
建议词:建议词的具体内容。所有字段都是必须存储的,存储的和搜索建议显示的保持一致。
表2.建议词的数据格式
编号 字段 值类型 是否需要
1 建议词字符长度 整数数值 必选
2 建议词 字符串 必选
排序相关:
这是搜索建议列表的排序因子,最常见影响排序的因子是出现频率和用户使用频率,如果单纯的使用字段1,整个排序就会是静态化,用户行为没有考虑进去。因此设计了出现频率和用户使用频率相互叠加作用在搜索建议的排序上。
排序打分公式: Score i = Freqd i FreqD × factor 1 + Frequ i FreqU × factor 2
Freqd建议词i在数据中出现的频率,Freqd全部建议词在数据中总的出现频率;
Frequ建议词i用户使用的频率,FreqU用户选择过的词总的使用频率;
factor1数据的排序调整因子,factor2用户使用频率的调整因子。factor1+factor2==1
以上列出的打分公式是对自动补全最基本的排序建模,实际应用过程中,可以增加字段,逐步调整排序的结果。
表3.频率的数据格式
编号 字段 值类型 是否需要
1 出现频率 整数数值 必选
2 用户使用频率 整数数值 必选
自动补全的软件功能实现:
首先判断是否有新的输入,如果有,将开始自动补全过程。
对所有的输入字符需要判断从哪个字符开始进行自动补全,通常的做法可以考虑使用分词器来做,最后的一个词将参与自动补全。这个词会在建议词中查找,如果查找到,将会对结果排序,并提供排序结果。如果没有查找到,不需要提供。
提供搜索建议后,等待用户选择,如果用户选择,将把对应词和词组的使用频率加1,如果没有选择,又开始输入新的字符,将重复之前的流程。
本发明的优点:
本发明所述的导航设备的搜索自动补全方法,在搜索输入的过程中,加入了搜索建议,用户可以根据搜索的目的,选择搜索建议进行搜索,解决了用户搜索输入操作步骤多的问题。搜索建议为了提高准确性,使用搜索数据来产生。为了提高结果排序的合理性,同时考虑了数据和用户使用频率的影响。
附图说明
下面结合附图及实施方式对本发明作进一步详细的说明:
图1为导航设备的搜索自动补全方法流程图。
具体实施方式
实施例1
本实施例提供了一种导航设备的搜索自动补全方法,其特征在于:所述的导航设备的搜索自动补全方法,包括搜索自动补全格式的设计,自动补全数据库的编译方法,提供建议的排序打分算法,自动补全的软件功能实现;解决方案具体如下:
自动补全数据库格式、编译方法:
自动补全数据中主要存储词和词组;词会基于搜索数据产生,通过分词器将数据分词,同时统计词出现的频率,并记录词出现在搜索数据中的位置。当词生成后,对频率大于经验阈值的结果将生成词组,判定词组产生的经验阈值与搜索数据体量有关。判定过程通过对词之间搜索位置的匹配,例如:词A出现在文档Doc1,Doc2,Doc4,Doc5中,词B出现在在文档Doc1,Doc2,Doc3,于是词A和词B同时出现在Doc1和Doc2中,同时出现的次数是2次,当2次大于经验值,那就判定为词A和词B具有某种粘着关系,词A和词B将构成词组。在存储词A和词B时,中间需要添加一个连接符号,至于采用什么连接符号,这可以跟搜索引擎一起来制定,可以是空格AB,可以是与运算符A&B,其前提是用户容易理解这个以词组的形式给出的搜索建议。
当搜索词和词组产生后,按照一定的顺序来排序,要与查找的顺序保持一致,例如:如果按照拼音字母音序查找,那么要按照拼音音序来排列这些词。如果按照汉字来查找,推荐采用按照字符编码的顺序来排序。当这些词和词组有序后,就可以考虑制作目标数据了。具体的数据的格式可以参考下面的格式设计。在实际的使用过程中,可能会针对不同应用场景,建议词数据量的差异,为了提供性能,还会增加一些跳跃表。如果在搜素建议中,还要提供其他的信息,还会增加一些表或者字段。因此自动补全的格式不仅限于这里列出的内容,可以做必要的扩充。
建议词索引:
会对搜索建议词的首个字符建立索引,输入都是从头开始输入,建立索引是高效的。这里1、2、3字段是必选。对于输入匹配到【词首字】后,可以通过【指向建议词】字段,跳转到对应建议词的位置。对于有词组的情况,可以考虑使用4、5字段。对于用户在第一个词输入完,第二个词开始输入的情况,可以通过【下一个建议词索引】,跳转到第二个建议词索引来进行匹配。如果数据量少,也可以直接跳转到【建议词】。
表1.建议词索引的数据格式
编号 字段 值类型 是否需要
1 建议词首字 字符 必选
2 指向建议词 地址偏移 必选
3 建议词个数 整数数值 必选
4 下一个建议词个数 整数数值 可选
5 下一个建议词索引 地址偏移 可选
说明:
字段1,”Hello”建议词的首字是“H”
字段2,例如:字段1是“H”,字段2会指向第一个含有H的建议词在整个自动补全数据库中的位置
字段3,例如:字段1是“H”,字段3会给出所有含有“H”的建议词的个数
字段4,5,对于“Hello world”,字段1是“H”,字段4会指向“W”的建议词索引
建议词:建议词的具体内容,所有字段都是必须存储的,存储的和搜索建议显示的保持一致。
表2.建议词的数据格式
编号 字段 值类型 是否需要
1 建议词字符长度 整数数值 必选
2 建议词 字符串 必选
排序相关:
这是搜索建议列表的排序因子,最常见影响排序的因子是出现频率和用户使用频率,如果单纯的使用字段1,整个排序就会是静态化,用户行为没有考虑进去。因此设计了出现频率和用户使用频率相互叠加作用在搜索建议的排序上。
排序打分公式: Score i = Freqd i FreqD × factor 1 + Frequ i FreqU × factor 2
Freqd建议词i在数据中出现的频率,Freqd全部建议词在数据中总的出现频率;
Frequ建议词i用户使用的频率,FreqU用户选择过的词总的使用频率;
factor1数据的排序调整因子,factor2用户使用频率的调整因子。factor1+factor2==1
以上列出的打分公式是对自动补全最基本的排序建模,实际应用过程中,可以增加字段,逐步调整排序的结果。
表3.频率的数据格式
编号 字段 值类型 是否需要
1 出现频率 整数数值 必选
2 用户使用频率 整数数值 必选
自动补全的软件功能实现:
首先判断是否有新的输入,如果有,将开始自动补全过程。
对所有的输入字符需要判断从哪个字符开始进行自动补全,通常的做法可以考虑使用分词器来做,最后的一个词将参与自动补全。这个词会在建议词中查找,如果查找到,将会对结果排序,并提供排序结果。如果没有查找到,不需要提供。
提供搜索建议后,等待用户选择,如果用户选择,将把对应词和词组的使用频率加1,如果没有选择,又开始输入新的字符,将重复之前的流程。

Claims (2)

1.一种导航设备的搜索自动补全方法,其特征在于:所述的导航设备的搜索自动补全方法,包括搜索自动补全格式的设计,自动补全数据库的编译方法,提供建议的排序打分算法,自动补全的软件功能实现;解决方案具体如下:
自动补全数据库格式、编译方法:
自动补全数据中主要存储词和词组;词会基于搜索数据产生,通过分词器将数据分词,同时统计词出现的频率,并记录词出现在搜索数据中的位置;当词生成后,对词与词同时出现的频率大于经验阈值的结果将生成词组,判定词组产生的经验阈值与搜索数据体量有关;
当搜索词和词组产生后,按照一定的顺序来排序,要与查找的顺序保持一致;
建议词索引:会对搜索建议词的首个字符建立索引,输入都是从头开始输入,建立索引是高效的;
建议词:建议词的具体内容,所有字段都是必须存储的;存储的和搜索建议显示的保持一致;
排序相关:这是搜索建议列表的排序因子,最常见影响排序的因子是出现频率和用户使用频率,如果单纯的使用字段1,整个排序就会是静态化,用户行为没有考虑进去;出现频率和用户使用频率相互叠加作用在搜索建议的排序上;
排序打分公式: Score i = Freqd i FreqD × factor 1 + Frequ i FreqU × factor 2
Freqd建议词i在数据中出现的频率,Freqd全部建议词在数据中总的出现频率;
Frequ建议词i用户使用的频率,FreqU用户选择过的词总的使用频率;
factor1数据的排序调整因子,factor2用户使用频率的调整因子;factor1+factor2=1;
以上列出的打分公式是对自动补全最基本的排序建模,实际应用过程中,可以增加字段,逐步调整排序的结果。
2.按照权利要求1所述的导航设备的搜索自动补全方法,其特征在于:所述的导航设备的搜索自动补全方法,自动补全的软件功能实现:
首先判断是否有新的输入,如果有,将开始自动补全过程;
对所有的输入字符需要判断从哪个字符开始进行自动补全,通常的做法可以考虑使用分词器来做,最后的一个词将参与自动补全;这个词会在建议词中查找,如果查找到,将会对结果排序,并提供排序结果;如果没有查找到,不需要提供;
提供搜索建议后,等待用户选择,如果用户选择,将把对应词和词组的使用频率加1,如果没有选择,又开始输入新的字符,将重复之前的流程。
CN201410747130.1A 2014-12-08 2014-12-08 一种导航设备的搜索自动补全方法 Pending CN104462369A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410747130.1A CN104462369A (zh) 2014-12-08 2014-12-08 一种导航设备的搜索自动补全方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410747130.1A CN104462369A (zh) 2014-12-08 2014-12-08 一种导航设备的搜索自动补全方法

Publications (1)

Publication Number Publication Date
CN104462369A true CN104462369A (zh) 2015-03-25

Family

ID=52908404

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410747130.1A Pending CN104462369A (zh) 2014-12-08 2014-12-08 一种导航设备的搜索自动补全方法

Country Status (1)

Country Link
CN (1) CN104462369A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111241427A (zh) * 2020-01-06 2020-06-05 百度在线网络技术(北京)有限公司 查询自动补全的方法、装置、设备和计算机存储介质
CN112528156A (zh) * 2020-12-24 2021-03-19 北京百度网讯科技有限公司 建立排序模型的方法、查询自动补全的方法及对应装置
WO2021139209A1 (zh) * 2020-01-06 2021-07-15 百度在线网络技术(北京)有限公司 查询自动补全的方法、装置、设备和计算机存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060106769A1 (en) * 2004-11-12 2006-05-18 Gibbs Kevin A Method and system for autocompletion for languages having ideographs and phonetic characters
CN101794307A (zh) * 2010-03-02 2010-08-04 光庭导航数据(武汉)有限公司 基于互联网分词思想的车载导航poi搜索引擎
CN102687138A (zh) * 2009-12-28 2012-09-19 雅虎公司 搜索建议聚类和呈现

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060106769A1 (en) * 2004-11-12 2006-05-18 Gibbs Kevin A Method and system for autocompletion for languages having ideographs and phonetic characters
CN102687138A (zh) * 2009-12-28 2012-09-19 雅虎公司 搜索建议聚类和呈现
CN101794307A (zh) * 2010-03-02 2010-08-04 光庭导航数据(武汉)有限公司 基于互联网分词思想的车载导航poi搜索引擎

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111241427A (zh) * 2020-01-06 2020-06-05 百度在线网络技术(北京)有限公司 查询自动补全的方法、装置、设备和计算机存储介质
CN111241427B (zh) * 2020-01-06 2021-06-11 百度在线网络技术(北京)有限公司 查询自动补全的方法、装置、设备和计算机存储介质
WO2021139209A1 (zh) * 2020-01-06 2021-07-15 百度在线网络技术(北京)有限公司 查询自动补全的方法、装置、设备和计算机存储介质
WO2021139221A1 (zh) * 2020-01-06 2021-07-15 百度在线网络技术(北京)有限公司 查询自动补全的方法、装置、设备和计算机存储介质
JP2022530690A (ja) * 2020-01-06 2022-06-30 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド クエリ自動補完の方法、装置、機器、及びコンピュータ記憶媒体
CN112528156A (zh) * 2020-12-24 2021-03-19 北京百度网讯科技有限公司 建立排序模型的方法、查询自动补全的方法及对应装置
CN112528156B (zh) * 2020-12-24 2024-03-26 北京百度网讯科技有限公司 建立排序模型的方法、查询自动补全的方法及对应装置

Similar Documents

Publication Publication Date Title
KR101465769B1 (ko) 사전 단어 및 어구 판정
CN107704102B (zh) 一种文本输入方法及装置
JP5362095B2 (ja) インプットメソッドエディタ
KR100806936B1 (ko) 자동완성 추천어를 정정하여 노출하는 자동완성 추천어제공 방법 및 시스템
CN102999483B (zh) 一种文本矫正的方法和装置
CN109948122B (zh) 输入文本的纠错方法、装置及电子设备
US20130061139A1 (en) Server-based spell checking on a user device
CN103123624B (zh) 确定中心词的方法及装置、搜索方法及装置
CN106250364A (zh) 一种文本修正方法及装置
CN104011712A (zh) 对跨语言查询建议的查询翻译进行评价
JP2010531492A (ja) ワード確率決定
US20090083255A1 (en) Query spelling correction
CN105431809A (zh) 用于国际语言的虚拟键盘输入
KR20070094402A (ko) 일반 추천어 및 광고 추천어 자동완성 방법 및 시스템
CN106326233B (zh) 地址提示方法及装置
US11531693B2 (en) Information processing apparatus, method and non-transitory computer readable medium
US20130060560A1 (en) Server-based spell checking
CN105468790A (zh) 一种评论信息检索方法和装置
US10650195B2 (en) Translated-clause generating method, translated-clause generating apparatus, and recording medium
CN104462369A (zh) 一种导航设备的搜索自动补全方法
CN110619112B (zh) 用于汉字的读音标注方法、装置、电子设备及存储介质
US11436278B2 (en) Database creation apparatus and search system
US20120317141A1 (en) System and method for ordering of semantic sub-keys
US20150186551A1 (en) Query Formation and Modification
CN112182353B (zh) 用于信息搜索的方法、电子设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150325