CN101576920B - 搜索引擎*** - Google Patents

搜索引擎*** Download PDF

Info

Publication number
CN101576920B
CN101576920B CN2009100872502A CN200910087250A CN101576920B CN 101576920 B CN101576920 B CN 101576920B CN 2009100872502 A CN2009100872502 A CN 2009100872502A CN 200910087250 A CN200910087250 A CN 200910087250A CN 101576920 B CN101576920 B CN 101576920B
Authority
CN
China
Prior art keywords
search engine
search
rule
authority
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2009100872502A
Other languages
English (en)
Other versions
CN101576920A (zh
Inventor
杨历
连林江
宋永强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yonyou Network Technology Co Ltd
Original Assignee
Yonyou Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yonyou Software Co Ltd filed Critical Yonyou Software Co Ltd
Priority to CN2009100872502A priority Critical patent/CN101576920B/zh
Publication of CN101576920A publication Critical patent/CN101576920A/zh
Application granted granted Critical
Publication of CN101576920B publication Critical patent/CN101576920B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了搜索引擎***,包括:索引数据库,用于储存数据索引信息,供搜索引擎使用;权限映射信息装置,通过权限有关非交互接口连接至业务***,储存权限映射信息;搜索规则配置装置,用于配置搜索规则;搜索引擎,通过权限无关非交互接口与业务***连接,有选择地监听业务***的业务数据变更事件,权限无关非交互接口用于处理业务数据变更事件,搜索引擎工作时读取权限映射信息和所述搜索规则,在所述业务***发生业务数据变更事件时,所述搜索引擎判断是否引起数据索引变化,如果结果为是,则获取与所述数据索引变化相关的数据变更列表,并产生新的虚拟变更列表。根据本发明的搜索引擎***改善了传统ERP查询在用户输入上的交互特性。

Description

搜索引擎***
技术领域
本发明涉及数据搜索技术,更具体而言,涉及搜索引擎***。
背景技术
ERP软件均带有数据查询功能,但传统ERP查询功能需要用户明确输入查询的类型范围,条件列和输出列。而且在查询结果排序方面也是需要用户指定。
在现有的ERP搜索产品中也存在一些基于文档搜索的ERP搜索实现方案。基于文档搜索的ERP搜索存在如下缺陷:
1)不能很好的利用ERP数据本身的结构化特性。
2)文档搜索引擎一般采用TF-IDF算法(一种基于词频统计信息得到数据权重的算法)决定命中结果权重信息,进而利用权重信息引导结果排序。但此算法对ERP数据不适用,排序效果很差。
3)由于文档搜索引擎没有考虑到ERP数据组织特点,所以不能快速的将结果分组显示。
4)文档搜索引擎不能给出ERP产品特有的相关搜索词汇推荐。
发明内容
为了解决上述技术问题至少之一,本发明提供了一种搜索引擎***,包括:索引数据库,用于储存数据索引信息,供所述搜索引擎使用;权限映射信息装置,通过权限有关非交互接口连接至业务***,储存权限映射信息;搜索规则配置装置,用于配置搜索规则;搜索引擎,通过权限无关非交互接口与业务***连接,有选择地监听所述业务***的业务数据变更事件,所述权限无关非交互接口用于处理所述业务数据变更事件,所述搜索引擎工作时读取所述权限映射信息和所述搜索规则,在所述业务***发生业务数据变更事件时,所述搜索引擎判断是否引起数据索引变化,如果结果为是,则获取与所述数据索引变化相关的数据变更列表,并产生新的虚拟变更列表。
优选地,所述业务数据变更事件包括:业务数据增加处理、业务数据修改处理、业务数据删除处理。
优选地,所述搜索引擎***进一步包括:短语规则信息装置,用于储存短语规则。
优选地,在用户输入词汇或短语时,所述搜索引擎判断所述词汇或短语是否符合所述短语规则,如果符合,则根据所述短语规则产生搜索规划,如果不符合,则采用缺省搜索规划。
优选地,所述搜索引擎根据所述搜索规划或所述缺省搜索规划进行权限整合。
优选地,所述搜索引擎根据所述搜索规划或所述缺省搜索规划进行权限整合包括以下处理:执行所述搜索规划或所述缺省搜索规划,得到命中数据类型列表,进行数据类型权限过滤;进一步执行所述搜索规划或所述缺省搜索规划得到结果详细列表,进行数据实例权限过滤;获取命中结果每一个实例的详细信息,进行数据字段权限过滤。
优选地,所述搜索引擎逐条获取命中结果的摘要信息,并将命中部分予以标记。所述搜索引擎通过交互接口发送重建指令给所述业务***,指示所述业务***重建索引。所述搜索引擎所获得摘要信息为所述业务***的数据库中的结构化信息。
优选地,所述搜索引擎***为ERP搜索引擎***,所述业务***为ERP业务***。本领域技术人员应当理解,虽然本说明书给出了应用于ERP的实例,但是本发明可以应用于任何适用搜索技术的场合,例如,SCM、CRM等。
根据本发明的搜索引擎***改善了传统ERP查询在用户输入上的交互特性。相对于传统ERP查询,具有如下优势:
能够自动理解用户输入,根据用户输入的词汇或者短语智能的得到查询结果。可以极大的简化用户输入,方便用户使用。有助于ERP普及化。
附图说明
图1示出了根据本发明的搜索引擎***的逻辑框图;
图2示出了根据本发明的搜索引擎***的结构图;
图3示出了根据本发明的搜索引擎***中使用的权限无关非交互结构处理业务数据变更事件的流程图;
图4示出了根据本发明的搜索引擎***的搜索过程的流程图。
具体实施方式
下面结合附图说明根据本发明的具体实施方式。
图1示出了根据本发明的搜索引擎***的逻辑框图。
根据本发明的搜索引擎***100包括:索引数据库102,用于储存数据索引信息,供所述搜索引擎使用;权限映射信息装置104,通过权限有关非交互接口连接至业务***,储存权限映射信息;搜索规则配置装置106,用于配置搜索规则;搜索引擎108,通过权限无关非交互接口与业务***连接,有选择地监听所述业务***的业务数据变更事件,所述权限无关非交互接口用于处理所述业务数据变更事件,所述搜索引擎工作时读取所述权限映射信息和所述搜索规则,在所述业务***发生业务数据变更事件时,所述搜索引擎判断是否引起数据索引变化,如果结果为是,则获取与所述数据索引变化相关的数据变更列表,并产生新的虚拟变更列表。
优选地,所述业务数据变更事件包括:业务数据增加处理、业务数据修改处理、业务数据删除处理。
优选地,所述搜索引擎***100进一步包括:短语规则信息装置110,用于储存短语规则。
优选地,在用户输入词汇或短语时,所述搜索引擎110判断所述词汇或短语是否符合所述短语规则,如果符合,则根据所述短语规则产生搜索规划,如果不符合,则采用缺省搜索规划。
优选地,所述搜索引擎110根据所述搜索规划或所述缺省搜索规划进行权限整合。
优选地,所述搜索引擎110根据所述搜索规划或所述缺省搜索规划进行权限整合包括以下处理:执行所述搜索规划或所述缺省搜索规划,得到命中数据类型列表,进行数据类型权限过滤;进一步执行所述搜索规划或所述缺省搜索规划得到结果详细列表,进行数据实例权限过滤;获取命中结果每一个实例的详细信息,进行数据字段权限过滤。
优选地,所述搜索引擎110逐条获取命中结果的摘要信息,并将命中部分予以标记。所述搜索引擎110通过交互接口发送重建指令给所述业务***,指示所述业务***重建索引。所述搜索引擎110所获得摘要信息为所述业务***的数据库中的结构化信息。
优选地,所述搜索引擎***100为ERP搜索引擎***,所述业务***为ERP业务***。本领域技术人员应当理解,虽然本说明书给出了应用于ERP的实例,但是本发明可以应用于任何适用搜索技术的场合,例如,SCM、CRM等。
图2示出了根据本发明的搜索引擎***的结构图。该ERP搜索引擎***200包括ERP索引数据库202、ERP权限映射信息装置204、ERP权限有关非交互接口206、ERP搜索规则配置装置208、ERP搜索引擎210、ERP权限无关非交互接212、ERP短语规则信息装置214。
ERP搜索引擎210对外有4组输入输出:ERP数据变更监视信息的输入;ERP索引信息重建命令输入;ERP权限映射信息导入;用户的搜索词、搜索短语输入和搜索结果输出。
图3示出了根据本发明的搜索引擎***中使用的权限无关非交互结构处理业务数据变更事件的流程图。
ERP数据变更监视过程参见图3。首先搜索引擎根据自身的“配置信息”决定监视哪些ERP业务***中的哪些数据类型需要被监视。(配置信息:比如说ERP业务中有500种单据和40种档案。但其中部分数据并不需要被索引。所以在可以通过“配置信息”指定500种单据中的那些单据参加搜索,那些不参加搜索)。当ERP业务数据中对应数据类型的数据产生新增、修改或者删除后,ERP业务***将产生对应的“数据变更事件”,并将这个事件发送到ERP搜索引擎。
ERP搜索引擎根据变更事件的类型是“新增”、“修改”还是“删除”。执行对应的索引数据库的索引库变更动作。然后,ERP搜索引擎判断该数据变更是否会引发关联数据的变化。(比如:基础数据中供应商名称发生修改。则这个供应商有关的所有“应收单”的收款人字段都会发生变化)。如果该变更将会引发关联索引项变化,在原始数据修改事件发生后,搜索引擎追加关联数据的虚拟数据修改事件。虚拟数据修改事件同样也能引发索引数据库的变化。
ERP索引信息重建过程:
当ERP业务数据出现较大范围变化。比如数据恢复、数据升级或者ERP搜索引擎因故没有启动监视等情况后。ERP搜索引擎支持全索引重建过程。在ERP全索引重建过程中,ERP搜索引擎扫描所有参加搜索的ERP业务数据,并对其建立索引。
ERP权限映射信息导入:
ERP搜索引擎内部直接支持权限过滤。即用户在ERP业务***中不能查看的数据,在ERP搜索中也不能查看。为了简化用户操作,ERP搜索引擎并不要求用户在ERP搜索中再次指定用户的各种权限。它直接从ERP业务***中导入权限。权限导入过程分为三部分。1)数据类型权限导入。2)数据实例权限导入。3)数据字段权限导入。
图4示出了根据本发明的搜索引擎***的搜索过程的流程图。
ERP搜索过程如下:
用户输入词汇或者短语后。ERP搜索引擎首先分析用户输入词汇的词性。其中词性信息并非来自于自然语言的词性,而是来自于ERP业务***中各种数据的键(名称、编码)信息。比如说“10011”在自然语言中是一个数字。但在ERP搜索引擎中会查找那些编号、编码、名称为“10011”的数据。进而决定“10011”这个词汇在ERP业务***中的词性。比如说ERP数据库中某财务凭证编码为“10011”,那么10011在此ERP搜索***中的词性被断定为凭证。如果ERP数据库中某应收单的编码为“10011”,ERP搜索***认为这个词的词性为应收单。
用户输入短语中多个词的词性信息决定后,根据“短语规则信息”中的配置决定搜索过程。比如说用户输入“五道口海淀”。经过词性分析,用户的输入属于“三级地名-二级地名”短语规则。根据这一规则,将ERP业务数据中关于海淀区的五道口的信息作为结果呈现给客户。而“朝阳区的五道口”不作为搜索结果。如果没有找到匹配的短语规则,搜索引擎执行缺省规则,即包含短语中各词汇之一的数据。
在搜索的短语规则确定后搜索引擎执行该规则。并产生相应结果。搜索结果按照词汇的命中位置进行一级排序,所有命中信息按照键字段命中、单据本体字段命中、单据引用信息字段命中的次序排列,然后结果按照ERP业务数据的时间信息做二级排序(新数据在前)。另外,作为创新点,ERP搜索引擎除了要给出命中信息列表外,还将命中信息按“数据的类型”聚合成为多个分组。方便用户进一步在特定类型数据中继续寻找结果。比如说在所有命中结果中有50条“应收单”和45条“应付单”。本ERP搜索产品会将结果分为两组,而不是采用一个列表混合所有结果的方法进行展示。
ERP搜索和其他搜索引擎类似均,采用倒排方法完成索引。所谓倒排,就是将用户可能进行搜索的词汇及对应的搜索结果形成一个二元组,并作为一个中间结果保存起来。当用户搜索这些词汇时将中间结果中准备好的搜索结果稍加处理即可呈现给用户。比如索引文件中保存了“高碳铆钉”的搜索结果有订单A,订单B,订单C等等。当用户搜索“高碳铆钉”时,直接将事先准备好的搜索结果(订单A,订单B,订单C)做“摘要处理”后即可呈现给用户。(一个单据的全部信息展示在屏幕上要占很大篇幅,所谓“摘要处理”就是一种抽取数据中的关键信息,方便用户查阅的手段)
ERP搜索和其他所有搜索引擎一样都存在分词问题。所谓分词,就是决定事先将那哪些词汇的搜索结果保存起来的技术。众所周知,在各种搜索引擎中都不会将所有的语句分割组合都保存在倒排文件中,显然这么做会产生组合***问题。而解决组合***的方法就是分词处理,其策略决定了语句中哪些词汇进入倒排文件,哪些序列组合信息将被忽略。
虽然ERP搜索和其他搜索引擎一样也存在分词问题,但ERP搜索引擎的词汇并不是自然语言中的词汇。ERP搜索引擎的分词信息来自于ERP数据库中的结构化信息。而不像文档搜索中的分词来自于自然语言的词汇统计信息。
例如某结构件编号“ES38.576.45”。这一信息在自然语言中显然不被认为是成词汇,但ERP***中他们是不可分割的“词汇”。再例如科目号“09-2543-987”在自然语言中也显然不是词汇,但在ERP业务***中则认为它是一个词汇。在ERP业务数据中大量数据是编号信息,和自然语言有很大不同。
对于单个词汇搜索,ERP搜索的“权重”(用于决定多条命中结果排列顺序的数值)来自于数据匹配的位置,而不是词频统计。
对于多个词组成的词组搜索,ERP搜索的权重信息来自于对词汇规则的判定。比如说当用户搜索“王五南通汽车”,ERP搜索将根据“王五”和“南通汽车”的词汇特性满足“人名-供应商名”规则,并执行搜索。在本例中,搜索引擎认为用户要寻找的是“南通汽车这个企业的王五”
ERP搜索结果将根据命中数据的类型进行分组显示。
ERP业务数据变更处理过程中,搜索引擎会根据业务数据之间的关系自动将相关数据的索引重建。
本领域技术人员应当理解,虽然本说明书给出了应用于ERP的实例,但是本发明可以应用于任何适用搜索技术的场合,例如,SCM、CRM等。
根据本发明的搜索引擎***改善了传统ERP查询的交互特性。相对于传统ERP查询,具有如下优势:
能够自动理解用户输入,根据用户输入的词汇或者短语智能的得到查询结果。可以极大的简化用户输入,方便用户使用。有助于ERP普及化。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种搜索引擎***,其特征在于,包括:
索引数据库,用于储存数据索引信息,供搜索引擎使用;
权限映射信息装置,通过权限有关非交互接口连接至业务***,储存权限映射信息;
搜索规则配置装置,用于配置搜索规则;
所述搜索引擎,通过权限无关非交互接口与业务***连接,有选择地监听所述业务***的业务数据变更事件,所述权限无关非交互接口用于处理所述业务数据变更事件,所述搜索引擎工作时读取所述权限映射信息和所述搜索规则,在所述业务***发生业务数据变更事件时,所述搜索引擎判断是否引起数据索引变化,如果结果为是,则获取与所述数据索引变化相关的数据变更列表,并产生新的虚拟变更列表。
2.根据权利要求1所述的搜索引擎***,其特征在于,所述业务数据变更事件包括:业务数据增加处理、业务数据修改处理、业务数据删除处理。
3.根据权利要求1所述的搜索引擎***,其特征在于,所述搜索引擎***进一步包括:短语规则信息装置,用于储存短语规则。
4.根据权利要求3所述的搜索引擎***,其特征在于,在用户输入词汇或短语时,所述搜索引擎判断所述词汇或短语是否符合所述短语规则,如果符合,则根据所述短语规则产生搜索规则,如果不符合,则采用缺省搜索规则。
5.根据权利要求4所述的搜索引擎***,其特征在于,所述搜索引擎根据所述搜索规则或所述缺省搜索规则进行权限整合。
6.根据权利要求5所述的搜索引擎***,其特征在于,所述搜索引擎根据所述搜索规则或所述缺省搜索规则进行权限整合包括以下处理:
执行所述搜索规则或所述缺省搜索规则,得到命中数据类型列表,进行数据类型权限过滤;
进一步执行所述搜索规则或所述缺省搜索规则得到结果详细列表,进行数据实例权限过滤;
获取命中结果每一个实例的详细信息,进行数据字段权限过滤。
7.根据权利要求6所述的搜索引擎***,其特征在于,所述搜索引擎逐条获取命中结果的摘要信息,并将命中部分予以标记。
8.根据权利要求1至7中任一项所述的搜索引擎***,其特征在于,所述搜索引擎通过交互接口发送重建指令给所述业务***,指示所述业务***重建索引。
9.根据权利要求7所述的搜索引擎***,其特征在于,所述搜索引擎所获得摘要信息为所述业务***的数据库中的结构化信息。
10.根据权利要求1至7中任一项所述的搜索引擎***,其特征在于,所述搜索引擎***为ERP搜索引擎***,所述业务***为ERP业务***。
CN2009100872502A 2009-06-19 2009-06-19 搜索引擎*** Expired - Fee Related CN101576920B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100872502A CN101576920B (zh) 2009-06-19 2009-06-19 搜索引擎***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100872502A CN101576920B (zh) 2009-06-19 2009-06-19 搜索引擎***

Publications (2)

Publication Number Publication Date
CN101576920A CN101576920A (zh) 2009-11-11
CN101576920B true CN101576920B (zh) 2012-11-28

Family

ID=41271854

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100872502A Expired - Fee Related CN101576920B (zh) 2009-06-19 2009-06-19 搜索引擎***

Country Status (1)

Country Link
CN (1) CN101576920B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013114438A1 (ja) * 2012-01-31 2013-08-08 株式会社アイ・ピー・エス 携帯端末管理サーバ、および携帯端末管理プログラム
CN102799645B (zh) * 2012-06-28 2016-05-04 用友网络科技股份有限公司 安全搜索装置和安全搜索方法
CN103810220B (zh) * 2012-11-15 2018-02-27 腾讯科技(深圳)有限公司 一种微博搜索方法及装置
CN102968501B (zh) * 2012-12-07 2016-02-17 福建亿榕信息技术有限公司 一种通用的全文搜索方法
CN103488474A (zh) * 2013-09-02 2014-01-01 用友软件股份有限公司 数据对象监听装置和数据对象监听方法
CN103559301A (zh) * 2013-11-14 2014-02-05 华为技术有限公司 更新数据的方法、数据库触发器和搜索引擎
CN103942260A (zh) * 2014-03-21 2014-07-23 深圳海联讯科技股份有限公司 一种结构化数据的权限数据索引技术
CN104199956B (zh) * 2014-09-16 2018-01-16 成都博智维讯信息技术有限公司 一种erp数据语音搜索方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1983279A (zh) * 2005-11-30 2007-06-20 Sap股份公司 数据元素建模
CN101093480A (zh) * 2005-12-29 2007-12-26 Sap股份公司 用于企业数据对象的***和方法
CN101127053A (zh) * 2007-10-16 2008-02-20 金蝶软件(中国)有限公司 一种在数据选择界面实现动态模糊查询的方法和***
CN101196912A (zh) * 2006-12-04 2008-06-11 Sap股份公司 用于应用程序状态同步的方法和设备
US7512985B1 (en) * 2008-04-30 2009-03-31 International Business Machines Corporation System, method, and computer program product for implementing search-and retrieval-compatible data obfuscation

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1983279A (zh) * 2005-11-30 2007-06-20 Sap股份公司 数据元素建模
CN101093480A (zh) * 2005-12-29 2007-12-26 Sap股份公司 用于企业数据对象的***和方法
CN101196912A (zh) * 2006-12-04 2008-06-11 Sap股份公司 用于应用程序状态同步的方法和设备
CN101127053A (zh) * 2007-10-16 2008-02-20 金蝶软件(中国)有限公司 一种在数据选择界面实现动态模糊查询的方法和***
US7512985B1 (en) * 2008-04-30 2009-03-31 International Business Machines Corporation System, method, and computer program product for implementing search-and retrieval-compatible data obfuscation

Also Published As

Publication number Publication date
CN101576920A (zh) 2009-11-11

Similar Documents

Publication Publication Date Title
CN101576920B (zh) 搜索引擎***
CN107402991B (zh) 一种写入半结构化数据的方法和分布式NewSQL数据库***
US7406477B2 (en) Database system with methodology for automated determination and selection of optimal indexes
US6757670B1 (en) Method and system for query processing
AU2002229734B2 (en) Database system and query optimiser
CN103177058B (zh) 存储为行存储和列存储二者的混合数据库表
Höffner et al. Linkedspending: Openspending becomes linked open data
US20110072008A1 (en) Query Optimization with Awareness of Limited Resource Usage
Perez et al. History-aware query optimization with materialized intermediate views
CN108292315A (zh) 储存和检索数据立方体中的数据
CN107943952A (zh) 一种基于Spark框架进行全文检索的实现方法
CN103548019A (zh) 用于根据数据仓库提供统计信息的方法和***
CN102760143A (zh) 一种在数据库***中动态整合执行结构的方法和装置
CN101566986A (zh) 联机事务处理中的数据处理方法和装置
CN101128825A (zh) 树的检索、合计、排序方法、信息处理装置以及树的检索、合计、排序程序
US20070250517A1 (en) Method and Apparatus for Autonomically Maintaining Latent Auxiliary Database Structures for Use in Executing Database Queries
CN107657052A (zh) 一种基于元数据管理的数据治理***
CN106777343A (zh) 增量分布式索引***和方法
CN107784030A (zh) 一种处理连接查询的方法及装置
CN102117318A (zh) 一种企业信息化***的数据处理方法
US12026160B2 (en) Query plan cache in database systems
US20050065939A1 (en) Method and system for optimizing snow flake queries
CN106484815B (zh) 一种基于海量数据类sql检索场景的自动识别优化方法
US7725448B2 (en) Method and system for disjunctive single index access
Sattler et al. Autonomous query-driven index mining

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: 100094 Haidian District North Road, Beijing, No. 68

Patentee after: Yonyou Network Technology Co., Ltd.

Address before: 100094 Haidian District North Road, Beijing, No. 68

Patentee before: UFIDA Software Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121128

Termination date: 20180619

CF01 Termination of patent right due to non-payment of annual fee