WO2011153708A1 - 一种基于领域概念的信息搜索方法 - Google Patents

一种基于领域概念的信息搜索方法 Download PDF

Info

Publication number
WO2011153708A1
WO2011153708A1 PCT/CN2010/073814 CN2010073814W WO2011153708A1 WO 2011153708 A1 WO2011153708 A1 WO 2011153708A1 CN 2010073814 W CN2010073814 W CN 2010073814W WO 2011153708 A1 WO2011153708 A1 WO 2011153708A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
query
search
model
database
Prior art date
Application number
PCT/CN2010/073814
Other languages
English (en)
French (fr)
Inventor
朱学文
Original Assignee
上海坦瑞信息技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 上海坦瑞信息技术有限公司 filed Critical 上海坦瑞信息技术有限公司
Priority to PCT/CN2010/073814 priority Critical patent/WO2011153708A1/zh
Publication of WO2011153708A1 publication Critical patent/WO2011153708A1/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Definitions

  • Relational databases provide data query technology. At present, most relational databases use standard SQL statements for data query. To improve the speed of data lookup, indexed technologies are provided by relational databases. However, the limitation is that data query between heterogeneous databases is difficult; querying a part of data in a column of a data table, when there is no way to index when the amount of data is large, the query will be very slow; User-used
  • the "select" statement query which returns the result (value), is often difficult to understand by the user.
  • the search performance of a character string that is not highly structured is greatly degraded, and when the amount of data is large, it is almost impossible to use.
  • the symptomatic column is a text description: "Headache, fever", to find out all the symptoms that contain "fever”.
  • the data rows are extremely inefficient in the database and are almost impossible to perform.
  • the query based on relational data is basically oriented to a single database, and the programmer writes the query interface to find the commonly used data for the user. Users can only find partial data within a limited range to a certain extent. Any data that is looked up in a relational database requires the finder to write the SQL statement and understand the data structure of the relational database.
  • the text search engine is a popular technology in recent years. Like the search function provided by Windows, it can find the file name and file content. But such engines cannot find content in a relational database. The security mechanisms of the data being looked up are also difficult to establish.
  • the web page For a single data source from an Internet web page, the web page is indexed by a certain algorithm. You cannot find a relational database or find text information for a local computer.
  • Metadata Type (MDT) technology is another direction that separates data from models, supports post-modeling and natural language modeling. It can be used directly by domain experts. It can solve the problem of integrated integration of heterogeneous data. This technology, implemented by the model engine, has a good data security mechanism. Summary of the invention
  • the results of an enterprise search need to be associated with user rights. Not all data is like Internet data and can be found by any queryer. Most enterprise data, such as government secrets, personal privacy (such as medical HIV infection, bank accounts), require certain permissions and authorization to find and use.
  • the search of relational databases can be achieved through user rights, but text search engines do not. This feature.
  • the present invention solves this problem by utilizing a model engine under MDT technology.
  • the present invention proposes a mechanism for describing cumbersome information in a domain conceptual model, while searching is performed on an abstract domain concept system, and the results are displayed in an understandable domain concept, thereby effectively storing information. Ways and other irrelevant information are separated.
  • the domain concept here refers to a concept, such as "staff”, which has a relatively fixed meaning in a particular business organization, such as hotel staff including cleaners and chefs, and state agency staff including cadres And employees.
  • the data scattered in each database and file is mapped to the conceptual model, and then the conceptual model is indexed and stored in the index file of the search engine.
  • the user When searching, the user inputs the query condition close to the natural language; processes the user input to conform to the query format; search engine search; uses the key obtained by the search engine to query the model engine, and the model engine returns the query result close to the natural language to the search engine.
  • search engine returns the results to the user.
  • the framework of the method is shown in the figure.
  • the domain conceptual model is: Staff (name, gender, date of birth, home address).
  • the present invention utilizes a software that maps the structure of a database into a domain conceptual model. (There is really a MDT to model the table structure.) Users can use this software to manipulate the domain concept model, and the software translates this operation into operations on the original information system, such as: Query "Name is Zhang San's work. Person”, this software translates this operation into a SQL statement "select
  • FIG. 3 a schematic diagram of mapping multiple databases to a DOP data center. Map multiple relational databases one by one and extract their conceptual models.
  • the conceptual model expressed in MDT is stored in the D0P data center.
  • a KEY is generated for each record of the source database when it is mapped, and is stored in the model engine.
  • the model engine can use the KEY to query the record to the source database.
  • Direct mapping of data across heterogeneous relational databases can be achieved using mapping techniques. Because multiple relational databases are mapped to a D0P data center, the D0P data center can be indexed and searched using a search engine. The model engine can use the KEY to query the record to the source database, thereby enabling the query.
  • the original conceptual model is extracted by MDT mapping relational database and displayed by visual tools. In this way, the analysis of the original database is completed at one time. Work and present in the form of a conceptual model. It avoids the need to re-analyze database repetitive operations each time you add a modified index directly to a relational database.
  • the D0P data center is indexed.
  • MDT directly expresses the domain concept
  • the original conceptual model is extracted by MDT mapping relational database and displayed by visual tools. In this way, the analysis of the original database is completed at one time and presented in the form of a conceptual model. This avoids the need to re-analyze database repetitive operations each time you add a modification to the relational database.
  • the basic unit of content search engine search is the word element, and Figure 4 is the structure diagram of the word element.
  • the content search engine analyzes the data source as it collects the data, splitting the data source into tokens.
  • the content of the lexical record, the location in the original text, etc. Stored in Documents ⁇
  • the search engine When searching with the domain concept, the search engine returns the results of the domain concept, and the domain concept server then retrieves the entire information result through the original information mechanism and returns it to the user in the form of a domain concept that the user can understand.
  • the query statement is first analyzed to obtain the word element, and then the word element is used to query the documents, and the search engine returns the result with the matching rate.
  • the matching rate range is selected from which the word is read from the documents. Because the "location in the original text" in the lexical element generated when the index is added in the D0P data center is replaced with the result of a KEYo query as the KEY, it is passed to the model engine.
  • Search engines can circumvent the technical challenges of full table scanning. This is because after the first search of the search engine is completed, the specific content of all documents is not read, but only the tokens that satisfy the matching rate range are returned. The database search then returns all the recorded content to the application result set. of. At the same time, because the search engine itself provides fuzzy query function, the problem of fuzzy query can also be directly solved.
  • the model engine can use the KEY to find the value in the source database, and the model engine uses the key to query the data in the original data set.
  • the model engine wraps the results of the query into an MDT format and returns the results to the search engine.
  • the search engine returns the results to the user.
  • the present invention solves this problem by using a model engine under MDT technology.
  • the model engine adopts ACL as an object-oriented security mechanism, combined with the MDT-body data model to make the data level security mechanism clear and simple. Fine-grained data security at the metadata level allows users or groups of users to set access rights to any MDT, or even an attribute in the MDT.
  • the search content can be customized by the end user and can return to the domain concept that the user can easily identify.
  • This kind of search method under the premise of facing the same amount of data, the search efficiency and performance of fuzzy search far exceeds the relational database.
  • FIG. 1 is an architectural diagram of an information search method based on a domain concept.
  • Figure 2 is a flow chart for indexing data scattered across databases and files.
  • Figure 3 is a schematic diagram of mapping multiple databases to a DOP data center.
  • Figure 4 is a structural diagram of a word element.
  • Figure 5 is a flow chart for processing user searches. detailed description
  • the specific implementation process is divided into two steps. First, as shown in Figure 2, the data scattered in each database and file is indexed. The specific steps are as shown in 1 ⁇ 3. Next, as shown in FIG. 5, the user search process is processed, and the specific steps are as shown in 4-6.
  • the MDT modeling tools supported by DOP technology establish domain concept models, such as the establishment of a "fever” conceptual model in the health field.
  • patient contains the following tree: "age”, “gender”, “date of birth”, “address”, “medical record number”, and so on.
  • the "patient” table contains "age”, "gender” and other information, of course, these column names are usually varied, we only need to establish
  • the model engine passes the mapped data to a generic search engine, such as Lucene.
  • Search engines classify and index information by their own algorithms.
  • the user enters a query condition close to the natural language, such as "patient name Wang Hao test result”.
  • the engine processes the information and passes it to the domain concept model.
  • the user When the user has searched for the field, it can be classified in advance to increase the speed, such as diagnostic information, inspection results, and so on.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

一种基于领域概念的信息搜索方法
技术领域
计算机软件、 数据搜索、 关系数据库的数据查询、 企业数据搜索。
背景技术
随着信息技术在各行业的说深入应用, 产生了大量的电子数据, 这些数据有的 存在关系数据库中, 有些是以文本形式存在于企业的个人计算机上, 还有一些如通 知、 新闻存在于具体企业的内部网站或邮件中。 如何简单的查找和使用这些数据, 计算机工业的专家发明了很多查询技术和方法。书本专利是基于以下背景技术下的发 明。
1、 关系数据库的数据查询技术
关系数据库提供了数据查询技术, 目前大多关系数据库都使用标准的 SQL 语句进行数据查询, 为提高数据查找的速度, 由关系数据库提供索引技术。 但其局 限性在于, 跨异构数据库之间的数据查询存在较大困难; 查询某个数据表中的一列 的部分数据, 在数据量较大时并没办法索引时, 查询会得非常慢; 用户自行使用的
" select "语句查询, 其返回结果 (值) , 往往很难被用户理解。 另外, 对结构化 程度不高的字符串的查找性能下降很多, 在数据量大的情况下, 几乎无法使用。 比 如, 有症状列, 是一段文字描述: "头痛、 发热" , 要找出所有含有 "发热"症状 数据行在数据库中效率极差, 几乎无法进行。
所以, 基于关系数据的查询, 基本上是面向单一数据库, 由程序员编写查询界 面, 给用户查找常用的数据。 用户只能一定程度上, 在有限的范围内查找部分数 据。 任意查找在关系数据库中的数据, 需要查找者会写 SQL语句, 并且要了解关系 数据库的数据结构。
关系数据的搜索技术不能查找数据库以外的文本等其他非结构化信息。 即使像 EXCEL这样的文件, 也要转找成数据库的格式才可能被数据库查找。 2、 文本搜索引擎
文本搜索引擎是近年较热门的技术, 像 windows提供的搜索功能一样, 可以 查找文件名、 文件内容。 但这类引擎不能查找关系数据库内的内容。 被查找的数据 的安全机制也很难建立。
3、 互联网的网页搜索引擎
面向来自互联网网页的单一数据源, 通过一定算法, 对网页进行索引。 不能 查找关系数据库, 也不能查找本地计算机的文本信息。
4、 元数据类型 (MDT) 技术
前三项是现有的查询搜索技术。 元数据类型 (MDT) 技术是另外一个方向, 它 可以实现数据与模型的分离, 支持后建模和自然语言建模。 可供领域专家直接使 用。 可以解决异构的数据的一体化整合难题。 这一技术, 由模型引擎实现, 有较好 的数据安全机制。 发明内容
1 . 要解决的技术问题
如背景技术 1中所述, 基于关系数据库的查询技术面临较大的局限。
A、 实现跨异构关系数据库的数据直接查询方式。
传统技术下, 跨越多个关系数据库***查询是难以实现的。 如果要实现跨系 统查询, 大部分方式是先建立数据仓库, 把异构数据放到单一的数据库中, 再进行 面向主题的统计分析, 时效性差, 成本高。
B、 实现关系数据的模糊查询, 并规避全表扫描的技术难题。
查询关系数据库某列中部分数据, 可以使用 like 语句模糊查找, 但是, 如 果数据量较大, 由于无法使用索引, 速度会非常慢, 达到用户难以接受的程度。 影 响数据库其他在线使用的用户。 本发明可以解决这类问题。
C、 真正实现自定义查询和返回结果的可读性。 关系数据库技术下, 没有专业技术人员帮助用户编写个性化的查询界面, 用 户无法自定义查询, 或者出现的查询结果只显示了各列的数据和列名, 大部分用户 无法看懂其内容。 比如, 在某健康管理***中, 从用户身份表中直接使用 select语 句查找, 用户 "年龄" 、 "身高" 、 并从体态特征表中查找 "腰围" , 可能会出现 " 75 、 120、 75" "23、 90、 35"这两组数据, 如果不是事先清楚排列顺序, 这 组数据很容量混淆, 外行甚至不知其所云。
D、 解决单一搜索引擎查找全部结构化与非结构化的企业级数据的难题。 当关系数据库与其他类型数据混合存在情况下如存在非结构化数据如文本文 件、 网页、 关系数据库数据共存时, 单一查询方式不能实现数据查找。
E、 实现搜索结果自动过滤功能。
企业搜索的结果需要与用户权限关联, 不是所有的数据都像互联网数据一 样, 可以给任何查询者查到。 大多企业数据如政府机密、 个人隐私 (如医疗的 HIV 感染、 银行账户) 等, 需要一定的权限并得到授权才能查找和使用, 关系数据库的 查找可以通过用户权限实现, 但文本搜索引擎等并没有这个功能。 本发明利用 MDT 技术下的模型引擎解决了这个问题。
2. 发明解决问题的要点
本发明提出一种机制, 能够将繁杂的信息以领域概念模型加以描述, 而搜索 则在经过抽象的领域概念***上进行, 结果以可以理解的领域概念显示出来,这样 就有效地将信息的存储方式以及其它无关的信息加以分离。
这里的领域概念是指一个概念, 如 "工作人员" , 这个概念在一个特定的企 业组织中有其相对固定的意义, 如宾馆的工作人员包括清洁工和厨师, 而国家机关 的工作人员包括干部和职工。
以下是关于本发明的具体描述。 首先把分散在各个数据库和文件里的数据映射到概念模型上, 再为概念模型 加索引, 存储到搜索引擎的索引文件中。
搜索时用户输入接近自然语言的查询条件; 处理用户输入, 使其符合查询格 式; 搜索引擎搜索; 用搜索引擎得到的 key到模型引擎查询, 模型引擎将接近自然 语言的查询结果返回给搜索引擎, 搜索引擎将结果返回给用户。 该方法的框架如图 所示。
1 ) 把分散在各个数据库和文件里的数据映射到概念模型上
如 "工作人员" , 可能存在一个数据库表 "worker"之中, 数据库表的列 为 "name, sex, birthday, address " 。 领域概念模型为: 工作人员 (姓名、 性别、 出生年月、 家庭地址) 。 本发明利用一种软件, 能够将数据库的结构映 射成领域概念模型。 (真的要有 MDT对表结构建模) 而用户可以使用这个软件对 领域概念模型进行操作, 而此软件将此操作翻译成对原始信息***的操作, 如: 查询 "姓名为张三的工作人员" , 此软件将此操作翻译成 SQL语句 " select
* from worker where name=' 张三, ", 将结果转换成领域概念的形式。 这种 软件已经在前一个发明中得到了阐述。
如图 3所示, 将多个数据库映射到 DOP数据中心的原理图。 对多个关系数据 库逐一做映射, 抽取其概念模型。 用 MDT表达的概念模型存放在 D0P数据中心里。 映 射时对源数据库的每条记录生成 KEY, 存储在模型引擎中。 模型引擎可以用该 KEY到 源数据库查询到该记录。
利用映射技术可以实现跨异构关系数据库的数据直接查询。 因为将多个关系 数据库映射到 D0P数据中心后可对 D0P数据中心加索引, 利用搜索引擎对其搜索。 而 模型引擎又能用该 KEY到源数据库查询到该记录, 由此可以实现查询。
如前所述因为 MDT直接表达领域概念, 用 MDT映射关系数据库, 把原来的概念 模型提取出来, 并由可视化工具展示出来。 这样, 一次完成对原数据库的分析工 作, 并以概念模型的形式展示。 避免了直接向关系数据库添加修改索引时每次都需 要重新分析数据库的重复操作。
2 ) 加索引
将映射后的信息推到一个通用的文本搜索引擎 (通用的文本搜索引擎有很 多, 如 Lucene是一个开源的文本搜索器) 之中进行分类, 在这一步中, 需要分 类(index)的内容以领域概念***的形式推入文本搜索器之中。
D0P数据中心加索引。 如前所述因为 MDT直接表达领域概念, 用 MDT映射关系 数据库, 把原来的概念模型提取出来, 并由可视化工具展示出来。 这样, 一次完成 对原数据库的分析工作, 并以概念模型的形式展示。 避免了直接向关系数据库添加 修改索弓 I时每次都需要重新分析数据库的重复操作。
内容搜索引擎搜索的基本单位是词元, 图 4是词元的结构图。 内容搜索引擎 收集数据时分析数据源, 将数据源分割成词元。 词元记录内容, 在原文中的位置等 信息。 存储在 Documents ^
3)搜索
在利用领域概念来进行搜索时, 搜索引擎返回领域概念的结果, 而领域概念服 务器再经过原来的信息机制取得整个信息结果, 并以用户可以理解的领域概念 的形式返回给用户。 查询时首先分析查询语句得到词元, 再用该词元到 documents查询, 搜索引 擎会返回有匹配率的结果。 选定匹配率范围, 从该范围内到 documents读取词元。 因为在 D0P数据中心添加索引时生成的词元中 "在原文中的位置"被替换为某一个 KEYo 查询的结果为该 KEY, 将其传入模型引擎。
搜索引擎可以规避全表扫描的技术难题。 这是因为搜索引擎第一次检索完成 后, 并没有把所有 documents中的具体内容都读取出来, 而只是返回满足匹配率范 围内的词元。 而数据库检索则把所有记录内容都取得以后再开始返回给应用结果集 的。 同时, 由于搜索引擎本身提供模糊查询功能, 模糊查询的难题也可以直接解 决。
模型引擎可以利用该 KEY找到他在源数据库里的值, 模型引擎用该 key到原 数据集里查询需要的数据。 模型引擎把查询到的结果包装成 MDT的格式, 并将结果 返回给搜索引擎。 搜索引擎把结果返回给用户。
本发明利用 MDT技术下的模型引擎解决了这个问题。 模型引擎采用 ACL是面向 对象 (Object ) 的安全机制, 和 MDT—体化数据模型相结合, 使得数据水平的安全 机制变得清晰而简捷。 元数据水平的细粒度数据安全机制可以为用户或用户组对任 何一个 MDT, 甚至 MDT中的一个属性设置访问权限。
3. 本发明的优点:
扩大了搜索的范围, 利用单一搜索引擎实现跨关系数据库、 非结构化文本数 据、 网页、 甚至医学图像的搜索和查询。
简化了企业搜索的难度。
搜索内容可以由最终用户自定义, 并且可以返回用户容易识别的领域概念。 这种搜索方式, 在面向同样数量数据的前提下, 模糊查找的搜索效率和性能 远远超过关系数据库。 附图说明
图 1是一种基于领域概念的信息搜索方法的架构图。
图 2是为分散在各个数据库和文件里的数据加索引的流程图。
图 3是将多个数据库映射到 DOP数据中心的原理图。
图 4是词元的结构图。
图 5是处理用户搜索流程图。 具体实施方式
具体实施过程分为两步, 首先如图 2所示, 为分散在各个数据库和文件 里的数据加索引, 具体步骤如 1~3。 其次如图 5所示, 处理用户搜索过程, 具体步骤如 4~6所示。
1. 建立领域概念模型
DOP技术支持的 MDT建模工具建立领域概念模型, 如在健康领域建立 "发热" 的概念模型。
模型名: 发热
属性:
测量部位: 腋下;
数值: >37.5
单位: 摄氏度;
2. 建立模型与数据的映射 这一部可以用已有的软件工具实现。
例如: 如需建立一个 "病人" 的概念, 我们先建立 "病人"概念的抽象数据 模型, 即 "病人"包含以下树形: "年龄" 、 "性别" 、 "出生日期" 、 "地 址" 、 "病历号" , 等等。
若现有***已有了 "病人" 的数据存放于关系数据库中, 其中 "病人"表中 含有 "年龄" 、 "性别"等信息, 当然这些列名称通常是五花八门, 我们只要建立
MDT抽象数据概念, "病人" 中的 "年龄"对应于物理数据中的 "年龄"列, "性 别"对应于物理数据中的 "姓名"列, 等等。
3. 模型引擎将映射好的数据传给通用的搜索引擎, 如 Lucene.
搜索引擎按自己的算法将信息进行分类和索引。
4. 用户搜索
用户输入接近自然语言的查询条件, 例如 "病人 姓名 王妍 检验结果" 。 引擎处理信息, 传给领域概念模型。
5. 返回结果 领域概念模型将信息组合成用户可以识别的格式, 返回给用户作为查询结果。 王妍的检验结果:
WBC白细胞总数 3. 84
参考值 4. 0-10. 0 10— 9/L
检验时间 2009-11-07
6、 分类检索
当用户已搜索的领域时, 可以事先分类, 提高速度, 如诊断信息、 检查结果等。

Claims

权利要求书
1. 一种把分散在各个数据库和文件里的数据映射到概念模型上的解决方案,从而可以实现跨 异构关系数据库的数据直接查询。 该方案由如下几步组成: 对多个关系数据库逐一做映 射, 提取其概念模型, 以概念模型的形式展示;映射时对源数据库的每条记录生成键值
(key) , 并对键值集中存储;
2. 如权利要求 1 所述的把分散在各个数据库和文件里的数据映射到概念模型上的解决方案, 其特征在于一次完成对原数据库的分析工作, 并以概念模型的形式展示。避免了直接向关 系数据库添加或修改索引时每次都需要重新分析数据库的重复操作。
3. 如权利要求 1 所述的把分散在各个数据库和文件里的数据映射到概念模型上的解决方案, 其特征在于实现跨多个异构关系数据库的数据直接查询。因为将多个关系数据库映射到数 据中心后可对数据中心的数据加索引, 再利用搜索引擎对其搜索。而模型引擎又能用该键 值到源数据库取得该记录, 由此可以实现查询。
PCT/CN2010/073814 2010-06-11 2010-06-11 一种基于领域概念的信息搜索方法 WO2011153708A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/CN2010/073814 WO2011153708A1 (zh) 2010-06-11 2010-06-11 一种基于领域概念的信息搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2010/073814 WO2011153708A1 (zh) 2010-06-11 2010-06-11 一种基于领域概念的信息搜索方法

Publications (1)

Publication Number Publication Date
WO2011153708A1 true WO2011153708A1 (zh) 2011-12-15

Family

ID=45097466

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2010/073814 WO2011153708A1 (zh) 2010-06-11 2010-06-11 一种基于领域概念的信息搜索方法

Country Status (1)

Country Link
WO (1) WO2011153708A1 (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1936896A (zh) * 2006-09-20 2007-03-28 网之易信息技术(北京)有限公司 一种基于搜索引擎的信息检索方法及检索***
CN101405725A (zh) * 2006-03-10 2009-04-08 独立行政法人情报通信研究机构 多义词的信息检索装置以及程序

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101405725A (zh) * 2006-03-10 2009-04-08 独立行政法人情报通信研究机构 多义词的信息检索装置以及程序
CN1936896A (zh) * 2006-09-20 2007-03-28 网之易信息技术(北京)有限公司 一种基于搜索引擎的信息检索方法及检索***

Similar Documents

Publication Publication Date Title
US8473473B2 (en) Object oriented data and metadata based search
US10394803B2 (en) Method and system for semantic-based queries using word vector representation
US8311999B2 (en) System and method for knowledge research
US20040015514A1 (en) Method and system for managing data objects
US20150154306A1 (en) Method for searching related entities through entity co-occurrence
US20140108460A1 (en) Data store organizing data using semantic classification
CN110321446B (zh) 相关数据推荐方法、装置、计算机设备及存储介质
CN103198136B (zh) 一种基于时序关联的个人电脑文件查询方法
CN105183884A (zh) 一种基于大数据技术的搜索引擎***及搜索引擎方法
CN111400323B (zh) 数据检索方法、***、设备及存储介质
KR20160053933A (ko) 스마트 검색 정제 기법
CN103678350B (zh) 社交网络搜索结果展示方法及装置
US10885081B2 (en) Systems and methods for contextual ranking of search results
Yafooz et al. Managing unstructured data in relational databases
Lin et al. OWL Ontology Extraction from Relational Databases via Database Reverse Engineering.
CN111061828A (zh) 一种数字图书馆知识检索方法及装置
KR101441219B1 (ko) 정보 엔터티들의 자동 연관
WO2018059430A1 (zh) 数据库搜索
Chen et al. An intelligent annotation-based image retrieval system based on RDF descriptions
CN104462075A (zh) 一种互联网人物信息的属性提取方法
TWI605353B (zh) File classification system, method and computer program product based on lexical statistics
JP3786233B2 (ja) 情報検索方法および情報検索システム
TWI234720B (en) Related document linking managing system, method and recording medium
WO2011153708A1 (zh) 一种基于领域概念的信息搜索方法
TW420777B (en) A query method of dynamitic attribute database management

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10852701

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 10852701

Country of ref document: EP

Kind code of ref document: A1