CN107992586A - 基于智能语意的检索方法 - Google Patents
基于智能语意的检索方法 Download PDFInfo
- Publication number
- CN107992586A CN107992586A CN201711295891.8A CN201711295891A CN107992586A CN 107992586 A CN107992586 A CN 107992586A CN 201711295891 A CN201711295891 A CN 201711295891A CN 107992586 A CN107992586 A CN 107992586A
- Authority
- CN
- China
- Prior art keywords
- words
- word
- high frequency
- search method
- meaning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了基于智能语意的检索方法,其特征在于,包括以下步骤:S1:将需要检索的文字划分为多个词语;S2:得出所有词语出现的频率,并选出出现频率最高的词语作为高频词;S3:选出与高频词相关的词语;所述相关的词语是指通过介词、形容词或副词与高频词连接的词语;S4:将高频词和相关的词语作为检索词进行检索。本发明基于智能语意的检索方法,通过智能语意的方式对词汇进行筛选,事先了检索的智能化,可以有效的节省人力成本。
Description
技术领域
本发明涉及计算机技术领域,具体涉及基于智能语意的检索方法。
背景技术
在网络时代,我们无时无刻地进行着检索。在因特网上进行检索主要有两种方式:目录浏览和使用搜索引擎。目录浏览的方式即搜索引擎采用的方式,用户可以根据自己的需要点击目录,深入下一层子目录,从而找到自己需要的信息。这种方式便于查找某一类的信息集合,但是精确定位的能力不强。搜索引擎是目前最为常用的一种网络检索工具。用户只需要提交自己的需求,搜索引擎就能返回大量结果。这些结果按照和检索提问的相关性进行排序。除了搜索引擎之外,图书馆订购的各种数据库也是信息检索的重要途径。美国国会图书馆参考咨询馆员托马斯·曼就介绍了关键词检索、引文检索、相关性检索等检索方法。
目前的检索往往都采用人工的方式进行检索,而随着文件数据量的增大,人工检索需要的工作量会以几何倍上升,极大的提高了检索工作的人力成本。
发明内容
本发明所要解决的技术问题是目前的检索往往都采用人工的方式进行检索,而随着文件数据量的增大,人工检索需要的工作量会以几何倍上升,极大的提高了检索工作的人力成本,目的在于提供基于智能语意的检索方法,解决上述问题。
本发明通过下述技术方案实现:
基于智能语意的检索方法,其特征在于,包括以下步骤:S1:将需要检索的文字划分为多个词语;S2:得出所有词语出现的频率,并选出出现频率最高的词语作为高频词;S3:选出与高频词相关的词语;所述相关的词语是指通过介词、形容词或副词与高频词连接的词语;S4:将高频词和相关的词语作为检索词进行检索。
现有技术中,检索往往都采用人工的方式进行检索,而随着文件数据量的增大,人工检索需要的工作量会以几何倍上升,极大的提高了检索工作的人力成本。本发明应用时,先将需要检索的文字划分为多个词语;再得出所有词语出现的频率,并选出出现频率最高的词语作为高频词;然后选出与高频词相关的词语;所述相关的词语是指通过介词、形容词或副词与高频词连接的词语;再然后将高频词和相关的词语作为检索词进行检索。由于通过智能语意的方式对词汇进行筛选,事先了检索的智能化,可以有效的节省人力成本。
进一步的,步骤S1包括以下子步骤:通过语意树将需要检索的文字划分为多个词语。
进一步的,步骤S2包括以下子步骤:当出现频率最高的词语为两个及以上时,将两个及以上词语都作为高频词。
进一步的,所述词语的字节数不超过10个。
进一步的,所述高频词的出现频率为两次及以上。
本发明与现有技术相比,具有如下的优点和有益效果:
本发明基于智能语意的检索方法,通过智能语意的方式对词汇进行筛选,事先了检索的智能化,可以有效的节省人力成本。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例
本发明基于智能语意的检索方法,基于智能语意的检索方法,其特征在于,包括以下步骤:S1:将需要检索的文字划分为多个词语;S2:得出所有词语出现的频率,并选出出现频率最高的词语作为高频词;S3:选出与高频词相关的词语;所述相关的词语是指通过介词、形容词或副词与高频词连接的词语;S4:将高频词和相关的词语作为检索词进行检索。步骤S1包括以下子步骤:通过语意树将需要检索的文字划分为多个词语。步骤S2包括以下子步骤:当出现频率最高的词语为两个及以上时,将两个及以上词语都作为高频词。所述词语的字节数不超过10个。所述高频词的出现频率为两次及以上。
本实施例实施时,先将需要检索的文字划分为多个词语;再得出所有词语出现的频率,并选出出现频率最高的词语作为高频词;然后选出与高频词相关的词语;所述相关的词语是指通过介词、形容词或副词与高频词连接的词语;再然后将高频词和相关的词语作为检索词进行检索。由于通过智能语意的方式对词汇进行筛选,事先了检索的智能化,可以有效的节省人力成本。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.基于智能语意的检索方法,其特征在于,包括以下步骤:
S1:将需要检索的文字划分为多个词语;
S2:得出所有词语出现的频率,并选出出现频率最高的词语作为高频词;
S3:选出与高频词相关的词语;所述相关的词语是指通过介词、形容词或副词与高频词连接的词语;
S4:将高频词和相关的词语作为检索词进行检索。
2.根据权利要求1所述的基于智能语意的检索方法,其特征在于,步骤S1包括以下子步骤:
通过语意树将需要检索的文字划分为多个词语。
3.根据权利要求1所述的基于智能语意的检索方法,其特征在于,步骤S2包括以下子步骤:
当出现频率最高的词语为两个及以上时,将两个及以上词语都作为高频词。
4.根据权利要求1所述的基于智能语意的检索方法,其特征在于,所述词语的字节数不超过10个。
5.根据权利要求1所述的基于智能语意的检索方法,其特征在于,所述高频词的出现频率为两次及以上。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711295891.8A CN107992586A (zh) | 2017-12-08 | 2017-12-08 | 基于智能语意的检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711295891.8A CN107992586A (zh) | 2017-12-08 | 2017-12-08 | 基于智能语意的检索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107992586A true CN107992586A (zh) | 2018-05-04 |
Family
ID=62036708
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711295891.8A Pending CN107992586A (zh) | 2017-12-08 | 2017-12-08 | 基于智能语意的检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107992586A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101576928A (zh) * | 2009-06-11 | 2009-11-11 | 腾讯科技(深圳)有限公司 | 一种相关文章的选取方法和装置 |
CN102610101A (zh) * | 2012-04-01 | 2012-07-25 | 北京世纪高通科技有限公司 | 一种采集交通事件信息的方法 |
CN102737025A (zh) * | 2011-03-30 | 2012-10-17 | 上海铂龙信息科技有限公司 | 一种专利检索的语法转换方法 |
CN103020311A (zh) * | 2013-01-08 | 2013-04-03 | 深圳市宜搜科技发展有限公司 | 一种用户检索词的处理方法及*** |
CN104281653A (zh) * | 2014-09-16 | 2015-01-14 | 南京弘数信息科技有限公司 | 一种针对千万级规模微博文本的观点挖掘方法 |
CN104778201A (zh) * | 2015-01-23 | 2015-07-15 | 湖南科技大学 | 一种基于多查询结果合并的在先技术检索方法 |
CN106445916A (zh) * | 2016-09-19 | 2017-02-22 | 合肥清浊信息科技有限公司 | 专利检索用语义分析方法 |
-
2017
- 2017-12-08 CN CN201711295891.8A patent/CN107992586A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101576928A (zh) * | 2009-06-11 | 2009-11-11 | 腾讯科技(深圳)有限公司 | 一种相关文章的选取方法和装置 |
CN102737025A (zh) * | 2011-03-30 | 2012-10-17 | 上海铂龙信息科技有限公司 | 一种专利检索的语法转换方法 |
CN102610101A (zh) * | 2012-04-01 | 2012-07-25 | 北京世纪高通科技有限公司 | 一种采集交通事件信息的方法 |
CN103020311A (zh) * | 2013-01-08 | 2013-04-03 | 深圳市宜搜科技发展有限公司 | 一种用户检索词的处理方法及*** |
CN104281653A (zh) * | 2014-09-16 | 2015-01-14 | 南京弘数信息科技有限公司 | 一种针对千万级规模微博文本的观点挖掘方法 |
CN104778201A (zh) * | 2015-01-23 | 2015-07-15 | 湖南科技大学 | 一种基于多查询结果合并的在先技术检索方法 |
CN106445916A (zh) * | 2016-09-19 | 2017-02-22 | 合肥清浊信息科技有限公司 | 专利检索用语义分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Niwa et al. | Web page recommender system based on folksonomy mining for ITNG'06 submissions | |
CN105095281B (zh) | 一种基于日志挖掘的网站分类目录优化分析方法 | |
TW201537367A (zh) | 搜索建議提供方法及裝置 | |
KR102600018B1 (ko) | 엔티티 관계 마이닝 방법, 장치, 전자 기기, 저장 매체 및 프로그램 | |
Patel et al. | Significance of stop word elimination in meta search engine | |
CN111061876B (zh) | 事件舆情数据分析方法及装置 | |
Liu et al. | ICTNET at Temporal Summarization Track TREC 2013. | |
US10733185B2 (en) | Access pattern based optimization of memory access | |
CN107992586A (zh) | 基于智能语意的检索方法 | |
Shabanzadeh et al. | A Semantic based query expansion to search | |
Wang et al. | Fashionklip: Enhancing e-commerce image-text retrieval with fashion multi-modal conceptual knowledge graph | |
Elbassuoni et al. | ROXXI: Reviving witness dOcuments to eXplore eXtracted Information | |
US10242076B2 (en) | Method and system for processing a search request | |
Wei et al. | Using tweets to help sentence compression for news highlights generation | |
US10872124B2 (en) | Search engine | |
CN108021681A (zh) | 有利于提高检索精度的*** | |
Gaur et al. | Focused crawling with ontology using semi-automatic tagging for relevancy | |
Ketui et al. | An EDU-based approach for Thai multi-document summarization and its application | |
Yang et al. | Qualifier: question answering by lexical fabric and external resources | |
Zhang et al. | A refined method for detecting interpretable and real-time bursty topic in microblog stream | |
Zhai et al. | A Novel Framework for Related Entities Finding: ICTNET at TREC 2009 Entity Track. | |
Ye et al. | Research on pattern representation method in semi-supervised semantic relation extraction based on bootstrapping | |
Shekhar et al. | A WEBIR crawling framework for retrieving highly relevant web documents: evaluation based on rank aggregation and result merging algorithms | |
Gu et al. | Measuring social tag confidence: is it a good or bad tag? | |
Wan et al. | Query expansion approach based on ontology and local context analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180504 |