CN107992586A - 基于智能语意的检索方法 - Google Patents

基于智能语意的检索方法 Download PDF

Info

Publication number
CN107992586A
CN107992586A CN201711295891.8A CN201711295891A CN107992586A CN 107992586 A CN107992586 A CN 107992586A CN 201711295891 A CN201711295891 A CN 201711295891A CN 107992586 A CN107992586 A CN 107992586A
Authority
CN
China
Prior art keywords
words
word
high frequency
search method
meaning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711295891.8A
Other languages
English (en)
Inventor
徐娇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Valley Information Technology Co Ltd
Original Assignee
Chengdu Valley Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Valley Information Technology Co Ltd filed Critical Chengdu Valley Information Technology Co Ltd
Priority to CN201711295891.8A priority Critical patent/CN107992586A/zh
Publication of CN107992586A publication Critical patent/CN107992586A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了基于智能语意的检索方法,其特征在于,包括以下步骤:S1:将需要检索的文字划分为多个词语;S2:得出所有词语出现的频率,并选出出现频率最高的词语作为高频词;S3:选出与高频词相关的词语;所述相关的词语是指通过介词、形容词或副词与高频词连接的词语;S4:将高频词和相关的词语作为检索词进行检索。本发明基于智能语意的检索方法,通过智能语意的方式对词汇进行筛选,事先了检索的智能化,可以有效的节省人力成本。

Description

基于智能语意的检索方法
技术领域
本发明涉及计算机技术领域,具体涉及基于智能语意的检索方法。
背景技术
在网络时代,我们无时无刻地进行着检索。在因特网上进行检索主要有两种方式:目录浏览和使用搜索引擎。目录浏览的方式即搜索引擎采用的方式,用户可以根据自己的需要点击目录,深入下一层子目录,从而找到自己需要的信息。这种方式便于查找某一类的信息集合,但是精确定位的能力不强。搜索引擎是目前最为常用的一种网络检索工具。用户只需要提交自己的需求,搜索引擎就能返回大量结果。这些结果按照和检索提问的相关性进行排序。除了搜索引擎之外,图书馆订购的各种数据库也是信息检索的重要途径。美国国会图书馆参考咨询馆员托马斯·曼就介绍了关键词检索、引文检索、相关性检索等检索方法。
目前的检索往往都采用人工的方式进行检索,而随着文件数据量的增大,人工检索需要的工作量会以几何倍上升,极大的提高了检索工作的人力成本。
发明内容
本发明所要解决的技术问题是目前的检索往往都采用人工的方式进行检索,而随着文件数据量的增大,人工检索需要的工作量会以几何倍上升,极大的提高了检索工作的人力成本,目的在于提供基于智能语意的检索方法,解决上述问题。
本发明通过下述技术方案实现:
基于智能语意的检索方法,其特征在于,包括以下步骤:S1:将需要检索的文字划分为多个词语;S2:得出所有词语出现的频率,并选出出现频率最高的词语作为高频词;S3:选出与高频词相关的词语;所述相关的词语是指通过介词、形容词或副词与高频词连接的词语;S4:将高频词和相关的词语作为检索词进行检索。
现有技术中,检索往往都采用人工的方式进行检索,而随着文件数据量的增大,人工检索需要的工作量会以几何倍上升,极大的提高了检索工作的人力成本。本发明应用时,先将需要检索的文字划分为多个词语;再得出所有词语出现的频率,并选出出现频率最高的词语作为高频词;然后选出与高频词相关的词语;所述相关的词语是指通过介词、形容词或副词与高频词连接的词语;再然后将高频词和相关的词语作为检索词进行检索。由于通过智能语意的方式对词汇进行筛选,事先了检索的智能化,可以有效的节省人力成本。
进一步的,步骤S1包括以下子步骤:通过语意树将需要检索的文字划分为多个词语。
进一步的,步骤S2包括以下子步骤:当出现频率最高的词语为两个及以上时,将两个及以上词语都作为高频词。
进一步的,所述词语的字节数不超过10个。
进一步的,所述高频词的出现频率为两次及以上。
本发明与现有技术相比,具有如下的优点和有益效果:
本发明基于智能语意的检索方法,通过智能语意的方式对词汇进行筛选,事先了检索的智能化,可以有效的节省人力成本。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例
本发明基于智能语意的检索方法,基于智能语意的检索方法,其特征在于,包括以下步骤:S1:将需要检索的文字划分为多个词语;S2:得出所有词语出现的频率,并选出出现频率最高的词语作为高频词;S3:选出与高频词相关的词语;所述相关的词语是指通过介词、形容词或副词与高频词连接的词语;S4:将高频词和相关的词语作为检索词进行检索。步骤S1包括以下子步骤:通过语意树将需要检索的文字划分为多个词语。步骤S2包括以下子步骤:当出现频率最高的词语为两个及以上时,将两个及以上词语都作为高频词。所述词语的字节数不超过10个。所述高频词的出现频率为两次及以上。
本实施例实施时,先将需要检索的文字划分为多个词语;再得出所有词语出现的频率,并选出出现频率最高的词语作为高频词;然后选出与高频词相关的词语;所述相关的词语是指通过介词、形容词或副词与高频词连接的词语;再然后将高频词和相关的词语作为检索词进行检索。由于通过智能语意的方式对词汇进行筛选,事先了检索的智能化,可以有效的节省人力成本。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.基于智能语意的检索方法,其特征在于,包括以下步骤:
S1:将需要检索的文字划分为多个词语;
S2:得出所有词语出现的频率,并选出出现频率最高的词语作为高频词;
S3:选出与高频词相关的词语;所述相关的词语是指通过介词、形容词或副词与高频词连接的词语;
S4:将高频词和相关的词语作为检索词进行检索。
2.根据权利要求1所述的基于智能语意的检索方法,其特征在于,步骤S1包括以下子步骤:
通过语意树将需要检索的文字划分为多个词语。
3.根据权利要求1所述的基于智能语意的检索方法,其特征在于,步骤S2包括以下子步骤:
当出现频率最高的词语为两个及以上时,将两个及以上词语都作为高频词。
4.根据权利要求1所述的基于智能语意的检索方法,其特征在于,所述词语的字节数不超过10个。
5.根据权利要求1所述的基于智能语意的检索方法,其特征在于,所述高频词的出现频率为两次及以上。
CN201711295891.8A 2017-12-08 2017-12-08 基于智能语意的检索方法 Pending CN107992586A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711295891.8A CN107992586A (zh) 2017-12-08 2017-12-08 基于智能语意的检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711295891.8A CN107992586A (zh) 2017-12-08 2017-12-08 基于智能语意的检索方法

Publications (1)

Publication Number Publication Date
CN107992586A true CN107992586A (zh) 2018-05-04

Family

ID=62036708

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711295891.8A Pending CN107992586A (zh) 2017-12-08 2017-12-08 基于智能语意的检索方法

Country Status (1)

Country Link
CN (1) CN107992586A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101576928A (zh) * 2009-06-11 2009-11-11 腾讯科技(深圳)有限公司 一种相关文章的选取方法和装置
CN102610101A (zh) * 2012-04-01 2012-07-25 北京世纪高通科技有限公司 一种采集交通事件信息的方法
CN102737025A (zh) * 2011-03-30 2012-10-17 上海铂龙信息科技有限公司 一种专利检索的语法转换方法
CN103020311A (zh) * 2013-01-08 2013-04-03 深圳市宜搜科技发展有限公司 一种用户检索词的处理方法及***
CN104281653A (zh) * 2014-09-16 2015-01-14 南京弘数信息科技有限公司 一种针对千万级规模微博文本的观点挖掘方法
CN104778201A (zh) * 2015-01-23 2015-07-15 湖南科技大学 一种基于多查询结果合并的在先技术检索方法
CN106445916A (zh) * 2016-09-19 2017-02-22 合肥清浊信息科技有限公司 专利检索用语义分析方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101576928A (zh) * 2009-06-11 2009-11-11 腾讯科技(深圳)有限公司 一种相关文章的选取方法和装置
CN102737025A (zh) * 2011-03-30 2012-10-17 上海铂龙信息科技有限公司 一种专利检索的语法转换方法
CN102610101A (zh) * 2012-04-01 2012-07-25 北京世纪高通科技有限公司 一种采集交通事件信息的方法
CN103020311A (zh) * 2013-01-08 2013-04-03 深圳市宜搜科技发展有限公司 一种用户检索词的处理方法及***
CN104281653A (zh) * 2014-09-16 2015-01-14 南京弘数信息科技有限公司 一种针对千万级规模微博文本的观点挖掘方法
CN104778201A (zh) * 2015-01-23 2015-07-15 湖南科技大学 一种基于多查询结果合并的在先技术检索方法
CN106445916A (zh) * 2016-09-19 2017-02-22 合肥清浊信息科技有限公司 专利检索用语义分析方法

Similar Documents

Publication Publication Date Title
Niwa et al. Web page recommender system based on folksonomy mining for ITNG'06 submissions
CN105095281B (zh) 一种基于日志挖掘的网站分类目录优化分析方法
TW201537367A (zh) 搜索建議提供方法及裝置
KR102600018B1 (ko) 엔티티 관계 마이닝 방법, 장치, 전자 기기, 저장 매체 및 프로그램
Patel et al. Significance of stop word elimination in meta search engine
CN111061876B (zh) 事件舆情数据分析方法及装置
Liu et al. ICTNET at Temporal Summarization Track TREC 2013.
US10733185B2 (en) Access pattern based optimization of memory access
CN107992586A (zh) 基于智能语意的检索方法
Shabanzadeh et al. A Semantic based query expansion to search
Wang et al. Fashionklip: Enhancing e-commerce image-text retrieval with fashion multi-modal conceptual knowledge graph
Elbassuoni et al. ROXXI: Reviving witness dOcuments to eXplore eXtracted Information
US10242076B2 (en) Method and system for processing a search request
Wei et al. Using tweets to help sentence compression for news highlights generation
US10872124B2 (en) Search engine
CN108021681A (zh) 有利于提高检索精度的***
Gaur et al. Focused crawling with ontology using semi-automatic tagging for relevancy
Ketui et al. An EDU-based approach for Thai multi-document summarization and its application
Yang et al. Qualifier: question answering by lexical fabric and external resources
Zhang et al. A refined method for detecting interpretable and real-time bursty topic in microblog stream
Zhai et al. A Novel Framework for Related Entities Finding: ICTNET at TREC 2009 Entity Track.
Ye et al. Research on pattern representation method in semi-supervised semantic relation extraction based on bootstrapping
Shekhar et al. A WEBIR crawling framework for retrieving highly relevant web documents: evaluation based on rank aggregation and result merging algorithms
Gu et al. Measuring social tag confidence: is it a good or bad tag?
Wan et al. Query expansion approach based on ontology and local context analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180504