CN116595043A - 一种大数据检索方法及装置 - Google Patents

一种大数据检索方法及装置 Download PDF

Info

Publication number
CN116595043A
CN116595043A CN202310476400.9A CN202310476400A CN116595043A CN 116595043 A CN116595043 A CN 116595043A CN 202310476400 A CN202310476400 A CN 202310476400A CN 116595043 A CN116595043 A CN 116595043A
Authority
CN
China
Prior art keywords
image
retrieval
module
information
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310476400.9A
Other languages
English (en)
Inventor
余建平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Sitaike Intelligent Technology Co ltd
Original Assignee
Nanjing Sitaike Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Sitaike Intelligent Technology Co ltd filed Critical Nanjing Sitaike Intelligent Technology Co ltd
Priority to CN202310476400.9A priority Critical patent/CN116595043A/zh
Publication of CN116595043A publication Critical patent/CN116595043A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种大数据检索方法及装置,检索装置包括图像检索模块、图像库模块、图像标注模块和用户交互模块;本发明设置由图像检索模块、图像库模块、图像标注模块和用户交互模块组成的检索装置,在进行检索时,通过图像检索模块进行图像,索引建立后,可直接使用查询接口在图像检测库中查询图像的ID,通过图像ID在图像检索库中查询图像,从而得到检测结构,其中,本申请的图像标注模块采用第一标注单元和第二标注单元分别基于图像的多源信息进行图像标注和基于图像自身进行图像标注,这样标注的信息更加完全,得到的图像标注压合更加丰富,在后续检索时,检索丰富度高,检索更加高效准确。

Description

一种大数据检索方法及装置
技术领域
本发明涉及一种大数据检索方法及装置,属于大数据处理技术领域。
背景技术
随着计算机技术、数字媒体技术和网络技术等先进技术应用到互联网产业中,互联网平台已经成为人们分享信息的第一选择,由于图像信息比文本信息能更加直观和生动的表现用户的感受,人们也更加容易理解和接受图像、视频这类多媒体数据,图像已经成为广泛应用的媒体信息,图像检索是人们常见的检索方法,通过输入相应的关键字,对图像进行检索,可得到想要的检索图像。
图像标注为图像检索和文本检索搭起了一座桥梁,将图像映射为关键词,
解决了图像难于被计算机检索的问题,基于此技术,用户可以将图像检索转化为关键词检索,非常符合人们的检索习惯,应用机器学习的图像自动标注技术,在高层语义的标注上准确率较低,标注的深度不够,例如通过现在最先进的图像识别算法,能识别出图像中的是一个人,却不能识别出那个人的名字,不能很好地满足用户的需求,而利用图像周围文本分析的方法进行标注则受限于图像周围文本的丰富程度和文本质量,例如用户发布了一张图片,但是却没有对图片进行任何文本描述,这会导致很多互联网图像因为周围文本信息不足,进而不能被***检索到。
发明内容
本发明的目的在于提供一种大数据检索方法及装置,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种大数据检索方法,所述检索方法的具体步骤如下:
步骤一:通过图像库模块采集图像,然后分别提取图像的多源信息和图像自身;
步骤二:图像库模块将采集的图像信息存入分布式数据化库中,然后图像标注模块提取分布式数据化库中的图像信息;
步骤三:图像标注模块提取图像的ID和图像的标注关键词,建立图像ID和图像标注关键词之间的关系,并将生成将标注的关键词导入图像检索库中;
步骤四:用户进行检索时,输入关键字,使用查询接口在图像检测库中查询图像的ID,通过图像ID在图像检索库中查询图像,并将查询结构返回给用户。
在上述的一种大数据检索方法及装置中,所述图像标注模块分为两个通道,其中一个通道是完全利用图像多源信息的标注模型,其中另一个是完全依靠图像本身的标注模型。
在上述的一种大数据检索方法及装置中,检索装置包括外安装壳体,所述外安装壳体的顶端固定设置有两个支撑滑板,且两个所述支撑滑板对称设置,所述支撑滑板的内部均开设有导向槽,所述导向槽的内部活动套设有导向杆,所述导向杆的一端固定连接有支撑板,所述支撑板的一端固定连接有限位板,所述限位板与支撑板一体设置的,所述限位板置于外安装壳体的外侧,所述外安装壳体的内部固定安装有图像检索模块、图像库模块、图像标注模块和用户交互模块,其中,图像检索模块:图像检索模块主要功能是用于关键字的图像检索,提升用户检索体验,通过倒排索引的建立,减少检索时间;
图像库模块:通过爬虫程序在微博上采集图像的相关信息,通过图像数据库存储图像的所有数据,包括图像自身、图像属性信息、用户信息和社交信息等多源数据;
图像标注模块:对图像进行标注,标注效果的好坏将直接决定图像检索的结果,为了提升标注的丰富度和深度,本模块充分结合图像和图像多源信息两种标注模型,两种模型互补,使得标注更加丰富和细致;
用户交互模块:用于用户检索、图像展示和筛选。
在上述的一种大数据检索方法及装置中,所述图像检索模块由用户输入接口单元、索引建立单元和检索结果输出单元组成,用户输入接口单元用于输出检索的关键字,并对关键字进行预处理。
在上述的一种大数据检索方法及装置中,所述图像库模块包括图像采集单元、图像数据库和图像检索库,其中,
图像采集单元:通过设置爬虫程序在交互软件上大量采集图像,以及图像的相关信息,提取图像的多源信息和图像自身;
图像数据库:图像数据库存储图像采集单元采集的图像的所有数据,包括图像自身、图像属性信息、用户信息和社交信息多源数据;
图像检索库:图像检索库主要存储图像的ID 和图像关键字标注信息。
在上述的一种大数据检索方法及装置中,所述图像标注模块由第一标注单元、第二标注单元和过滤单元组成,所述第一标注单元基于图像的多源信息进行图像标注,第二标注单元基于图像自身进行图像标注。
在上述的一种大数据检索方法及装置中,所述用户输入接口单元对关键字进行预处理的具体方法如下:
用户输入关键字查询,***获取该关键字,利用语义相似度算法与单词词典中的关键词进行相似度计算,找出其中与该关键字最相似的8个组成关键字相似列表,并按照相似度排序,关键字相似列表的作用是,当数据库中查询不到用户所输入关键字的图像时,关键字相似列表中的关键字替代用户输入的检索关键字进行检索。
在上述的一种大数据检索方法及装置中,所述过滤单元的具体方法如下:
当通过第一标注单元和第二标注单元对图像进行标注后,通过过滤单元过滤掉错误的图像标注信息,进而提高标注词的准确性。
与现有技术相比,本发明的有益效果是:
本发明一种大数据检索方法及装置,设置由图像检索模块、图像库模块、图像标注模块和用户交互模块组成的检索装置,在进行检索时,通过图像检索模块进行图像,索引建立后,可直接使用查询接口在图像检测库中查询图像的ID,通过图像ID在图像检索库中查询图像,从而得到检测结构,其中,本申请的图像标注模块采用第一标注单元和第二标注单元分别基于图像的多源信息进行图像标注和基于图像自身进行图像标注,这样标注的信息更加完全,得到的图像标注压合更加丰富,在后续检索时,检索丰富度高,检索更加高效准确。
附图说明
图1为本发明一种大数据检索装置的结构示意图;
图2为本发明一种大数据检索装置的内部结构示意图。
图中:1、外安装壳体;2、防护盖板;3、条形散热腔;4、支撑板;5、限位板;6、支撑滑板;7、导向杆。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了一种大数据检索方法及装置的技术方案:
一种大数据检索方法,所述检索方法的具体步骤如下:
步骤一:通过图像库模块采集图像,然后分别提取图像的多源信息和图像自身;
步骤二:图像库模块将采集的图像信息存入分布式数据化库中,然后图像标注模块提取分布式数据化库中的图像信息;
步骤三:图像标注模块提取图像的ID和图像的标注关键词,建立图像ID和图像标注关键词之间的关系,并将生成将标注的关键词导入图像检索库中;
步骤四:用户进行检索时,输入关键字,使用查询接口在图像检测库中查询图像的ID,通过图像ID在图像检索库中查询图像,并将查询结构返回给用户。
图像标注模块分为两个通道,其中一个通道是完全利用图像多源信息的标注模型,其中另一个是完全依靠图像本身的标注模型。
图像标注为图像检索和文本检索搭起了一座桥梁,将图像映射为关键词,
解决了图像难于被计算机检索的问题,基于此技术,用户可以将图像检索转化为关键词检索,非常符合人们的检索习惯,应用机器学习的图像自动标注技术,在高层语义的标注上准确率较低,标注的深度不够,利用图像周围文本分析的方法进行标注则受限于图像周围文本的丰富程度和文本质量,例如用户发布了一张图片,但是却没有对图片进行任何文本描述,这会导致很多互联网图像因为周围文本信息不足,进而不能被***检索到,为提高图像标注关键词的质量,本申请采用两组标注模型对图像进行标注,充分利用了图像的各种多源信息,不仅仅只依赖图像周围文本信息,在更大的数据中分析出与它相似的图像,利用这些相似图像的标注词,学习到待标注图像的标注。
本申请的标注模型,首先将图像数据进行预处理,使其数据结构化后作为图像自动标注模型的输入,数据预处理包括数据除噪、中文分词、去停用词和数据规约,处理后,通过收集整理互联网上不同来源的数据,根据图像数据不同维度的表示信息如图像的属性信息(图像发布时间、图像发布地点等)、图像文本信息、图像发布者信息、图像发布者的社交关系信息制定相应的相似度计算方法,通过图像的属性信息和图像文本信息计算图像相似度,利用图像发布者信息和图像发布者的社交信息计算图像发布者相似度,将图像相似度和图像发布者相似度经过拟合计算得到最后的图片相似度,通过相似图像的标签进行图像的标注,进而生成图像的标注词。
检索装置包括外安装壳体1,外安装壳体1的顶端固定设置有两个支撑滑板6,且两个支撑滑板6对称设置,支撑滑板6的内部均开设有导向槽,导向槽的内部活动套设有导向杆7,导向杆7的一端固定连接有支撑板4,支撑板4的一端固定连接有限位板5,限位板5与支撑板4一体设置的,限位板5置于外安装壳体1的外侧,外安装壳体1的内部固定安装有图像检索模块、图像库模块、图像标注模块和用户交互模块,其中,图像检索模块:图像检索模块主要功能是用于关键字的图像检索,提升用户检索体验,通过倒排索引的建立,减少检索时间;
图像库模块:通过爬虫程序在微博上采集图像的相关信息,通过图像数据库存储图像的所有数据,包括图像自身、图像属性信息、用户信息和社交信息等多源数据,具体的,如在微博上抓取图像时,采用微博爬虫,通过设置微博爬虫是图像检索***中必不可少的一环,它不断地从微博获取图像相关数据,为图像检索提供了数据支撑,考虑到基于API的微博数据获取方式存在局限性,不仅需要申请高级接口,而且还要用户授权才能获取他的全部微博信息,因此,通过爬虫进行读取会更加方便,微博爬虫的主体架构是采用Scrapy爬虫框架。
所以本***选择爬虫来获取微博图像的相关信息
图像标注模块:对图像进行标注,标注效果的好坏将直接决定图像检索的结果,为了提升标注的丰富度和深度,本模块充分结合图像和图像多源信息两种标注模型,两种模型互补,使得标注更加丰富和细致;
用户交互模块:用于用户检索、图像展示和筛选。
图像检索模块由用户输入接口单元、索引建立单元和检索结果输出单元组成,用户输入接口单元用于输出检索的关键字,并对关键字进行预处理。
如,当用户进行图像检索时,用户在搜索框中输入关键字,点击图像搜索,***后台返回包含该关键字的图像,如果没有检索到该关键字的图像,通过检索相似关键字,返回其结果,通过输入关键字“梅西”作为检索,***返回了一些与“梅西”相关的关键字,例如“阿根廷、退役、世界杯、大力神杯”等,用户可以通过点击这些关键字在结果集中进行筛选,可以看到通过提供在第一次检索结果图像中具有的高频关键字,用户可以更加便捷的检索出自己需要的图片。
图像库模块包括图像采集单元、图像数据库和图像检索库,其中,
图像采集单元:通过设置爬虫程序在交互软件上大量采集图像,以及图像的相关信息,提取图像的多源信息和图像自身;
图像数据库:图像数据库存储图像采集单元采集的图像的所有数据,包括图像自身、图像属性信息、用户信息和社交信息多源数据;
图像采集模块每天可采集几十万张图片信息,传统的数据库不足以应付这一海量的数据存储,因此本申请采取HBase对图像数据进行存储,HBase 具有解决海量数据的高速存储和读取能力,根据图像的数据类型,建立了一张大表,将图像内容单独用一个列簇存储,图像的其他属性分别存放在其他列簇上,这样设计能支持图片的多属性综合查询,图片以单元格的形式存储,当图片的大小大于数据块大小时,会将图片压缩存储导致存储时间消耗增大,所以为了提升存储效率,HBase的数据块限制从默认的64KB调整为1024KB。
图像检索库:图像检索库主要存储图像的ID 和图像关键字标注信息。
图像标注模块由第一标注单元、第二标注单元和过滤单元组成,所述第一标注单元基于图像的多源信息进行图像标注,第二标注单元基于图像自身进行图像标注。
用户输入接口单元对关键字进行预处理的具体方法如下:
用户输入关键字查询,***获取该关键字,利用语义相似度算法与单词词典中的关键词进行相似度计算,找出其中与该关键字最相似的8个组成关键字相似列表,并按照相似度排序,关键字相似列表的作用是,当数据库中查询不到用户所输入关键字的图像时,关键字相似列表中的关键字替代用户输入的检索关键字进行检索。
过滤单元的具体方法如下:
本申请虽然通过第一标注单元和第二标注单元从两个方向上对图像进行了标注,其图像标注的丰富程度很好,但是也带来了许多的错误标志,导致了最后的准确率有所下降,因此,当通过第一标注单元和第二标注单元对图像进行标注后,通过过滤单元过滤掉错误的图像标注信息,进而提高标注词的准确性。
本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (9)

1.一种大数据检索方法,其特征在于,所述检索方法的具体步骤如下:
步骤一:通过图像库模块采集图像,然后分别提取图像的多源信息和图像自身;
步骤二:图像库模块将采集的图像信息存入分布式数据化库中,然后图像标注模块提取分布式数据化库中的图像信息;
步骤三:图像标注模块提取图像的ID和图像的标注关键词,建立图像ID和图像标注关键词之间的关系,并将生成将标注的关键词导入图像检索库中;
步骤四:用户进行检索时,输入关键字,使用查询接口在图像检测库中查询图像的ID,通过图像ID在图像检索库中查询图像,并将查询结构返回给用户。
2.根据权利要求1所述的一种大数据检索方法,其特征在于,所述图像标注模块分为两个通道,其中一个通道是完全利用图像多源信息的标注模型,其中另一个是完全依靠图像本身的标注模型。
3.一种大数据检索装置,其特征在于,所述检索装置基于上述任一权利要求1-2所述的检索方法进行检索,检索装置包括外安装壳体(1),所述外安装壳体(1)的顶端固定设置有两个支撑滑板(6),且两个所述支撑滑板(6)对称设置,所述支撑滑板(6)的内部均开设有导向槽,所述导向槽的内部活动套设有导向杆(7),所述导向杆(7)的一端固定连接有支撑板(4),所述支撑板(4)的一端固定连接有限位板(5),所述限位板(5)与支撑板(4)一体设置的,所述限位板(5)置于外安装壳体(1)的外侧,所述外安装壳体(1)的内部固定安装有图像检索模块、图像库模块、图像标注模块和用户交互模块,其中,
图像检索模块:图像检索模块主要功能是用于关键字的图像检索,提升用户检索体验,通过倒排索引的建立,减少检索时间;
图像库模块:通过爬虫程序在微博上采集图像的相关信息,通过图像数据库存储图像的所有数据,包括图像自身、图像属性信息、用户信息和社交信息等多源数据;
图像标注模块:对图像进行标注,标注效果的好坏将直接决定图像检索的结果,为了提升标注的丰富度和深度,本模块充分结合图像和图像多源信息两种标注模型,两种模型互补,使得标注更加丰富和细致;
用户交互模块:用于用户检索、图像展示和筛选。
4.根据权利要求3所述的一种大数据检索装置,其特征在于,所述图像检索模块由用户输入接口单元、索引建立单元和检索结果输出单元组成,用户输入接口单元用于输出检索的关键字,并对关键字进行预处理。
5.根据权利要求3所述的一种大数据检索装置,其特征在于,所述图像库模块包括图像采集单元、图像数据库和图像检索库,其中,
图像采集单元:通过设置爬虫程序在交互软件上大量采集图像,以及图像的相关信息,提取图像的多源信息和图像自身;
图像数据库:图像数据库存储图像采集单元采集的图像的所有数据,包括图像自身、图像属性信息、用户信息和社交信息多源数据;
图像检索库:图像检索库主要存储图像的ID 和图像关键字标注信息。
6.根据权利要求3所述的一种大数据检索装置,其特征在于,所述图像标注模块由第一标注单元、第二标注单元和过滤单元组成,所述第一标注单元基于图像的多源信息进行图像标注,第二标注单元基于图像自身进行图像标注。
7.根据权利要求4所述的一种大数据检索装置,其特征在于,所述用户输入接口单元对关键字进行预处理的具体方法如下:
用户输入关键字查询,***获取该关键字,利用语义相似度算法与单词词典中的关键词进行相似度计算,找出其中与该关键字最相似的8个组成关键字相似列表,并按照相似度排序,关键字相似列表的作用是,当数据库中查询不到用户所输入关键字的图像时,关键字相似列表中的关键字替代用户输入的检索关键字进行检索。
8.根据权利要求6所述的一种大数据检索装置,其特征在于,所述过滤单元的具体方法如下:
当通过第一标注单元和第二标注单元对图像进行标注后,通过过滤单元过滤掉错误的图像标注信息,进而提高标注词的准确性。
9.根据权利要求3所述的一种大数据检索装置,其特征在于,所述外安装壳体(1)的顶部设置有防护盖板(2),所述外安装壳体(1)的两侧均设置有条形散热腔(3)。
CN202310476400.9A 2023-04-28 2023-04-28 一种大数据检索方法及装置 Pending CN116595043A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310476400.9A CN116595043A (zh) 2023-04-28 2023-04-28 一种大数据检索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310476400.9A CN116595043A (zh) 2023-04-28 2023-04-28 一种大数据检索方法及装置

Publications (1)

Publication Number Publication Date
CN116595043A true CN116595043A (zh) 2023-08-15

Family

ID=87605455

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310476400.9A Pending CN116595043A (zh) 2023-04-28 2023-04-28 一种大数据检索方法及装置

Country Status (1)

Country Link
CN (1) CN116595043A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117290384A (zh) * 2023-11-27 2023-12-26 同方赛威讯信息技术有限公司 一种基于大数据与计算机视觉结合的图文检索***及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103164539A (zh) * 2013-04-15 2013-06-19 中国传媒大学 一种结合用户评价与标注的交互式图像检索方法
CN103853797A (zh) * 2012-12-07 2014-06-11 中兴通讯股份有限公司 一种基于n元图片索引结构的图片检索方法与***
CN108897778A (zh) * 2018-06-04 2018-11-27 四川创意信息技术股份有限公司 一种基于多源大数据分析的图像标注方法
CN114648790A (zh) * 2022-03-02 2022-06-21 安徽尚视信息科技有限公司 一种基于人脸识别的快速检索装置
CN218181544U (zh) * 2022-06-16 2022-12-30 合肥长月科技有限公司 一种图文检索装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103853797A (zh) * 2012-12-07 2014-06-11 中兴通讯股份有限公司 一种基于n元图片索引结构的图片检索方法与***
CN103164539A (zh) * 2013-04-15 2013-06-19 中国传媒大学 一种结合用户评价与标注的交互式图像检索方法
CN108897778A (zh) * 2018-06-04 2018-11-27 四川创意信息技术股份有限公司 一种基于多源大数据分析的图像标注方法
CN114648790A (zh) * 2022-03-02 2022-06-21 安徽尚视信息科技有限公司 一种基于人脸识别的快速检索装置
CN218181544U (zh) * 2022-06-16 2022-12-30 合肥长月科技有限公司 一种图文检索装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117290384A (zh) * 2023-11-27 2023-12-26 同方赛威讯信息技术有限公司 一种基于大数据与计算机视觉结合的图文检索***及方法
CN117290384B (zh) * 2023-11-27 2024-02-02 同方赛威讯信息技术有限公司 一种基于大数据与计算机视觉结合的图文检索***及方法

Similar Documents

Publication Publication Date Title
CN109992645B (zh) 一种基于文本数据的资料管理***及方法
CN107180045B (zh) 一种互联网文本蕴含地理实体关系的抽取方法
CN103020159A (zh) 一种面向事件的新闻展现方法和装置
CN105022827A (zh) 一种面向领域主题的Web新闻动态聚合方法
CN111460252A (zh) 一种基于网络舆情分析的自动化搜索引擎方法及***
CN106354860A (zh) 基于标签集的信息资源自动贴标签并自动推送的方法
CN113360599A (zh) 一种基于内容识别的多源异构情报汇聚协同处理平台
CN116595043A (zh) 一种大数据检索方法及装置
CN111125297A (zh) 一种基于搜索引擎的海量离线文本实时推荐方法
KR20110133909A (ko) 모든 자연어 표현의 각각의 의미마다 별도의 용어를 동적으로 생성하는 방법 및 이를 기반으로 하는 사전 관리기,문서작성기, 용어 주석기, 검색 시스템 및 문서정보체계 구축장치
CN112148938B (zh) 一种跨域异构数据检索***及检索方法
CN113094514A (zh) 一种基于领域知识图谱的水务数据智能发现方法
CN111460173B (zh) 一种甲状腺癌的疾病本体模型的构建方法
CN117095419A (zh) 一种pdf文档数据处理与信息抽取装置及方法
CN111159984A (zh) 一种具有智能学习笔记功能的辅助阅读***
Lehmberg Web table integration and profiling for knowledge base augmentation
Joglekar et al. Search engine optimization using unsupervised learning
CN110781207A (zh) 一种基于用户画像的专利推荐方法
CN112507105A (zh) 一种基于微信公众号的多模智能问答***及方法
KR20090049433A (ko) 색상 키워드를 이용한 검색 방법 및 시스템
Luo et al. Multimedia news exploration and retrieval by integrating keywords, relations and visual features
CN105912584B (zh) 一种基于网页信息数据的数据索引***
Xie The application of artificial intelligence technology in public library information retrieval
CN102890715A (zh) 一种特定领域信息自动化组织的装置及其方法
CN113656641A (zh) 支持模糊评论挖掘的视频高效检索***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination