CN109784163A - 一种轻量视觉问答***及方法 - Google Patents
一种轻量视觉问答***及方法 Download PDFInfo
- Publication number
- CN109784163A CN109784163A CN201811518735.8A CN201811518735A CN109784163A CN 109784163 A CN109784163 A CN 109784163A CN 201811518735 A CN201811518735 A CN 201811518735A CN 109784163 A CN109784163 A CN 109784163A
- Authority
- CN
- China
- Prior art keywords
- text
- light weight
- processing module
- feature
- fusion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
Abstract
本发明提出一种轻量视觉问答***和方法,包括图像处理模块、文本处理模块,特征融合器,和分类器,其中,所述图像处理模块采用卷积神经网络提取图像特征,并转化为图像特征向量;所述文本处理模块提取文本特征形成文本特征向量;所述图像特征向量和所述文本特征向量均被送入所述特征融合器进行融合,并将融合的结果送入分类器,形成最终答案。本方法可以从图像特征提取和问题文本特征提取两方面对降低模型的复杂度,便于将问答***移植到移动端。
Description
技术领域
本发明涉及计算机视觉领域,尤其涉及视觉问答技术领域。
背景技术
深度学习以其强大的特征学习能力,在计算机视觉(CV)和自然语言处理(NLP)中获得广泛应用。卷积神经网络(CNN)可以抽取并压缩图像信息,多在图像处理中应用;而递归神经网络(RNN)在自然语言处理领域,尤其是在语音识别,机器翻译,语言模型与文本生成等方面取得很大的成功。
视觉问答是计算机视觉领域里最具挑战性的问题之一。视觉问答的任务就是利用计算机自动地分析图片与问题,从而对提出的问题给出回答。由于视觉问答涉及到计算机视觉和自然语言处理两个领域的内容,那么很自然的一种解决方案就是将在计算机视觉和自然语言处理中应用非常成功的卷积神经网络和递归神经网络结合构造组合模型。而其中最常使用的卷积神经网络是Res-net和VGG-net,最常使用的递归神经网络是LSTM和GRU。但视觉问答因为需要同时处理图像和问题,往往计算较慢,在算力不足时,比如移动端中,得出答案的时间会比较长。
在将图像信息与文本信息融合方面,Hedi Ben-younes等在论文MUTAN:Multimodal Tucker Fusion for Visual Question Answering中提出了MUTAN融合模型,如图1所示,基于Tucker张量,分解为三个内模矩阵和核心张量,且通过约束核心张量进一步控制模型参数的数量,在训练期间能够防止过度拟合,而且能够更灵活地调整输入/输出预测。本发明基于MUTAN模型,使用shuffle-net处理图像,使用卷积神经网络TextCNN来处理问题语句,可以有效降低模型的复杂度,便于将问答***移植到移动端。
发明内容
本发明的目的在于提出一种对算力要求低,便于移植到移动端的问答***和方法。所采用的技术方案如下:
一种轻量视觉问答***,包括图像处理模块1、文本处理模块2,特征融合器3,和分类器4,其中,所述图像处理模1块采用卷积神经网络提取图像特征,并转化为图像特征向量;所述文本处理模块2提取文本特征形成文本特征向量;所述图像特征向量和所述文本特征向量均被送入所述特征融合器3进行融合,并将融合的结果送入分类器4,形成最终答案。
进一步地,所述图像处理模块1采用shuffle-net模型提取图像特征。
进一步地,所述文本处理模块2采用TextCNN提取文本特征。
进一步地,所述文本处理模块2包括输入层21、卷积层22、池化层23和全连接层24,所述输入层21将句子中每个单词预训练好的词向量排在一起,得到一个n*k矩阵,其中n是预先设定句子长度,不足时用0补充,k为词向量的长度;所述输入层21与所述卷积层22连接,所述卷积层22对输入的矩阵进行卷积神经网络处理,卷积层包括多个层;卷积层22与所述池化层23连接,所述池化层23与所述全连接层24连接,最终由所述全连接层24得到文本的特征。
进一步地,所述特征融合器3采用MUTAN模型进行Tucker分解,对各分量进行融合,得到融合的结果。
进一步地,所述分类器4为SoftMax分类器,采用的损失函数为交叉熵损失函数。
进一步地,所述***嵌入移动终端中使用。
一种轻量视觉问答方法,采用预先训练的shuffle-net模型提取图像特征,采用TextCNN提取文本特征,然后利用MUTAN模型将所述图像特征与所述文本特征融合,得到答案。
进一步地,所述融合的方法为,将从文本特征提取器得到的向量q,图像特征提取器得到的向量ν融合,得到张量T,并对T进行Tucker分解,得到参数核心张量τc,以及三个内模矩阵Wq、Wν、Wo,计算获得融合的特征y:
其中,×i代表向量在第i维同张量相乘,将y送入分类器中即可得到最终答案。
进一步地,在移动终端中应用该方法。
本发明的轻量视觉问答***和方法的优势在于:从图像特征提取和问题文本特征提取两方面对降低模型的复杂度,便于将问答***移植到移动端。
附图说明
图1为MUTAN融合模型架构图。
图2为轻量视觉问答***框图。
图3为文本处理模块结构图。
具体实施方式
如图2所示,本发明的轻量化视觉问答***,包括图像处理模块1、文本处理模块2,特征融合器3,和分类器4,其中,待检测图像进入所述图像处理模块1处理,图像处理模块1采用卷积神经网络提取图像特征,并转化为图像特征向量;询问文本进入所述文本处理模块2处理,在文本处理模块2中对文本的特征进行提取,形成文本特征向量;所述图像特征向量和所述文本特征向量均被送入特征融合器3进行融合,并将融合的结果送入分类器4,形成最终答案。
在图像处理模块1中选取预训练好的shuffle-net模型提取特征,其中,shuffle-net最后一个卷积层的特征将送入特征融合器中。
文本处理模块2采用TextCNN处理询问文本,其结构如图3所示,在输入层21中,将预先句子中每个单词对应预训练好的词向量排在一起,得到一个n*k矩阵。其中n是预先设定句子长度,不足时用0补充,k为词向量的长度。然后按照卷积神经网络处理,即输入层21连接卷积层22,在多个卷积层22中对特征进行提取。卷积层22与所述池化层23连接,池化层23中采用最大池化法的将特征池化,池化层23与所述全连接层24连接,最终由所述全连接层24得到文本的特征。
在特征融合器3中,采用采用MUTAN模型进行Tucker分解,对各分量进行融合,得到融合的结果。MUTAN融合模型是由Hedi Ben-younes等在论文MUTAN:Multimodal TuckerFusion for Visual Question Answering中提出的,其流程如图1所示。
从文本特征提取器得到的向量q,图像特征提取器得到的向量ν融合,得到张量T,并对T进行Tucker分解,得到参数核心张量τc,以及三个内模矩阵Wq、Wν、Wo,计算获得融合的特征y:
其中,×i代表向量在第i维同张量相乘,将y送入分类器中即可得到最终答案。
所述Tucker张量分解的方式为:T=((τc×1Wq)×2Wν)×3Wo,其中,T由文本特征向量q和图像特征向量ν融合得到。
分类器4为SoftMax层,训练选取的损失函数为交叉熵损失,表示为:
其中yi代表真实的答案索引,是预测的答案索引.i=1……|A|,|A|是不同的答案个数。
一种轻量视觉问答方法,采用预先训练的shuffle-net模型提取图像特征,采用TextCNN提取文本特征,然后利用MUTAN模型将所述图像特征与所述文本特征融合,得到答案。
经过实验证明,使用shuffle-net作为视觉问答的图像特征提取器,TextCNN作为文本特征提取器,可以有效降低模型的复杂度,便于将问答***移植到移动端。
Claims (10)
1.一种轻量视觉问答***,其特征在于,包括图像处理模块(1)、文本处理模块(2),特征融合器(3),和分类器(4),其中,所述图像处理模块(1)采用卷积神经网络提取图像特征,并转化为图像特征向量;所述文本处理模块(2)提取文本特征形成文本特征向量;所述图像特征向量和所述文本特征向量均被送入所述特征融合器(3)进行融合,并将融合的结果送入分类器(4),形成最终答案。
2.根据权利要求1所述的轻量视觉问答***,其特征在于,所述图像处理模块(1)采用shuffle-net模型提取图像特征。
3.根据权利要求1或2所述的轻量视觉问答***,其特征在于,所述文本处理模块(2)采用TextCNN提取文本特征。
4.根据权利要求3所述的轻量视觉问答***,其特征在于,所述文本处理模块(2)包括输入层(21)、卷积层(22)、池化层(23)和全连接层(24),所述输入层(21)将句子中每个单词预训练好的词向量排在一起,得到一个n*k矩阵,其中n是预先设定句子长度,不足时用0补充,k为词向量的长度;所述输入层(21)与所述卷积层(22)连接,所述卷积层(22)对输入的矩阵进行卷积神经网络处理,卷积层包括多个层;卷积层(22)与所述池化层(23)连接,所述池化层(23)与所述全连接层(24)连接,最终由所述全连接层(24)得到文本的特征。
5.根据权利要求1-4任一项所述的轻量视觉问答***,其特征在于,所述特征融合器(3)采用MUTAN模型进行Tucker分解,对各分量进行融合,得到融合的结果。
6.根据权利要求1-5任一项所述的轻量视觉问答***,其特征在于,所述分类器(4)为SoftMax分类器,采用的损失函数为交叉熵损失函数。
7.根据权利要求1-6任一项所述的轻量视觉问答***,其特征在于,所述***嵌入移动终端中使用。
8.一种轻量视觉问答方法,其特征在于,采用预先训练的shuffle-net模型提取图像特征,采用TextCNN提取文本特征,然后利用MUTAN模型将所述图像特征与所述文本特征融合,得到答案。
9.根据权利要求8所述的轻量视觉问答方法,其特征在于,所述融合的方法为,将从文本特征提取器得到的向量q,图像特征提取器得到的向量ν融合,得到张量T,并对T进行Tucker分解,得到参数核心张量τc,以及三个内模矩阵Wq、Wν、Wo,计算获得融合的特征y:
y=((τc×1(qTWq))×2(νTWν))×3Wo,
其中,×i代表向量在第i维同张量相乘,将y送入分类器中即可得到最终答案。
10.根据权利要求8所述的轻量视觉问答方法,其特征在于,在移动终端中应用该方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811518735.8A CN109784163A (zh) | 2018-12-12 | 2018-12-12 | 一种轻量视觉问答***及方法 |
PCT/CN2019/124008 WO2020119631A1 (zh) | 2018-12-12 | 2019-12-09 | 一种轻量视觉问答***及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811518735.8A CN109784163A (zh) | 2018-12-12 | 2018-12-12 | 一种轻量视觉问答***及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109784163A true CN109784163A (zh) | 2019-05-21 |
Family
ID=66496867
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811518735.8A Pending CN109784163A (zh) | 2018-12-12 | 2018-12-12 | 一种轻量视觉问答***及方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN109784163A (zh) |
WO (1) | WO2020119631A1 (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110298338A (zh) * | 2019-06-20 | 2019-10-01 | 北京易道博识科技有限公司 | 一种文档图像分类方法及装置 |
CN110348535A (zh) * | 2019-07-17 | 2019-10-18 | 北京金山数字娱乐科技有限公司 | 一种视觉问答模型训练方法及装置 |
WO2020119631A1 (zh) * | 2018-12-12 | 2020-06-18 | 中国科学院深圳先进技术研究院 | 一种轻量视觉问答***及方法 |
CN111814843A (zh) * | 2020-03-23 | 2020-10-23 | 同济大学 | 视觉问答***中图像特征模块端到端训练方法及应用 |
CN111967487A (zh) * | 2020-03-23 | 2020-11-20 | 同济大学 | 一种用于视觉问答模型训练的增量型数据增强方法及应用 |
CN112100346A (zh) * | 2020-08-28 | 2020-12-18 | 西北工业大学 | 基于细粒度图像特征和外部知识相融合的视觉问答方法 |
CN112148891A (zh) * | 2020-09-25 | 2020-12-29 | 天津大学 | 一种基于图感知张量分解的知识图谱补全方法 |
CN112925904A (zh) * | 2021-01-27 | 2021-06-08 | 天津大学 | 一种基于Tucker分解的轻量级文本分类方法 |
CN113128415A (zh) * | 2021-04-22 | 2021-07-16 | 合肥工业大学 | 一种环境辨别方法、***、设备及存储介质 |
CN113919344A (zh) * | 2021-09-26 | 2022-01-11 | 腾讯科技(深圳)有限公司 | 文本处理方法和装置 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113837212B (zh) * | 2020-06-24 | 2023-09-26 | 四川大学 | 一种基于多模态双向导向注意力的视觉问答方法 |
CN113157889A (zh) * | 2021-04-21 | 2021-07-23 | 韶鼎人工智能科技有限公司 | 一种基于主题损失的视觉问答模型构建方法 |
CN113918679A (zh) * | 2021-09-22 | 2022-01-11 | 三一汽车制造有限公司 | 一种知识问答方法、装置及工程机械 |
CN113792703B (zh) * | 2021-09-29 | 2024-02-02 | 山东新一代信息产业技术研究院有限公司 | 一种基于Co-Attention深度模块化网络的图像问答方法及装置 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105138993A (zh) * | 2015-08-31 | 2015-12-09 | 小米科技有限责任公司 | 建立人脸识别模型的方法及装置 |
CN105956608A (zh) * | 2016-04-21 | 2016-09-21 | 恩泊泰(天津)科技有限公司 | 一种基于深度学习的目标定位、分类算法 |
CN106055576A (zh) * | 2016-05-20 | 2016-10-26 | 大连理工大学 | 一种大规模数据背景下的快速有效的图像检索方法 |
CN106250918A (zh) * | 2016-07-26 | 2016-12-21 | 大连理工大学 | 一种基于改进的推土距离的混合高斯模型匹配方法 |
CN106372581A (zh) * | 2016-08-25 | 2017-02-01 | 中国传媒大学 | 构建及训练人脸识别特征提取网络的方法 |
CN107368770A (zh) * | 2016-05-12 | 2017-11-21 | 深圳市维杰乐思科技有限公司 | 一种回头客自动识别方法及*** |
CN107679582A (zh) * | 2017-10-20 | 2018-02-09 | 深圳市唯特视科技有限公司 | 一种基于多模态分解模型进行可视问答的方法 |
US20180121533A1 (en) * | 2016-10-31 | 2018-05-03 | Wal-Mart Stores, Inc. | Systems, method, and non-transitory computer-readable storage media for multi-modal product classification |
CN108509519A (zh) * | 2018-03-09 | 2018-09-07 | 北京邮电大学 | 基于深度学习的通用知识图谱增强问答交互***及方法 |
CN108564588A (zh) * | 2018-03-21 | 2018-09-21 | 华中科技大学 | 一种基于深度特征和图割法的建成区自动提取方法 |
CN108875648A (zh) * | 2018-06-22 | 2018-11-23 | 深源恒际科技有限公司 | 一种基于手机视频流的实时车辆损伤和部件检测的方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9965705B2 (en) * | 2015-11-03 | 2018-05-08 | Baidu Usa Llc | Systems and methods for attention-based configurable convolutional neural networks (ABC-CNN) for visual question answering |
CN106777185B (zh) * | 2016-12-23 | 2020-07-10 | 浙江大学 | 一种基于深度学习的跨媒体中草药植物图像搜索方法 |
CN107066583B (zh) * | 2017-04-14 | 2018-05-25 | 华侨大学 | 一种基于紧凑双线性融合的图文跨模态情感分类方法 |
CN108256549B (zh) * | 2017-12-13 | 2019-03-15 | 北京达佳互联信息技术有限公司 | 图像分类方法、装置及终端 |
CN108763325B (zh) * | 2018-05-04 | 2019-10-01 | 北京达佳互联信息技术有限公司 | 一种网络对象处理方法及装置 |
CN109784163A (zh) * | 2018-12-12 | 2019-05-21 | 中国科学院深圳先进技术研究院 | 一种轻量视觉问答***及方法 |
-
2018
- 2018-12-12 CN CN201811518735.8A patent/CN109784163A/zh active Pending
-
2019
- 2019-12-09 WO PCT/CN2019/124008 patent/WO2020119631A1/zh active Application Filing
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105138993A (zh) * | 2015-08-31 | 2015-12-09 | 小米科技有限责任公司 | 建立人脸识别模型的方法及装置 |
CN105956608A (zh) * | 2016-04-21 | 2016-09-21 | 恩泊泰(天津)科技有限公司 | 一种基于深度学习的目标定位、分类算法 |
CN107368770A (zh) * | 2016-05-12 | 2017-11-21 | 深圳市维杰乐思科技有限公司 | 一种回头客自动识别方法及*** |
CN106055576A (zh) * | 2016-05-20 | 2016-10-26 | 大连理工大学 | 一种大规模数据背景下的快速有效的图像检索方法 |
CN106250918A (zh) * | 2016-07-26 | 2016-12-21 | 大连理工大学 | 一种基于改进的推土距离的混合高斯模型匹配方法 |
CN106372581A (zh) * | 2016-08-25 | 2017-02-01 | 中国传媒大学 | 构建及训练人脸识别特征提取网络的方法 |
US20180121533A1 (en) * | 2016-10-31 | 2018-05-03 | Wal-Mart Stores, Inc. | Systems, method, and non-transitory computer-readable storage media for multi-modal product classification |
CN107679582A (zh) * | 2017-10-20 | 2018-02-09 | 深圳市唯特视科技有限公司 | 一种基于多模态分解模型进行可视问答的方法 |
CN108509519A (zh) * | 2018-03-09 | 2018-09-07 | 北京邮电大学 | 基于深度学习的通用知识图谱增强问答交互***及方法 |
CN108564588A (zh) * | 2018-03-21 | 2018-09-21 | 华中科技大学 | 一种基于深度特征和图割法的建成区自动提取方法 |
CN108875648A (zh) * | 2018-06-22 | 2018-11-23 | 深源恒际科技有限公司 | 一种基于手机视频流的实时车辆损伤和部件检测的方法 |
Non-Patent Citations (4)
Title |
---|
HEDI BEN-YOUNES等: "MUTAN: Multimodal Tucker Fusion for Visual Question Answering", 《2017 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION (ICCV)》 * |
XIAO SUN等: "A New LSTM Network Model Combining TextCNN", 《INTERNATIONAL CONFERENCE ON NEURAL INFORMATION PROCESSING》 * |
周苏等: "《软件工程基础》", 31 August 2010, 中国铁道出版社 * |
董冬冬: "《谁的青春不热血》", 30 September 2017, 中国法制出版社 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020119631A1 (zh) * | 2018-12-12 | 2020-06-18 | 中国科学院深圳先进技术研究院 | 一种轻量视觉问答***及方法 |
CN110298338A (zh) * | 2019-06-20 | 2019-10-01 | 北京易道博识科技有限公司 | 一种文档图像分类方法及装置 |
CN110348535B (zh) * | 2019-07-17 | 2022-05-31 | 北京金山数字娱乐科技有限公司 | 一种视觉问答模型训练方法及装置 |
CN110348535A (zh) * | 2019-07-17 | 2019-10-18 | 北京金山数字娱乐科技有限公司 | 一种视觉问答模型训练方法及装置 |
CN111967487B (zh) * | 2020-03-23 | 2022-09-20 | 同济大学 | 一种用于视觉问答模型训练的增量型数据增强方法及应用 |
CN111967487A (zh) * | 2020-03-23 | 2020-11-20 | 同济大学 | 一种用于视觉问答模型训练的增量型数据增强方法及应用 |
CN111814843A (zh) * | 2020-03-23 | 2020-10-23 | 同济大学 | 视觉问答***中图像特征模块端到端训练方法及应用 |
CN111814843B (zh) * | 2020-03-23 | 2024-02-27 | 同济大学 | 视觉问答***中图像特征模块端到端训练方法及应用 |
CN112100346A (zh) * | 2020-08-28 | 2020-12-18 | 西北工业大学 | 基于细粒度图像特征和外部知识相融合的视觉问答方法 |
CN112100346B (zh) * | 2020-08-28 | 2021-07-20 | 西北工业大学 | 基于细粒度图像特征和外部知识相融合的视觉问答方法 |
CN112148891A (zh) * | 2020-09-25 | 2020-12-29 | 天津大学 | 一种基于图感知张量分解的知识图谱补全方法 |
CN112925904A (zh) * | 2021-01-27 | 2021-06-08 | 天津大学 | 一种基于Tucker分解的轻量级文本分类方法 |
CN112925904B (zh) * | 2021-01-27 | 2022-11-29 | 天津大学 | 一种基于Tucker分解的轻量级文本分类方法 |
CN113128415A (zh) * | 2021-04-22 | 2021-07-16 | 合肥工业大学 | 一种环境辨别方法、***、设备及存储介质 |
CN113128415B (zh) * | 2021-04-22 | 2023-09-29 | 合肥工业大学 | 一种环境辨别方法、***、设备及存储介质 |
CN113919344A (zh) * | 2021-09-26 | 2022-01-11 | 腾讯科技(深圳)有限公司 | 文本处理方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2020119631A1 (zh) | 2020-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109784163A (zh) | 一种轻量视觉问答***及方法 | |
Jaiswal et al. | Facial emotion detection using deep learning | |
US20210406525A1 (en) | Facial expression recognition method and apparatus, electronic device and storage medium | |
CN105913039B (zh) | 基于视觉和语音的对话数据交互处理方法及装置 | |
CN111966800B (zh) | 情感对话生成方法、装置及情感对话模型训练方法、装置 | |
CN110990543A (zh) | 智能对话的生成方法、装置、计算机设备及计算机存储介质 | |
CN107818306A (zh) | 一种基于注意力模型的视频问答方法 | |
CN108170816A (zh) | 一种基于深度神经网络的智能视觉问答模型 | |
CN108009573B (zh) | 一种机器人情绪模型生成方法、情绪模型以及交互方法 | |
Zhang et al. | Continuous emotion recognition with audio-visual leader-follower attentive fusion | |
CN110543554A (zh) | 针对多轮对话的分类方法和装置 | |
Mazaheri et al. | Video fill in the blank with merging lstms | |
CN110598603A (zh) | 人脸识别模型获取方法、装置、设备和介质 | |
CN111949824A (zh) | 基于语义对齐的视觉问答方法和***、存储介质 | |
JP2024522328A (ja) | 言語モデルを使うマルチモーダル入力の処理 | |
CN112906493A (zh) | 一种基于互相关注意力机制的跨模态行人重识别方法 | |
CN113032535A (zh) | 辅助视障人士视觉问答方法、装置、计算设备及存储介质 | |
CN112766021A (zh) | 一种基于行人的关键点信息与语义分割信息进行行人重识别的方法 | |
CN114283325A (zh) | 一种基于知识蒸馏的水下目标识别方法 | |
CN113554040B (zh) | 一种基于条件生成对抗网络的图像描述方法、装置设备 | |
CN116994021A (zh) | 图像检测方法、装置、计算机可读介质及电子设备 | |
CN116453024B (zh) | 视频情绪识别***、方法 | |
CN117496567A (zh) | 基于特征增强的面部表情识别方法及*** | |
CN117494762A (zh) | 学生模型的训练方法、素材处理方法、装置及电子设备 | |
CN116861963A (zh) | 基于多路光注入激光器的光子卷积储备池的自动驾驶设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190521 |