CN117576571A

CN117576571A - 基于图像和文本的多模态果蔬叶片病害识别方法及***

Info

Publication number: CN117576571A
Application number: CN202410057430.0A
Authority: CN
Inventors: 熊小飞; 王鑫磊; 王汉军; 熊欣瑶; 熊甜; 黎彦军; 黎利华
Original assignee: Hanzhong Science And Technology Resource Coordination Center Hanzhong Institute Of Botany; Hanzhong Zhongyuan Agricultural Technology Development Group Co ltd
Current assignee: Hanzhong Science And Technology Resource Coordination Center Hanzhong Institute Of Botany; Hanzhong Zhongyuan Agricultural Technology Development Group Co ltd
Priority date: 2024-01-16
Filing date: 2024-01-16
Publication date: 2024-02-20
Anticipated expiration: 2044-01-16
Also published as: CN117576571B

Abstract

本发明涉及植物病害识别技术领域，尤其涉及基于图像和文本的多模态果蔬叶片病害识别方法及***，该方法的步骤包括：获取叶片病害图像和文本信息，文本信息包括时间信息、地理位置信息、环境信息和用户输入的文本描述信息；对文本信息进行预处理，预处理包括缺失值填充和降噪；通过卷积神经网络提取叶片病害图像中的病斑特征信息并获取生长阶段信息；对文本信息和生长阶段信息进行文本特征分析，提取文本特征信息；对病斑特征信息和文本特征信息进行融合，输出病害识别结果。本发明通过对图像信息和文本信息进行多模态融合并对缺失的文本信息进行有效填充，提高了病害识别的可靠性和准确率。

Description

基于图像和文本的多模态果蔬叶片病害识别方法及***

技术领域

本发明涉及植物病害识别技术领域，尤其涉及基于图像和文本的多模态果蔬叶片病害识别方法及***。

背景技术

在果蔬叶片病害识别中，单一模态的数据往往存在信息局限性，不能完整描述病害的特征，而不同模态数据能够从多个角度描述病害特征，形成信息互补，从而更加完整的表达病害特征。同时，在果蔬生长过程中，不同生长阶段的果蔬对病害具有不同的易感性和抵抗力。但是，现有的多模态果蔬叶片病害识别方法通常存在文本信息缺失以及未将生长阶段信息纳入多模态数据的问题。

例如在公开号为CN115048537A的专利中公开了一种基于图像-文本多模态协同表示的病害识别***，涉及蔬菜叶部病害识别模型研究领域，该***包括：图像识别模块，用于识别图像数据；文本识别模块，与图像识别模块连接，用于提取文本数据特征；知识图谱模块，与文本识别模块连接，用于为病害诊断过程提供知识性指导；模型训练模块，与知识图谱模块连接，用于获取病害类别识别结果。

而在授权公告号为CN116168223B的中国专利中公开了一种基于多模态的花生叶斑病病害等级检测方法，包括以下步骤：采用K-means方法构建数据集，对采集的花生叶斑病原始数据进行分组，并训练所需的数据集；对花生叶斑病的RGB图像和光谱数据进行预处理；将预处理后的RGB图像和光谱数据分别输入至花生叶斑病多模态检测模型的Resnet101网络和改进的1D-CNN网络中进行特征提取，再通过特征融合模块将提取的特征进行融合，并输出花生叶斑病病害等级结果；选择评价指标对花生叶斑病病害等级结果进行评价。

以上专利均存在本背景技术提出的问题：现有的果蔬叶片病害多模态识别方法通常存在文本信息缺失的问题，且在识别过程中忽略了果蔬生长阶段信息对病害识别结果的影响。

发明内容

为了克服现有技术存在的缺陷与不足，本发明提供基于图像和文本的多模态果蔬叶片病害识别方法及***，通过对图像信息和文本信息进行多模态融合并对缺失的文本信息进行有效填充，提高了病害识别的可靠性和准确率。

为了达到上述目的，本发明采用以下技术方案：

本发明提供基于图像和文本的多模态果蔬叶片病害识别方法，包括下述步骤：

获取叶片病害图像和文本信息，文本信息包括时间信息、地理位置信息、环境信息和用户输入的文本描述信息；

对文本信息进行预处理，预处理包括缺失值填充和降噪；

通过卷积神经网络提取叶片病害图像中的病斑特征信息并获取生长阶段信息；

对文本信息和生长阶段信息进行文本特征分析，提取文本特征信息；

对病斑特征信息和文本特征信息进行融合，输出病害识别结果。

作为优选的技术方案，所述文本信息与叶片病害图像为一对一映射关系，其中，时间信息为获取叶片病害图像的时间信息，地理位置信息为获取叶片病害图像的地理位置信息，环境信息为获取叶片病害图像的环境信息，用户输入的文本描述信息以叶片病害图像为描述对象。

作为优选的技术方案，所述环境信息包括气象信息和土壤信息，其中，气象信息包括天气类型、温度信息、湿度信息、日照时长信息和降水量信息，土壤信息包括土壤温度信息和土壤湿度信息。

作为优选的技术方案，所述文本描述信息包括果蔬种类、种植时间、病斑颜色和病斑面积占叶片面积的比例。

作为优选的技术方案，所述缺失值填充用于对文本信息中的缺失值进行填充，具体步骤包括：

当地理位置信息或时间信息存在缺失时，通过叶片病害图像获取叶片病害背景图像相似性并按照从大到小排序，将排序中前个叶片病害背景图像相似性对应的叶片病害图像映射的文本信息中出现频次最高的地理位置信息或时间信息作为缺失值进行填充，其中，/>为大于0的正整数；

当环境信息存在缺失时，通过地理位置信息和时间信息获取时空信息相似性，将时空信息相似性最高的文本信息中的环境信息作为缺失值进行填充；

当文本描述信息存在缺失时，通过叶片病害图像获取病斑图像相似性，将病斑图像相似性和时空信息相似性之和最高的文本信息中的文本描述信息作为缺失值进行填充。

作为优选的技术方案，所述叶片病害背景图像相似性计算的具体步骤包括：

通过DeepLabV3+模型获取叶片病害背景图像，将缺失地理位置信息或时间信息的叶片病害背景图像记作第一背景图像，将文本信息完整的叶片病害背景图像记作第二背景图像；

计算叶片病害背景图像相似性，用下式表示：

；

式中表示第一背景图像，/>表示第二背景图像，/>表示第一背景图像的宽度，/>表示第一背景图像的高度，/>表示第二背景图像的宽度，表示第二背景图像的高度，/>表示取最小值函数，/>表示第一背景图像的平均亮度，/>表示第二背景图像的平均亮度，/>表示第一背景图像和第二背景图像的协方差，/>表示第一背景图像的方差，/>表示第二背景图像的方差，/>和/>表示稳定性常数，/>表示第一背景图像和第二背景图像的相似性。

作为优选的技术方案，所述时空信息相似性最高的文本信息获取的具体步骤包括：

将环境信息缺失的文本信息作为第一文本信息，将信息完整的文本信息作为第二文本信息；

通过地理位置信息获取距离差值，用下式表示：

；

式中表示地球半径，/>表示第一文本信息中地理位置信息的纬度与第二文本信息中地理位置信息的纬度之差，/>表示第一文本信息中地理位置信息的纬度，表示第二文本信息中地理位置信息的纬度，/>表示第一文本信息中地理位置信息的经度与第二文本信息中地理位置信息的经度之差，/>表示距离差值；

通过对第一文本信息中的时间信息和第二文本信息中的时间信息作差，获取时间差值；

将距离差值小于预设距离阈值且时间差值最小的文本信息作为时空信息相似性最高的文本信息，其中，所述预设距离阈值由本领域技术人员根据大量实验确定。

作为优选的技术方案，所述病斑图像相似性计算的具体步骤包括：

通过U-Net模型获取叶片病害图像中的病斑图像，将缺失文本描述信息的叶片病害图像的病斑图像记作第一病斑图像，将文本信息完整的叶片病害图像的病斑图像记作第二病斑图像；

计算病斑图像相似性，用下式表示：

；

式中表示权重参数，/>表示颜色空间中的颜色数量，/>表示第一病斑图像颜色直方图中第/>个颜色的归一化频率，/>表示第二病斑图像颜色直方图中第/>个颜色的归一化频率，/>表示第一病斑图像中像素灰度值/>和像素灰度值/>在相同的距离和方向上共同出现的概率，/>表示第二病斑图像中像素灰度值/>和像素灰度值/>在相同的距离和方向上共同出现的概率，/>表示病斑图像相似性。

作为优选的技术方案，所述降噪包括无效字符清洗、语法检查、语义检查、重复数据删除和标点符号删除。

作为优选的技术方案，所述生长阶段信息通过文本信息中的时间信息与用户输入的文本描述信息中的种植时间作差获取，生长阶段信息包括萌芽阶段、幼苗阶段、生长阶段和成熟阶段。

作为优选的技术方案，所述文本特征分析使用BERT模型对文本信息和生长阶段信息进行文本特征提取，其中，BERT模型由12个Transformer编码器组成，每个Transformer编码器包括多头自注意力机制层、归一化层和全连接前馈神经网络层。

作为优选的技术方案，所述病害识别结果包括病害种类、病害侵染区域和个性化防治建议。

本发明还提供基于图像和文本的多模态果蔬叶片病害识别***，包括：

多模态数据采集模块，用于获取叶片病害图像和文本信息，文本信息包括时间信息、地理位置信息、环境信息和用户输入的文本描述信息；

文本信息预处理模块，用于对文本信息进行预处理，预处理包括缺失值填充和降噪；

神经网络模块，用于通过卷积神经网络提取叶片病害图像中的病斑特征信息并获取生长阶段信息；

文本分析模块，用于对文本信息和生长阶段信息进行文本特征分析，提取文本特征信息；

病害结果输出模块，用于对病斑特征信息和文本特征信息进行融合，输出病害识别结果。

本发明的一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时，实现基于图像和文本的多模态果蔬叶片病害识别方法。

本发明的一种控制器，包括存储器和处理器，所述存储器用于存储计算机程序，所述处理器用于执行所述计算机程序时实现基于图像和文本的多模态果蔬叶片病害识别方法。

本发明与现有技术相比，具有如下优点和有益效果：

（1）本发明通过获取叶片病害图像以及采集叶片病害图像的时间信息、地理位置信息、环境信息和文本描述信息，将图像信息和文本信息进行多模态融合，在提高病害识别准确率的同时给出更具针对性的防治建议。

（2）本发明通过计算叶片病害背景图像相似性、时空信息相似性和病斑图像相似性，对文本信息中的缺失值进行有效填充，进一步提高了病害识别的可靠性和准确率。

附图说明

通过阅读参照以下附图所作的对非限制性实施例的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1为本发明的基于图像和文本的多模态果蔬叶片病害识别方法的整体流程示意图；

图2为本发明的基于图像和文本的多模态果蔬叶片病害识别方法中所述Transformer编码器的示意图；

图3为本发明的基于图像和文本的多模态果蔬叶片病害识别***的结构示意图。

具体实施方式

下面通过附图以及具体实施例对本发明技术方案做详细地说明，应当理解本发明实施例以及实施例中的具体特征是对本发明技术方案的详细的说明，而不是对本发明技术方案的限定，在不冲突的情况下，本发明实施例以及实施例中的技术特征可以相互组合。

实施例1：

如图1所示，本实施例提供基于图像和文本的多模态果蔬叶片病害识别方法，具体包括下述步骤：

S1：获取叶片病害图像和文本信息，文本信息包括时间信息、地理位置信息、环境信息和用户输入的文本描述信息；

文本信息与叶片病害图像为一对一映射关系，其中，时间信息为获取叶片病害图像的时间信息，地理位置信息为获取叶片病害图像的地理位置信息，环境信息为获取叶片病害图像的环境信息，用户输入的文本描述信息以叶片病害图像为描述对象；

环境信息包括气象信息和土壤信息，其中，气象信息包括天气类型、温度信息、湿度信息、日照时长信息和降水量信息，土壤信息包括土壤温度信息和土壤湿度信息；

文本描述信息包括果蔬种类、种植时间、病斑颜色和病斑面积占叶片面积的比例。

S2：对文本信息进行预处理，预处理包括缺失值填充和降噪；

S21：缺失值填充用于对文本信息中的缺失值进行填充，具体步骤包括：

当地理位置信息或时间信息存在缺失时，通过叶片病害图像获取叶片病害背景图像相似性并按照从大到小排序，将排序中前个叶片病害背景图像相似性对应的叶片病害图像映射的文本信息中出现频次最高的地理位置信息或时间信息作为缺失值进行填充，其中，/>为大于0的正整数，本实施例中，/>优选为10；

当文本描述信息存在缺失时，通过叶片病害图像获取病斑图像相似性，将病斑图像相似性和时空信息相似性之和最高的文本信息中的文本描述信息作为缺失值进行填充；

S22：叶片病害背景图像相似性计算的具体步骤包括：

计算叶片病害背景图像相似性，用下式表示：

；

式中表示第一背景图像，/>表示第二背景图像，/>表示第一背景图像的宽度，/>表示第一背景图像的高度，/>表示第二背景图像的宽度，表示第二背景图像的高度，/>表示取最小值函数，/>表示第一背景图像的平均亮度，/>表示第二背景图像的平均亮度，/>表示第一背景图像和第二背景图像的协方差，/>表示第一背景图像的方差，/>表示第二背景图像的方差，/>和/>表示稳定性常数，/>表示第一背景图像和第二背景图像的相似性；

其中，DeepLabv3+模型通过编码-解码结构实现对输入叶片病害图像的逐像素分割，在编码器中以Xception作为主干特征提取网络，提取叶片病害图像的浅层特征并传入解码器，在空洞空间金字塔池化单元中通过1×1卷积层、膨胀率分别为6、12、18的多尺度空洞卷积层以及池化层，将空洞空间金字塔池化单元的多个输出结果拼接融合得到深层特征图，在解码器中对获取到的深层特征进行4倍上采样，并与浅层特征融合后再经过4倍双线性插值上采样恢复到原尺寸，输出最终的叶片病害背景图像；

S23：时空信息相似性最高的文本信息获取的具体步骤包括：

通过地理位置信息获取距离差值，用下式表示：

；

将距离差值小于预设距离阈值且时间差值最小的文本信息作为时空信息相似性最高的文本信息，其中，预设距离阈值由本领域技术人员根据大量实验确定；

S24：病斑图像相似性计算的具体步骤包括：

计算病斑图像相似性，用下式表示：

；

式中表示权重参数，/>表示颜色空间中的颜色数量，/>表示第一病斑图像颜色直方图中第/>个颜色的归一化频率，/>表示第二病斑图像颜色直方图中第/>个颜色的归一化频率，/>表示第一病斑图像中像素灰度值/>和像素灰度值/>在相同的距离和方向上共同出现的概率，/>表示第二病斑图像中像素灰度值/>和像素灰度值/>在相同的距离和方向上共同出现的概率，/>表示病斑图像相似性；

其中，U-Net模型由编码器和解码器两部分组成，编码器经过卷积层和池化层对输入的叶片病害图像进行特征提取，同时将数据的空间逐渐缩小；

解码器由卷积层和上采样层构成，将编码器部分提取的特征映射还原到原始分辨率，并生成病斑分割结果；

编码器和解码器通过跳跃方式进行连接，用于将编码器的高层次特征信息传递到解码器中，以帮助解码器对丢失的特征信息进行补充，更好地生成病斑分割结果。

S3：通过卷积神经网络提取叶片病害图像中的病斑特征信息并获取生长阶段信息；

生长阶段信息通过文本信息中的时间信息与用户输入的文本描述信息中的种植时间作差获取，生长阶段信息包括萌芽阶段、幼苗阶段、生长阶段和成熟阶段。

S4：对文本信息和生长阶段信息进行文本特征分析，提取文本特征信息；

文本特征分析使用BERT模型对文本信息和生长阶段信息进行文本特征提取，BERT模型由12个Transformer编码器组成，如图2所示，每个Transformer编码器包括多头自注意力机制层、归一化层和全连接前馈神经网络层。

S5：对病斑特征信息和文本特征信息进行融合，输出病害识别结果，其中，病害识别结果包括病害种类、病害侵染区域和个性化防治建议。

实施例2：

如图3所示，本实施例提供基于图像和文本的多模态果蔬叶片病害识别***，包括：

多模态数据采集模块21，用于获取叶片病害图像和文本信息，文本信息包括时间信息、地理位置信息、环境信息和用户输入的文本描述信息；

文本信息预处理模块22，用于对文本信息进行预处理，预处理包括缺失值填充和降噪；

神经网络模块23，用于通过卷积神经网络提取叶片病害图像中的病斑特征信息并获取生长阶段信息；

文本分析模块24，用于对文本信息和生长阶段信息进行文本特征分析，提取文本特征信息；

病害结果输出模块25，用于对病斑特征信息和文本特征信息进行融合，输出病害识别结果。

多模态数据采集模块21，用于获取叶片病害图像和文本信息，文本信息包括时间信息、地理位置信息、环境信息和用户输入的文本描述信息，其中，文本信息与叶片病害图像为一对一映射关系，时间信息为获取叶片病害图像的时间信息，地理位置信息为获取叶片病害图像的地理位置信息，环境信息为获取叶片病害图像的环境信息，用户输入的文本描述信息以叶片病害图像为描述对象；

文本信息预处理模块22，用于对文本信息进行预处理，预处理包括缺失值填充和降噪，其中：

缺失值填充用于对文本信息中的缺失值进行填充，具体步骤包括：

叶片病害背景图像相似性计算的具体步骤包括：

计算叶片病害背景图像相似性，用下式表示：

；

时空信息相似性最高的文本信息获取的具体步骤包括：

通过地理位置信息获取距离差值，用下式表示：

；

病斑图像相似性计算的具体步骤包括：

计算病斑图像相似性，用下式表示：

；

降噪包括对文本信息进行无效字符清洗、语法检查、语义检查、重复数据删除和标点符号删除。

神经网络模块23，用于通过卷积神经网络提取叶片病害图像中的病斑特征信息并获取生长阶段信息，其中，生长阶段信息通过文本信息中的时间信息与用户输入的文本描述信息中的种植时间作差获取，生长阶段信息包括萌芽阶段、幼苗阶段、生长阶段和成熟阶段。

文本分析模块24，用于对文本信息和生长阶段信息进行文本特征分析，提取文本特征信息，其中，文本特征分析使用BERT模型对文本信息和生长阶段信息进行文本特征提取，如图2所示，BERT模型由12个Transformer编码器组成，每个Transformer编码器包括多头自注意力机制层、归一化层和全连接前馈神经网络层。

病害结果输出模块25，用于对病斑特征信息和文本特征信息进行融合并输出病害识别结果，其中，融合并输出病害识别结果的过程使用CLIP模型、ViLBERT模型或LXMERT模型，病害识别结果包括病害种类、病害侵染区域和个性化防治建议。

上述关于本发明的基于图像和文本的多模态果蔬叶片病害识别***中的各参数和各个单元模块实现相应功能的步骤，可参考上文中关于基于图像和文本的多模态果蔬叶片病害识别方法的实施例中的各参数和步骤，在此不做赘述。

实施例3：

本发明实施例的一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时，实现上述的基于图像和文本的多模态果蔬叶片病害识别方法。需要说明的是：基于图像和文本的多模态果蔬叶片病害识别方法的所有计算机程序均使用Python语言实现，其中，文本信息预处理模块、神经网络模块、文本分析模块和病害结果输出模块均由远程服务器控制；远程服务器的CPU为Intel Xeon Gold 5118，GPU为NVIDIA GTX2080Ti 11GB，操作***为Ubuntu 18.04.2，深度学习框架为PyTorch1.7.0，CUDA版本为10.2，使用cuDNN 7.6.5进行加速推理；Intel Xeon Gold 5118包含存储器和处理器，其中，存储器用于存储计算机程序；处理器用于执行计算机程序，使得Intel Xeon Gold 5118执行实现基于图像和文本的多模态果蔬叶片病害识别方法。

所属技术领域的技术人员知道，本发明可以实现为***、方法或计算机程序产品。

因此，本公开可以具体实现为以下形式，即：可以是完全的硬件、也可以是完全的软件（包括固件、驻留软件、微代码等），还可以是硬件和软件结合的形式，本文一般称为“电路”、“模块”或“***”。此外，在一些实施例中，本发明还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式，该计算机可读介质中包含计算机可读的程序代码。

可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子（非穷举的列表）包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器（RAM），只读存储器（ROM）、可擦式可编程只读存储器（EPROM或闪存）、光纤、便携式紧凑磁盘只读存储器（CD-ROM）、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.基于图像和文本的多模态果蔬叶片病害识别方法，其特征在于，包括下述步骤：

对文本信息进行预处理，预处理包括缺失值填充和降噪；

对病斑特征信息和文本特征信息进行融合，输出病害识别结果；

所述缺失值填充用于对文本信息中的缺失值进行填充，具体步骤包括：

当地理位置信息或时间信息存在缺失时，通过叶片病害图像获取叶片病害背景图像相似性并按照从大到小排序，将排序中前个叶片病害背景图像相似性对应的叶片病害图像映射的文本信息中出现频次最高的地理位置信息或时间信息作为缺失值进行填充，其中，为大于0的正整数；

所述叶片病害背景图像相似性计算的具体步骤包括：

计算叶片病害背景图像相似性，用下式表示：

；

式中表示第一背景图像，/>表示第二背景图像，/>表示第一背景图像的宽度，/>表示第一背景图像的高度，/>表示第二背景图像的宽度，/>表示第二背景图像的高度，/>表示取最小值函数，/>表示第一背景图像的平均亮度，/>表示第二背景图像的平均亮度，/>表示第一背景图像和第二背景图像的协方差，/>表示第一背景图像的方差，/>表示第二背景图像的方差，/>和/>表示稳定性常数，/>表示第一背景图像和第二背景图像的相似性；

所述时空信息相似性最高的文本信息获取的具体步骤包括：

通过地理位置信息获取距离差值，用下式表示：

；

将距离差值小于预设距离阈值且时间差值最小的文本信息作为时空信息相似性最高的文本信息；

所述病斑图像相似性计算的具体步骤包括：

计算病斑图像相似性，用下式表示：

；

2.根据权利要求1所述的基于图像和文本的多模态果蔬叶片病害识别方法，其特征在于，所述文本信息与叶片病害图像为一对一映射关系，其中，时间信息为获取叶片病害图像的时间信息，地理位置信息为获取叶片病害图像的地理位置信息，环境信息为获取叶片病害图像的环境信息，用户输入的文本描述信息以叶片病害图像为描述对象。

3.根据权利要求1所述的基于图像和文本的多模态果蔬叶片病害识别方法，其特征在于，所述环境信息包括气象信息和土壤信息，其中，气象信息包括天气类型、温度信息、湿度信息、日照时长信息和降水量信息，土壤信息包括土壤温度信息和土壤湿度信息。

4.根据权利要求1所述的基于图像和文本的多模态果蔬叶片病害识别方法，其特征在于，所述文本描述信息包括果蔬种类、种植时间、病斑颜色和病斑面积占叶片面积的比例。

5.根据权利要求1所述的基于图像和文本的多模态果蔬叶片病害识别方法，其特征在于，所述生长阶段信息通过文本信息中的时间信息与用户输入的文本描述信息中的种植时间作差获取，生长阶段信息包括萌芽阶段、幼苗阶段、生长阶段和成熟阶段。

6.根据权利要求1所述的基于图像和文本的多模态果蔬叶片病害识别方法，其特征在于，所述文本特征分析使用BERT模型对文本信息和生长阶段信息进行文本特征提取，其中，BERT模型由12个Transformer编码器组成，每个Transformer编码器包括多头自注意力机制层、归一化层和全连接前馈神经网络层。

7.根据权利要求1所述的基于图像和文本的多模态果蔬叶片病害识别方法，其特征在于，所述病害识别结果包括病害种类、病害侵染区域和个性化防治建议。

8.基于图像和文本的多模态果蔬叶片病害识别***，其基于权利要求1-7中任一项所述的基于图像和文本的多模态果蔬叶片病害识别方法实现，其特征在于，所述***包括：

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时，实现权利要求1-7中任一项所述的基于图像和文本的多模态果蔬叶片病害识别方法。

10.一种控制器，包括存储器和处理器，所述存储器用于存储计算机程序，其特征在于，所述处理器用于执行所述计算机程序时实现权利要求1-7中任一项所述的基于图像和文本的多模态果蔬叶片病害识别方法。