CN117093376A - 一种应用于国产gpu环境下的智能识别模型适配方法 - Google Patents
一种应用于国产gpu环境下的智能识别模型适配方法 Download PDFInfo
- Publication number
- CN117093376A CN117093376A CN202311352128.XA CN202311352128A CN117093376A CN 117093376 A CN117093376 A CN 117093376A CN 202311352128 A CN202311352128 A CN 202311352128A CN 117093376 A CN117093376 A CN 117093376A
- Authority
- CN
- China
- Prior art keywords
- model
- intelligent
- domestic
- steps
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000006978 adaptation Effects 0.000 title claims abstract description 35
- 238000012549 training Methods 0.000 claims abstract description 33
- 238000013135 deep learning Methods 0.000 claims abstract description 23
- 238000011161 development Methods 0.000 claims abstract description 12
- 238000005457 optimization Methods 0.000 claims abstract description 6
- 238000012360 testing method Methods 0.000 claims description 39
- 238000011156 evaluation Methods 0.000 claims description 19
- 238000012795 verification Methods 0.000 claims description 17
- 238000009434 installation Methods 0.000 claims description 16
- 238000012544 monitoring process Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 6
- 230000006872 improvement Effects 0.000 claims description 6
- 238000011056 performance test Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 5
- 230000001133 acceleration Effects 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 4
- 230000001419 dependent effect Effects 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 4
- 238000004806 packaging method and process Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 3
- 230000002457 bidirectional effect Effects 0.000 claims description 3
- 238000004821 distillation Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000013095 identification testing Methods 0.000 claims description 3
- 238000011900 installation process Methods 0.000 claims description 3
- 238000011068 loading method Methods 0.000 claims description 3
- 238000013508 migration Methods 0.000 claims description 3
- 230000005012 migration Effects 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 claims description 3
- 238000012805 post-processing Methods 0.000 claims description 3
- 238000013138 pruning Methods 0.000 claims description 3
- 238000011002 quantification Methods 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 3
- 238000002360 preparation method Methods 0.000 claims description 2
- 238000010998 test method Methods 0.000 claims description 2
- 238000013434 data augmentation Methods 0.000 claims 1
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000010881 fly ash Substances 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000002002 slurry Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/5044—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering hardware capabilities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/60—Software deployment
- G06F8/61—Installation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Stored Programmes (AREA)
Abstract
本发明涉及人工智能和国产化基础平台领域,且公开了一种应用于国产GPU环境下的智能识别模型适配方法,包括以下步骤:S1:硬件设备基础环境检测;S1:硬件设备基础环境检测;S2:指令集业务架构适配;S3:深度学***台在实际业务应用需求中的适配性能和可靠性进行评估,确保国产硬件平台能够满足项目需求。结合潜在发展和优化需求,综合考察硬件设备的各方面能力是否能够形成良好支撑。
Description
技术领域
本发明属于人工智能和国产化基础平台领域,更为具体地讲,涉及一种应用于国产GPU环境下的智能识别模型适配方法。
背景技术
随着人工智能和大数据技术的发展,智能识别、辅助审核在各类平台、网站资源生产和发布中的应用越来越广泛。目前智能识别技术主要基于英伟达等国外GPU显卡实现,国产芯片、AI加速卡等硬件产品性能相对较低、兼容性较差、适配度较低,因此,虽然寒武纪等国产GPU已经支持主流深度学习框架,但是缺乏和主流AI框架的适配技术手段及对接的软件生态,需要进一步解决指令集支持等问题。
发明内容
本发明的目的在于将主流深度学***台,提供一种应用于国产GPU环境下的智能识别模型适配方法,本发明能够实现充分对国产硬件平台在实际业务需求中的适配性能和可靠性进行评估,确保国产硬件平台能够满足项目需求。结合潜在发展和优化需求,综合考察硬件设备的各方面能力是否能够形成良好支撑。
本发明提供如下技术方案:一种应用于国产GPU环境下的智能识别模型适配方法,包括以下步骤:
S1:硬件设备基础环境检测;
S2:指令集业务架构适配;
S3:深度学习框架适配;
S4:智能识别模型训练调优和推理;
S5:智能识别模型性能稳定性提升;
S6:智能识别应用验证。
所述步骤S1:硬件设备基础环境检测的具体步骤包括:
S1.1:适配所述硬件固件和驱动程序,具体方法包括以下步骤:
S1.1.a:安装固件和驱动,安装过程中若出现固件或驱动版本过低,下载安装高版本驱动程序;若出现“掉卡”等驱动安装失败问题,重新安装驱动程序;
S1.1.b:使用终端命令确认固件和驱动有效安装;
S1.2:适配依赖组件库,具体方法包括以下步骤:
S1.2.a:源代码获取;
S1.2.b:安装能够支持多种目标架构的交叉编译工具;
S1.2.c:配置编译选项,通过构建***来管理编译过程;
S1.2.d:运行构建命令编译依赖库,生成目标架构编译的依赖库;
S1.2.e:安装编译后的依赖库,通过终端命令确认依赖库有效安装。
所述步骤S2:指令集业务架构适配的具体步骤包括:
S2.1:指令集业务架构兼容性测试,具体测试方法为:
针对业务场景的数据,安装相关分析处理的工具包;启动业务服务,进行测试,通过命令查看相关依赖是否安装成功;若成功安装则通过兼容性测试,去步骤S2.2;
否则,则进行相关工具包的适配步骤:1)源码获取;2)配置编译选项;3)生成目标架构的编译库;4)安装测试后去步骤S2.2;
S2.2:指令集业务QPS性能测试,具体测试方法为:
在原平台和目标平台分别使用同一套业务逻辑代码和算法模型,进行业务模块部署;针对业务中的算法和数据,对硬件平台的响应速度和吞吐量进行测试;根据业务需求和测试结果裁定指令集业务QPS性能测试结果。
所述步骤S3:深度学习框架适配的具体步骤包括:
S3.1:选择国产加速平台支持的深度学习框架;
S3.2:对主流深度学习框架进行源码编译构建安装;
S3.3:根据深度学习框架,运行官方示例demo代码,验证有效性。
所述步骤S4:智能识别模型训练调优和推理的具体步骤包括:
S4.1:安装智能模型的训练和推理所需的依赖环境;
S4.2:针对业务场景,准备数据集,划分好训练集和测试集,生成分类标签;
S4.3:在原平台和目标平台上分别进行算法模型实现,模型结构和参数保持一致;
S4.4:读入训练数据开始训练,训练完成后保存模型文件;
S4.5:加载训练好的智能模型文件,将模型格式转为国产平台支持的格式,封装模型推理接口,修改原平台预处理代码和后处理代码,使用封装的接口进行模型的推理和预测。
所述步骤S5:智能识别模型性能稳定性提升的具体步骤包括:
S5.1:智能模型性能评估,具体评估方法为:
S5.1a:针对业务场景,构建智能模型评估所需要的测试数据集,并上传到不同平台。在不同平台下,使用同一套测试数据、算法模型和评估标准,对需要识别的业务数据进行模型识别测试,统计识别结果。评估标准包含智能模型的精准率、召回率、F1以及mAP这4个评价指标。其中,精准率和召回率反映识别模型预测的精度和全面度,并通过F1反映综合指标;mAP则反映多类别预测场景下的识别模型的平均准确率。通过以上评估标准度量不同平台下的识别模型的性能;
S5.1b:对同一张图片推理10次,观察推理结果,出现模型输出性能不稳定,并且在测试集上的推理效果差的问题;
S5.2:模型输出性能提升,推理效果提升的具体方法有:
S5.2a:检查训练数据的质量,确保数据的准确性和充分性。可以通过数据清洗、数据增强等方式来提高数据质量;
S5.2b:调整模型的复杂度,避免过拟合。可以通过增加正则化项、减少模型参数等方式来控制模型的复杂度;
S5.2c:使用交叉验证等技术来评估模型的性能,避免过拟合。可以将数据集划分为多个训练集和验证集,通过验证集来评估模型的性能;
S5.2d:对模型进行调参,优化模型的性能。可以通过网格搜索、随机搜索等方式来寻找最优的超参数组合;
S5.2e:增加训练数据量,提高模型的泛化能力。可以通过数据增强、数据合成等方式来增加训练数据量;
S5.2f:使用迁移学习等技术来提高模型的泛化能力。可以使用预训练的模型作为基础模型,通过微调等方式来适应新的任务;
S5.2g:在测试集上进行模型调优,提高模型的泛化能力。可以使用验证集来评估模型的性能,然后在测试集上进行模型调优;
S5.3:性能提升验证:使用双向数据绑定方法对推理队列中的张量进行整合规范;
S5.4:重复S5.2和S5.3步骤,进行性能提升验证。
所述步骤S6:智能识别应用验证的具体步骤包括:
S6.1:源码安全监测,具体方法为:
首先针对国产GPU平台的AI计算加速卡,选择支持的深度学习框架版本,然后结合目标业务场景,对开源框架的源码进行安全风险检测,防止漏洞导致安全问题;
S6.2:智能模型开发,具体方法包括以下步骤:
S6.2.a:对主流的深度学习框架的接口进行封装,实现统一的开发接口;
S6.2.b:数据预处理,包括过滤、清洗、增广等;
S6.2.c:结合业务数据和需求,构建适合的深度神经网络模型;
S6.2.d:初始化模型训练,训练、验证完成后保存模型;
S6.3:智能模型部署,具体方法包括以下步骤:
S6.3.a:模型迁移:训练和验证后的模型转换为国产硬件平台环境的格式,生成离线模型;
S6.3.b:模型优化:根据部署环境的特性,进行模型剪枝,量化,蒸馏等操作以减小模型的大小和提高其在特定硬件上的性能;
S6.3.c:部署环境准备:包括安装必要的软件库,配置硬件设备,设置网络连接等;
S6.3.d:模型部署:将优化后的模型部署到目标环境中,并进行测试;
S6.3.e:模型监控和更新:在模型部署和运行过程中,持续监控其性能和功能,根据需要进行模型更新和优化;
S6.3.f:推理应用开发:根据审核业务需求和数据流,开发智能识别应用,调用离线模型自动审核业务中的实际样本,将识别结果传回业务处理流程,将识别结果显示到应用界面。
本发明具备以下有益效果:
本发明能够实现充分对国产硬件平台在实际应用需求中的适配性能和可靠性进行评估,确保国产硬件平台能够满足项目需求。结合潜在发展和优化需求,综合考察硬件设备的各方面能力是否能够形成良好支撑。
附图说明
图1是发明原理图;
图2是指令集业务架构适配流程图;
图3是算法模型适配流程图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
实施例
图1是本发明一种应用于国产GPU环境下的智能识别模型适配方法的原理图,具体步骤包括:
S1:硬件设备基础环境检测;
S2:指令集业务架构适配;
S3:深度学习框架适配;
S4:智能识别模型训练调优和推理;
S5:智能识别模型性能稳定性提升;
S6:智能识别应用验证。
在本实例中,测试环境为国产GPU寒武纪智能加速卡,型号为:MLU370-X8,作为对比的非国产显卡设备为英伟达GPU,型号为:NVIDIA 3080Ti,深度学习框架为百度飞浆PaddlePaddle框架。
所述步骤S1:硬件设备基础环境检测:
S1.1:适配所述硬件固件和驱动程序:
首先对GPU硬件安装固件和驱动,安装过程中若出现固件或驱动版本过低,下载安装高版本驱动程序;若出现“掉卡”等驱动安装失败问题,重新安装驱动程序;
安装完成之后使用终端命令(cnmon)确认固件和驱动有效安装;
S1.2:适配依赖组件库:
第1步进行源代码获取:在项目的官方网站或GitHub存储库中找到依赖库的源代码。第2步安装交叉编译工具:对于当前项目,安装能够支持多种目标架构的交叉编译工具,例如GCC(GNU编译器集合)。第3步配置编译选项:对于当前项目,通过构建***来管理编译过程,例如autoconf或cmake等。为项目目标架构配置编译工具,涉及到设置环境变量及其他可能的标志和选项,指向交叉编译器。第4步运行构建命令(如make)编译依赖库,生成目标架构编译的依赖库,执行安装和测试,安装和测试过程依据不同项目,在具体实施上有所不同。一般步骤为先将编译好的库安装到目标***,然后执行官方提供的demo程序,确认安装的有效性。
所述步骤S2:如图2所示,指令集业务架构适配具体步骤包括:
S2.1:指令集业务架构兼容性测试:
针对业务场景的数据,安装相关分析处理的工具包;启动业务服务,进行测试,通过命令查看相关依赖是否安装成功;若成功安装则通过兼容性测试,去步骤S2.2;
否则,则进行相关工具包的适配步骤:1)源码获取;2)配置编译选项;3)生成目标架构的编译库;4)安装测试后去步骤S2.2;
S2.2:指令集业务QPS性能测试:
在原平台和目标平台分别使用同一套业务逻辑代码和算法模型,进行业务模块部署;针对业务中的算法和数据,使用fastAPI封装接口服务并对硬件平台的响应速度和吞吐量进行测试;根据业务需求和测试结果裁定指令集业务QPS性能测试结果。
所述步骤S3:深度学习框架适配:
S3.1:主流框架适配:
第1步对主流深度学习框架进行源码编译构建安装,实例中采用百度飞浆PaddlePaddle框架,编译安装步骤包括:
1)准备相关依赖:
mm_v0.1_aarch64-kylin10.tar;
cntoolkit-3.1.4-1.ky10.aarch64.rpm;
cnnl-static-1.14.2-1.ky10.aarch64.rpm;
cnnl-1.14.2-1.ky10.aarch64.rpm;
cncl-1.5.2-1.ky10.aarch64.rpm;
2)2)编译进容器,代码如下:
gh repo clone Cambricon/mlu-ops
cd mlu-ops/bangc-ops;
./build.sh;
拷贝头文件到neuware下;
3)编译paddle:
CTR2.5对应的paddle仓库为:飞浆2.4版本库;
3.1)使用步骤1)中准备的rpm包安装更新底层库,命令为:
ARG CNTOOLKIT_VERSION=3.1.4-1;
ARG CNNL_VERSION=1.14.2-1;
ARG CNCL_VERSION-1.5.2-1;
ARG MLUOPS_VERSION=0.4.1-1;
3.2)进入工作环境命令为:
cd Paddle;
3.3)创建编译目录,命令为:
mkdir build&&cd build;
3.4)执行cmake,命令为:
cmake .. -DPY_VERSION=3.7 -DPYTHON_EXECUTABLE=`which python3` -DWITH_ARM=ON -DWITH_TESTING=OFF -DON_INFER=ON -DWITH_XBYAK=OFF -DCMAKE_CXX_FLAGS=”who-error -w” -DWITH_MLU=ON;
第2步根据深度学习框架,运行官方示例demo代码,验证有效性,验证代码如下:
cd Paddle;
pip install build/python/dist/paddlepaddle_mlu-0.0.0-cp37-cp37m-arm;
python;
import paddle;
paddle.utils.run_check();
所述步骤S4:如图3所示,智能识别模型训练调优和推理具体实施步骤如下:
S4.1:安装智能模型的训练和推理所需的依赖环境,包括:寒武纪GPU驱动及依赖库、安装寒武纪mlu驱动、paddle_mlu以及后期寒武纪适配的yolox的docker镜像;
S4.2:针对业务场景,准备数据集,基于数据集中的样本存在类别不平衡的情况,使用分层划分方法,划分好训练集和测试集,确保训练集和测试集中的类别比例相似,生成分类标签;
S4.3:在原平台和目标平台上分别进行算法模型实现,指定相同的损失函数、优化器和评估指标,模型结构和参数保持一致;
S4.4:读入训练数据,开始训练,训练完成后保存模型文件;
S4.5:加载训练好的智能模型文件,将Paddle框架的模型格式转为ONNX格式,然后把ONNX格式的模型转为国产平台支持的MagicMind格式,封装模型推理接口,修改原平台预处理代码和后处理代码,使用封装的接口进行模型的推理和预测。
所述步骤S5:智能识别模型性能稳定性提升:
S5.1:智能模型性能评估,具体评估方法为:
S5.1a:针对业务场景,构建智能模型评估所需要的测试数据集,并上传到不同平台。在不同平台下,使用同一套测试数据、算法模型和评估标准,对需要审核的业务数据进行模型识别测试,统计识别结果。评估标准包含智能模型的精准率、召回率、F1以及mAP这4个评价指标。其中,精准率和召回率反映识别模型预测的精度和全面度,并通过F1反映综合指标;mAP则反映多类别预测场景下的识别模型的平均准确率。通过以上评估标准度量不同平台下的识别模型的性能;
S5.1b:对同一张图片推理10次,观察推理结果,出现模型输出性能不稳定,并且在测试集上的推理效果差的问题;
S5.2:性能提升验证:使用双向数据绑定方法对推理队列中的张量进行整合规范;
S5.3:重复S5.1b步骤,进行性能提升验证。
所述步骤S6:智能识别应用验证:
S6.1:源码安全监测:
首先针对国产GPU平台的AI计算加速卡,选择支持的深度学习框架版本,然后结合目标业务场景,对开源框架的源码进行安全风险检测,防止漏洞导致安全问题;
S6.2:智能模型开发:
第1步对主流的深度学习框架的接口进行封装,实现统一的开发接口;第2步进行数据预处理,包括过滤、清洗、增广等;第3步结合智能识别业务数据和需求,构建深度神经网络模型;第4步开始模型训练,训练、验证完成后保存模型权重文件;第5步将训练好的智能识别模型进行部署,具体方法包括以下步骤:
1)模型迁移:训练和验证后的模型转换为国产硬件平台环境的格式,生成离线模型;
2)模型优化:根据部署环境的特性,进行模型剪枝,量化,蒸馏等操作以减小模型的大小和提高其在特定硬件上的性能;
第6步准备部署环境,包括安装必要的软件库,配置硬件设备,设置网络连接等;第7步执行模型部署,将优化后的模型部署到目标环境中,并进行测试;第8步模型监控和更新:在模型部署和运行过程中,持续监控其性能和功能,根据需要进行模型更新和优化;第9步推理应用开发,根据智能识别业务需求和数据流,开发智能识别应用,调用离线模型自动识别业务中的实际样本,将识别结果传回业务处理流程,将识别结果显示到应用界面。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
Claims (9)
1.一种应用于国产GPU环境下的智能识别模型适配方法,其特征在于,包括以下步骤:
S1:硬件设备基础环境检测;
S2:指令集业务架构适配;
S3:深度学习框架适配;
S4:智能审核模型训练调优和推理;
S5:智能审核模型性能稳定性提升;
S6:智能审核应用验证。
2.根据权利要求1所述的一种应用于国产GPU环境下的智能识别模型适配方法,其特征在于,所述S1:硬件设备基础环境检测的具体步骤包括:
S1.1:适配硬件固件和驱动程序,具体方法包括以下步骤:
S1.1.a:安装固件和驱动,安装过程中若出现固件或驱动版本过低,下载安装高版本驱动程序;若出现“掉卡”导致的驱动安装失败问题,重新安装驱动程序;
S1.1.b:使用终端命令确认固件和驱动有效安装;
S1.2:适配依赖组件库,具体方法包括以下步骤:
S1.2.a:源代码获取;
S1.2.b:安装能够支持多种目标架构的交叉编译工具;
S1.2.c:配置编译选项,通过构建***来管理编译过程;
S1.2.d:运行构建命令编译依赖库,生成目标架构编译的依赖库;
S1.2.e:安装编译后的依赖库,通过终端命令确认依赖库有效安装。
3.根据权利要求1所述的一种应用于国产GPU环境下的智能识别模型适配方法,其特征在于,所述S2:指令集业务架构适配的具体步骤包括:
S2.1:指令集业务架构兼容性测试,具体测试方法为:
针对业务场景的数据,安装相关分析处理的工具包;启动业务服务,进行测试,通过命令查看相关依赖是否安装成功;若成功安装则通过兼容性测试,去步骤S2.2;
否则,则进行相关工具包的适配步骤;
S2.2:指令集业务QPS性能测试,具体测试方法为:
在原平台和目标平台分别使用同一套业务逻辑代码和算法模型,进行业务模块部署;针对业务中的算法和数据,对硬件平台的响应速度和吞吐量进行测试;根据业务需求和测试结果裁定指令集业务QPS性能测试结果。
4.根据权利要求1所述的一种应用于国产GPU环境下的智能识别模型适配方法,其特征在于,所述S3:深度学习框架适配的具体步骤包括:
S3.1:主流框架适配,具体方法包括以下步骤:
S3.1.a:对主流深度学习框架进行源码编译构建安装;
S3.1.b:根据深度学习框架,运行官方示例demo代码,验证有效性。
5.根据权利要求1所述的一种应用于国产GPU环境下的智能识别模型适配方法,其特征在于,所述S4:智能识别模型训练调优和推理的具体步骤包括:
S4.1:安装智能模型的训练和推理所需的依赖环境;
S4.2:针对业务场景,准备数据集,划分好训练集和测试集,生成分类标签;
S4.3:在原平台和目标平台上分别进行算法模型实现,模型结构和参数保持一致;
S4.4:读入训练数据开始训练,训练完成后保存模型文件;
S4.5:加载训练好的智能模型文件,将模型格式转为国产平台支持的格式,封装模型推理接口,修改原平台预处理代码和后处理代码,使用封装的接口进行模型的推理和预测。
6.根据权利要求1所述的一种应用于国产GPU环境下的智能识别模型适配方法,其特征在于,所述步骤S5:智能识别模型性能稳定性提升的具体步骤包括:
S5.1:智能模型性能评估,具体评估方法为:
S5.1a:针对业务场景,构建智能模型评估所需要的测试数据集,并上传到不同平台;在不同平台下,使用同一套测试数据、算法模型和评估标准,对需要识别的业务数据进行模型识别测试,统计识别结果;评估标准包含智能模型的精准率、召回率、F1以及mAP这4个评价指标;其中,精准率和召回率反映识别模型预测的精度和全面度,并通过F1反映综合指标;mAP则反映多类别预测场景下的识别模型的平均准确率,通过以上评估标准度量不同平台下的识别模型的性能;
S5.1b:对同一张图片推理10次,观察推理结果,出现模型输出性能不稳定,并且在测试集上的推理效果差的问题;
S5.2:性能提升验证:使用双向数据绑定方法对推理队列中的张量进行整合规范;
S5.3:重复S5.1步骤,进行性能提升验证。
7.根据权利要求1所述的一种应用于国产GPU环境下的智能识别模型适配方法,其特征在于,所述步骤S6:智能识别应用验证的具体步骤包括:
S6.1:源码安全监测,具体方法为:
首先针对国产GPU平台的AI计算加速卡,选择支持的深度学习框架版本,然后结合目标业务场景,对开源框架的源码进行安全风险检测,防止漏洞导致安全问题;
S6.2:智能模型开发;
S6.3:智能模型部署。
8.根据权利要求6所述的一种应用于国产GPU环境下的智能识别模型适配方法,其特征在于,智能模型开发,具体方法包括以下步骤:
S6.2.a:对主流的深度学习框架的接口进行封装,实现统一的开发接口;
S6.2.b:数据预处理,包括数据过滤、数据清洗、数据增广;
S6.2.c:结合业务数据和需求,构建适合的深度神经网络模型;
S6.2.d:初始化模型训练,训练、验证完成后保存模型。
9.根据权利要求6所述的一种应用于国产GPU环境下的智能识别模型适配方法,其特征在于,智能模型部署,具体方法包括以下步骤:
S4.3.a:模型迁移:训练和验证后的模型转换为国产硬件平台环境的格式,生成离线模型;
S4.3.b:模型优化:根据部署环境的特性,进行模型剪枝,量化,蒸馏操作以减小模型的大小和提高其在特定硬件上的性能;
S4.3.c:部署环境准备:包括安装必要的软件库,配置硬件设备,设置网络连接;
S4.3.d:模型部署:将优化后的模型部署到目标环境中,并进行测试;
S4.3.e:模型监控和更新:在模型部署和运行过程中,持续监控其性能和功能,根据需要进行模型更新和优化;
S4.3.f:推理应用开发:根据智能识别业务需求和数据流,开发智能审核应用,调用离线模型自动审核业务中的实际样本,将审核结果传回业务处理流程,将审核结果显示到应用界面。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311352128.XA CN117093376A (zh) | 2023-10-19 | 2023-10-19 | 一种应用于国产gpu环境下的智能识别模型适配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311352128.XA CN117093376A (zh) | 2023-10-19 | 2023-10-19 | 一种应用于国产gpu环境下的智能识别模型适配方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117093376A true CN117093376A (zh) | 2023-11-21 |
Family
ID=88777581
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311352128.XA Pending CN117093376A (zh) | 2023-10-19 | 2023-10-19 | 一种应用于国产gpu环境下的智能识别模型适配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117093376A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113076143A (zh) * | 2021-04-21 | 2021-07-06 | 扬州万方电子技术有限责任公司 | 一种国产平台人工智能环境适配方法及兼容性测试方法 |
CN114186697A (zh) * | 2021-12-10 | 2022-03-15 | 北京百度网讯科技有限公司 | 基于深度学习框架生成和应用深度学习模型的方法及装置 |
CN114330696A (zh) * | 2021-12-31 | 2022-04-12 | 中国联合网络通信集团有限公司 | 多框架的深度学习模型处理方法、装置及电子设备 |
CN114707667A (zh) * | 2022-04-29 | 2022-07-05 | 中国电子科技集团公司第二十八研究所 | 一种数据驱动的自动模型训练及应用*** |
CN116483730A (zh) * | 2023-05-10 | 2023-07-25 | 公安部第一研究所 | 基于国产软硬件和开源测试工具的业务***自动测试方法 |
WO2023160290A1 (zh) * | 2022-02-23 | 2023-08-31 | 京东方科技集团股份有限公司 | 神经网络推理加速方法、目标检测方法、设备及存储介质 |
-
2023
- 2023-10-19 CN CN202311352128.XA patent/CN117093376A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113076143A (zh) * | 2021-04-21 | 2021-07-06 | 扬州万方电子技术有限责任公司 | 一种国产平台人工智能环境适配方法及兼容性测试方法 |
CN114186697A (zh) * | 2021-12-10 | 2022-03-15 | 北京百度网讯科技有限公司 | 基于深度学习框架生成和应用深度学习模型的方法及装置 |
CN114330696A (zh) * | 2021-12-31 | 2022-04-12 | 中国联合网络通信集团有限公司 | 多框架的深度学习模型处理方法、装置及电子设备 |
WO2023160290A1 (zh) * | 2022-02-23 | 2023-08-31 | 京东方科技集团股份有限公司 | 神经网络推理加速方法、目标检测方法、设备及存储介质 |
CN114707667A (zh) * | 2022-04-29 | 2022-07-05 | 中国电子科技集团公司第二十八研究所 | 一种数据驱动的自动模型训练及应用*** |
CN116483730A (zh) * | 2023-05-10 | 2023-07-25 | 公安部第一研究所 | 基于国产软硬件和开源测试工具的业务***自动测试方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cummins et al. | Compiler fuzzing through deep learning | |
US20200249936A1 (en) | Method and system for a platform for api based user supplied algorithm deployment | |
EP3816806A1 (en) | Utilizing neural network and artificial intelligence models to select and execute test cases in a software development platform | |
EP3432229A1 (en) | Ability imparting data generation device | |
US11650799B2 (en) | Remote application modernization | |
CN113076143B (zh) | 一种国产平台人工智能环境适配方法及兼容性测试方法 | |
CN112989363B (zh) | 漏洞定位方法、装置、电子设备和存储介质 | |
CN108984416B (zh) | 一种评估Maven环境中依赖冲突危险级别的方法 | |
CN113626324A (zh) | 一种面向Move语言虚拟机的模糊测试方法 | |
CN115437336A (zh) | 测试用例的测试方法及装置、电子设备和存储介质 | |
CN112580627A (zh) | 基于国产智能芯片K210的yolov3目标检测方法及电子装置 | |
CN115543781A (zh) | 汽车软件模型自动化验证的方法及交互*** | |
US20200301676A1 (en) | Framework for GPU Code Generation and Debugging | |
CN117093376A (zh) | 一种应用于国产gpu环境下的智能识别模型适配方法 | |
Fursin | The collective knowledge project: Making ML models more portable and reproducible with open APIs, reusable best practices and MLOps | |
CN117235527A (zh) | 端到端容器化的大数据模型构建方法、装置、设备及介质 | |
CN100483342C (zh) | 量测程序智能生成***及方法 | |
CN110716716A (zh) | 移动端可视化ai编程平台 | |
FR2828750A1 (fr) | Procede et structure de mise en oeuvre d'un pointeur de securite | |
Akinsola et al. | Qualitative comparative analysis of software integration testing techniques | |
CN117667045A (zh) | 集成深度学习和plc语言的边缘控制器及代码生成方法 | |
US12013773B2 (en) | Generating debuggable executables based on optimizing different compiler options for source code modules | |
KR102454168B1 (ko) | 제조수행 통합관리 시스템 | |
KRISHNA et al. | AGILE TEST AUTOMATION FOR WEB APPLICATION USING TESTNG FRAMEWORK WITH RANDOM INTEGRATION ALGORITHM IN MACHINE LEARNING TO PREDICT ACCURACY AND RESPONSE TIME ON AUTOMATED TEST RESULTS | |
Doroshenko et al. | Optimization of Parallel Software Tuning with Statistical Modeling and Machine Learning. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |