当前位置: 首页 > news >正文

算能BM1684升级为BM1688: tpu_mlir转换模型_SDK更新_代码修改_问题排查_代码调试

目录

1 开发环境搭建

1.1 下载SDK

1.2 拉取docker镜像

1.3 创建容器

1.4 安装tpu_mlir

1.5 准备工作目录

2 onnx转mlir文件

3 mlir转int8模型

3.1 生成校准表

3.2 编译为int8量化模型

4 混精度

5 准备编译依赖的SDK、库、头文件

5.1 拷贝sophon的库和头文件

5.2 拷贝ffmpeg的库和头文件

5.3 拷贝opencv的库和头文件

5.4 修改makefile中库文件和头文件路径

6 解决编译报错以及修改代码

6.1 fatal error: bmnn_utils.h: No such file or directory

6.2 error: ‘string’ is not a member of ‘std’

6.3 error: ‘bmcv_padding_atrr_t’ was not declared in this scope; did you mean ‘bmcv_padding_attr_t’?

6.4 /usr/bin/ld: cannot find -lbmvideo: No such file or directory

7 运行

8 问题排查

9 代码调试

参考文献:


1 开发环境搭建

1.1 下载SDK

技术资料

下载完之后解压

1.2 拉取docker镜像

拉取镜像前有个问题,以前转换bm1684的算法模型的时候,拉取镜像命令也是

docker pull sophgo/tpuc_dev:latest

这次bm1688的拉取镜像命令是一样的,那么latest就重复了,所以我现在把以前的bm1684使用的标签命名为bm1684,然后等会我拉取了bm1688的镜像之后命名为bm1688

上面是把1684的latest命名成了bm1684,接下来下载1688的latest并命名为bm1688

1.3 创建容器

docker run --privileged --name bm1688 -v $PWD:/workspace -it sophgo/tpuc_dev:bm1688

1.4 安装tpu_mlir

加上清华源,要不然下载很慢

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tpu_mlir[all]
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tpu_mlir[onnx,torch]

然后

cd /workspace/sophonsdk_edge_v1.9_official_release/tpu_milr
source envsetup.sh

1.5 准备工作目录

建立 model_yolov5s 目录, 并把模型文件和图片文件都 放入 model_yolov5s 目录中。

mkdir model_yolov5s
cd model_yolov5s
#然后把onnx模型和图片拷贝到当前目录
mkdir workspace  #这个workspace是在model_yolov5s文件夹下面创建的
cd workspace

我这里其实不这样做,我直接把以前bm1684时使用的model_yolov5s拷贝过来,

cp -drf /data/chw/bitedalu_20220713/mlir/Release_v2312-LTS/Release_v2312-LTS/tpu-mlir_20231116_054500/model_yolov5s /data/chw/bitedalu_20250423/sophonsdk_edge_v1.9_official_release/tpu_milr/model_yolov5s

然后把以前1684执行时的那些workspace的中间过程文件都给删了

rm -rf  /data/chw/bitedalu_20250423/sophonsdk_edge_v1.9_official_release/tpu_milr/model_yolov5s/workspace/*

2 onnx转mlir文件

在/workspace/sophonsdk_edge_v1.9_official_release/tpu_milr/model_yolov5s/workspace文件夹下面执行命令

model_transform.py \--model_name yolov5s \--model_def ../edge_compute_best_20230821.onnx \--input_shapes [[1,3,640,640]] \--mean 0.0,0.0,0.0 \--scale 0.0039216,0.0039216,0.0039216 \--keep_aspect_ratio \--pixel_format rgb \--output_names 339,391,443 \--test_input ../calib/00ca3e9473b4407bb1e72a38a7c6c69f.jpg \--test_result yolov5s_top_outputs.npz \--mlir yolov5s.mlir

 --output_names 320,340,354 这里的三个具体名字通过用netron看onnx模型文件确定, 

3 mlir转int8模型

3.1 生成校准表

	run_calibration.py yolov5s.mlir \--dataset ../calib \--input_num 200 \-o yolov5s_cali_table

这里calib文件夹里面是校准图片,里面是200张图片和200个标注文件。

3.2 编译为int8量化模型

	model_deploy.py \--mlir yolov5s.mlir \--quantize INT8 \--calibration_table yolov5s_cali_table \--chip bm1688 \--test_input yolov5s_in_f32.npz \--test_reference yolov5s_top_outputs.npz \--tolerance 0.85,0.45 \--model yolov5s_pcb_4shuchu_1688_int8_sym.bmodel

4 混精度

混精度参考以前1684的,命令不要照抄,要注意修改,比如1684修改成1688,比如其他的一些名字也注意修改。

利用tpu-mlir工具将深度学习算法模型转成算能科技平台.bmodel模型的方法步骤-CSDN博客

5 准备编译依赖的SDK、库、头文件

7.8. BM1684(X)_to_BM1688(CV186AH)兼容性文档 — SOPHONSDKUserGuide (HEAD detached at 046884f) 文档

在上面链接文档,看到这个介绍

然后我去解压

接下来需要把libsophon下面的头文件和库文件拷到我的工程中

还有media相关的库文件和头文件拷贝我的工程中,

5.1 拷贝sophon的库和头文件

在盒子的/data1/chw/bitmain_all_1688/lib/新建一个sophon,然后在/data1/chw/bitmain_all_1688/lib/sophon路径下执行下面的拷贝命令,
scp -rf root@192.168.1.10:/data/chw/bitedalu_20250423/sophonsdk_edge_v1.9_official_release/sophon-img/libsophon_soc_0.4.11_aarch64/opt/sophon/libsophon-0.4.11/lib/* ./

然后头文件也是,

同样也是新建个sophon文件夹,
scp -r root@192.168.1.10:/data/chw/bitedalu_20250423/sophonsdk_edge_v1.9_official_release/sophon-img/libsophon_soc_0.4.11_aarch64/opt/sophon/libsophon-0.4.11/include/* ./

5.2 拷贝ffmpeg的库和头文件

先把原来1684的ffmpeg的头文件和库文件全都删掉,然后再拷贝。

scp -r root@192.168.1.10:/data/chw/bitedalu_20250423/sophonsdk_edge_v1.9_official_release/sophon-img/sophon-media-soc_1.9.0_aarch64/opt/sophon/sophon-ffmpeg_1.9.0/lib/* /data1/chw/bitmain_all_1688/lib/ffmpeg/
scp -r root@192.168.1.10:/data/chw/bitedalu_20250423/sophonsdk_edge_v1.9_official_release/sophon-img/sophon-media-soc_1.9.0_aarch64/opt/sophon/sophon-ffmpeg_1.9.0/include/* /data1/chw/bitmain_all_1688/include/ffmpeg/

5.3 拷贝opencv的库和头文件

先把原来1684的opencv的头文件和库文件全都删掉,然后再拷贝。

scp -r root@192.168.1.10:/data/chw/bitedalu_20250423/sophonsdk_edge_v1.9_official_release/sophon-img/sophon-media-soc_1.9.0_aarch64/opt/sophon/sophon-opencv_1.9.0/include/* /data1/chw/bitmain_all_1688/include/opencv/
scp -r root@192.168.1.10:/data/chw/bitedalu_20250423/sophonsdk_edge_v1.9_official_release/sophon-img/sophon-media-soc_1.9.0_aarch64/opt/sophon/sophon-opencv_1.9.0/lib/* /data1/chw/bitmain_all_1688/lib/opencv/

5.4 修改makefile中库文件和头文件路径

由于前面我拷贝库文件和头文件的时候,删除了一些文件夹,然后新建了一些文件夹,那么makefile中也需要修改一下相应的文件夹。

6 解决编译报错以及修改代码

直接先make看看错误,慢慢来解决。

6.1 fatal error: bmnn_utils.h: No such file or directory

这个其实是在算能的模型demo的dependencies里面的。

把这几个文件全都拷贝到include/sophon里面,

6.2 error: ‘string’ is not a member of ‘std’

增加头文件 #include <string>

6.3 error: ‘bmcv_padding_atrr_t’ was not declared in this scope; did you mean ‘bmcv_padding_attr_t’?

这是算能SDK更新后,修改了名字,解决方法是,在公共头文件中添加 typedef bmcv_padding_attr_t bmcv_padding_atrr_t;但是其实在include/sophon/bm_wrapper.hpp这个文件中已经有

所以我直接包含bm_wrapper.hpp这个头文件就可以了,

6.4 /usr/bin/ld: cannot find -lbmvideo: No such file or directory

/usr/bin/ld: cannot find -lbmvideo: No such file or directory
/usr/bin/ld: cannot find -lbmjpuapi: No such file or directory
/usr/bin/ld: cannot find -lbmjpulite: No such file or directory

makefile把这几个库去掉,这是bm1684的。

7 运行

经过上面的修改之后,程序就能够运行起来了.但是我发现模型一个目标也没有检测出来,

8 问题排查

用demo跑一下我转的模型看看是否正常,

把\\192.168.1.10\public\data\chw\bitedalu_20250423\sophonsdk_edge_v1.9_official_release\sophon-demo\sophon-demo_v0.2.9_1740285_20250212\sample\YOLOv5整体拷贝到BM1688盒子上,算能的readme里面写的是让交叉编译,我为了省时间,不在X86上安装编译环境了,直接在BM1688盒子上编译,

然后需要修改cpp/yolov5_bmcv/CMakeLists.txt

为什么这里要增加这个,因为本来应该在X86上安装环境,然后这些库和头文件是在类似("${SDK}/lib/")这种目录的,但是我没装,所以直接用我的,

然后

mkdir build
cd build
cmake -DTARGET_ARCH=soc -DSDK=/opt/sophon/ -DCMAKE_BUILD_TYPE=Debug  ..  #这里-DSDK=/opt/sophon/其实没用,因为根本就没安装SDK

然后把我转的模型拷贝过来,再拷贝个测试视频,然后执行下面的命令

./yolov5_bmcv.soc --bmodel=./easnet_pcb_4shuchu_1688_int8_sym.bmodel --input=shigu5.mp4 --classnames=coco.names

然后发现检测效果可以,那么说明我转的模型没有问题,那就是我的代码有问题,可以这个代码在BM1684上都是没问题的,那可能就是BM1688上有些API可能换了,所以我要调试、排查下我的代码。

9 代码调试

参考文献:

技术资料

7.8. BM1684(X)_to_BM1688(CV186AH)兼容性文档 — SOPHONSDKUserGuide (HEAD detached at 046884f) 文档 利用tpu-mlir工具将深度学习算法模型转成算能科技平台.bmodel模型的方法步骤-CSDN博客

相关文章:

  • 【MySQL】3分钟解决MySQL深度分页问题
  • 一种专用车辆智能配电模块的设计解析:技术革新与未来展望
  • C#并行编程极大提升集合处理速度,再也没人敢说你程序性能差了!
  • 【信息系统项目管理师】高分论文:论成本管理与采购管理(信用管理系统)
  • 高校学子走进万物纵横:体验边缘计算前沿技术,共探产业创新未来
  • 38 python random
  • 数据结构初阶:排序
  • 什么是可重入锁ReentrantLock?
  • day01_编程语言介绍丶Java语言概述丶开发环境搭建丶常用DOS命令
  • volatile缓存可见性实现原理
  • 解决Spring Boot多模块自动配置失效问题
  • 【MFC】 VS2022打开低版本的MFC,双击.rc文件,DIalog加载失败,页面弹窗fatal error RC***:cannot open*****
  • 使用 AI Agent 改善师生互动的设计文档
  • 探秘LLM推理模型:hidden states中藏着的self verification的“钥匙”
  • 串口通讯协议文档
  • SpringCloud搭建Eureka注册中心
  • 【重磅】敲敲云桌面版正式发布!
  • 销售新人必看!5大秘籍助你快速上手,告别迷茫!
  • 07 Python 字符串全解析
  • Java从入门到“放弃”(精通)之旅——JavaSE终篇(异常)
  • 龚曙光:散文家永远只有一个视角,就是“我与时代”
  • 从篆刻书画到装帧设计,再看钱君匋的“艺兼众美”
  • 《我的后半生》:人生下半场,也有活力重启的可能
  • “五一”前多地市监部门告诫经营者:对预订客房不得毁约提价
  • 稀土管制难倒特斯拉人形机器人“擎天柱”,马斯克:“正与中国协商”
  • 建行原副行长章更生被开除党籍:靠贷吃贷,大搞权钱交易