【“星睿O6”AI PC开发套件评测】开箱+刷机+基础环境配置
开箱
很荣幸可以参与“星睿O6”AI PC开发套件评测,话不多说先看开箱美图,板子的包装还是蛮惊艳的。
基础开发环境配置
刷机
刷机参考这里的文档快速上手即可,笔者同时验证过使用USB和使用NVMe硬盘盒直接在硬盘上刷机,操作下来建议使用NVMe硬盘盒,这样效率更高,不要问为什么,看下面的使用USB刷机过程的图片即可
Debian12更换国内源
考虑到国内使用原本官方源下载软件速度比较慢,将原本的官方源更新为国内源,下面以阿里源为例
deb https://mirrors.aliyun.com/debian/ bookworm main non-free non-free-firmware contrib
deb-src https://mirrors.aliyun.com/debian/ bookworm main non-free non-free-firmware contrib
deb https://mirrors.aliyun.com/debian-security/ bookworm-security main
deb-src https://mirrors.aliyun.com/debian-security/ bookworm-security main
deb https://mirrors.aliyun.com/debian/ bookworm-updates main non-free non-free-firmware contrib
deb-src https://mirrors.aliyun.com/debian/ bookworm-updates main non-free non-free-firmware contrib
deb https://mirrors.aliyun.com/debian/ bookworm-backports main non-free non-free-firmware contrib
deb-src https://mirrors.aliyun.com/debian/ bookworm-backports main non-free non-free-firmware contrib
先备份一下原本的文件然后使用vim编辑器将使用来源替换原本的官方源
sudo cp /etc/apt/sources.list /etc/apt/sources.list_bak
sudo vim /etc/apt/sources.list
保存后然后执行
sudo apt-get update
sudo apt-get upgrade
最后可以安装一下几个常见的库应用方便后面在板子上运行一些AI应用
sudo apt install build-essential git cmake libprotobuf-dev protobuf-compiler libomp-dev libopencv-dev unzip
Python环境安装
Debian默认不允许直接用pip在系统环境中安装包,以避免破坏系统环境。因此,系统默认的Python环境使用pip安装Python包会遇到下面的问题
解决方法很简单,创建一个虚拟环境,具体创建流程如下:
sudo apt install python3-venv
python3 -m venv llm_env
source llm_env/bin/activate
然后就可以愉快的在虚拟环境里使用pip安装包了
基于MegPeak验证GPU性能
Megpeak是一个用于测试处理器峰值计算性能的工具,目前支持ARM、x86架构的处理器以及由OpenCL驱动的GPU
接下来介绍一下如何使用Megpeak验证板子性能:
编译
git clone https://github.com/MegEngine/MegPeak
mkdir -p build && cd build
cmake .. -DMEGPEAK_ENABLE_OPENCL=ON
make
运行
export LIBOPENCL_PATH="/opt/cixgpu-pro/lib/aarch64-linux-gnu/libOpenCL.so:/lib/aarch64-linux-gnu/libOpenCL.so.1"
结果分析
-
设备信息
GPU:Mali-G720-Immortalis r0p0
计算单元:10个
时钟频率:900MHz
支持的扩展:包含大量扩展,如 cl/_khr/_fp16(半精度浮点支持)和 cl/_arm/_matrix/_multiply(ARM 矩阵乘法优化) -
性能数据
本地内存带宽:最高达到 ~239 GBPS(int2)
全局内存带宽:最高达到 ~37 GBPS(float2/float4)
整数计算:~288 GFLOPS
单精度浮点计算:~2270 GFLOPS(float2/float4)
半精度浮点计算:~4482 GFLOPS(half2)
双精度浮点:不支持
参考文档
Debian12更换国内源sourcelist
https://aijishu.com/a/1060000000503889