当前位置：首页 > news >正文

【“星睿O6”AI PC开发套件评测】开箱+刷机+基础环境配置

news 来源：原创 2025/4/25 11:36:10

开箱

很荣幸可以参与“星睿O6”AI PC开发套件评测，话不多说先看开箱美图，板子的包装还是蛮惊艳的。

在这里插入图片描述

基础开发环境配置

刷机

刷机参考这里的文档快速上手即可，笔者同时验证过使用USB和使用NVMe硬盘盒直接在硬盘上刷机，操作下来建议使用NVMe硬盘盒，这样效率更高，不要问为什么，看下面的使用USB刷机过程的图片即可

在这里插入图片描述

Debian12更换国内源

考虑到国内使用原本官方源下载软件速度比较慢，将原本的官方源更新为国内源，下面以阿里源为例

deb https://mirrors.aliyun.com/debian/ bookworm main non-free non-free-firmware contrib
deb-src https://mirrors.aliyun.com/debian/ bookworm main non-free non-free-firmware contrib
deb https://mirrors.aliyun.com/debian-security/ bookworm-security main
deb-src https://mirrors.aliyun.com/debian-security/ bookworm-security main
deb https://mirrors.aliyun.com/debian/ bookworm-updates main non-free non-free-firmware contrib
deb-src https://mirrors.aliyun.com/debian/ bookworm-updates main non-free non-free-firmware contrib
deb https://mirrors.aliyun.com/debian/ bookworm-backports main non-free non-free-firmware contrib
deb-src https://mirrors.aliyun.com/debian/ bookworm-backports main non-free non-free-firmware contrib

先备份一下原本的文件然后使用vim编辑器将使用来源替换原本的官方源

sudo cp /etc/apt/sources.list /etc/apt/sources.list_bak
sudo vim /etc/apt/sources.list

保存后然后执行

sudo apt-get update
sudo apt-get upgrade

最后可以安装一下几个常见的库应用方便后面在板子上运行一些AI应用

sudo apt install build-essential git cmake libprotobuf-dev protobuf-compiler libomp-dev libopencv-dev unzip

Python环境安装

Debian默认不允许直接用pip在系统环境中安装包，以避免破坏系统环境。因此，系统默认的Python环境使用pip安装Python包会遇到下面的问题

在这里插入图片描述

解决方法很简单，创建一个虚拟环境，具体创建流程如下：

sudo apt install python3-venv
python3 -m venv llm_env
source llm_env/bin/activate

然后就可以愉快的在虚拟环境里使用pip安装包了

基于MegPeak验证GPU性能

Megpeak是一个用于测试处理器峰值计算性能的工具，目前支持ARM、x86架构的处理器以及由OpenCL驱动的GPU

接下来介绍一下如何使用Megpeak验证板子性能：

编译

git clone https://github.com/MegEngine/MegPeak
mkdir -p build && cd build
cmake .. -DMEGPEAK_ENABLE_OPENCL=ON
make

运行

export LIBOPENCL_PATH="/opt/cixgpu-pro/lib/aarch64-linux-gnu/libOpenCL.so:/lib/aarch64-linux-gnu/libOpenCL.so.1"

在这里插入图片描述

结果分析

设备信息
GPU：Mali-G720-Immortalis r0p0
计算单元：10个
时钟频率：900MHz
支持的扩展：包含大量扩展，如 cl/_khr/_fp16（半精度浮点支持）和 cl/_arm/_matrix/_multiply（ARM 矩阵乘法优化）
性能数据
本地内存带宽：最高达到 ~239 GBPS（int2）
全局内存带宽：最高达到 ~37 GBPS（float2/float4）
整数计算：~288 GFLOPS
单精度浮点计算：~2270 GFLOPS（float2/float4）
半精度浮点计算：~4482 GFLOPS（half2）
双精度浮点：不支持