当前位置: 首页 > news >正文

llama-factory微调报错:

报错信息

[INFO] [utils.py:789:see_memory_usage] CPU Virtual Memory: used =
81.51 GB, percent = 64.9%
W0419 10:14:27.573000 108354 site-packages/torch/distributed/elastic/multiprocessing/api.py:897] Sending process 108373 closing signal SIGTERM
W0419 10:14:27.594000 108354 site-packages/torch/distributed/elastic/multiprocessing/api.py:897] Sending process 108375 closing signal SIGTERM
W0419 10:14:27.594000 108354 site-packages/torch/distributed/elastic/multiprocessing/api.py:897] Sending process 108376 closing signal SIGTERM
E0419 10:14:33.446000 108354 site-packages/torch/distributed/elastic/multiprocessing/api.py:869] failed (exitcode: -9) local_rank: 1 (pid: 108374) of binary: /opt/conda/envs/llamaf/bin/python

Traceback (most recent call last):
File “/opt/conda/envs/llamaf/bin/torchrun”, line 33, in
sys.exit(load_entry_point(‘torch==2.5.1’, ‘console_scripts’, ‘torchrun’)())
xxx
xxx
xxx
torch.distributed.elastic.multiprocessing.errors.ChildFailedError:
/home/LLaMA-Factory/src/llamafactory/launcher.py FAILED

由于看到CPU Virtual Memory 只加载到了64.9%,发现是内存不足。

解决方法:

# 创建分区路径
sudo mkdir -p /data/swap/
# 设置分区的大小
# bs=128M是块大小,count=64是块数量,
# 所以swap空间大小是bs*count=96GB
sudo dd if=/dev/zero of=/data/swap/swap0 bs=512M count=192
# 设置该目录权限
sudo chmod 0600 /data/swap/swap0
# 创建SWAP文件
sudo mkswap /data/swap/swap0
# 激活SWAP文件
sudo swapon /data/swap/swap0
# 查看SWAP信息是否正确
sudo swapon -s

相关文章:

  • JavaScript在边缘计算(Edge Computing)环境下的性能考量
  • 八股文---Redis(1)
  • 山东科技大学深度学习考试回忆
  • 嵌入式芯片中的 低功耗模式 内容细讲
  • CTF--秋名山车神
  • LeetCode 2563.统计公平数对的数目:排序 + 二分查找
  • QML中的3D功能--纹理应用
  • 致远OA——自定义开发rest接口
  • OSPF综合实验(HCIP)
  • 09-DevOps-Jenkins实现CI持续集成
  • Java集合框架中的List、Map、Set详解
  • 【unity】Vulkan模式下部分Android机型使用VideoPlayer组件播放视频异常问题
  • 超简单的git学习教程
  • 又来聊一下加班的问题
  • jenkins尾随命令
  • Stable Diffusion秋叶整合包V4独立版Python本地API连接指南
  • 【AI提示词】IT专家顾问
  • 【Docker-14】容器操作案例
  • Java Web 之 互联网协议 100问
  • 向量陷阱:关键词、长度与相关性如何误导Embedding模型?
  • 马上评|机器人马拉松,也是具身智能产业的加速跑
  • 伊朗艺术中的中国风
  • 习近平主席东南亚三国行|元首外交硕果累累 • 一图读懂
  • 关注“老旧小区加装电梯”等安全隐患,最高检发布相关典型案例
  • 杭州一地铁口建筑被吐槽像棺材,官方回应:暂无拆除计划
  • 硅基世界的“缘分”——系统与人工智能携手进化