当前位置: 首页 > news >正文

实时数字人——DH_LIVE

前两天亲手搭建了实时对话数字人VideoChat,今天来搭建下DH_LIVE。

DH_LIVE一个实时数字人解决方案,从输入文字到数字人对口型说话用时2-3秒。

今天就来实际操作下dh_live的搭建过程。

首先贴上git地址:https://github.com/kleinlee/DH_live

然后又找到了个带webui的开源地址:https://github.com/v3ucn/DH_live_webui 含一键启动脚本。

1、先来看下自己本地的环境配置:

图片

系统:win10

显卡:rtx 2060 super

2、创建 环境

conda create -n dhlive python==3.10

图片

3、创建好后激活环境,进入到项目目录

conda activate dhlive

4、安装环境

pip install -r requirements.txt

5、安装比较顺利,直接安装成功了,接着来试着启动下 

python api.py

报错了。如图:

图片

这种比较好解决,直接 pip install pydub 即可。

6、接着再次执行 第五步,又报错,如图:

图片

    pip install torchaudio

    7、继续执行第五步,还报错

    图片

    这是ffmpeg没有配置环境变量,配置下即可。

    我的电脑--》右键--》属性--》高级系统设置--》环境变量--》系统变量--》path--》新建--》添加ffmpeg的bin路径保存即可。后台回复"ffmpeg"可获取ffmpeg文件

    图片

    图片

    图片

    图片

    配置好后重启打开窗口执行ffmpeg

    图片

    看到输出即为配置成功。

    8、接着再执行第五步,又报错

    图片

    pip install edge_tts

    9、接着执行第五步,终于成功了

    图片

    经实测,效果还不错,就是口型有点不太对应。从输入到说话的间隔要看文本长度。

    后台回复“DH_LIVE”可获取到一键启动的项目文件,包含checkpoints模型文件。

    相关文章:

  • 使用Qt Quick Controls创建自定义日历组件
  • SCADA系统:工业自动化与智能管控的核心架构
  • 从工作到娱乐:Codigger Desktop 让桌面环境更智能
  • Java并发编程 - ReentrantLock
  • 运维打铁:Centos 7 安装 redis_exporter 1.3.5
  • Vue 3 相比 Vue 2 的优势
  • 开发 MCP Proxy(代理)也可以用 Solon AI MCP 哟!
  • Netty线上如何做性能调优?
  • 弄清C语言中的链表
  • FPGA上实现YOLOv5的一般过程
  • STM32 的 GPIO和中断
  • 基于深度学习和单目测距的前车防撞及车道偏离预警系统
  • git 操作
  • STM32 串口通信
  • Git 详细使用说明文档(适合小白)
  • MVCC详解
  • maven工程中引入外部jar
  • 信息系统项目管理工程师备考计算类真题讲解八
  • 拥抱健康生活,解锁养生之道
  • Trae或者VsCode无法识别相对路径(不自动切换工作目录)
  • 全品系停货?泸州老窖:暂未接到通知,常规调控手段
  • 5月1日起,涉外婚姻登记将在上海市16区全面铺开
  • 著名诗人、中国城市发展研究院原常务副院长吕贵品逝世
  • 中海宏洋集团4.17亿元竞得浙江绍兴宅地,溢价率20.87%
  • 肖扬任武钢集团董事长、党委书记
  • 海南陵水一酒店保洁员调包住客港币,被判刑一年六个月