当前位置：首页 > news >正文

论文略读（2025.3.18-更新中）

news 来源：原创 2025/4/26 14:42:52

关于可控视频生成

I2V3D: Controllable image-to-video generation with 3D guidance
Image to Video工作，能够实现给一张图，输出一个视频，且可以控制相机。动态信息来自于用户手工设计（相机移动，人体骨骼驱动）。
pipeline：先image分割前背景，背景用viewcrafter操控，前景得到mesh。然后在blender中编辑使之运动。用render的video提几个关键帧用SDXL过一下，得到真实一点的关键帧，再用SVD插帧。
请添加图片描述
ReCamMaster
可控制相机的video编辑。输入一段video，通过给定新的相机轨迹，输出新相机下的video。通过相机内外参控制。
比较了三种camera control的方法：frame-dimension(本篇）, channel-dimension, view-dimension。其中frame的最佳。具体是f帧变2f帧，作为condition。
请添加图片描述

深度估计

DepthCrafter
视频深度估计方法，基于扩散模型。不需要相机pose。三阶段训练，可以支持超长视频的深度估计（对应一个创新点）
请添加图片描述

img-to-3d human

LHM: Large Animatable Human Reconstruction Model for Single Image to 3D in Seconds
https://github.com/aigc3d/LHM
请添加图片描述

相关文章：

盘泰UV种植体：抗老化新科技，焕发种植牙新活力

Xilinx系列FPGA视频采集转HDMI2.0输出，基于HDMI 1.4/2.0 Transmitter Subsystem方案，提供6套工程源码和技术支持

设计模式之建造者模式

【深度学习入门_机器学习理论】支持向量机（SVM）

【总结】Pytest vs Behave，BDD 测试框架哪家强？

SpringSecurity配置(自定义认证过滤器)

基于deepseek的智能语音客服【第三讲】知识库封装

Rust会取代Java吗？Rust与Java对比

【商城实战(49)】解锁小程序端适配与优化，让商城飞起来

druid开启防火墙之后的bug

【MySQL】架构

从基础到实践（十九）：DC/DC由来和工作原理介绍

数据源支持远程Excel/CSV，数据集支持分组字段功能，DataEase开源BI工具v2.10.6 LTS版本发布

YOLO11报错：AttributeError: module ‘torch‘ has no attribute ‘OutOfMemoryError‘

Pytorch使用手册—自定义函数的双重反向传播与自定义函数融合卷积和批归一化（专题五十二）

蓝桥杯算法分享：征服三座算法高峰

TensorFlow 的基本概念和使用场景

该错误是由于`KuhnMunkres`类未定义`history`属性导致的

【橘子websocket】如何基于vertx来构建websocket聊天室(上)

JS—原型与原型链：2分钟掌握原型链

甘肃省原副省长赵金云被开除公职，甘肃省委表态：坚决拥护党中央决定

玉渊谭天丨“稀土管制让美国慌了”，美军工稀土储备仅够数月

从“高阶智驾”到“辅助驾驶”，上海车展上的“智驾”宣发变调

魔都眼丨人形机器人“华山论剑”：拳击赛缺席，足球赛抢镜

白俄罗斯驻华大使：应发挥政党作用，以对话平台促上合组织发展与合作

政治局会议：要提高中低收入群体收入，设立服务消费与养老再贷款