当前位置: 首页 > news >正文

Sand AI 开源 MAGI-1 视频生成模型,近屿智能带你领略无限扩展的 AI 视界

2025年4月21日,Sand AI推出了MAGI-1开源视频生成模型,以其自回归扩散架构和卓越的生成能力迅速引起关注。该模型不仅支持高保真的视频生成,还具备无限扩展和灵活的时间轴控制功能,适合影视制作和复杂场景的叙述。MAGI-1的开源特性和强大的社区反馈,使其在视频生成领域脱颖而出,未来可能在实时生成和虚拟现实应用中发挥更大作用。

MAGI-1 基于扩散变换器架构,引入块因果注意力、并行注意力块、Sandwich 规范化等技术创新,通过分块生成(每块 24 帧)实现高效视频生成。其独特流水线设计支持并行处理,最多可同时生成四个块,大幅提升效率。

模型通过快捷蒸馏技术,支持灵活的推理预算,并在物理行为预测和时间一致性上表现优异,适用于长篇叙事和复杂动态场景。MAGI-1 的“无限视频扩展”功能允许无缝延长视频内容,结合“秒级时间轴控制”,用户可通过逐块提示实现场景转换和精细化编辑,满足影视制作、讲故事等需求。

在图像到视频任务中,模型展现出高保真输出,原生分辨率达 1440x2568px,动作流畅、细节逼真。作为开源模型,MAGI-1 提供 Docker 部署支持,24B 参数版本需 8 张 H100 GPU,未来 4.5B 版本将适配单张 RTX 4090,降低使用门槛。

在竞争激烈的视频生成领域,MAGI-1 以开源和自回归架构脱颖而出。Sand AI 计划推出更轻量化版本,并深化硬件优化,未来或推动实时生成、虚拟现实等应用。MAGI-1 的发布不仅是技术突破,更是对开源生态的贡献,有望重塑视频创作格局。

相关文章:

  • 《深入理解计算机系统》阅读笔记之第二章 信息的表示和处理
  • Apipost免费版、企业版和私有化部署详解
  • 保安员证考试的理论知识有哪些重点?
  • 计算机基础 原码反码补码问题
  • 一篇速成Linux 设置位 S(SetUID)
  • kafka课后总结
  • 简述:变更调查的历史情况
  • 定时任务:Quartz
  • Windows同步技术-使用命名对象
  • MySQL引擎分类与选择、SQL更新底层实现、分库分表、读写分离、主从复制 - 面试实战
  • 明远智睿SD2351核心板:以48元撬动AI视觉产业革命的“硬核引擎”
  • 队列基础和例题
  • 保障海外业务发展,U-Mail邮件中继提供高效安全的解决方案
  • [Mybatis-plus]
  • 数据结构------C语言经典题目(6)
  • protothread协程库实现非阻塞延时(无操作系统)
  • LangChain 中主流的 RAG 实现方式
  • 第5.5章:ModelScope-Agent:支持多种API无缝集成的开源框架
  • Golang | 自行实现并发安全的Map
  • 运维打铁:Mysql 分区监控以及管理
  • 吕国范任河南省人民政府副省长
  • 广州一季度GDP为7532.51亿元,同比增长3%
  • 释新闻|SEVIS是什么?在美留学生遭身份中止意味什么?
  • 在县中,我看到“走出去”的渴望与“留下来”的惯性
  • 刘非履新浙江省委常委、杭州市委书记,曾在吉湘云多省任职
  • 青海西宁市公安局原党委委员、副局长王小华被“双开”