当前位置：首页 > news >正文

用 24 小时登顶权威榜单的 HiDream-i1-dev，参与“AI 神笔马良挑战赛“

news 来源：原创 2025/4/26 12:52:40

当国产 AI 文本模型已渗透日常生活，图像生成领域却长期处于追赶状态。面对 Stable Diffusion、Midjourney 等海外模型的压制，国产方案始终困于——元素堆砌生硬、细节逻辑失真、中文理解隔阂等困局中。直到 HiDream-i1 成功破圈，努力惊艳了所有人！

d.run 大模型服务平台已正式上线 HiDream-i1-dev 开发者版，用户即日起登录平台即可沉浸式体验顶尖国产文生图大模型，并参与 "AI 神笔马良挑战赛"。参与者不仅能赢取算力代金券，更能亲眼见证自己的创意构想经 AI 赋能转化为惊艳的艺术作品，还等什么，快来参赛！（参与方式见后文）。

那 HiDream-i1 到底有什么特别之处呢？

01

全球顶尖的开源图像生成模型
——HiDream-i1

4 月 15 日，智象未来宣布开源其图像生成大模型 HiDream-I1。该模型在发布 24 小时内即登顶国际权威评测平台 Artificial Analysis 榜首，终结了 OpenAI、Google、Midjourney 等海外巨头长期垄断全球生图模型 TOP 的格局，成为首个登顶该榜单的中国原生多模态大模型，并在图像质量、语义理解、艺术表现三大维度刷新行业纪录。

领先全球的中文理解能力

HiDream-i1-dev 实现了中文母语直通 AI 绘图的跨越，在权威的 GenEval 中文评测中，HiDream-i1-dev 以 0.83 分的优异成绩超越 SDXL、DALL·E 3 等国际主流模型。更值得关注的是模型选择采用 MIT 开源协议，不仅允许图片进行商用，更向开发者敞开模型调优的大门，为中文 AI 创作生态注入无限可能。

生成高质量图像的核心挑战，在于精准解析并实现用户复杂指令。HiDream-i1-dev 依托自主研发的深度优化 tokenizer 与创新语义分层机制，展现出革命性的中文文本解析能力 —— 相较于过往依赖英文关键词输入的局限，该模型能精准捕捉中文语义的细微差别，从文字位置、主次关系、边界轮廓，到色彩搭配、字体形态等视觉要素，均能通过语义分层处理实现精细化映射，让复杂创意指令转化为图像时不再受限于语言转换的损耗。

尽管在超写实光影渲染与复杂文本排版方面仍需追赶顶尖闭源模型，但 HiDream-i1-dev 已展现出独特优势：其生成图像的质感逼近 GPT-4o，更在文化适配性上实现独树一帜。我们不用再削足适履，HiDream-i1 正为国内创作者搭建起直通想象力的巴别塔，在提示词与像素的共振中，搭建出一个用中文书写的 AI 艺术新纪元。

丰富且细腻的图像生成效果

作为面向产业落地的工程化创新，HiDream-I1 开创性地推出 Full（完整版）、Dev（开发者版）、Fast（轻量版）三阶产品矩阵。其中 Dev 版以 17B 参数规模实现技术突破：通过自主知识产权的渐进式蒸馏技术，将推理步骤压缩至 28 步的同时基本保持原模型表现力，实测性能位列全球开源生图模型第三，为开发者打造出效率与质量平衡的工业级工具。

相较传统的图像生成模型，HiDream-i1-dev 在三大核心维度展现出了性能的提升：

图文一致性：该模型首创双流MMDiT与单流DiT的混合架构，可以更高效精准的融合文本与视觉的多模态信息，从而提升生成图像与用户输入提示的一致性；
复杂文本理解能力：模型配备了多种顶尖的文本编码器包括 OpenCLIP ViT-bigG、OpenAI CLIP ViT-L、T5-XXL，Llama-3.1-8B-Instruct，多方加码，帮助精准理解复杂文本需求，将空间、颜色、数量等关系准确梳理后，大幅增强生成图像的准确性；
细节增强技术：支持发丝纹理、布料褶皱等微观表现，尽力实现真实场景的还原。