当前位置: 首页 > news >正文

用 24 小时登顶权威榜单的 HiDream-i1-dev,参与“AI 神笔马良挑战赛“

当国产 AI 文本模型已渗透日常生活,图像生成领域却长期处于追赶状态。面对 Stable Diffusion、Midjourney 等海外模型的压制,国产方案始终困于——元素堆砌生硬、细节逻辑失真、中文理解隔阂等困局中。直到 HiDream-i1 成功破圈,努力惊艳了所有人!

d.run 大模型服务平台已正式上线 HiDream-i1-dev 开发者版,用户即日起登录平台即可沉浸式体验顶尖国产文生图大模型,并参与 "AI 神笔马良挑战赛"。参与者不仅能赢取算力代金券,更能亲眼见证自己的创意构想经 AI 赋能转化为惊艳的艺术作品,还等什么,快来参赛!(参与方式见后文)。

那 HiDream-i1 到底有什么特别之处呢?

01

全球顶尖的开源图像生成模型
——HiDream-i1

4 月 15 日,智象未来宣布开源其图像生成大模型 HiDream-I1。该模型在发布 24 小时内即登顶国际权威评测平台 Artificial Analysis 榜首,终结了 OpenAI、Google、Midjourney 等海外巨头长期垄断全球生图模型 TOP 的格局,成为首个登顶该榜单的中国原生多模态大模型,并在图像质量、语义理解、艺术表现三大维度刷新行业纪录

图片

领先全球的中文理解能力

HiDream-i1-dev  实现了中文母语直通 AI 绘图的跨越,在权威的 GenEval 中文评测中,HiDream-i1-dev 以 0.83 分的优异成绩超越 SDXL、DALL·E 3 等国际主流模型。更值得关注的是模型选择采用 MIT 开源协议,不仅允许图片进行商用,更向开发者敞开模型调优的大门,为中文 AI 创作生态注入无限可能。

图片

生成高质量图像的核心挑战,在于精准解析并实现用户复杂指令。HiDream-i1-dev 依托自主研发的深度优化 tokenizer 与创新语义分层机制,展现出革命性的中文文本解析能力 —— 相较于过往依赖英文关键词输入的局限,该模型能精准捕捉中文语义的细微差别,从文字位置、主次关系、边界轮廓,到色彩搭配、字体形态等视觉要素,均能通过语义分层处理实现精细化映射,让复杂创意指令转化为图像时不再受限于语言转换的损耗。

尽管在超写实光影渲染与复杂文本排版方面仍需追赶顶尖闭源模型,但 HiDream-i1-dev 已展现出独特优势:其生成图像的质感逼近 GPT-4o,更在文化适配性上实现独树一帜。我们不用再削足适履,HiDream-i1 正为国内创作者搭建起直通想象力的巴别塔,在提示词与像素的共振中,搭建出一个用中文书写的 AI 艺术新纪元。

丰富且细腻的图像生成效果

作为面向产业落地的工程化创新,HiDream-I1 开创性地推出 Full(完整版)、Dev(开发者版)、Fast(轻量版)三阶产品矩阵。其中 Dev 版以 17B 参数规模实现技术突破:通过自主知识产权的渐进式蒸馏技术,将推理步骤压缩至 28 步的同时基本保持原模型表现力,实测性能位列全球开源生图模型第三,为开发者打造出效率与质量平衡的工业级工具。

相较传统的图像生成模型,HiDream-i1-dev 在三大核心维度展现出了性能的提升:

  • 图文一致性该模型首创双流MMDiT与单流DiT的混合架构,可以更高效精准的融合文本与视觉的多模态信息,从而提升生成图像与用户输入提示的一致性;

  • 复杂文本理解能力:模型配备了多种顶尖的文本编码器包括 OpenCLIP ViT-bigG、OpenAI CLIP ViT-L、T5-XXL,Llama-3.1-8B-Instruct,多方加码,帮助精准理解复杂文本需求,将空间、颜色、数量等关系准确梳理后,大幅增强生成图像的准确性;

  • 细节增强技术:支持发丝纹理、布料褶皱等微观表现,尽力实现真实场景的还原。

02

AI 神笔马良挑战赛
火热开启

当前,HiDream-i1-dev 已正式接入 d.run 大模型服务平台,并同步开启 “AI 神笔马良挑战赛”。诚邀广大用户踊跃参赛,让每一次文字输入都成为灵感落地的起点!

活动主题AI 神笔马良挑战赛

活动时间:4 月 22 日-4 月 30 日(共 8 天,倒计时启动!)

创作主题:「用 AI展现东方美学——亭·台·楼·阁」

用你的 AI 创意,让传统建筑焕发数字生命力!

参与方式:

1️⃣ 生成作品:在 d.run 平台 输入你的创意提示词,生成 1 张主题作品; 

2️⃣ 提交资料:扫下方二维码添加小编,将 「最终图片+提示词文本+d.run 使用截图」 私信发送至官方小编即可;

图片

3️⃣ 规则说明:在截止时间前,每人仅限提交 1 张作品,需为首次公开原创 AI 内容。

奖项设置:

  • 神笔马良奖(1 名):600 元平台代金券

  • 金笔马良奖(5 名):100 元平台代金券

  • 银笔马良奖(10 名):50 元平台代金券

评选标准:

我们将会组织内部评审团包含品牌设计师、UI 设计师、插画师等长期与视觉图像打交道的专业人员进行评选。

  • 质量维度(30%):结构合理性、色彩应用、光影处理

  • 提示词符合度(30%):生成内容匹配程度、元素完整及风格相符

  • 美学角度(40%):视觉体验、传统建筑美感、情感共鸣

结果公布时间:5 月 7 日

为帮助大家轻松参赛,「DaoCloud 道客」工程师团队通过分布式计算优化与动态资源调度,使生图速度较本地部署提升 2 倍,简单场景秒级出图,复杂画面生成时间也大幅压缩。同时,我们支持零门槛网页端直达:无需代码基础,注册登录,30秒完成「中文描述→参数微调→图像生成」全流程。

小编给大家做了如下简单指引,方便大家使用。

Step1 : 登入注册 console.d.run

Step2:点击大模型服务平台——模型体验——图片模型

图片

Step3: 点击右侧 HiDream-i1-dev 进入界面

图片

Step4: 输入对应的文字要求,正向意味着希望在图片中出现,负向意味着不在图片中出现,并调整所需数量和图片尺寸,目前平台最大尺寸支持 1024*1024。最后修改 Guidance scale,数值越低发散性越强。

图片

PS:生图的提示词需要优化后才能呈现更好的效果,小编建议可以使用平台上已经接入的 DeepSeek、千问等文本大模型来进行优化哦,用 AI 指导 AI 工作,效率更高!

欢迎大家多多投稿!

相关文章:

  • commix
  • HTTP状态码
  • HarmonyOS NEXT应用开发-Notification Kit(用户通知服务)notificationManager.addSlot
  • 【差分隐私】假设检验的视角(高斯差分隐私)
  • html+servlet项目中的echart图表
  • 【分布式系统中的“瑞士军刀”_ Zookeeper】一、Zookeeper 快速入门和核心概念
  • 利用TTP协议 ETag + 路由守卫 实现前端发版后通知用户更新得一个方案
  • ​升级Ubuntu 20.04 LTS到22.04 LTS​
  • websheet之 编辑器
  • 开发体育直播系统内容与用户管理机制技术实现方案
  • 【玩泰山派】7、玩linux桌面环境xfce - (4)使用gstreamer
  • 3.4 Spring Boot异常处理
  • 酷狗音乐安卓版K歌功能与音效优化体验测评
  • 基于vue框架的电信用户业务管理系统的设计与实现8ly70(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
  • 容器化实现基于的技术
  • C++----模拟实现string
  • 《Java编程思想》读书笔记:第十章 内部类
  • IMX675-AAQR-C 索尼图像传感器 属于索尼 Starvis 2 系列,主打 高灵敏度、低噪声,适用于工业检测、安防监控、机器视觉等场景 提供数据手册
  • 从零开始学Python游戏编程40-碰撞处理2
  • fps项目总结:生成武器子弹丧尸攻击
  • 《深化养老服务改革发展的大湾区探索》新书将于今年6月出版
  • 政治局会议:积极维护多边主义,反对单边霸凌行径
  • 11-13世纪的地中海贸易
  • 中国驻英国大使郑泽光:中国反制美国关税是为了维护国际公平正义和多边贸易体制
  • 上海汽车贸易有限公司原总经理王璟接受监察调查
  • 研究|和去年相比,人们使用AI的需求发生了哪些变化?