深度剖析!GPT-image-1 API 开放对 AI 绘画技术生态的冲击!
4月24日凌晨,OpenAI正式发布了全新的图像生成模型“gpt-image-1”,并通过API向全球开发者开放使用,这意味着其GPT-4o的图像生成能力正式向开发者开放!
在这之前,GPT-4o的图像生成功能于今年3月25日由 OpenAI 创始人兼 CEO 萨姆・阿尔特曼直播发布,次日正式上线,在海内外都掀起了不小的关注和讨论。
这是 OpenAI 首次将图像生成功能直接集成到多模态模型GPT-4o中,通过统一训练框架,模型能同时理解文本、图像和上下文,用户仅需通过自然语言交互,就能实现从文本到图像的创作。精准指令遵循和上下文感知能力,令 OpenAI 的用户赞不绝口。
上线仅一天后,GPT-4o生成的吉卜力风格图片便在网络上掀起了病毒式传播。用户只需简单指令,就能将普通图片转换为吉卜力风格,不管是人物还是城市风景皆可。画面质感可媲美吉卜力工作室原画团队,连 CEO 萨姆・阿尔特曼也直接换上吉卜力风格头像为 GPT-4o 宣传。
而4月24日发布的 gpt-image-1 模型,基于 GPT-4o 的多模态能力,同样能生成吉卜力风格的图像,同时更胜 GPT-4o 的图像生成功能,正如 CEO 萨姆・阿尔特曼在其推特上提到的,API版本与ChatGPT版本的不同之处在于:gpt-image-1可以支持各种高级功能的定制,比如控制生成的图像质量与生成速度、背景、输出格式等。
在API定价方面,gpt-image-1具有明显优势。gpt-image-1 API 采用基于 token 的计费方式,文本输入、图像输入和图像输出的 token 分别计价,文本输入 token 每百万 5 美元,图像输入 token 每百万 10 美元,图像输出 token 每百万 40 美元。
以生成方形图像为例,低质量图像每张约 0.02 美元(约 0.15 元人民币),中等质量每张约 0.07 美元(约 0.50 元人民币),高质量图像每张约 0.19 美元(约 1.37 元人民币)。
此处插入一则通知,中小企业和个人开发者可以通过算力租用实现AI绘画、AI模型训练。比如,算力云平台就专为中小企业和高校实验室提供算力租用服务,目前有 RTX 4090/3090/2080Ti 等充足的显卡在香港、台湾多地域可租用。
无需高配电脑,玩转AI绘画!云端快速部署Stable Diffusion的步骤分享!
当前AI绘画市场主要由 MidJourney 和 Stable Diffusion 主导,MidJourney 以出色的艺术风格表现力和易用性,收获了大量个人创作者与小型团队的青睐;Stable Diffusion 凭借开源特性,让开发者能够对模型进行个性化调整,在专业领域与企业应用中广泛扎根。二者已在市场份额、用户群体及应用场景等方面形成了相对稳定的格局。
然而,gpt-image-1入场极有可能给AI绘画赛道带来诸多变数。从技术实力来看,GPT-image-1 基于强大的 GPT-4o 多模态架构,对复杂文本提示的理解与转化能力十分出众,能生成细节丰富、精准度高的图像,甚至在图像中文字的渲染上达到了新高度,解决了过往AI绘画文字易出错、排版混乱的难题,这对注重图文结合效果的广告设计、出版印刷等行业而言极具吸引力。功能特性上,它不仅支持多种风格图像生成,涵盖写实、动漫、复古等,还能灵活调整输出图像的质量、尺寸、格式等参数,这种高度定制化服务是 MidJourney 和 Stable Diffusion 所欠缺的。
商业合作层面,gpt-image-1 API也已展现出强劲势头,Adobe、Figma、Canva 等知名平台已经纷纷将其集成到自家产品中,借助这些平台庞大的用户基础,GPT-image-1 有望迅速渗透到各类设计工作流程中,改变用户对AI绘画工具的选择倾向。可以预见,随着 GPT-image-1 的不断优化与应用,AI 绘画市场或将重新洗牌,一场围绕技术、用户体验与市场份额的激烈竞争即将拉开帷幕 。
以上是算力云今日内容分享,感兴趣的朋友多多关注。