华体会体育奥特曼「红色警戒」5个月后，GPT Image 2屠榜，断层跳跃反杀谷歌

发布日期：2026-05-01 14:18 点击次数：133

新智元报说念

裁剪：元宇

【新智元导读】被Google按了半岁首，OpenAI终于祭出一记反杀。GPT Image 2上线12小时，就登顶Arena文生图榜，跳跃Nano Banana 2达241分。Arena官方称，这是Image Arena文生图排名榜迄今最大的分差。

发布本日，三榜通杀。

GPT Image 2上线12小时，Text-to-Image（文生图）、Single-Image Edit（单图裁剪）、Multi-Image Edit（多图裁剪）三个分榜一说念登顶。

Arena官方原话：「a clean sweep」（全胜）。

伸开剩余91%

文生图主榜，GPT Image 2 1512分，Nano Banana 2 1271分。241分差距，Arena史上最大。

「莫得任何模子曾以这种差距总揽过Image Arena」，Arena官方暗意。

在Image Arena总共盲测对决中，GPT Image 2的胜率是93%：100张图配对盲选，93张东说念主们选了OpenAI那张。

「若是把DALL-E看作洞穴壁画，把Images 1.0视为古代艺术，那么Images 2.0就是文艺回应」。

OpenAI在发布会开场中这么先容Images 2.0，奥特曼更是将它称作跨代升级：

这大略一下子从GPT-3跃升到了GPT-5。

https://www.youtube.com/watch?v=sWkGomJ3TLI

OpenAI官方API文档对Images 2.0给出了一个最高等的评价。

https://developers.openai.com/api/docs/models/gpt-image-2

但真确的故事，并不在数据里。

被Google压了半年

OpenAI总算扳回一局

期间倒回2025年8月。

Google放出了Nano Banana。这个在Gemini里镶嵌的图像生成模子，在C端斯须引爆。

三个月后的Q3财报会上，Google CEO Sundar Pichai亲口走漏了一组数字：Gemini月活，从7月的4.5亿涨到10月的6.5亿。

Google Labs负责东说念主Josh Woodward称，这一增长很猛进度上来自Nano Banana带动的图像生成飞扬。

11月，Google再发Nano Banana Pro。文本渲染才调惊艳，AI图像第一次能把字写对，OpenAI在C端被反超。

11月18日，Google再补一刀。Gemini 3发布即登顶LM Arena，1501分，首个冲破1500的前沿模子。

这一月底，奥特曼对全公司发了一份「红色警戒」（code red）的里面备忘录。

据The Information报说念，奥特曼暗里告诉职工，Gemini 3可能给OpenAI带来经济顶风。Yahoo Finance后续走漏：code red之下，OpenAI暂停了AI Agent等其他家具的研发，资源一说念歪斜到ChatGPT。

12月，OpenAI仓促拿出GPT Image 1.5。Arena第一，但C端没能引爆。

2026年2月，Google再补一刀，Nano Banana 2登场，Arena再度跳跃。

OpenAI又输了一次。

一直到4月21日，GPT Image 2上线，OpenAI这才收尾反超，再行扳回一局。

绘制AI将被再行界说

GPT Image 2凭什么能跳跃241分？

中枢谜底藏在架构层面。

GPT Image 2不是Stable Diffusion那一代的扩散模子。

OpenAI有计划负责东说念主Boyuan Chen称这是「revamped from scratch」（从零重构）的「generalist model」（通用模子），OpenAI的里面叫法是「图像版的GPT」。

但Chen在press briefing时停止公开承认它具体是扩散如故自回来架构。

外界多量把它理会为「带推理辩论的图像生成系统」：画之前先辩论，再动笔。这恰是GPT Image 2和上一代图像模子最大的不同。

OpenAI在官方阐明里给了它一个新标签：首个具备原生念念考才调的图像模子（image model with native thinking capabilities）。

画之前先想、画完我方检查、需要时联网搜索贵寓、一次能产出8张前后连贯的图。

这不是画笔，是会念念考的视觉助理。

Arena榜单分项数据清楚：

笔墨渲染（Text Rendering）单项，GPT Image 2比前代涨了316分；卡通动漫和东说念主像各涨296分；3个家具/3D/写实分类，合座在+247到+277分区间。

笔墨渲染是2025年11月Nano Banana Pro初度处理的问题，但那时准确率94%。GPT Image 2把它推到了99%。

OpenAI发布会现场演示：让GPT Image 2画一碗米饭，其中只消一粒米上写有模子名字。

具体到才调展示，华体会体育appOpenAI总裁Greg Brockman在我方的X账号上作念了示范。

第一个案例，老像片开辟。

肃清发黄的家庭老像片，一个指示词，坐窝变身高清彩色版。

OpenAI官方API文档里那句「high-fidelity image inputs」（高保真图像输入），说的就是模子对原图细节的保留才调：输入端能精准读取肃清的、结巴的、肮脏的老像片细节，输出端才能再行渲染出明晰版。

第二个案例中，Brockman转发了用户@doodlestein的一组测试图：用合并个复杂指示词让GPT Image 2画一张数学阐述图。

他评价说，即等于复杂指示词，GPT Image 2也能生成作风互异的图。

@doodlestein 测试GPT Image 2用合并个指示词画一张线性代数阐述图。模子连气儿画出4个全王人不同的版块：一样是Mona Lisa+特征向量教化，每个版块的构图、配色、信息密度全王人不同。

这个案例真确价值不在「能画数学图」，而是处理了当年两年中AI生图的一个伏击的痛点：输出单一、变体可控性差。

GPT Image 2第一次让「一个prompt给我4个全王人不同的场地」造成了产等级才调。

业内一位LM Arena资深测试者点评说念：

GPT Image 2和Nano Banana Pro之间的差距，跟Nano Banana Pro和DALL-E之间的差距一样大。

跨了整整一代。

GPT Image 2 Thinking模式生成的manga作风漫画页：从一个浮浅指示词动身，模子保握脚色一致性、铺出多格剧情。

DALL-E退役

Adobe Canva被逼到墙角

发布本日，卑劣器具集成的速率比技巧圈预期的还快。

Figma、Canva、Adobe Firefly、fal、Hermes Agent，一说念在4月21日本日完成集成。

API订价更是潜伏杀机：

这个差价背后，可能带来2026年图像生成行业最大的产业重构。

5月12日，DALL-E 2和DALL-E 3负责退役。

它们是2022年开启了总共这个词AIGC视觉立异的开山始祖。三年后，被OpenAI自家的采纳者，亲手送入历史。

OpenAI在官方发布阐明里提到：

图像不是隐秘，是谈话。一张好图作念的事和一个好句子一样：选拔、成列、揭示。

这代表了一种家具玄学的转向。

天然，也不是莫得反方声息。ZDNet在实测中发现，GPT Image 2无法准确复刻品牌logo，连ZDNet我方的logo王人被画歪了。

Nano Banana 2在portrait realism和multi-reference一致性上仍有上风。

GPT Image 2天然还不够完整，但赛说念口头仍是出现了变化。

渲染时期适度了

推理时期刚运行

Google把推理塞进图像模子里。OpenAI把图像器具塞进推理模子里。242分Elo差距测的就是二者架构上的差异。

implicator.ai的这句评价，离别了图像生成的两个时期。

2022到2025年，是渲染时期。

DALL-E、Midjourney、Stable Diffusion，联想王人是「画得像」。模子是画笔，用户是画师，prompt是画稿。

GPT Image 2代表的是一个推理时期。

模子先念念考再动笔，能搜索、能自检、能完成任务。它不是画笔，是会画画的助手。

GPT Image 2发布真赶巧得深爱的，是图像生成走向「会念念考」这件事本人。

短期看，Black Forest Labs（Flux 2）浮泛可能最大。

Kingy AI直言：当作diffusion-first（扩散为先）的厂商，Flux 2的整条技巧活水线在架构上和「token-by-token」的推理道路是冲突的。

要么和会，要么重写，莫得第三条路。

中期看，Google可能会不才个季度反击。Nano Banana 3，或者Imagen-Reason，期间不会太久。

遥遥望，这件事的影响远不啻图像生成。

当AI运行用「念念考」来产出图像、视频、音频、代码，总共这个词生成式AI的范式王人会随着发生变化。

客岁12月，奥特曼在备忘录里敲下「code red」的时候，应该没猜想五个月后会以这种姿首回到Arena榜首。

但此次反杀的真确意旨，可能不是OpenAI赢了Google，而是OpenAI改写了图像生成赛说念的律例。

Arena.AI单图裁剪榜（Image Edit Arena）：GPT Image 2 (medium) 仍以1510+分连续登顶，第二、三、四、五名一说念被OpenAI自家模子和Google Gemini系列占据。https://arena.ai/leaderboard/image-edit

Google下一拳什么时候出？这个问题决定了2026下半年AI口头的走向。

而在那一拳挥出来之前，GPT Image 2会在Arena榜首坐多久，没东说念主知说念。

参考贵寓：

https://arena.ai/leaderboard/image-edit

秒追ASI华体会体育

发布于：北京市加拿大PC中国官网入口

让建站和SEO变得简单

华体会体育奥特曼「红色警戒」5个月后，GPT Image 2屠榜，断层跳跃反杀谷歌

热点资讯

推荐资讯

让建站和SEO变得简单

华体会体育 奥特曼「红色警戒」5个月后，GPT Image 2屠榜，断层跳跃反杀谷歌

热点资讯

推荐资讯

华体会体育奥特曼「红色警戒」5个月后，GPT Image 2屠榜，断层跳跃反杀谷歌