OpenAI正式发布全新图像生成模型ChatGPT Images 2.0(官方产品名),该模型具备“思考”能力,在准确性、时效性、一致性和视觉连贯性上表现突出。实测显示,简单提示词即可生成以假乱真的界面截图、TikTok视频截图等复杂图像,且支持多语言理解,中文文字生成准确率高。

在生产力场景中,该模型可完成商品广告设计、论文海报生成等任务,并能基于联网搜索自动收集信息。官方介绍,ChatGPT Images 2.0最高支持生成2K分辨率图像,支持最宽3:1、最窄1:3的图片比例,知识截止时间为2025年12月,一次提示最多可生成8个输出且能保持角色和物体连续性。

在大模型竞技场上,ChatGPT Images 2.0已登顶第一,在文本到图像任务中领先第二名Nano Banana 2240分。目前该模型已全量上线ChatGPT、Codex和OpenAI API。

该模型研究团队由Gabriel Goh领导,团队成员包括OpenAI研究科学家陈博远等华人研究者,陈博远本科毕业于伯克利,后在麻省理工取得博士学位,研究方向侧重于世界模型、具身智能和强化学习。(量子位)