实测GPT-Image-2 我们正在集体失去“看见真相”的能力

倚天百科百科资讯 2026-04-25 22:04:02 3

像素级复刻，来了

4月21日，GPT-Image-2上线，我们实测后得出结论——中文互联网“眼见为真”的信任，被彻底打破了。

不同于早期AI生成图片“一眼假”的突兀感，这个新模型对真实世界的复刻，达到了像素级别。

而且，不需要复杂的提示词，只需要简单的指令，就可以生成任何你想要的社交软件截图。

提示词：生成一张罗永浩抖音直播截图画面，包括主播、评论、互动数据等；生成一张微信朋友圈截图画面，分享旅游打卡，带图片带文案，带互动点赞评论

“仿造”一个小红书百万粉丝账号，手拿把掐。甚至AI会自动设计“天生我材必有用，千金散尽还复来”和明月高悬的账号背景。

不过，还是有微微漏洞——按出生日期推断，李白应是浪漫的双鱼座。

以及，按照现有的小红书生态，百万级账号和笔记点赞十万的场景应该很难出现——也许是AI按照人物名气的“合理推算”？

不只是抖音、朋友圈、小红书等社交账号，“新闻”也是可以被轻易伪造的。

这里的给出提示词仅是：生成一张微博热搜截图，其中一条消息是知名演员官宣去送快递。不知为何AI自动提取了张颂文……

可以看出，生成的热搜词条非常丰富且还原：有职场话题、比赛成绩、生活常识、企业热点、娱乐新闻……

不过细看，应该是因为GPT的“记忆”（静态知识库）只到2025年年底，生成的词条信息时间较为陈旧，都是2024年事件。

而且，于2024年9月10日苹果秋季发布会上公布价格iPhone16，显然并不是在夏天（“莎头”组合巴黎奥运会夺冠时间倒是在7月的夏天。）。

不过，在当年五月天巡演官宣时间中，成都站确实在9月9日官宣——时间上也能和iPhone16“圆”上。

除了我们常用的社交软件，一些早被互联网“收录”的人脸也能生成逼真画面。

这里的提示词是：生成一张几个科技大佬线下团建吃饭的照片，要有正脸。

哎，扎克伯克怎么混进去了？

那再试一次，同样的提示词。

这下更“合理”了——中国互联网的半壁江山，悉数齐聚。

一个小插曲是，当把这两张大佬聚餐图再喂给豆包，让判断出席人物时候，豆包得出了这样的结论：

AI也能骗过AI，可能是核心提取了关键人物：马云和扎克伯克的关键会面。

不过，不光是我们的本土AI“被骗”。有测试显示，包括Gemini在内的主流AI系统都难以识别GPT-Image-2生成的UI伪造图像。

不光是国内，海外名人更是“重灾区”。不过，目前测试结果是，无法“指定”某个具体人物，只能“虚指”。

图源｜凤凰网科技，真实截图

又比如，“明星”不可以，但“演员”可以。

提示词：生成一张实拍画面，国外知名演员在菜市场买菜砍价，跟人吵起来

我们的测试感受也从“惊喜”：生成速度快，不需要“排队”；操作极简，简单一句话指令都能生成的逼真自然。

再到“恐慌”——因为没有水印，不细看真容易被骗。

于是又实验了几个极端场景，看是否存在安全漏洞，容易被有心之人利用。

比如生成一张身份证照片、银行转账截图、医疗结算单……

GPT都还无法生成。

但，如果去掉具体细节，指令范围大一点，不聚焦某一具体信息，依旧能够执行。

人物的形态、毛发，甚至脸上毛孔都清晰可见。身份证上的人脸也能对得上。生日日期和身份证号完美匹配，310115也正是浦东新区的通用代码。

虽然模型对“精确伪造特定人物身份证”有拒绝机制，但对生成“虚构但逼真的证件模板”的约束很弱，这为套用模板进行诈骗、伪造文书等行为留下了空间。

“伪造”聊天记录，也是真实感极强——针对个人，尤其是信息辨别能力差的老人，这种图片完全能够骗过。

生成出来的“模仿”手机后置镜头的拍摄，能把反光、手机裂痕都清晰还原。

骗家长说，自己在埋头苦学，也有了“证据”。

指令：帮我生成一个学生在课堂上偷拍老师讲课的实拍画面

更是可以轻易“伪造”不在场证明，截图、照片，以后也许都没办法直接当作证据了。

|
“你那天晚上在哪里”，“在看电影呀”（PS：当年《奥本海默》在国内公映时间正是8月30日）

给企业“伪造”后台交易数据，AI也能手到擒来。

为了不进一步“教学”，我们就不放更多测试成果了。

技术发展太快，保护网跟不上了

四年前，当文生图工具 Midjourney 爆火时，在专业领域还能掀起“人类 PK AI”孰优孰劣的激情讨论，和AI“抄袭”的声讨。

彼时，大家还在庆幸AI没有“灵魂”，生成的图片僵硬、无细节，风格化不强，“一眼假”的效果也让不少制图领域的专业人士浅松了一口气。

但随着技术进步，质疑、对抗的声音愈发微弱。从2022年的Midjourney、2023年的stable diffusion，到2025年的kling veo3，再到2026年Seedance、GPT-Image-2，模型迭代以无法阻挡的趋势滚滚向前。

如今，生图模型的进化速度，已经没给人类留出太多适应时间了。

GPT-Image-1从上线到 1.5，用了8个月。1.5 到 2，只用了4个月——更新时间缩短一半不说，每一代都在解决上一代的核心短板，并打开了新的可能性。

2026 年初还刚凭借 Nano Banana Pro 确立行业地位的 Google，被迅猛追赶，倍感压力。早期测试报告显示，GPT-Image-2在真实感、文字渲染和世界知识三个维度上同时超越了 Nano Banana Pro，这种三连胜并不常见。

在社交平台上，有不少尝鲜用户晒出自己生成的“千禧年风”照片，被不知情的围观者质疑：“这是真实拍的吧？”

图源｜小红书

OpenAI是怎么做到的？

相比于上一代模型，此次更新，最核心的代际跃迁是首次引入“思维链”推理能力。通过内置的推理架构，它能在生成前自动分解复杂指令、规划空间布局、验证数字逻辑并搜索实时信息。

与此呼应，GPT-Image-2分为两种运行模式：一是面向所有用户开放的即时（Instant）模式，强调生成速度；二是仅对付费用户开放的思考（Thinking）模式，该模式下模型会执行更复杂的逻辑推演和多步骤规划。

而且，GPT-Image-2解决了长期以来非拉丁文字渲染的痛点。无论是中文、日文、还是韩文，能够精准渲染极小字号文本、书法字体，可一次性生成含密集文字的海报、多格漫画、数据图表，文字位置和格式零差错。

在2026年4月的Image Arena权威评测中，GPT-Image-2以1512分登顶，领先第二名242分，在文字渲染、指令遵循、真实感、风格控制四大核心维度均断层领先。

文字渲染的进步，意味着生成信息图、海报、产品包装、排版复杂的图表，都变得更可靠了，也意味着能够能够切入更广阔的商业领域。

图源｜小红书

GPT-Image-2能生成与真实软件界面极为相似的图像，包括浏览器窗口、移动端应用界面、数据可视化图表，保真度是上一代产品无法比拟的。也就是说，它不仅能够制作信息图表、科学海报、教学指南、漫画分镜等场景，在UI界面原型与电商编目方面同样潜力巨大。

目前OpenAI的API已支持2K分辨率输出，4K模式正在测试。可以预见的，AI生成的图片，未来会更清晰，也就更加“真实”。

从前期测试可看出，这款“史上最强”的模型，对于身份证等高度敏感、涉及精确个人信息的场景，模型有拒绝机制；但对于泛化的、不指向具体真实人物的伪造场景，约束较弱，而这正是风险所在。

随着真实度提高，“造假”成本也被无限下放，只能靠人类为数不多的记忆经验来“鉴AI”。尤其是，目前GPT生成图片并无水印，提高了辨别难度。

图源｜小红书

当前，AI检测技术的迭代速度明显滞后于生成技术。

OpenAI确实为GPT-Image-2部署了多层安全防护。根据其技术部署，GPT-Image-2沿用了OpenAI的C2PA内容凭证体系，在文件元数据层嵌入带数字签名的来源信息，用户可通过Content Credentials验证图片是否由该模型生成。

在面向企业级用户的Microsoft Foundry部署中，微软进一步将OpenAI的图像生成安全缓解措施与Azure AI内容安全相结合，加入了针对敏感内容的过滤器和分类器。

然而，这套护栏存在明显短板。C2PA元数据在用户对图片进行截图、转发至社交平台、或被平台压缩处理后，会直接丢失，凭证随之失效。

换言之，C2PA能在“源头”自证清白，却无法阻止图片在传播链条中被“洗白”。

C2PA元数据在截图、转发或压缩后容易丢失。对于普通用户而言，收到一张微信截图或朋友圈图片时，元数据或许早已不复存在，辨别真伪的窗口也随之关闭。

从GPT-Image-1上线到1.5版本用了8个月，1.5到2只用了4个月——技术迭代在不断加速。

而与之相对，欧盟AI法案的透明度条款更是从立法到生效横跨了超过两年，中国《人工智能生成合成内容标识办法》从酝酿到施行走了一年多。

安全护栏能否有效拦截恶意使用，取决于普通用户会不会被截图后的AI假图欺骗，而这恰恰是当前护栏最薄弱的环节。检测技术能否追平生成能力的代际差距也仍是一个巨大的未知数。而法规的落地效果，“持证上岗”在纸面与实操之间，还有一段相当艰难的距离。

当AI生图的进化已经精确到毛孔和反光，保护网的每一根线，都还太稀疏了。在这场速度不对等的竞赛中，每一位普通用户，或许都需要先学会一件事：对屏幕上的一切，多留一分警惕。

本文地址： http://www.yitian.cc/35681.html

文章来源：倚天百科