人类对AI最大的误解，来自AI扩图

转载

916 天前

7895

绘声绘影

文章转载来源：绘声绘影

原文来源：青投创新

图片来源：由无界 AI生成

这几天，在各大媒体榜单中，你一定看到过“AI扩图”的话题。

为什么会火？

可以说，AI扩图的火爆程度和搞笑程度不相上下。

先上一张传播度很高的AI扩图“佳作”：

这位博主凭借这一条视频单条视频点赞量171.7万，转发量213.2万，评论区有23.2万互动量。

许多网友纷纷效仿，在评论区留下自己通过AI扩图后的离谱照片，有些评论都能达到几万到几十万的点赞。

当然，明星和影视剧成了AI扩图搞笑创作的“重灾区”，有这样：

这样的：

还有这样的：

AI扩图仿佛打开了一扇新世界的大门，让普通人和AI也能轻松发生交集，只是可能会让人类产生“AI很弱”的错觉罢了。

其实，专业选手是十分惊艳的。

01 AI扩图的顶流们

AI扩图，就是基于AI算法的智能识别，它可以根据图像的上下文和纹理预测和生成图片缺失的部分，为原始图片带来更大的画幅和更广的视角。

其实AI扩图这个功能早在几个月就已经挺火了，最早是5月份Adobe Photoshop上线智能扩图功能，只需输入文字提示，AI即可扩图生成我们想象中的场景。

那个时候就已经有人用Photoshop生成恶搞影视剧照，表情包，可谓是小火了一把。

但，作为AI扩图圈的大哥大，Adobe Firefly可不是用来搞笑的。

它需要用户使用画笔进行添加或减去图片内容，进行局部重绘。随后，就可以输入新的描述词进行再创作。

10月左右，Adobe Firefly进行了一次重大更新，这次更新之后，Adobe直接将其命名为Firefly 2。

在Firefly 2功能下，无论是图片渲染程度、分辨率、还是图像模型等，均有了质的提升，特别是在渲染人体时，皮肤纹理、发丝等微小细节也均被照顾到。

从官方发布的图片来看，相较于Firefly 1，Firefly 2明显更为真实，细节之处也经得起推敲。

（图：Firefly 1&2对比）

值得一提的是，Adobe向Photoshop Beta用户免费开放公测的AI功能——Generative Expand，其核心功能就是扩展。

如果对生成的图片不满意，还可以通过修改描述进行无限生成，直到满意为止。

据悉，单次图片生成的时间约在1分钟左右，再加上图片生成后的精致效果，侧面展现了其强大的算力水平。

Adobe的成功，让其他AI巨头也蠢蠢欲动。

7月份MidJourney正式对外更新了“平移扩图”功能，可以实现图片进行前后“扩图 1.5 倍”或“扩图 2 倍”，相对之前固定式的生成式功能显得更加人性化。

说起MidJourney的扩图功能，简直想象力拉满。

我们先来看下这两个画面：

你能想象它们是出自同一张图片吗？

除此之外，还有更震撼的效果。

这就是Midjourney在它最新5.2版本中带来的Zoom Out功能。

效果一出，不少网友在惊叹“太疯狂”之余，也在猜测着它“扩”了多少次，有网友大胆地给出了预估：50次！！

更多网友则是纷纷自己开始搞花活，不到一个小时，直接出一部大片：

如此来看，MidJourney的扩图功能还是相当可以的。

此外，还有我们前几天介绍过的——Pika1.0。其可以完成视频的扩展。

不得不说专业选手果然是不一样的。

02 AI扩图另类出圈

但说实话，像MidJourney、Adobe Photoshop这种专业软件的扩图功能对于普通人来说，还是有一定门槛的，实用性并不高。

随后，为了满足普通用户的需求，国产AI绘画工具相仿上线AI扩图功能，比如美图、海艺AI、触手AI以及抖音等等。

拿抖音来说，AI扩图功能一上线，就因其用户体量大，使用门槛低，无需提示词，和平台流量扶持，迅速火爆出圈，基本达到全民皆可玩透的境界。

抖音热榜甚至达到几千万人在看的程度。

于是，才有了文章开头的局面，AI扩图正在成为全民娱乐的工具。

似乎……这个逻辑，确实不是人能想出来的！！

大哥应该很迷茫。

真的很想撬开AI的脑袋，看看它到底在想什么？！

不过，作为一款娱乐工具，可以给它们打个满分，毕竟它为很多博主带来了不少的粉丝和流量。

03 真正的AI扩图技术

针对AI扩图，其实不管是Midjourney、Photoshop、DALL-E 2还是Stable Diffusion，其背后原理也有些相似之处。

像DALL-E、Stable Diffusion、Photoshop的Generative Fill等都用到了一种叫做Outpainting的技术。

Outpainting是一种图像处理技术，与Inpainting（图像内部填充）相反，可以根据现有图像的内容、风格和上下文，合成与原始图像相协调的新内容，从而扩展图像的视觉范围。

Outpainting通常依赖于深度学习模型，有基于内容扩散的、基于GAN的、基于语义理解的等。

此外，AI扩图不仅是增加像素的数量，更重要的是增加图像分辨率的过程。

例如，CNN是AI扩图中常用的神经网络，通过学习大量的低分辨率和高分辨率图像对，来理解图像特征，学习如何从低分辨率重建高分辨率图像。

超分辨率技术使得模型能够填补低分辨率图像中缺失的像素，从而生成更高分辨率的图像。

在扩图过程中为了保证图像细节还要注意细节增强、噪声抑制等。

虽然目前AI扩图技术有了很大进展，但实时处理能力还有待提升，通常来说更高质量的图像扩展需要更多的计算时间。

现有的很多AI扩图工具生成速度已经有了不小的提高，不过成品的质量是否符合逻辑，这个概率还是比较随机的。

关键词：

来源：绘声绘影

发布人：暖色

声明：该文观点仅代表作者本人，不代表火讯财经立场。火讯财经系信息发布平台，仅提供信息存储空间服务。

如文章涉及侵权，请及时致函告之，本站将第⼀时间删除⽂章。邮箱：840034348@qq.com

上一篇：妙鸭用AI搞修图，「美妙大战」要来了？

下一篇：李国飞：繁荣越令人沉醉，危机往往埋得越深|《1929》推荐序

人类对AI最大的误解，来自AI扩图

01 AI扩图的顶流们

02 AI扩图另类出圈

03 真正的AI扩图技术

18256篇

124630712

新闻排行

李国飞：繁荣越令人沉醉，危机往往埋得越深|《1929》推荐序

RWA研究院携手Conflux，共探2026香港Web3嘉年华新范式

田涛对话马拉比：在AI浪潮中破解“上帝密码”与人类命运

数字人民币2.0全景：从16.7万亿交易额之后的制度化跃迁

催生万亿新资产：AI代理如何拥有、赚取和交易

250亿美元RWA市场背后的政策红线：42号文的“境内严禁”到底划在哪？

GPT-5.4与百万token时代：上市公司的AI转型窗口还剩多久

美国资本重注拉美：赌的不是增长，是金融体系的"关键节点"

友情链接：