文章转载来源:Kyle
图片来源:由无界 AI 生成
距离 Midjourney v5 发布已经过去了半年时间,下一个重大版本 v6 什么时候发布?答案是:今年晚些时候。
Midjourney 首席执行官 David Holz 在昨日的活动中表示,Midjourney v5 到 v6 的飞跃将大于 v4 到 v5 的飞跃。不过,Holz 没有给出确切的发布日期,但表示很快就会发布,总之肯定是今年。
对于Midjourney v6 会带来哪些新的东西,Holz 承诺会带来更好的文本理解,即图像生成将更接近提示的描述,并更好地记录提示措辞中的细节,也可能会带来文本渲染功能。
Holz说这些“并不难”。 但他也表示,他还没有看到很好的文本渲染,并且对于该功能是否会有以及达到何种效果程度仍持开放态度。
OpenAI 上周发布了新版本的图像生成大模型 DALL-E 3。DALL-E 是最早的一批生成式 AI 大模型,比 Midjourney 更早。DALL-E 3 版本在各个方面都进行了大幅提升。很多人甚至认为 DALL-E 3 将对 Midjourney 构成直接威胁,在一些方面甚至已经超越了 Midjourney,尤其是 DALL-E 3 与 ChatGPT 结合之后对提示词的理解,对细节的理解,正在超越 Midjourney。
当被问及 OpenAI 的 DALL-E 3 的发布时,Holz “非常乐观”地认为 Midjourney 将继续提供最高的图像质量。 DALL-E 3 和 Midjourney v5 的第一次比较表明,DALL-E 3 在图像质量方面并没有那么领先,但它确实更好地遵循提示并可以渲染文本。
Midjourney 的路线图上还包括创建 3D 图像和视频的功能。 尤其是对于 3D 图像,Holz “非常乐观”,认为事情很快就会出现转折点。
当他审视当前的视频游戏时,他说他对图像质量的糟糕程度以及生成式 AI 对质量的贡献之大感到惊讶。 Holz 过去曾表示,他预计未来视频游戏将是生成的,而不是渲染的。3D 图像功能对于 VR、AR 游戏创建者将会是一大福音。
Midjourney 今年不打算发布任何有关 3D 生成的具体信息或演示。 Midjourney 团队正在开发的视频生成也是如此,但 Holz 表示,视频生成可能比 3D 要晚,还没有做好准备。
Midjourney 目前最大的缺点之一是生成的图像分辨率相当低。 当前默认图像尺寸为 1,024 x 1,024 像素。 其他宽高比也可用,但它们不会提高 72ppi 的分辨率。 例如,16:9 图像的分辨率只能达到 1,456 x 816 像素。
这种分辨率通常适合网络发布,但不足以进行任何大尺寸的打印。 因此,更高分辨率支持是一个急需解决的用户需求。
Midjourney 团队同时还正在开发新的 Niji 风格。这款二次元模型在上线之后受到了二次元爱好者的一致好评,新的 Niji 模型预计也将带来大量升级改进。
Midjourney 的 web 版本仍在开发中。 新 web 版本将分两个阶段推出:
第一阶段:能够查看、搜索自己的图像等
第二阶段:将具有图像创建和社交功能
但对于上线时间,Holz 没有提供具体的时间表。
来源:Kyle
发布人:暖色
声明:该文观点仅代表作者本人,不代表火讯财经立场。火讯财经系信息发布平台,仅提供信息存储空间服务。
如文章涉及侵权, 请及时致函告之,本站将第⼀时间删除⽂章。邮箱:840034348@qq.com