StabilityAI发布多项产品更新,SD模型将具备3D能力

转载
380 天前
2161
Kyle

文章转载来源:Kyle

图片来源:由无界 AI生成

开源图像生成大模型 Stable Diffusion(SD) 的开发商 Stability AI 今天宣布了其 Stable Diffusion 平台的多项新增强功能。 这些更新不仅提供了令人兴奋的文本转图像新功能,而且还涉足 3D 内容创建领域。


3D 模型生成来了


最显着的增强是全新的 Stable 3D 模型。 到目前为止,Stable Diffusion 主要致力于二维 (2D) 图像生成。 Stable 3D 模型将改变这一现状,提供有助于任何类型 3D 内容创建的功能,包括图形设计甚至视频游戏开发。

对于图形设计师、数字艺术家和游戏开发人员来说,3D 内容创建可能是最复杂和耗时的任务之一,通常需要数小时(有时甚至数天)才能创建一个中等复杂的 3D 对象。

Stable 3D 能够通过图像或插图,或编写文本提示来生成概念质量纹理 3D 对象,消除了大部分复杂性,并允许非专家人士在几分钟内通过选择一个模型来生成草稿质量的 3D 模型。

使用 Stable 3D 创建的对象以“.obj”标准文件格式,可以在 Blender 和 Maya 等 3D 工具中进一步编辑和改进,或者导入到游戏引擎中,例如 Unreal Engine 5 或 Unity。大幅度降低了创作者的工作量。

Stable 3D 为独立设计师、艺术家和开发人员提供了快速的创作环境,使他们能够每天以极低的成本创建数千个 3D 对象。

目前,Stability AI 仅开放了 Stable 3D 的私人预览版本,申请访问 https://stability.ai/contact


Sky Replacer


除了进军 3D 内容生成领域之外,Stability AI 还推出了 Sky Replacer 工具,该工具的设计目的正是顾名思义——替换 2D 图像中的天空背景。

Stable Diffusion 平台现在还提供 Stable Fine-Tuning,旨在帮助企业加快特定用例的图像微调过程。

此外,该公司还将在 Stability AI API 生成的图像中集成一个用于内容身份验证的隐形水印。 随着生成式 AI 日益成为常见工作流程的一部分,这些新的更新都是为了帮助企业进行创意开发。

Stability AI 首席执行官 Emad Mostaque 在接受采访时表示:“这是为了给富有创意的故事讲述者提供他们所需的工具,使他们能够对图像进行额外的控制。”


竞争日益激烈的 AIGC 领域


Stability AI 的进步正值文本到图像生成市场竞争变得激烈之际。

Adobe 瞄准了这一市场,推出了与该公司设计软件紧密集成的AI工具 Firefly 。 Midjourney 不断为其技术添加新功能,以帮助设计师生成图像。 不容忽视的是,OpenAI 最近发布了 ChatGPT 原生的 DALL-E 3 模型,该模型改进了在图像内生成文本的功能。

Mostaque 非常清楚自己的竞争情况,并致力于通过多种方式帮助 Stability AI 脱颖而出。 他特别强调,他的公司现在正在从仅仅提供模型转向提供创意渠道。 他指出,借助新的Sky Replacer 和微调功能,它们都是超出用于生成图像的核心基本模型中的附加步骤。

Sky Replacer 不仅仅是一个功能,它还以业务用例为焦点。

替换图像中的背景的概念并不是一个新概念。 在非生成式 AI 应用中,背景通常可以被绿幕和色度键等技术替换。

Mostaque 表示,Stability AI 正在这些经典技术的基础上构建工作流程并实现工作流程自动化,从而使业务用户的流程变得快速高效。 改变天空的背景颜色不仅仅是添加某种形式的创意天赋,它是一种具有非常具体和实用的用例的功能。

“例如,Sky Replacer 对于房地产来说非常有用。”

Mostaque 指出,用户希望能够拥有不同的背景、不同的灯光效果。 他强调,从根本上说,这一切都是为了提供控制,因为组织有自己的工作流程来生成图像和内容。 Stability AI 正在做的是构建优化的工作流程,以帮助实现不同用例所需的控制。

“Sky Replacer 是我们将推出的一系列产品中的第一个,这些产品非常针对行业和企业,建立在我们过去 6 到 12 个月的经验基础上。”


Stable 3D 扩展了 Stable Diffusion 的新用例


新的 Stable 3D 模型的工作原理是扩展 Stable Diffusion 中使用的扩散模型,以包含额外的 3D 数据集和矢量化。

“我对能够以 3D 方式创建整个世界感到非常兴奋。”

Mostaque 解释说,Stable 3D 是根据 Stable Diffusion 和 Stability AI 在 Objaverse-XL 上的工作构建的,Objaverse-XL 是世界上最大的开放 3D 数据集之一。 构建和渲染 3D 图像长期以来一直是一个资源密集型过程,但 Mostaque 乐观地认为稳定 3D 将比传统的 3D 图像生成方法更有效。 他强调,稳定人工智能还处于早期阶段,但他乐观地认为该技术将随着时间的推移稳步发展和扩展。 Stable 3D 最初以私人预览形式提供。

“与传统的 3D 模型创建相比,这非常高效。过去需要很长时间才能建造的东西现在很快就能得到第一批批准。”


水印和拜登关于 AI 的行政命令


拜登政府本周发布了关于人工智能的行政命令(EO),其中一个组成部分是将水印集成到生成的内容中。

Stability AI 现在正在将隐形水印和内容凭证(Content Credentials)集成到其 API 中。 内容凭证是 Adobe 和其他公司参与的一项多供应商行业工作,旨在帮助提供有关内容的作者信息。 Mostaque 表示,添加隐形水印和内容凭证是负责任的做法。 这也是 Stability AI 致力于为生成的内容带来真实性的更广泛努力的一部分。

Mostaque 说:“我们确实正在围绕这一问题推出一系列举措和一些额外的举措,以及额外的研究,因为我们想知道什么是真的,什么是假的。它还有助于我们为未来版本构建的一些归因和其他机制。”

参考资料:

https://venturebeat.com/ai/exclusive-stability-ai-brings-advanced-3d-and-image-fine-tuning-to-stable-diffusion/

https://stability.ai/blog/stability-ai-enhanced-image-apis-for-business-features