首先看看 Microsoft Bing Chat AI 中的 ChatGPT 的 DALL-E 3
关键点
- Microsoft Bing Chat 推出了 DALL-E 3,这是 OpenAI 工具的高级版本,可将文本描述转换为详细的艺术作品。升级版本正在向部分用户推出。
- DALL-E 3 通过在图像中准确生成文字、标签和标志,显着改进了 DALL-E 2。
- OpenAI 确认 DALL-E 3 将于 10 月份向其 AI 平台的付费客户开放。但是,Bing Chat 免费提供相同的 DALL-E 3 图像创建功能。
据该公司消息人士透露,微软 Bing Chat 正在向“一小部分用户”推出 DALL-E 3,这是 OpenAI 文本到图像工具的升级版本。
由 ChatGPT 驱动的 DALL-E 3 集成已在我们的 Bing Chat 微软帐户之一上上线,它的工作原理与广告中所宣传的一样 – 您可以将图像描述转换为包含更多细节和文本的艺术品。与 DALL-E 2 不同,新的 DALL-E 3 在创建高质量艺术品方面要好得多,这要归功于它处理图像中文本的方式。
微软支持的 OpenAI 的 DALL-E 就像一个魔盒。你可以告诉人工智能画任何图画,它会创造出独特的艺术品,但上一代模型不擅长在图像中生成文字、标签和标志。新模型解决了文本生成问题,OpenAI 现在可以更准确地生成标签或标志。
例如,如果你要求 Bing Chat AI 创建“一个牛油果的插图,它坐在治疗师的椅子上,说‘我只是感觉内心很空虚’,中间有一个坑大小的洞。治疗师一把勺子,乱写笔记”,就能准确得出结果。图像中的文字“我只是感到内心空虚”也正确显示。
正如您在上面的屏幕截图中看到的,DALL-E 3 处理图像中的文本的能力明显优于其前身。虽然 DALL-E 2 使用随机字母制作艺术品,但 Bing Chat 中的新 AI 模型使用所描述的精确文本渲染图像。
“我只是感觉内心很空虚”这句话完美地印在了图像中。
我们不知道 Bing Chat 上有多少用户可以访问 DALL-E 3,它甚至还没有出现在 ChatGPT 中,但 Microsoft 消息人士告诉我们,该支持正在向少数用户/帐户推出。
昨天,在宣布下一代文本到图像 AI 模型的博客文章中,OpenAI 确认其 AI 平台(ChatGPT Plus 和 Enterprise)的付费客户可以在 10 月份访问 DALL-E 3。订阅ChatGPT Plus后,您可以直接在ChatGPT中输入提示并创建图像。
但是,如果您迫不及待或不想为 ChatGPT Plus 付费,则可以使用 Bing Chat 的 DALL-E 3 图像创建器,它免费提供相同的功能。
如果您可以访问 DALLE-3 的早期预览版,您应该能够在 Microsoft Edge Canary 中的 Bing Chat 中尝试新的图像创建器,该工具最近更新了“AI 在网络上书写”和 Bing 的“继续在电话上”功能。
DALL-E 比以前的型号特别好
新的文本到图像人工智能模型比其前身模型提供了多项质量改进,前身模型无法处理标签和标志、高质量图像请求等。
详细信息尚不清楚,但与之前的模型一样,ChatGPT 和 Bing Chat 中的 DALL-E 3 基于互联网创作者、摄影师、艺术家、库存图像等的数百万张图像训练的数据。
“现代文本到图像系统倾向于忽略文字或描述,迫使用户学习即时工程。DALL·E 3 代表了我们生成完全符合您提供的文本的图像的能力的飞跃。” OpenAI 在博客文章中指出。
新旧型号之间的主要区别在于 DALL-E 3 更注重文本、物体等小细节。