Microsoft Bing Chat 的 GPT-4 集成为 Windows 11 带来强大的图像识别功能

Bing AI 聊天图像更新
图片来源:微软

Microsoft Bing Chat 在桌面上进行了另一项重大更新,支持图像识别(OCR)。此功能使用 OpenAI 的 ChatGPT-4 视觉模型来检测和理解图像中的对象,并使用现实生活中的示例对图像进行详细解释。

微软正在向全球精选用户推出 Bing Chat 视觉功能。更新后,您会注意到语音图标旁边有一个新选项,允许您直接将图像上传到聊天室或从互联网粘贴图像并要求 Bing 进行解释。

该功能的官方名称为“图像识别”,只有部分用户告诉我们他们可以使用该功能,这表明这可能是一次随机 A/B 测试。微软官方在一份声明中证实,只有不到 10% 的定期使用 Bing Chat 的用户可以使用 Bing Vision,这证实了我们关于这是随机 A/B 测试的猜测。

据微软称,Bing Vision 选项将在未来几周内向所有人展示。

重要的是要了解该功能也包含在 Windows Copilot 中。您可以从桌面或文件资源管理器中拖动图像,将其放到 Copilot 上,然后要求 AI 解释该图像或创建类似的内容。最后,您可以将图像直接复制到 PowerPoint、Word 或剪贴板。

Bing Chat 即将支持 Chrome 和 Safari。

5 月份,微软在 Safari 和 Chrome 中短暂测试了 Bing Chat 支持,我们预计很快就会正式宣布确认扩展。虽然可以通过修改用户代理让 Bing Chat 在 Chrome 中工作,但可能感觉没有必要,特别是因为 Bard 和其他聊天机器人很容易访问。

除了 Chrome 和 Safari 支持之外,微软还希望使用微软的人工智能来改进 Bing Image Creator。

通过 Bing 插件集成,该功能可能会变得更好,官方表示微软正在计划“大规模推出插件”以扩展 Bing 聊天的功能。

该公司计划将每个功能变成一个插件,并创建搜索的不同方面。

微软已经对 Bing Chat 进行了几项重大改进,例如取消对 Microsoft 帐户的支持。

此前,微软通过强制用户使用 Microsoft 帐户登录来阻止用户。由于微软现在正试图推动 Bing AI 超越 Microsoft 帐户或 Edge 等其他服务,因此该限制已被取消。

类似文章