谷歌浏览器的 PDF 查看器正在获得将图像转换为文本的能力
PDF 是非常有用的文档,但有些是懒惰创建的。您几乎肯定遇到过包含文本图像而不是选定文本的 PDF 文件。如果您希望将文本复制到另一个文档中,这会是一个严重的烦恼,但对于任何依赖文本转语音工具向他们大声朗读文档的人来说,这也是一个主要问题。
谷歌为 Chrome 用户带来了一些好消息;该浏览器能够将图像转换为 PDF(OCR 样式)中的文本。然而,有一些坏消息。这个非常有用的功能——至少在最初——不会提供给所有人。
谷歌在 ISTELive 23 教育技术展览会之前宣布了这一消息,因为该公司更新了 Chrome 内置的辅助工具。此前,该阅读模式工具是 ChromeOS 版本 Chrome 独有的,可用于增加文本大小并更改 PDF 字体以提高易读性,现在该工具将推广到所有版本铬。
但针对基于图像的 PDF 的新 OCR 处理方式无疑更令人感兴趣。谷歌在谈到即将推出的功能时表示:“借助 PDF OCR 技术,屏幕阅读器用户将能够在 ChromeOS 上的 Chrome 浏览器中将图像转换为 PDF 文本”。
该公司更详细地说:
2019 年,我们推出了获取图像描述功能,以便用户可以在 Chrome 浏览器上获取未标记图像的描述。今天,我们正在该功能的基础上进一步发展,并向 PDF 添加更多功能。我们在 ChromeOS 上的 Chrome 浏览器中添加了将图像转换为 PDF 文本的功能。这意味着,当屏幕阅读器用户遇到没有替代文本(屏幕阅读器嵌入并可读的图像的描述)的 PDF 时,屏幕阅读器将能够将图像转换为文本并大声朗读。阅读模式和图像到文本都将在未来几个月内开始推出。
正如谷歌指出的那样,这项非常有用的功能将只提供给 ChromeOS 下的 Chrome 用户,尽管这种排他性很可能最终会结束。阅读模式功能仅适用于 ChromeOS 大约四个月,并且可以合理地假设 PDF 图像到文本的转换最终也将提供给所有 Chrome 用户。