深圳dns-域名控制面板-谷歌 Lookout 软件 AI 新功能帮助盲人更好地了解数字图片信息

深圳dns,谷歌官方日前共享了其 Lookout 软件的最新更新细节,该软件于 2019 年初次推出,使用人工智能处理图画的 Alt 文本信息,并允许用户与系统进行问答式会话。这一功用根据 Google DeepMind 开发的先进视觉语言模型。
谷歌,google
域名控制面板,Lookout 软件现在正处于测试版,并通过与英国皇家瞎子协会(RNIB)的亲近合作开发,约请有限的人测试这一功用,并方案很快向更多人提供这一功用。
Alt 文本是内容创作者可以增加到视觉上的描绘,以便瞎子或低视力的人可以得到数字图画中的描绘——无论是网站上的照片还是与朋友共享的交际媒体图画。问题是许多图片的标题和 Alt 文本质量不高,或许往往根本就没有,这使得许多人无法获取视觉信息。
事实上,卡内基梅隆大学 2019 年的一项研讨发现,在 109 万条推文中,只要 0.01% 包括内容创作者增加的 Alt 文本,这意味着超过 99% 的这些图片不简单被失明的人获取。现在,人工智能正在协助使图画更简单获得。
Lookout 于 2019 年推出,是与瞎子和低视力群体一起设计的,它使用人工智能协助人们完成日常工作,如整理邮件和收拾杂物。现在 Lookout 中一项名为「图画问答」的新功用正在为瞎子和低视力社区的特定人群推出。现在,无论图片是否没有阐明或 Alt 文本,Lookout 都可以处理图片并提供描绘——然后人们可以用语音或打字来提问,对图片中的内容有更具体的了解。
「这次合作显现了咱们的多模态模型如何直接惠及人们的生活,」谷歌 DeepMind 首席业务官 Colin Murdoch 说。「它为更多的使用开辟了新的途径,特别是当涉及到使用人工智能使咱们周围的世界更简单挨近时」。