在这次 Google I/O 开发者大会上,谷歌发布了在上述两种方式上取得的进展,以及这些进展是怎样确保谷歌的产品惠及大众。
以下为 I/O 开发者大会上,谷歌在 AI 和计算方面的重要技术进展和发布。
AI 技术改进产品
采用 AI 技术改进谷歌的产品,使产品更有帮助,更容易获得,并提供创新的新功能。
更多搜索选项,更多查询自由
多重搜索功能
Google 之所以声名大噪,靠的就是他们标志性的互联网搜索引擎。
2022 年的 I/O 大会并没有带来太多让人眼前一亮的搜索新功能,但新的“我附近的多重搜索”(multi-search near me)功能还是让大家的日常生活更方便了些。
Google 现在允许用户同时搜索图片和文字(例如同时搜索漏水的水龙头图片加上更换配件信息),再过几个月,大家还可以在图片中添加“我附近的”来查询本地可用结果。如果我们在网上看到一道自己不了解的菜肴,只需要配合“我附近的”进行图像多重搜索,就能找到提供这道菜品的当地餐厅。
除此之外,Google 还通过新的“场景内搜索”增强了视觉搜索能力。其功能非常简单:只要在繁忙的场景(例如杂货店过道)中平移相机,就能立即获得关于画面内多个对象的信息。想比较不同品牌的沙拉酱哪个更好吃?完全不成问题。
从 Google 搜索中删除个人信息
Google 还添加了一项早该发布的功能:从 Google 搜索中手动删除个人相关信息。
如果大家曾经在 Google 上搜索过自己的名字,就会惊讶于自己原本有那么多生活细节已经被晒在了网上。在 Google 上,我们往往能轻松找到相应的家庭住址、电话号码等。使用此次新功能,用户可以立即提出删除请求、并随时监控处理状态。虽然还不能保证百分之百成功,但这至少要比完全无法控制个人信息要强得多。
Google 翻译新增了 24 种语言
新增 24 种语言
Google 在今年的 I/O 主题演讲中花了不少篇幅,讨论他们如何适应不同人群的方言和外貌特征。首先,Google Translate 新增 24 种语言,包括首次纳入的盖丘亚语和艾马拉语等美洲土著语言。
与之前就提供的卫星视图相比,沉浸式视图能为用户提供基于不同点位的 3D 俯视图,让人获得亲临现场的感受。这项功能也支持部分室内场景,例如餐厅,可帮助大家在出行前做好功课。
Google 表示,沉浸式视图将在 2022 年底率先于洛杉矶、纽约市、旧金山、东京和伦敦推出。
Google Assistant 可更自然地与你对话
对于喜欢跟智能设备交谈的朋友,Google 带来了针对 Google Assistant 的一系列改进。短期之内,Google 将为 Google Nest Hub Max 智能家居产品推出一项“看和说”新功能。顾名思义,此功能将摆脱“Hey Google”开启的针对性查询,支持设备通过与用户的眼神交流激活语音分析。只要盯着 Nest Hub Max 看,再询问天气状况,大家就能得到想要的答案。
接下来,谷歌将把 YouTube 上的自动翻译字幕应用到移动设备上。这意味着观众可以获取 16 种自动翻译的视频字幕,创作者也可以借此吸引全球观众。
AI 构建到 Google Workspace 系列产品中
谷歌正在将 AI 构建到 Workspace 系列产品中,以帮助人们提升工作效率。
Google Docs 引入了自动总结功能,将其中一个机器学习模型应用在文本总结功能种,Google Docs 将自动解析单词并提取出要点。这标志着自然语言处理的一个大飞跃。总结需要理解长段落、压缩信息并生成语言,而这些已经超出过去最好的机器学习模型的能力。
此外,团队还将总结功能引入 Google Workspace 的其他产品。在接下来的几个月里,Google Chat 将使用该功能,为聊天对话提供摘要,帮助用户迅速加入群聊,或回顾重点信息。还将把将转录和总结功能引入 Google Meet,这样用户可以快速补上重要会议中错过的部分。
Google Meet 通话 AI 增强
Google 在本届 I/O 上还展示了另外一项不太起眼、但效果拔群的新功能——Google Meet 通话 AI 增强。
Google 凭借先进的机器学习技术增强了用户在网络摄像头中的形象,能够大大改善其他 Google Meet 用户看到的最终画面。之前用过 Google Meet 的朋友肯定或多或少遇到过光照条件不佳、显示效果糟糕的窘境,现在问题终于解决了。当然,最好的办法还是买个补光灯。
此外还为 Google Meet 带来了摄影棚规格的虚拟灯光,可以调整灯光的位置和亮度,用户即使身处黑暗的房间或坐在窗前仍然可以被清晰看到。这项功能正在测试中。
通过计算使知识更易获得
推出生成语言模型 LaMDA 2
谷歌研发的用于对话应有的生成语言模型 LaMDA 的 Demo,以及 AI Test Kitchen,继续提升
在基础设施方面创新方面,谷歌宣布 计划向美国各地的数据中心和办公室投资 95 亿美元。谷歌将为 Google Cloud 客户推出全世界最大的开放机器学习中心。
该机器学习中心拥有 8 个 Cloud TPU v4 芯片,是 Google 定制,建在为 Google 最大的神经模型提供支持的网络基础设施之上,能提供接近 9 x 1018 的算力,可以为 Google 的客户提供前所未有的运行复杂模型和工作负荷的能力,希望这将推动医学、物流等领域的创新。
增强现实技术:计算技术新前沿
谷歌在 AR 领域投入颇多:已将 AR 引用到许多产品当中,包括 Google Lens、多重搜索(multisearch)、场景探索(scene exploration)以及 Google Maps 的 Live Views 和沉浸式视图功能。AR 各项性能已应用于手机终端。
小结:
Google I/O 2022 规模浩大、内容无法一一尽数,相信无论您是 Google 铁粉还是普通用户,都能从中找到自己感兴趣的议题。