·PaLM-E是迄今为止已知的最大VLM(视觉语言模型)。作为一种多模态具身VLM,它不仅可以理解图像,还能理解、生成语言,执行各种复杂的机器人指令而无需重新训练。它还展示出了强大的涌现能力(模型有不可预测的表现)。
本周早些时候,谷歌CEO Sundar Pichai在I/O 2018上揭开了Duplex的面纱。与Google Assistant结合后,这项语音技术能够用自然流利的语气,帮用户完成美发沙龙和餐馆的预定操作,瞬间将亚马逊Alexa和苹果Siri等竞争对手甩在了八百里开外。