谷歌在强硬的ChatGPT反击中透露了其新AI驱动的Google Lens技巧

时间：2024-05-14 来源：未知作者：Gushan

这是人工智能领域又一个繁忙的星期，这一年里这样的星期有很多，谷歌在谷歌I/O 2024活动前夕几个小时透露了一项即将登陆移动设备的新AI功能——我们预计将在此次活动中听到一些重大宣布。

谷歌在社交媒体上的一张图片显示，有人向手机询问摄像头捕捉到的内容。在这张图片中，手机正确地识别出画面中正在搭建谷歌I/O舞台的人们。

用户和手机接着就关于谷歌I/O 2024展开实时对话，对话内容以及实时转录在屏幕上显示。我们没有得到更多信息，但这显然是在暗示即将揭晓的一些内容。

据我们所知，它看起来像是将现有的谷歌Lens和谷歌Gemini技术进行了混合，但所有操作都是即时完成的。Lens和Gemini已经可以对图像进行分析，但实时分析视频流将是一项全新的功能。

这与OpenAI昨日展示的带有多模态功能(结合音频、文本和图像)的ChatGPT机器人非常相似。现在，ChatGPT拥有了一个名为GPT-4 Omni(GPT-4o)的新型AI模型，这使得所有这些自然交互变得更加容易。

我们还曾在Rabbit R1人工智能设备上看到过类似的技术演示。这种理念是，这些人工智能不再像你输入文本的盒子，而是更像能够看到、识别和交谈的合成人。

根据这段预告片来看，谷歌杰米尼AI模型和机器人很可能会采用这种方式。虽然我们无法确定视频中出现的是哪款智能手机，但这些新功能可能首先在Pixel手机(比如即将推出的谷歌Pixel 8a)上推出。

更多推荐