谷歌在强硬的ChatGPT反击中透露了其新AI驱动的Google Lens技巧
时间:2024-05-14
来源:未知
作者:Gushan
这是人工智能领域又一个繁忙的星期,这一年里这样的星期有很多,谷歌在谷歌I/O 2024活动前夕几个小时透露了一项即将登陆移动设备的新AI功能——我们预计将在此次活动中听到一些重大宣布。
谷歌在社交媒体上的一张图片显示,有人向手机询问摄像头捕捉到的内容。在这张图片中,手机正确地识别出画面中正在搭建谷歌I/O舞台的人们。
用户和手机接着就关于谷歌I/O 2024展开实时对话,对话内容以及实时转录在屏幕上显示。我们没有得到更多信息,但这显然是在暗示即将揭晓的一些内容。
据我们所知,它看起来像是将现有的谷歌Lens和谷歌Gemini技术进行了混合,但所有操作都是即时完成的。Lens和Gemini已经可以对图像进行分析,但实时分析视频流将是一项全新的功能。
这与OpenAI昨日展示的带有多模态功能(结合音频、文本和图像)的ChatGPT机器人非常相似。现在,ChatGPT拥有了一个名为GPT-4 Omni(GPT-4o)的新型AI模型,这使得所有这些自然交互变得更加容易。
我们还曾在Rabbit R1人工智能设备上看到过类似的技术演示。这种理念是,这些人工智能不再像你输入文本的盒子,而是更像能够看到、识别和交谈的合成人。
根据这段预告片来看,谷歌杰米尼AI模型和机器人很可能会采用这种方式。虽然我们无法确定视频中出现的是哪款智能手机,但这些新功能可能首先在Pixel手机(比如即将推出的谷歌Pixel 8a)上推出。