谷歌隐私政策更新引关注:公开网络数据将应用于更多AI服务
7月6日消息,谷歌近日宣布其隐私政策最新调整,其中包括Bard和Cloud AI在内的人工智能服务可能会利用公开的网络数据进行训练。这一更新行动将使公众更为清楚地了解谷歌在收集和使用数据方面的运作方式。
谷歌发言人克里斯塔·马尔登(Christa Muldoon)对外表示,谷歌向来秉持隐私政策透明原则,开放网络的公开信息是其训练语言模型的重要资源。这次的政策更新,除了包含谷歌翻译在内的传统服务外,还明确包括了Bard等新服务。马尔登强调,谷歌已将隐私原则和保障措施融入人工智能技术开发之中,以确保其与谷歌的人工智能原则保持一致。
据了解,自2023年7月1日起,谷歌隐私政策的描述已明确指出,公司会“利用公开的信息来训练谷歌人工智能模型,用于开发像谷歌翻译、Bard以及Cloud AI等产品和功能”。新的政策也赋予了谷歌更多的自由度,允许其不仅使用公开数据训练大型语言模型,还可以用于训练其他类型的人工智能系统。
然而,新政策对如何防止受版权保护的内容进入训练数据库的具体做法并未明确。许多公开网站都明确禁止数据收集或网络抓取行为,以避免其数据被用于训练大型语言模型和其他人工智能工具。这也让谷歌以及其他大型人工智能系统的开发商如GPT-4必须非常谨慎地选择他们用于训练模型的数据来源。
当前,法规的存在与市场竞争的加剧,使得对训练模型的数据来源,包括社交媒体内容或艺术家作家的版权作品的使用,都需十分慎重。对于数据合理使用原则是否适用于这类人工智能应用,目前法律监管尚处于灰色地带,诸多疑问和诉讼也随之产生。
另一方面,包含大量公共信息的社交媒体平台,如Twitter和Reddit近期已对其他公司获取其平台数据的行为采取了严格措施。尽管这一举措在一定程度上减少了数据被滥用的风险,但也因改变了API现行机制,引发了用户社区的强烈反对。
与此同时,美国最大的报纸出版商Gannett已向谷歌及其母公司Alphabet提起诉讼,认为谷歌凭借其人工智能技术在数字广告市场中取得了进一步的垄断地位。此外,谷歌的一些试验性人工智能搜索产品也因被指称为“抄袭引擎”而饱受争议,批评者认为其导致其他网站的流量大幅减少。
面对众多挑战和争议,人工智能公司如何在保护用户隐私、尊重版权以及推动技术创新之间找到平衡,将是未来一个亟待解决的问题。