数学中国

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 604|回复: 0

ChatGPT 每 5 个提示词消耗一瓶水,微软一年用掉 2500 个奥运泳池

[复制链接]
发表于 2023-9-14 10:50 | 显示全部楼层 |阅读模式
ChatGPT 每 5 个提示词消耗一瓶水,微软一年用掉 2500 个奥运泳池



来源 | 智东西(公众号:zhidxcom)

编译 | 陈佳慧

编辑 | 徐珊


智东西 9 月 11 日消息,据美联社报道,构建类似 ChatGPT 这样的 AI 产品的成本很难衡量,目前水资源消耗巨大的问题尤其突出。

例如每次向 ChatGPT 给出 5-50 个提示或问题,它就会消耗 500 毫升的水用于冷却计算设备和为数据中心供电的发电厂,而 ChatGPT 用户超过 1 亿人,总耗水量将相当惊人。研究报告显示,微软全球用水量飙升 34% ,谷歌用水量增加 20% ,AI 技术开发商需要对大模型开发大量消耗水资源引起重视。

构建大语言模型需要机器对大量人类撰写的文本进行分析,而所有的这些计算都会消耗大量电力并产生大量热量,数据中心需要抽水到冷却塔来保持机器的凉爽,但这些用于冷却的水资源本是提供给当地居民的饮用水。因此,AI 技术开发商需要思考如何提高训练大模型的效率,同时增加使用清洁能源为数据中心供电,以实现可持续发展目标。

一、用水量微软增长 34% 、谷歌增长 20% ,AI 大模型开发项目耗水量巨大

根据微软最新的环境报告,从 2021 年到 2022 年,其全球用水量激增了 34% ,用水量达到近 17 亿加仑,相当于 2500 多个奥运游泳池的用水量,与前几年相比大幅增加,外部研究人员认为这与微软的 AI 开发有关。

加州大学河滨分校(University of California, Riverside)的研究员任少磊(Shaolei Ren)认为,微软公司全球用水量的大部分增长都是因为 AI ,其中包括微软对生成式 AI 的大量投资和与 OpenAI 的合作。微软支持的OpenAI 技术需要大量的水,这些水是从爱荷华州中部的浣熊河和得梅因河的交汇处抽取的,用来给一台强大的超级计算机降温,帮助其 AI 系统学习模仿人类写作。


▲OpenAI

任少磊一直在尝试计算出 ChatGPT 等生成式 AI 产品对环境的影响。在今年晚些时候将要发表的一篇论文中,任少磊的团队估计,每次向 ChatGPT 给出 5-50个提示或问题,它就会消耗 500 毫升的水,这个范围会根据服务器所在地和季节有所变化。所消耗的水不仅用于直接冷却服务器,还用于冷却为数据中心供电的发电厂。

不仅是微软,同一时期,谷歌的用水量也增长了 20% ,任少磊仍然将其归因于 AI 的开发训练。不过谷歌的用水量增长并不均匀。在俄勒冈州,谷歌的用水量比较稳定,但该州庞大的用水量引起了公众的关注;而在拉斯维加斯以外的地区,谷歌的用水量则翻了一番。此外,谷歌在爱荷华州的数据中心对可饮用水的需求也非常大,比谷歌在其它地方的数据中心都要多。

微软、OpenAI 和谷歌等行业领先的技术开发商在竞相利用生成式 AI 的同时,都承认开发 AI 产品是一项高成本的工作,其中,从订购昂贵的半导体到用水量激增都在推动成本上涨,未来,关于 AI 模型的开发不仅要关注其碳足迹,其水足迹也需要重视起来。

二、选址合理、积极配合政府,微软与 OpenAI 将采取一系列措施实现可持续发展

2019 年,微软向 OpenAI 投资 10 亿美元,两家公司首次达成合作。合作交易中,微软需要为 OpenAI 提供其训练 AI 模型所需的计算能力。专家们认为,因为需要在计算内核之间传输大量数据,在单个地点对人工智能模型进行预训练是很重要的。

为了完成训练 AI 模型的工作,微软与 OpenAI 将目光目光投向了爱荷华州的西得梅因市(West Des Moines),这是一座拥有 6.8 万人口的城市。十多年来,微软一直在那里建设数据中心以支持其云计算服务,并且微软在当地建设的第四和第五个数据中心将于今年晚些时候投入使用。

对于与 OpenAI 合作开发超级计算机的选址,微软没有很快公布。2020 年微软首次公开其正在为 OpenAI 开发世界上最强大的超级计算机之一,当时拒绝向美联社透露位置,但描述了这个超级计算机是一个拥有超过 285000 个传统半导体核心和 10000 个图形处理器的“单一系统”,其中用到的图形处理器是对 AI 工作负载至关重要的芯片。

直到 5 月底,微软总裁 Brad Smith 才透露,微软已经在爱荷华州建立了“先进的 AI 超级计算数据中心”,专门让 OpenAI 在那里训练其第四代大语言模型 GPT-4 。该模型现在为高级版本的 ChatGPT 和微软自己的一些产品提供动力,并加速了一场关于遏制 AI 社会风险的讨论。


▲ 微软总裁 Brad Smith 讲话

从某些方面来看,西得梅因市是训练强大 AI 系统相对高效的地方,特别是与微软在亚利桑那州的数据中心相比,在同样的计算需求下,西得梅因市的数据中心消耗的水资源要比亚利桑那州的数据中心少得多。就像任少磊说的那样:“这两个地方在训练方面没有什么区别,但在用水和能源消耗方面,两者有很大差异。”

因为在一年中的大部分时间里,爱荷华州的天气足够凉爽,微软可以使用室外空气来保持超级计算机的正常运行,并将热量排出大楼。微软在一份对外公开的文件中提到,只有当温度超过 29.3 摄氏度时,数据中心才会利用水来降温。

可是尽管如此,微软仍然需要大量的水资源,特别是在气温较高的夏天。根据西德梅因市自来水公司的数据,2022 年 7 月,也就是 OpenAI 声称完成 GPT-4 训练的前一个月,微软向其位于爱荷华州的数据中心群注入了大约 1150 万加仑的水,相当于该地区总用水量的 6% 左右,而该自来水公司能够调用的水资源还需要供应给当地居民作为饮用水。

2022 年,西德梅因市自来水公司发文件称,只有微软的数据中心项目能够“展示并实施技术来显著减少峰值用水量,以保障居民和其他商业需求的用水供应”时,他们才会考虑接受微软未来的数据中心项目。微软对此回应,他们正在直接与自来水公司合作,以解决自来水公司的反馈意见。

在回答美联社关于用水量的提问时,微软在本周的一份声明中提到,他们正在投资研究测量 AI 的能源和碳足迹,同时也在努力研究如何使大语言模型系统在训练和应用时更加高效。

微软的该篇声明称:“我们将继续监测我们的排放情况,在增加使用清洁能源为数据中心供电、购买可再生能源等方面加快进展,并通过其它努力,共同发力来实现我们的可持续发展目标,即到 2030 年实现负碳、正水和零浪费。”

OpenAI 在其周五的声明中也表达了同样的观点,称其已经认识到训练大语言模型可能会耗费大量能源和水资源,他们正在认真思考如何更好地利用 AI 的计算能力,提高 AI 工作效率。

结语:AI 技术发展背后的巨大能源消耗需要各方加强重视

微软全球用水量飙升 34% ,谷歌用水量增加 20% ,研究人员认为两家公司的用水量激增与其 AI 开发项目有关,并且微软、OpenAI 和谷歌等行业领先的技术开发商均承认训练 AI 带来的用水量激增提升了其开发成本,他们需要采取提升大语言模型效率、使用清洁能源等行动实现可持续发展目标。

同时,AI 开发项目所在地的政府也重视水资源消耗巨大的问题,避免企业大量用水为当地居民使用生活用水和饮用水造成不便。

未来,生成式 AI 开发中水资源消耗巨大的问题是否会得到缓解,我们将继续关注。

来源:美联社

2023-09-11 22:11:32 来源:智东西 北京

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|数学中国 ( 京ICP备05040119号 )

GMT+8, 2024-4-29 15:17 , Processed in 0.069336 second(s), 16 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表