人工智能算法在使许多计算过程更高效方面取得了巨大进步,但“效率”并不总是人工智能行业本身的游戏名称。著名的是,马萨诸塞大学阿默斯特分校的一组研究人员得出的结论是——至少在几年前——人工智能模型的单次训练运行的碳足迹可能与多辆汽车的寿命相当。随着人工智能的使用越来越多——越来越大的模型在起作用——环境成本越来越受到关注。
在2021 年人工智能硬件峰会上,一个名为“确保人工智能系统的可持续性”的小组正面面对了这个问题。小组成员:Carole-Jean Wu,Facebook 研究科学家;谷歌大脑杰出工程师、2017 年图灵奖共同获得者大卫帕特森;和 MLPerf 的执行董事 David Kanter。
“人工智能的资源需求在过去十年中呈指数级增长,”吴说。“很明显,人工智能的增长趋势目前处于不可持续的速度——因此,虽然需求刺激了显着的市场增长,但它确实可以以许多不同的方式影响我们的环境。”
人工智能培训真的是问题所在吗?
帕特森的开场齐射挑战了关于人工智能碳足迹的传统智慧,在他回忆起他参与的一项关于大型神经网络训练碳足迹的调查时,质疑了类似阿默斯特论文中的结论。他说:“我们引用的一些论文……出乎意料地高出近 100 倍。”“我认为,如果我们对现代社会有所了解,就事实达成一致非常重要。”
帕特森引用发表在《科学》杂志上的一篇论文回忆说,它的结论是“'有能量进入云中,但这使能源消耗远离数据中心,数据中心的效率不如云。”因此,当他们考虑到这一点并回顾过去十年时,尽管计算能力是其五倍多,但数据中心的总体能耗仅为 6%,原因是效率低下、未充分利用的数据中心和建筑物正在被高效的云所取代。”
此外,帕特森说,虽然人工智能培训确实使用能源,但能源的性质和规模很重要。“其中几家公司在碳足迹方面非常积极,并试图使用无碳能源,”他说,并引用了谷歌、微软和其他公司在可持续发展方面的强大努力。他说,对于谷歌来说,来自大型模型训练的能源使用百分比不到 0.005%。“这是四舍五入的错误,”他说。“这只是谷歌所做工作的一小部分。”
小组成员还质疑培训是否是人工智能碳足迹最重要的问题。“我的直觉是推理是最大的问题,”坎特说,因为它随着客户数量的增加而扩展。因此,他说,如果在推理方面产生有意义的减少,那么对培训进行前期碳投资可能是值得的。
聚焦制造业
此外,吴说,在许多情况下,“计算环境成本的主要来源已经相当多地……转向硬件制造”而不是产品使用——这是多年来在使用方面的效率工作的结果。例如,Apple 发现其端到端碳足迹的 74% 来自制造而非客户使用,其中 33% 来自集成电路制造。
在这一点上,Kanter 指出“客户端应用程序和业务应用程序非常不同”,认为来自 Apple 客户端的利用率可能远低于云数据中心的利用率。与此同时,帕特森通过将其相对较长的使用寿命和更高的利用率与智能手机等消费电子产品的较短使用寿命并列,为数据中心部件的相对可持续性辩护。
然而,人工智能硬件的制造可持续性打开了它自己的蠕虫罐——因为,正如吴所说,“[碳]排放是一个难题。”她说,剩下的难题包括大量环境问题,例如电子垃圾(据吴称,2019 年生产了 5000 万吨)和废水处理。坎特同意:“在半导体方面,二氧化碳是一个问题,”他说,“但还有很多其他问题,比如砷化镓。......这些东西在二氧化碳之外有很多危险。”
开发解决方案
为了解决这些问题,小组成员有很多想法来提高人工智能系统的可持续性。坎特提倡测量和基准测试。他说,从表面上看,人们可能期望算法的效率以摩尔定律的速度进步——但相反,MLPerf 基准已经大大超过了它。“我的观点是,基准有助于推动事情的发展,”他说。“基准的重点在于它使整个行业在'更好'的含义上保持一致。”
Patterson 表示同意,理由是他早期对在 MLPerf 中包含功率和训练测量的兴趣。“可悲的是,我没有赢得这场争论,”他指出。“工程师们竞争。如果您添加一个可以竞争的指标,它将影响结果,”他说。“每瓦性能,而不是直接性能,将是一个很大的帮助。”在谷歌,他了解到谷歌云将通过引用其可持续性来与亚马逊和微软竞争,因此他解释说,营销潜力是存在的。
小组成员还强调了选择可持续生产和运营设施的重要性。“我谈到的那篇论文中最大的惊喜是位置的重要性,”帕特森说。Wu 表示同意,并强调可以通过选择环境友好型晶圆厂或通常寻找由无碳能源提供的设施来产生差异。
帕特森以个人责任说明结束,敦促人工智能研究人员在他们的公司内推动这些措施。“如果你真的相信全球气候变化是真实存在的,我认为你应该问问你个人可以做什么,作为你工作和个人行为的一部分。”