欧易数字货币交易所 更快、更好、更强

欧易是世界领先的数字货币交易平台,你可以放心购买比特币、以太币、莱特币、狗狗币等数字货币,也可以探索Web3、投资DeFi 和NFT。欧易是您数字货币之旅的得力助手,下载欧易APP客户端安装包将助您轻松赚币.

hero thumb

斯坦福指出AI扩展定律拟合偏差或导致巨额算力浪费

3月27日(UTC+8),斯坦福大学(Stanford University)教授 Percy Liang(Percy Liang)在最新研究讨论中指出,当前人工智能领域广泛使用的扩展定律(Scaling Laws)在本质上可以被视为一种回归分析方法,但如果采用存在偏差的拟合方式,可能在大规模训练中悄然造成数百万美元级别的计算资源浪费。

扩展定律通常用于描述模型性能与计算资源(如参数规模、数据量、算力投入)之间的关系。在大模型训练中,这一理论被广泛用于指导企业如何分配算力资源,以在成本与性能之间取得最佳平衡。然而,Percy Liang指出,当这些拟合模型在数学假设或数据处理上存在偏差时,其预测结果可能在小规模实验中看似合理,但在大规模训练时却会被严重放大,从而影响整体资源配置效率。

他的同事 Eric Czech(Eric Czech)进一步分析了当前行业中常见的一种拟合方法——抛物线 IsoFLOP 曲线拟合。他研究发现,包括 Meta(Meta)、DeepSeek(DeepSeek)、Microsoft(Microsoft)以及 Waymo(Waymo)等多家机构在使用该方法时,可能存在系统性偏差问题。

这种偏差主要体现在曲线拟合对不同规模训练数据的敏感度不足。当模型在中小规模训练阶段拟合较好时,研究人员可能误以为该趋势可以线性外推至更大规模,但实际情况往往并非如此。这种误差在大规模算力投入时会被显著放大,导致训练资源分配不合理,甚至影响最终模型性能优化路径。

研究团队强调,扩展定律虽然在现代AI系统设计中发挥着关键指导作用,但它本质上依赖于统计建模与经验拟合,因此并非绝对规律,而是一种近似工具。如果在使用过程中忽视其统计假设或拟合误差,就可能在高成本训练阶段产生严重后果。

在当前大模型竞争日益激烈的背景下,算力资源已经成为人工智能发展的核心约束之一。企业在训练超大规模模型时往往需要投入数百万甚至数千万美元的计算成本,因此任何微小的拟合误差都可能转化为巨大的经济损失。

此外,这一问题也引发了关于AI基础研究方法论的进一步讨论。如何构建更加稳健的扩展预测模型,如何降低拟合偏差,以及如何在不同规模间实现更可靠的外推能力,成为当前研究的重要方向。

总体来看,斯坦福大学此次提出的观点强调了一个关键事实:在人工智能快速扩展的时代,模型性能提升不仅依赖算力规模的增加,更依赖于对基础数学模型与统计方法的严格审视。正确理解并应用扩展定律,将直接影响未来AI研发的成本效率与技术路径选择。