踢馆OpenAI，谷歌最新研究推翻Scaling laws？-钛媒体官方网站

踢馆OpenAI，谷歌最新研究推翻Scaling laws？

· 2024.04.12 16:17

2923

踢馆OpenAI，谷歌最新研究推翻Scaling laws？

谷歌研究院和约翰霍普金斯大学的最新研究对AI领域广泛接受的Scaling Laws提出了挑战【10】。Scaling Laws是指在AI模型中，随着模型大小、数据集大小和计算量的增加，模型性能也会相应提高的规律。这一概念在大语言模型（LLM）的研究中得到了广泛的验证和应用【2】。

然而，谷歌的研究团队在探索潜在扩散模型（Latent Diffusion Models, LDMs）时发现，Scaling Laws在这一模型类别中并不总是成立【10】。LDMs是一种新兴的图像生成模型，包括了从DALL·E到OpenAI的Sora等知名模型【10】。研究指出，在计算资源有限的情况下，增加模型的参数量并不总是导致性能的提升。相反，适当规模的模型在更多的训练步骤下可能会胜过参数量更大的模型【10】。

这项研究通过设计不同参数量的LDMs进行实验，发现在总计算量固定的情况下，较小的模型在训练步骤较多时能够达到更好的生成质量【10】。这表明，在资源有限的实际情况下，模型的大小和训练步骤的选择需要根据可用的计算资源进行适配，以达到最佳的性能【10】。

此外，研究还发现，在进行超分辨率任务和DreamBooth任务的微调时，大模型在图像细节生成方面表现得更好【10】。这意味着在某些任务中，模型的规模仍然是提升性能的关键因素【10】。

谷歌的这项研究对AI领域的Scaling Laws提出了重要的质疑，表明这一规律并非在所有情况下都适用【10】。这一发现强调了在设计和训练AI模型时，需要考虑更多的因素，如模型的具体任务、可用资源和训练策略等，而不能单纯依赖于模型规模的增加【10】。

总体而言，谷歌的研究为AI模型的开发提供了新的视角，提示研究人员和开发者在追求模型性能提升时，需要更加细致地考虑模型规模、数据集大小、计算量和训练步骤等多个维度的相互作用【10】。这一发现也可能对未来AI技术的发展和应用产生深远的影响【10】。

违规提示

普通投稿

钛媒体App

钛空时间App

关注喜欢的作者

参与互动讨论

作品投稿