【新智元导读】在5月中旬,谷歌发布了AlphaEvolve。不仅30天内攻克了18年未解的难题,或将开启了一场无需「灵感」的科学革命:未来,科学家将不再依赖直觉,而是靠AI解决难题! 它不仅仅是生成文本工具,更不是简单的模板生成器。它喻示了AI的无限可能,就像AlphaGo的「神之一手」,展现了人类从未做过的突破。 AlphaGo不仅能够高效地探索围棋的所有可能局面,而且能够提出当时最佳走法。在几十年的围棋历史中,人类都没有发现这种下法。 某种意义上,AlphaGo是AI智能体。在庞大的搜索空间中,它可以高效探索并提出最优解。这种能力让人们感到惊讶,因为围棋非常复杂,科学家们认为AI能够在这一领域取得突破还需要很长时间。 几十年来,人们认为矩阵乘法的复杂度是立方级别的。也就是说,如果你有两个矩阵,矩阵的维度是n,那么计算的时间复杂度是n?。 通过搜索,AlphaTensor发现了比之前所知的算法更高效的解决方案。它不仅在效率上超越了传统算法,而且这个结果还证明了AI可以实现超人级别的突破。 通过基因池和评估函数,确保每一代的改进都能够提高整体的解的质量,同时保持了多样性,以便在庞大的搜索空间中发现最佳解决方案。 如果AlphaEvolve被要求解决一个相对简单的问题,它几乎能立即得到答案;但如果是一个非常复杂的问题,那么解决方案可能需要更长时间,更多的代次来不断改进。 至于预测需要多少代才能达到最优解,这个问题比较复杂。问题的难度,无法预料,尤其是在科学领域,一些看似简单的问题实际上可能非常难,反之亦然。但幸运的是,只要持续运行AlphaEvolve,它会随着时间的推移不断得到更好的结果。 在面对复杂或模糊的任务时,大多数通用编码智能体,容易陷入困境或产生错误,因为它们通常依赖于直接的任务说明,而这些说明往往不够精确,或者它们没有很强的判断能力。 例如,在优化数据中心调度时,评估函数可能是一个模拟器,它能够根据给定的调度算法来判断该算法在现实中的表现如何。 那对于开发者来说,设计好的评估函数确实非常具有挑战性。你需要明确什么样的结果才是好的解决方案。在某些情况下,开发者可以使用现有的模拟器来进行评估,而在其他更复杂的情况下,可能需要开发定制化的评估工具。 评估函数不仅要能判断方案的好坏,还要能够在不同的任务中灵活应用。比如,在数据中心调度优化问题中,评估函数的复杂性可能远高于一些较简单的任务。 AI不仅仅给出答案,还提供算法,科学家们可以通过研究算法来理解背后的原理,这对于深入理解问题和解决方案非常重要。


