字
字节笔记本
2026年5月31日
OpenAI o1 的秘密不是新架构,是 Test-Time Scaling Law
API中转
¥120
OpenAI o1 的核心创新不是新的模型架构,而是 Test-Time Scaling Law。
传统模型在推理时固定计算量,无论问题多复杂都用一样多的计算资源。o1 的思路是:给模型更多的推理时间,让它能在复杂问题上"多想一会儿"。
实现方式是 chain-of-thought 推理的工程化。模型在回答之前先生成一段内部推理过程,逐步分析问题、拆解子任务、验证中间结果。推理过程越长,消耗的计算资源越多,但对复杂问题的准确率也越高。
这种"用推理时间换准确率"的策略在数学、编程、科学推理等需要多步逻辑的任务上效果显著。
分享: