OpenAI的巨变如此悄悄的来了，AI大模型开启推理新时代

　　来源：华尔街见闻

　　在人工智能的历史上，2024年9月12日或许将被铭记为一个历史性转折点。就在这一天，OpenAI宣布了其最新系列AI模型——o1。据官方称，o1是史上最聪明的模型，思考方式也更接近人类，标志着人类正在通往推理时代的新道路。

　　o1模型的核心在于其推理能力。与基于预测的模型不同，o1在回答问题之前会进行深入的思考，探索不同的路径直到找到最佳答案。

　　这种能力使得o1能够在给定更多的“思考”时间时，回答更难的问题，类似于在国际象棋比赛中关键时刻考虑可能的走法。这种推理能力是AI发展的一大步，它使得AI能够在更广泛的领域中应用，包括但不限于编程、数学和科学问题。

　　普通用户在日常使用中可能难以察觉o1模型与GPT系列之间的微妙差异，但对于深入研究AI技术的研究人员而言，这一变化却是革命性的。

　　据《The Atlantic》上周文章，研究人员已经认识到，与GPT等旧模型相比，o1模型不仅仅是一次简单的升级，而是标志着一个“完全不同的游戏规则”和“真正的进步”。作为第一个具备真正通用推理能力的大模型，o1模型在处理复杂问题和推理任务时展现出的能力，或预示着人工智能技术的一个历史性转折点。

　　OpenAI研究副总裁Mark Chen今年早前指出，o1与标准 ChatGPT 有着根本的不同，因为它可以“推理”，这是人类智能的标志。此后不久，OpenAI首席执行官Altman宣布“智能时代即将到来”，人工智能将帮助人类解决气候问题并殖民太空。上周，这家初创公司向公众发布了具有完全成熟推理能力的o1完整的第一代版本。

　　第一个具备真正通用推理能力的大模型

　　OpenAI称，o1模型是第一个具备真正通用推理能力的大模型，这一点在测试化学、物理和生物学专业知识的基准GPQA-diamond上得到了充分体现。

　　根据OpenAI的评估，o1在该测试中全面超过了人类博士专家，准确率达到78.3%，而人类专家的得分为69.7%。OpenAI称，“通用人工智能（AGI）之路，已经没有任何阻碍”。

　　此外，o1在多个高难度的推理基准测试中表现优异，例如在美国数学邀请赛（AIME）中，o1的正确率达到了83.3%，远超其前身GPT-4o的表现。

　　o1模型的推出，也使得国内外的AI企业开始密切关注彼此的动态，意图在AI大模型领域实现突破。市场涌现出一批新兴的大模型，如kimi的k0math、Deepseek的DeepSeek-R1-Lite和昆仑万维的“天工大模型4.0”o1版，它们在逻辑思维与深度推理的能力上，试图与o1抗衡。

　　风险提示及免责条款

　　市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。