刚刚！OpenAI发布全新o1系列两款模型，o1-mini价格暴降80%，已全面上线

ChatGPT代充2024-09-13 08:25:251090

温馨提示：在 ChatGPT 官网（www.chatgpt.com）使用 GPT-5.5、ChatGPT-Image-2 等模型时，需要 ChatGPT Plus 或更高等级的会员权限。如需购买帐号或代充值会员，请扫码添加我们客服咨询。

刚刚，传说中的OpenAI迄今为止最强大的 AI 模型终于到来，但并非完全命名为外界所盛传的Strawberry，或者是Orion。

北京时间9月13日凌晨，美国OpenAI公司宣布推出两款新的 AI 模型：OpenAI o1-preview和o1-mini ，旨在解决各种复杂任务，在推理数学、编程、科学等问题的能力上有显著提高，并解决比以前的科学、编码和数学模型更难的问题，思考的时间越长，给出的答案就。另外，全新的o1-mini 速度更快，价格比o1-preview便宜80%，并且在编码任务等能力方面可与o1-preview 相媲美。

OpenAI表示，即日起，ChatGPT Plus 和 Team用户将能够在 ChatGPT 中访问 o1 模型，不过也有一定限制，就是在发布时，用户每周发送消息次数限制为 o1-preview 30 条消息和 o1-mini 50 条消息。

“当今的语言模型花费了相似的时间来尝试解决各种大大小小的问题。Openai o1 则代表着向可以无限推理的模型迈出了一小步，这种认知技能对于帮助解决我们这个时代任何尚未解决的重大问题都至关重要。”OpenAI表示，现在的o1只是一个预览版，公司将期待定期更新和改进。除了此版本之外，OpenAI还将包含目前正在开发的下一次更新的评估。

OpenAI CEO奥尔特曼（Sam Altman）表示，“这是我们迄今为止功能最强大、最一致的模型系列 o1，也是迄今为止我们最好的推理模型。o1 仍然存在缺陷，仍然有限，并且第一次使用时的感觉仍然比花更多时间使用后的感觉更令人印象深刻。”

“但是你宁愿大多数时候都有些悲伤，偶尔非常快乐，还是宁愿一直有些快乐，偶尔非常悲伤？”奥尔特曼随后称。

据悉，今年以来，OpenAI发布GPT-4o、sora视频模型等产品引发关注。此次，OpenAI再度更新，发布全新o1系列模型产品。

具体来说，OpenAI分为工作原理、安全、适合对象、o1-mini等方面来叙述。

工作原理层面，OpenAI表示，“我们训练这些模型花更多时间思考问题，然后再做出反应，就像人类一样。通过训练，它们学会完善自己的思维过程，尝试不同的策略，并认识到自己的错误。在我们的测试中，下一个模型更新在物理、化学和生物学的具有挑战性的基准任务上的表现与博士生相似。我们还发现它在数学和编码方面表现出色。在国际数学奥林匹克 (IMO) 资格考试中，GPT-4o 仅正确解决了 13% 的问题，而推理模型得分为 83%。他们的编码能力在比赛中得到了评估，并在 Codeforces 比赛中达到了第 89 个百分位。”

“作为早期模型，它还不具备 ChatGPT 的许多实用功能，例如浏览网页获取信息以及上传文件和图片。对于许多常见情况，GPT-4o 将在短期内变得更加强大。但对于复杂的推理任务来说，这是一个重大进步，代表了人工智能能力的新水平。鉴于此，我们将计数器重置为 1，并将该系列命名为 OpenAI o1。”OpenAI表示。

安全层面，OpenAI表示，“在开发这些新模型的过程中，我们提出了一种新的安全训练方法，利用它们的推理能力，使它们遵守安全和协调准则。通过能够在上下文中推理我们的安全规则，它可以更有效地应用它们。我们衡量安全性的一种方法是测试当用户试图绕过安全规则（称为“越狱”）时，我们的模型如何继续遵循安全规则。在我们最严格的越狱测试之一中，GPT-4o 得分为 22（0-100 分制），而我们的 o1 预览模型得分为 84。”

“为了适应这些模型的新功能，我们加强了安全工作、内部管理和联邦政府合作。这包括使用我们的准备框架进行严格的测试和评估（在新窗口中打开）、一流的红队测试和董事会级审查流程，包括我们的安全与安保委员会。为了推进我们对人工智能安全的承诺，我们最近与美国和英国的人工智能安全研究所正式达成协议。我们已经开始实施这些协议，包括授予这些研究所早期使用该模型研究版本的权限。这是我们合作中重要的第一步，有助于在未来模型公开发布之前和之后建立研究、评估和测试流程。”OpenAI称。

适合对象层面，如果您正在解决科学、编码、数学和类似领域的复杂问题，这些增强的推理能力可能特别有用。例如，医疗研究人员可以使用 o1 来注释细胞测序数据，物理学家可以使用 o1 来生成量子光学所需的复杂数学公式，各领域的开发人员可以使用 o1 来构建和执行多步骤工作流程。

OpenAI o1-mini方面，公司称，o1 系列擅长准确生成和调试复杂代码。

“我们训练了一个获得 213 分并在 2024 年国际信息学奥林匹克竞赛（IOI）中排名第 49 个百分位的模型，从 o1 开始初始化并进行培训以进一步提高编程技能。该模型在与人类参赛者相同的条件下参加了 2024 年 IOI 的比赛。它有 10 个小时来解决 6 个具有挑战性的算法问题，每个问题允许提交 50 个问题。对于每个问题，我们的系统对许多考生提交的内容进行了抽样，并根据考试时选择策略提交了其中的 50 个。提交的内容是根据 IOI 公共测试用例、模型生成的测试用例和学习的评分函数的性能来选择的。如果我们是随机提交的，我们平均只会得到 156 分，这表明在比赛限制下，这种策略价值近 60 分。在宽松的提交约束下，我们发现模型性能显著提高。当每个问题允许提交 10,000 个问题时，该模型获得了 362.14 分——高于金牌阈值——即使没有任何测试时间选择策略。最后，我们模拟了由 Codeforces 主办的竞技编程竞赛，以展示该模型的编码技能。我们的评估与比赛规则非常匹配，并允许 10 份提交。GPT-4o 的 Elo 评分3 为 808，在人类竞争对手中处于第 11 个百分位。该模型远远超过了 GPT-4o 和 o1——它的 Elo 评分为 1807，表现优于 93% 的竞争对手。”OpenAI表示。

另外，为了给开发人员提供更高效的解决方案，公司还发布了OpenAI o1-mini，这是一种速度更快、成本更低的推理模型，在编码方面尤其有效。作为一款较小的模型，o1-mini 比 o1-preview 便宜 80%，使其成为一款功能强大、经济高效的模型，适用于需要推理但不需要广泛世界知识的应用程序。

那么，你如何使用 OpenAI o1？

OpenAI首先表示，从今天开始，ChatGPT Plus 和 Team用户将能够在 ChatGPT 中访问 o1 模型。o1-preview 和 o1-mini 都可以在模型选择器中手动选择，在发布时，每周发送消息次数限制为 o1-preview 30 条消息和 o1-mini 50 条消息。我们正在努力提高这些发送次数，并使 ChatGPT 能够根据给定的提示自动选择正确的模型。

其次，ChatGPT Enterprise（企业）和 Edu（教育）用户将从下周开始使用这两种（mini和预览）模式。而符合 API usage tier 5(opens in a new window)的ed开发人员（在新窗口中打开）的开发人员，现在可以开始使用 API 中的两种模型进行原型设计，速率限制为 20 RPM。同时正在努力在进行额外测试后提高这些限制。这些模型的 API 目前不包括函数调用、流式传输、对系统消息的支持和其他功能。

最后，OpenAI还计划向所有ChatGPT Free（免费）用户提供 o1-mini 访问权限。

展望未来，OpenAI表示，o1是 ChatGPT 和 API 中这些推理模型的早期预览。除了模型更新之外，公司还希望添加浏览、文件和图像上传以及其他功能，使其对每个人都更有用。除了新的 OpenAI o1 系列之外，公司还计划继续开发和发布 GPT 系列中的模型。

（本文首发于钛媒体App，作者｜林志佳）

温馨提示：在 ChatGPT 官网（www.chatgpt.com）使用 GPT-5.5、ChatGPT-Image-2 等模型时，需要 ChatGPT Plus 或更高等级的会员权限。如需购买帐号或代充值会员，请扫码添加我们客服咨询。

本文链接：https://www.daichong.cc/gpt4_gpt5_122.html

OpenAI-o1 ChatGPTPlus OpenAI o1 chatgpt 中文 OpenAIo1 OpenAI01 chatgpt o1 o1-mini o1-preview ‍‍OpenAI o1-mini OpenAI o1-preview