微软支持的 OpenAI 公司正在推出 “草莓 ”系列人工智能模型,旨在花更多时间处理查询答案,以解决棘手问题。这些模型能够推理复杂的任务,并能解决比以前的科学、编码和数学模型更具挑战性的问题。
OpenAI 在内部使用代号 “草莓”(Strawberry)来指代该项目,并将周四公布的模型命名为 o1 和 o1-mini。该公司表示,o1 将从周四开始在 ChatGPT 及其 API 中使用。
专注于提高公司模型的推理能力,OpenAI 努力创造能够真正进行一般推理的人工智能模型的成果。
OpenAI 在博文中说,o1 模型在国际数学奥林匹克竞赛资格考试中的得分率为 83%,而其上一个模型 GPT-4o 的得分率仅为 13%。该模型还提高了在编程竞争性问题上的表现,并在科学问题的基准测试中超过了人类博士水平的准确率。这些模型之所以能取得这样的成绩,是因为采用了一种被称为 “思维链 ”推理的技术,即把复杂的问题分解成更小的逻辑步骤。当这种方法被用作一种提示技术时,人工智能模型在复杂问题上的表现往往会有所改善。
现在,OpenAI 已经将这种能力自动化,这样模型就可以在没有用户提示的情况下自行分解问题。我们训练这些模型在做出反应之前花更多时间思考问题,就像人一样。通过训练,它们学会完善自己的思考过程,尝试不同的策略,并认识到自己的错误。