最近 OpenAI o1 的测试基本跑完,大家基本认可这是一个智商超群的模型,今天看完 OpenAI o1 的技术报告和相关资料,发现了一些非常有趣的点,把这些有趣的点串起来,竟然细思恐极。

全网 OpenAI o1 的测试基本跑完,大家基本认可这是一个独立思考智商超高的模型,智商测试120,高考数学全对。

但是当人们询问模型的思维过程时,却收到 OpenAI 的封号警告,这有什么不能问的?

o1 的思维过程里到底隐藏着怎样的秘密,才会受到如此严密的保护?

带着这个疑问看完了模型的技术报告,似乎有点懂了...

一、先从光鲜亮丽的那一面说起

OpenAI 发布新模型系列 OpenAI o1,新模型的非常特殊,各种能力缺失:不支持联网搜索、不支持文件、不支持画图,也不支持 system prompt,不支持 tool,不支持 json mode,不支持结构化输出。

但是,新模型会进行系统2思考,通过花费更多时间思考,能够推理复杂任务,并解决科学、编程、数学领域中的难题。

o1 的 IQ 成绩是 120 分,人类智商的平均值大约是100 ,其他模型都在 100 分以下。

很多人在测试 o1 的时候,一个体会是无法想出能测试模型能力的题,这可能正是智商差异的体现。

数据来源:https://trackingai.org/IQ (但请注意,通过题目测试智商具备一定争议)

image.png

还记得两个月前,OpenAI 定义了 AI 的 5 个 Level 吗?今天 AI 行业就正式进入了 Level 2,Level 2 的含义是推理者,模型具备了和人类同水平的问题解决能力。

image.png

o1,已经达到 Level2,值得注意,但并未达到 Level3,Agent 能力依然很低

c6e39d7c019b65c24a00fa5d47222c23.jpeg

要到达 L3,需要 L2 的模型生成数据,并使用这些数据进行训练。

二、技术报告里的真相,解放思想