看了今天OpenAI的新品发布直播,我嗅觉被奥特曼耍了
专题:阛阓交往或仍围绕策略预期张开 行情演绎紧迫节点将至
开端:知危
环球好,这里是知危剪辑部,看完刚刚兑现的 OpenAI 新品发布直播,咱们的心里产生了弘大的猜忌:
就这?就这?就这???
昨天,OpenAI 的 CEO 奥特曼高调晓谕了 OpenAI 将会从今天运转开启一个为期 12 天的怒放日步履,声称接下来每个责任日齐会有一次直播,本色会包括新品发布或演示、一些大型步履和一些 “ 圣诞礼物 ”。
自打 9 月份发布了 o1 模子之后, OpenAI 憋了快一个季度莫得新的大看成了,原本以为是要 “ 连开七天春晚 ” 的节拍,剪辑部依然作念好 “ 露出熬夜 12 天挑战 ” 的准备。
限度,刚刚兑现的本轮步履第一场直播,15 分钟就草草完毕了,不错说是OpenAI 过往直播发布会里最没趣的一集,有一种被奥特曼耍了的嗅觉。。。
这即是 12 天超长步履的强度吗?也太低了吧???
好了,发完悔怨,照旧跟环球先容一下这场发布会的本色,天然短,但也照旧有一定灵验信息。
最初,o1 十足体模子郑再版上线,同期还推出了一个 o1 Pro 模子况且相应推出了 ChatGPT Pro 订阅以及高档语音功能,相较于之前 Plus 订阅 20 好意思元每月的价钱,Pro 订阅高达 200 好意思元每月,不外不错不限次使用 o1 Pro 模子和高档语音功能,也算是量大管饱了。
而在模子效劳上,官方纸面数据其实并莫得终点大的飞跃性提高。。。
为什么这样说呢,因为凭据官方给出的跑分数据,o1 郑再版模子的智商仅在数学和编程方面有较大的提高,但在博士级别问题的提高上相配小,新推出的 o1 Pro 版块也仅在各方面比 o1 郑再版模子提高了极少点。

要知谈,o1 模子发布时主打的即是能在博士级别的复兴中有出色发扬,限度郑再版和 Pro 版在这方面比拟预览版基本莫得什么提高,亦然有些让东谈主盼愿破灭的。
知危剪辑部之前找过清华、北大、南京大学的三个博士测试评价过 o1 预览版模子,三位博士暗示 o1 如实在念念维和常识储备上达到了博士的水准,但无法对课题进行探索和提供更深的方案念念路,是以并莫得真的达到 “ 作念学术 ” 的水平。
当今是深宵咱们没目标筹商之前的博士进行测试,不外从官方公布的只是 5 分的提高上来看,预计效劳体感应该不会有什么较大永别,数据是骗不了东谈主的。
不外,天然模子的复兴智商提高未几,然则模子的体验照旧提高很大的,o1 郑再版模子的紧要失误犯错率比 o1 预览模板少了约 34%,同期复兴速率提高了约 50% 。
直播现场对比发问了 “ 列出二世纪的罗马天子,包括他们的技能和配置 ” 这个问题,o1 郑再版给出复兴用时仅有 14 秒,比 o1 预览版的 33 秒快了近 20 秒,体感差距照旧很大的。

而在复兴的可靠性上,为了更显然的对比,OpenAI 弃取了 “ 4/4 可靠性 ” 测试,具体来讲即是:仅当模子在四次问答中四次齐粗略正确复兴问题,才被合计是搞定了该问题。
在 “ 4/4 可靠性 ” 测试的评分上来看,o1 郑再版在各个规模齐比预览版有显赫的可靠性提高,同期 Pro 版比郑再版也有较大提高。

除了体验上的提高,还有交互上的提高,o1 郑再版模子当今复古多模态输入了,你不错通过图+翰墨的形式向模子进行发问。
在直播现场,OpenAI 团队画了一张 “ 天际数据中心 ” 草图,并让 o1 模子复兴图中形式给 GPU 散热的散热器面积表面上应该需要多大,况且复兴是时要议论到 “ 奈那儿理太阳和深空的影响?” 以及 “ 热力学第一定律在其中奈何阐扬作用?” 这两个问题。

o1 仅用 10 秒就复兴了这个问题,他相配奢睿的捕捉到了图中的 1GW 的输入功率元素,这是一个要津信息,同期指出了系统只可通过热放射散热。
与此同期,责任主谈主员在发问时挑升遁入了一个信息,那即是悉数系统的平常责任温度应该是些许,但 o1 模子我方奢睿的界说了系统应该在 300K 也即是 27 摄氏度的环境下责任,进而运转估算散热板所需要的面积。

图中复兴的大约翻译:所需的散热器面积对散热器的均衡温度高度敏锐。较低的散热器温度意味着每单元面积的放射量减少,因此需要更大的面积。而较高的散热器温度则不错减少所需面积,但可能加多工程复杂性(因为需要使用粗略承受更高温度且仍保合手高放射率的材料)。
为了诠释问题,咱们弃取一个相对适中的散热器温度,举例 T = 300 K(约27°C),这是电子确立或冷却轮回系统温度的一个合理上限。这将为咱们提供一个基准值。在策划面积下限时,咱们假定莫得寄生热负荷,况且系统处于渴望条目。
(注:如若允许系统运行在更高温度,所需面积会减少。咱们将在 300 K 下进行一个示例策划,并诠释温度变化奈何影响面积需求。)
合座来说,此次发布的东西天然莫得环球盼愿中的那么好,环球盼愿的 Sora 郑再版、GPT-5、AI 搜索浏览器等家具齐莫得出现,但好在郑再版 o1 和 o1 Pro 也强迫说得夙昔。
不知齐背面剩下的 11 场直播本色会不会遮盖到环球盼愿的东西,搞不好 OpenAI 想压轴在附进圣诞节的时辰给环球来个圣诞惊喜也没准~
哦,对了还有一件事情漏掉了,那即是因为 o1 Pro 模子的念念考深度比 o1 要高,耗时会更长,是以为了用户体验,OpenAI 给模子加入了一个复兴经由条,这样作念不错相配灵验的缓解用户在恭候复兴时辰的心焦。




(转自:知危)

背负剪辑:李桐