焦點

o1滿血版泄露！奧數(shù)題圖片推理手拿把掐奧特曼劇透o2

字號+ 作者：下愚不移網(wǎng) 來源：綜合 2024-12-29 14:33:47 我要評論(0)

o1滿血版泄露了！沒想到，OpenAI還擱那兒“今年一定”呢，不少網(wǎng)友已經(jīng)率先上手體驗到了doge）。事情是醬嬸的：有網(wǎng)友發(fā)現(xiàn)，OpenAI已經(jīng)在ChatGPT官網(wǎng)上部署了完整

o1滿血版泄露了！血版泄露

沒想到，奧數(shù)OpenAI還擱那兒“今年一定”呢，題圖特不少網(wǎng)友已經(jīng)率先上手體驗到了（doge）。片推

o1滿血版泄露！奧數(shù)題圖片推理手拿把掐奧特曼劇透o2

事情是理手醬嬸的：有網(wǎng)友發(fā)現(xiàn)，OpenAI已經(jīng)在ChatGPT官網(wǎng)上部署了完整版o1，拿把大家伙兒還都能卡bug直接用！掐奧

最初發(fā)現(xiàn)此事的劇透網(wǎng)友，測試確認泄露模型具有奧特曼所說的血版泄露圖像推理能力。

△圖源：@legit_rumors

而日志也顯示該模型就是奧數(shù)o1本模。

于是題圖特，趕在OpenAI出手修復(fù)之前，片推網(wǎng)友們抓緊大玩特玩了一波——

滿血o1到底有多牛

和已經(jīng)發(fā)布的理手o1-preview、o1-mini最直觀的拿把不同是，泄露出來的掐奧o1支持上傳附件。

這也就意味著，終于能測測o1的多模態(tài)能力了。

網(wǎng)友們也不說廢話，直接上強度，普特南數(shù)學(xué)競賽的證明題截圖一貼，甩給滿血o1。

對正整數(shù)n，有fn(x)=cos(x)cos(2x)cos(3x)…cos(nx)。找出最小的n，使得|fn‘’(0)|＞2023。

思考了18秒之后，o1給出答案：18。

答案正確：

再來一道更復(fù)雜的，雖然在識圖上遇到了一點小問題，但還是穩(wěn)穩(wěn)做對了。

在如此驚艷表現(xiàn)之下，似乎正確識別人類史上首張黑洞照片也不算什么了（doge）。

不過嘛，也不是沒有翻車案例。比如，讓大模型數(shù)數(shù)圖里有多少個三角形。

ID為anagh的網(wǎng)友，給泄露模型和GPT-4o做了個同屏對比：4o速度很快，給出了錯誤答案19。

而滿血o1花了1分39秒，狂刷一堆token……給出了不同的錯誤答案：29。

正確答案是24。

這個bug現(xiàn)在已經(jīng)修復(fù)了。不過，有意思的是，這次模型泄露，持續(xù)了整整3個小時。

不小心還是故意的？

有網(wǎng)友犀利地點出，這事兒看上去不是“不小心”，而是“精心策劃”：

目的是讓人們對即將發(fā)布的模型有一個預(yù)期。

不少網(wǎng)友贊同這樣的觀點：

奧特曼的目的是測試和炒作。

而由于一切看上去已經(jīng)部署就緒，甚至有人猜測，o1完整版的正式上線時間就在未來一周之內(nèi)。

值得注意的是，就在這次泄露事件之后，奧特曼馬上在??上開始了自己的表演：

好家伙，都已經(jīng)吹上o2的風(fēng)了（還假裝上錯號……）。

至于為什么是這個時間……

那不得趕在Anthropic發(fā)布Claude Haiku 3.5之前搞點事嘛（doge）。

參考鏈接：

[1]https://x.com/legit_rumors/status/1852625385801859321

[2]https://x.com/koltregaskes/status/1852657291469709626

[3]https://x.com/anaghnairr/status/1852668741751919016

1.本站遵循行業(yè)規(guī)范，任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源；2.本站的原創(chuàng)文章，請轉(zhuǎn)載時務(wù)必注明文章作者和來源，不尊重原創(chuàng)的行為我們將追究責(zé)任；3.作者投稿可能會經(jīng)我們編輯修改或補充。