<rt id="ogeyi"><tr id="ogeyi"></tr></rt>

<label id="ogeyi"></label>

<label id="ogeyi"></label>

<fieldset id="ooooy"></fieldset>

<fieldset id="ooooy"></fieldset>

<fieldset id="ooooy"><table id="ooooy"></table></fieldset>

<tfoot id="ooooy"><input id="ooooy"></input></tfoot>

o3-pro正式推出！說聲“嗨”就花了80美元思考1 1用時16分鐘

2025-06-12 15:00:28 分類：新聞統(tǒng)計中...

OpenAI深夜放大招，正式推出“最新最強版”推理模型o3-pro！

而且同一時間，o3模型降價80%不降智。

官方測評結(jié)果顯示，在專家評估中，所有人一致更偏愛o3-pro而非o3的回答。

此外，o3-pro也一舉超越o3、o1-pro，成為當前最擅長數(shù)學、科學和編程的OpenAI模型。

OpenAI CEO奧特曼也第一時間激動表示：

這真是太聰明了！我第一次看到它相對于o3的勝率時，簡直不敢相信。

目前o3-pro已取代o1-pro，面向ChatGPT的Pro和Team用戶開放，Enterprise和Edu用戶將在下周獲得使用權(quán)限。

而對開發(fā)者來說，o3-pro已經(jīng)可以通過API接入：

每百萬輸入tokens收費20美元（約合人民幣143元），每百萬輸出tokens收費80美元（約合人民幣574元）。

有多貴呢？

溫馨提醒，據(jù)稱一句簡單的“嗨”就花了網(wǎng)友80美元（doge）。

或許OpenAI也意識到這個價格確實有點貴，所以另一邊趕緊宣布o3降價80%。

o3降價80%不降智

官網(wǎng)顯示，o3的最新API價格如下：

每百萬輸入tokens收費2美元，每百萬輸出tokens收費8美元。

對比o1-pro下降了80%以上，不僅是o3-pro的1/10，而且和GPT-4o（每百萬輸入/輸出分別為2.5美元和10美元）基本持平。

至于降價原因，明面上的說法是OpenAI對推理服務架構(gòu)進行了全面優(yōu)化。

就是說，雖然o3和o3-pro底層模型相同，但由于推理更高效，所以價格自然就下調(diào)了。

不過，就在奧特曼對這一價格“沾沾自喜”時，關(guān)于o3“是否真的沒有降智”卻陷入了爭議。

網(wǎng)友們也是相當直白，在奧特曼這條推文底下直接表達了懷疑：

甚至有博主以親身經(jīng)歷（暫無法確定真實性）出來發(fā)聲，認為o3在實測中變笨了。

OpenAI降價并非出于慈善……

然而這一說法也遭到了其他網(wǎng)友的反駁，總體來看目前對峙雙方并未就這一爭議拿出實質(zhì)性證據(jù)。

雖然爭議尚未討論出具體結(jié)果，但一些關(guān)于o3-pro的測試結(jié)果已經(jīng)新鮮出爐。

和開頭所提一致，官方在更嚴格的“4/4可靠性”評估中也驗證了o3-pro尤為擅長數(shù)學、科學和編程。

p.s. 這項評估需要o3-pro在四次嘗試中（而不僅僅是一次，pass@1）正確回答問題~

不過官方也多次提醒，由于o3-pro可以使用工具，因此響應時間通常比o1-pro更長。

我們建議將其用于對可靠性要求更高的棘手問題，等待幾分鐘是值得的。

這也和一眾網(wǎng)友實測下來的感受相符，o3-pro確實變強了，能夠解決一些其他模型無法答對的問題，不過由于響應變慢，價格也是真貴。

HyperWriteAI CEO讓它思考“1 1=？”，結(jié)果往往需要耗時1分鐘以上（第一次問甚至用時16分鐘）。

當然，這也恰好代表了o3-pro的錯誤打開方式。

不論是官方建議還是一些好的網(wǎng)友實測結(jié)果，都說明o3-pro更適合挑戰(zhàn)一些有難度、有價值的問題。

賓大教授Ethan Mollick分享了一個其他模型都曾鎩羽而歸的問題：從“SPACE”到“EARTH”制作一個單詞階梯。

這個游戲需要模型從“SPACE”到“EARTH”，每次只改變一個字母，單詞真實有效且長度不變（右側(cè)為解釋“為什么這是一個合法的英語單詞”）。

而o3-pro成功完成了挑戰(zhàn)，并且這不是模型通過聯(lián)網(wǎng)搜索得到的答案（即通過推理得到）。

另一位生物醫(yī)學科學家也分享了與o3-pro合作開發(fā)免疫系統(tǒng)的例子。

作為對比，他也向o3提出了同一任務（要求先識別出人類天然免疫系統(tǒng)的關(guān)鍵局限性），結(jié)果表明o3-pro更勝一籌。

o3列出的前五個問題雖然強調(diào)了類似的重要問題，但后兩個問題無需徹底重構(gòu)免疫系統(tǒng)即可解決。

相比之下，o3-pro不僅提出了更多限制，而且它所指出的每一個限制都是極其關(guān)鍵、內(nèi)在的問題，需要徹底重構(gòu)。

整體而言，通過ARC-AGI測試結(jié)果可以看到，o3-pro在高難任務上表現(xiàn)略好，但提升幅度不大，且成本隨難度上升。

p.s. 這項測試主要考驗AI在面對新問題時的抽象推理和問題解決能力~

奧特曼發(fā)小作文

這是我最后一次在沒有任何人工智能幫助的情況下寫這樣的文章了。

有意思的是，同一時間奧特曼也火速發(fā)了一篇小作文——

題目為《The Gentle Singularity（溫和的奇點）》，來探討AI發(fā)展對人類社會的影響。

其主要觀點包括下面這些：

1、2025年，我們迎來了能夠真正進行認知工作的智能Agent，編寫計算機代碼的方式將徹底改變。2026年，我們很可能會看到能產(chǎn)生原創(chuàng)見解的系統(tǒng)；2027年，或許會出現(xiàn)能在現(xiàn)實世界中執(zhí)行任務的機器人。

2、到了2030年代，智慧和能源——即想法及實現(xiàn)想法的能力——將變得極其豐富。這兩者長期以來一直是人類進步的基本限制；如果智慧和能源變得充足（加上良好的治理），理論上我們可以實現(xiàn)一切。

3、隨著數(shù)據(jù)中心的生產(chǎn)逐漸自動化，智能的成本最終應該會接近電力成本。（很多人關(guān)心ChatGPT每次查詢用多少能量；平均每次查詢大約耗電0.34瓦時，大概相當于烤箱運行一秒多一點，或高效燈泡使用幾分鐘。此外，每次查詢大約用水0.000085加侖，約等于十五分之一茶匙。）

4、相比AI，人類有一個長期且重要的優(yōu)勢：我們天生在意他人，以及他人怎么想、怎么做，而對機器卻沒什么感情。

5、從相對論的角度看，奇點是一點點發(fā)生的，融合是逐步進行的。我們正攀登那條技術(shù)指數(shù)增長的長弧線；向前看總覺得是陡峭的垂直，向后看則像是平緩的線，但其實它是一條平滑的曲線。（回想2020 年，如果那時我們說2025年會接近 AGI，聽起來會很瘋狂，但對比過去五年所發(fā)生的一切，也許現(xiàn)在的預測不那么瘋狂了。）

6、我們（整個行業(yè)，不只是OpenAI）正在為世界構(gòu)建一個大腦，它的極限將取決于我們的好點子。

7、OpenAI如今做的事情很多，但最根本的身份仍是一個超級智能研究公司。

BTW，奧特曼最新推文有透露，原計劃中的公開權(quán)重模型要推遲了。

嗯，又一個期貨（doge）~

完整小作文地址如下：https://blog.samaltman.com/the-gentle-singularity

參考鏈接：

[1]https://x.com/OpenAI/status/1932530409684005048

[2]https://x.com/OpenAIDevs/status/1932532777565446348

[3]https://x.com/aidan_mclau/status/1932507602216497608[4]https://x.com/sama/status/1932547247243505924

鄭重聲明：本文版權(quán)歸原作者所有，轉(zhuǎn)載文章僅為傳播更多信息之目的，如作者信息標記有誤，請第一時間聯(lián)系我們修改或刪除，多謝。

標簽：

相關(guān)文章閱讀

余華英的三個子女現(xiàn)狀余華英的四個女兒在法庭上
什么是抑郁癥軀體化_什么是抑郁癥軀體化
大連60歲老人免費坐公交嗎_大連60歲憑老年證可以免費乘車嗎
緬北地下奶廠是真的嗎_緬北牛奶工廠是真的嗎

主站蜘蛛池模板：国产成人精品综合| 久久综合九色综合精品| 狠狠色狠狠色综合系列| 亚洲国产成人精品无码久久久久久综合| 久久桃花综合桃花七七网| 国产精品国产色综合色| 伊人激情久久综合中文字幕 | 麻豆久久婷婷五月综合国产| 久久综合亚洲色hezyo| 国产精品综合第五页| 69国产成人综合久久精品| 亚洲狠狠爱综合影院婷婷| 一本色道久久综合亚洲精品蜜桃冫| 色噜噜狠狠色综合中国| 狠狠色狠狠色综合日日不卡| 亚洲妓女综合网99| 色综合中文综合网| 国产AV综合影院| 综合五月激情二区视频| 婷婷五月综合缴情在线视频| 狠狠色噜噜色狠狠狠综合久久| 国产亚洲综合视频| 狠狠综合视频精品播放| 久久婷婷是五月综合色狠狠| 亚洲狠狠成人综合网| 色综合久久最新中文字幕| 亚洲综合自拍成人| 色综合久久久久网| 亚洲av综合日韩| 国产成人综合日韩精品婷婷九月| 国产成人综合精品| 久久综合给合综合久久| 国产亚洲综合久久系列| 激情综合婷婷丁香五月| 色婷婷综合久久久久中文一区二区 | 久久综合精品不卡一区二区| 国产精品综合久久第一页| 国产精品综合第五页| 亚洲五月激情综合图片区| 2020国产精品亚洲综合网| 国产成人综合精品|

<ul id="ksguq"></ul>

<ul id="ksguq"></ul>

<strike id="ksguq"><menu id="ksguq"></menu></strike>

<del id="ksguq"><sup id="ksguq"></sup></del>