天天摸天天做天天爽水多-天天摸夜夜摸夜夜狠狠摸-天天怕夜夜怕狠狠怕-天天拍天天射-天天干天天干天天插-天天干天天干天天干

首頁 > 實用技巧 > 干貨教程 > OpenAI推出全新推理模型o3、o4-mini,以及一個編程智能體

OpenAI推出全新推理模型o3、o4-mini,以及一個編程智能體

發布時間:2025-04-17 11:49:33來源: 13041198719

4月17日凌晨,OpenAI正式宣布推出目前OpenAI系列里能力最強的推理模型——o3模型和o4-mini模型。

去年12月,OpenAI就預熱過o3推理模型,當時強調的重點是o3模型在解決困難問題上的能力,要顯著強于OpenAI第一代推理模型o1。

而此次正式發布中,OpenAI不僅強調了o3模型在能力上的領先性,同時還強調了o3的Agent能力,且強調o3是第一代能夠在思維鏈中使用圖像進行推理的模型。

自主調用工具是Agent能力最重要的體現。OpenAI表示,曾看到o3為了解一個特別難的任務,連續調用了大約600次工具。

隨著OpenAI的O系列、DeepSeek R1等推理模型日趨成熟,業內普遍認為,只需一條指令即可完成整套任務的AI Agent能力將迎來顯著提升。

相比于Google,Anthropic等從去年就開始宣傳Agent能力,甚至已經開始推動MCP、A2A等Agent協議普及的公司,OpenAI之前在Agent能力上的布局相對缺失。而今天的發布,證明OpenAI在Agent能力上,仍然有自己的思考和布局。

OpenAI宣布, 從今天開始,Plus、Pro和Team用戶就可以使用o3模型和o4-mini模型了,接下來幾周還會推出o3-pro模型,替代過去的o1-pro模型。

在彩蛋環節,OpenAI還表示,未來將發布一系列編程工具,重新定義AI時代的編程,首發的是一個叫Codex CLI的開源輕量化編程agent。Codex CLI可以直接使用OpenAI的模型(最終包括o3和o4-mini),接管本地計算機終端命令行界面,直接進行代碼編寫和文件移動等等。

OpenAI的展示很有意念編程(vibe coding)的味道了:直接在網頁上截圖了一個別人編程好的效果圖,丟給Codex CLI,跟它說做一個html文件復現這個效果,并做一些改動。很快,Codex CLI就自己寫了代碼,調用了系統工具,復現出了一個類似的效果。

OpenAI今日的發布大致符合預期——o3和 o4-mini已經預熱多時,視覺推理與Agent能力也早已在其他公司的模型中有所體現。

不過,從今天的發布中仍能看出OpenAI在Agent等前沿方向上的布局節奏,以及將已有能力產品化的獨特能力。

OpenAI的模型迭代,也再一次重新肯定了后訓練Scaling Law的存在。目前看來,AI模型在接下來幾年,仍然會出現能力的快速進化,還未到達瓶頸。

OpenAI的Agent能力,目前更多的是調用自身的工具

OpenAI此次發布的一大亮點在于Agent的能力。最初的兩個展示都與工具調用能力有關。

第一個展示是研究員給了OpenAI一個十年前寫過的論文圖片,讓o3模型找到一個特定的結果,并和最新的研究成果進行比較。

o3模型首先利用內置的視覺推理能力,放大圖片,找到了研究員想要的特定結果,然后根據圖片中的內容進行推理,算出了論文推導的數值,然后使用搜索功能,查找了十篇論文,比較了最新研究成果與作者十年前論文的結果的區別,最后給出了自己的建議。

第二個演示是研究員問OpenAI,根據我的興趣,讀新聞,告訴我一些我可能感興趣的事情。

這個演示則利用的是OpenAI內置的記憶工具——OpenAI幾天前剛剛宣布OpenAI的模型目前有了可以訪問用戶全量記憶的能力。

o3模型先是訪問記憶后,找出用戶喜歡水肺潛水和彈奏音樂,然后利用搜索功能,找到了一條交叉兩條興趣的新聞:研究人員會錄下健康珊瑚礁的聲音,然后用水下揚聲器在海里播放這些聲音,以保護珊瑚。

最后o3模型使用了OpenAI的canvas工具和數據分析工具,生成了一個漂亮的博客界面,完成了任務。

可以看到,在OpenAI目前的布局當中,Agent能力更多的是調用OpenAI的內部工具。

不過,在基礎的工具調用能力水平存在的情況下,如果想要接入其他工具,似乎也并不是很難。OpenAI今年3月剛剛宣布接入MCP協議,為之后使用其他工具打下了基礎。

o4-mini 表現出色,RL的Scaling Law仍在起作用

雖然在去年12月OpenAI曾經預熱過o3模型的具體能力,這次正式發布,官方表示因為進行了「對推理成本和實用性做了大量優化」,在評測結果上,OpenAI表示可能會有差別。

在發布會直播中,OpenAI展示了幾組測試結果,o3模型和o4-mini模型在數學能力、代碼能力和多模態能力上都表現出色:

干貨教程更多>>

大眾朗逸現在還能不能購買?有多少優惠?哪個配置性價比最高? 前4月汽車產銷首超千萬輛,新能源車增勢與價格區間碾壓燃油車 雪鐵龍C3電動車:簡約而不簡單,城市通勤新選擇 雪佛蘭邁銳寶XL:轎跑范兒,高性價比,值得入手嗎? 紅旗天工06試駕:這智駕真給傳統車企長臉了! 25款添越加長版賓利旗下拿得出手的就是它 長安汽車母親節特別活動引爆重慶,巨型康乃馨+無人機秀演繹“硬核浪漫” 魏建軍回應長城為什么要造4.0T V8發動機 跨價格體驗,新哈弗H6的舒適亮點 福特車主看!行車記錄儀選購與使用攻略 福特EXP:設計前衛卻未能贏得市場的雙座轎跑 2025年4月轎車銷量排行榜!吉利星愿成功奪冠,日產軒逸排名第五 日產銷量4月份繼續下滑,4月銷售46295臺,下降15.7% 本田為何不在“馬路三大媽”的名單里?網友:那是有門檻的 豐田的中國式進化:一場由內而外的深度革命 比亞迪方程豹全新SUV車型“鈦7”諜照曝光,依舊硬派 為用戶帶來越級體驗 吉利銀河星耀8實拍簡評 北京奔馳自主打造的“車神一號”汽車人模型落地展出 寶馬股份公司申請為共乘乘客提供個性化車輛預設專利,可自動調節車輛設置 經典來襲!一汽奧迪集結金盞速度節演繹quattro高性能魅力 上汽發布全新MPV,酷似GL8!2.0T+8AT,7/9座可選,現款10萬 小鵬汽車拿下一季度新勢力國內/出海雙料銷冠:海外9國位列第一 理想發布L系列煥新版,李想:自研VLA時,公司踏入了人工智能無人區 蔚來渠道整合、極氪招合伙人,新局面下新勢力們的“收與放” 都是10萬內純電小車,吉利星愿和埃安UT誰更安全?對比后差距明顯 出海賣皮卡,廣汽的最后一招? 領克09這部車怎么樣,為什么性價比很高,但銷量不高 六座SUV大亂斗!15萬水桶車硬剛30萬豪車,誰才是家庭真香之選? 卡羅拉掀背版竟然也推出限量版本,搶到變身人生贏家? 破界·馭電—阿維塔06成都賽道試駕:性能與智能的雙重革命
主站蜘蛛池模板: 美女黄18 | 躁夜夜躁 | 乡村乱肉第19部全文小说 | 亚洲欧美另类日本久久影院 | 天天爽天天 | 国产性大片黄在线观看在线放 | 日韩在线观看高清 | 精品一区二区三区视频在线观看 | 欧美一级欧美三级在线观看 | 久久99精品久久久久久国产越南 | 丝瓜着色的视频 | www.色99| 天堂资源在线中文 | 久久综合久久综合久久综合 | 亚洲日本韩国在线 | 国产乱插 | 国产成人综合久久 | 国产黄色在线 | 久久手机精品视频 | 日日操操操 | 久久精品亚洲欧美日韩久久 | 日本在线不卡免 | 日韩网| 91av综合 | 91精品一区二区三区在线观看 | 在线不卡亚洲 | 欧美日韩在线国产 | 毛片无码国产 | 国产欧美日韩综合精品无毒 | 国产精品国内免费一区二区三区 | 日本午夜三级 | 午夜毛片视频高清不卡免费 | 人人爽人人爱 | 日韩欧美亚 | 日皮视频在线免费观看 | 国产日韩欧美综合在线 | 欧美激情视频网 | 小黄视频网站 | 亚欧在线一线 | 日韩欧美中文 | 精品久久久一二三区 |