智快網 - 新科技與新能源行業網絡媒體

GPT-5.5凌晨發布,性能飆升引關注,Anthropic緊急應對競爭壓力

   發布時間:2026-04-25 09:54 作者:沈如風

OpenAI今日凌晨正式推出其最新智能體編程模型GPT-5.5,這款被團隊稱為"迄今為止最智能、最直觀易用"的模型,標志著人工智能在計算機輔助工作領域邁出關鍵一步。OpenAI首席執行官Sam Altman評價稱,該模型展現出"知道該做什么"的卓越判斷力。

在核心性能方面,GPT-5.5在智能體編碼、計算機操作、知識型工作及早期科學研究等需要跨上下文推理的領域表現尤為突出。第三方評估機構Artificial Analysis的智能指數顯示,該模型在10項關鍵評估中綜合排名第一,特別是在Terminal-Bench Hard、GDPval-AA等復雜任務測試中領先同類產品。值得注意的是,其運營成本僅為前沿編碼模型的一半,展現出顯著性價比優勢。

編程能力是此次升級的最大亮點。測試數據顯示,GPT-5.5在代碼編寫、調試及多工具協同等維度全面超越Gemini 3.1 Pro,在專業任務處理和抽象推理測試中多數指標優于Claude Opus 4.7。實際案例中,開源項目Claude Engineer創始人Pietro Schirano利用該模型在20分鐘內完成代碼差異對比、分支創建及完美合并,更成功生成操作流暢的3D射擊游戲,所有圖形均通過Three.js實時渲染。

知識工作場景下,GPT-5.5展現出強大的自主操作能力。在未經提示優化的客服測試中取得98%的準確率,在真實計算機操作測試OSWorld-Verified中達到78.7%的完成度。OpenAI財務團隊使用該模型處理24771份稅務表格時,通過自動化流程節省了兩周工作時間。更引人注目的是,波蘭數學家Bartosz Naskr?cki僅憑單條提示詞,就在11分鐘內構建出能可視化二次曲面交線的代數幾何應用。

科學研究領域同樣取得突破性進展。在遺傳學基準測試GeneBench中,GPT-5.5相比前代模型有顯著提升,在生物信息學評估BixBench中領先所有已公布模型。該模型能協助研究人員完成從假設檢驗到成果產出的全流程工作,包括反復審閱稿件、壓力測試技術論證、協同處理多格式文檔等復雜任務。

安全防護體系經過全面強化,OpenAI通過與內外紅隊合作,針對高級網絡安全和生物技術能力增加專項測試,并收集近200個早期合作伙伴的實際使用反饋。在保持與GPT-5.4相當的響應延遲同時,新模型通過優化token使用效率,在相同任務中消耗的資源顯著減少。

商業應用方面,GPT-5.5提供兩個版本:標準版定價為每百萬輸入token 5美元、輸出token 30美元;Pro版定價為每百萬輸入token 30美元、輸出token 180美元。該模型正逐步向ChatGPT和Codex的Plus、Pro、企業級用戶開放,API開發者可通過Responses API和Chat Completions API接入服務。此次發布恰逢競爭對手Claude Code性能爭議,Anthropic隨即宣布完成模型優化并重置用戶使用限制。

 
 
更多>同類內容
全站最新
熱門內容
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數碼群