Br!ef AI 電子報
 
Together with
 
monday.com logo

NEWS
OpenAI 買下 Ona 升級 Codex

Weekly Ona agent sessions chart

OpenAI 買下雲端環境新創 Ona,以後 Codex 可以在雲端獨立跑好幾天的複雜任務,企業也能更放心地把AI 代理(Agents)放進自家系統用。

  • 筆電關掉繼續跑:整合 Ona 後,Codex 不用綁在單機上,可以在安全的雲端環境持續工作幾個小時甚至幾天。

  • 企業能完全控管:Ona 讓 AI 代理直接在企業自己的雲端環境運作,不管資料邊界還是活動紀錄都能自己掌握,解決資安疑慮。

  • 迎戰對手 Anthropic:OpenAI 最近買了幾家公司來保持領先,現在 Codex 每週活躍用戶已經破 500 萬,比之前成長了四倍

對不會寫程式的知識工作者有差嗎?雖然 Codex 一開始是做給工程師用的,但現在已經擴展到幫一般人處理複雜工作。以後 AI 代理可以在雲端幫你把簡報或流程圖做到好,你只要負責下指令跟看結果就好。

ADVERTISING
讓 {{active_subscriber_count}}+ 位讀者認識你的產品

《Brief AI 電子報》讀者近 50% 擁有碩士以上學歷、管理階層超過 40%。超過 30 家國內外知名品牌合作,例如:Intel、數位時代、知識衛星...

看看合作方式

LAUNCH
Claude 代理支援排程與金鑰保護

Claude Managed Agents scheduled deployments and environment variables

Anthropic 為 Claude Managed Agents 推出定時排程環境變數功能,讓開發者不用再自己維護基礎設施,就能讓 AI 代理安全地自動跑任務。

  • 設定排程取代自建基礎設施:只要設好 cron 排程,代理就會在時間到時自動開啟新的工作階段跑任務,團隊不用再自己架設和維護排程伺服器

  • 網路邊界注入防止金鑰外洩:代理沙盒裡只會放佔位符,真實 API 金鑰只在連到白名單網域時才補上去,就算遇到提示詞注入也不會洩漏金鑰。

  • 整合 CLI 解鎖網頁瀏覽能力:透過環境變數安全地連接 Browserbase 等指令列工具,讓託管代理第一次具備上網瀏覽與互動的能力。

這些新功能需要額外付費嗎?不用,Anthropic 不對排程與金鑰庫等基礎設施另外收費,只照原本 Claude Platform 的使用量計費;對比 OpenAI 預計在 2026 年 7 月對工作區代理實施的浮動點數計價,Claude 的成本計算比較單純

CHART
Claude Fable 5 橫掃三大榜

Claude Fable 5 ranked #1 in Code Arena Frontend

Anthropic 的 Claude Fable 5 在Code、Text 和新的 Agent 榜單全部拿到第一,高任務成功率證明它很能處理真實的工作任務

  • 實際工作成功率居冠:在需要用網頁搜尋操作檔案和終端機的 Agent Arena 裡,Fable 5 的任務成功率跟好評度都大幅拉開跟 GPT-5.5 還有 Opus-4.8 的差距。

  • 程式與文字全面領先:它不只拿下 Text 總榜第一,連前端(HTML、React)、困難提示創意寫作跟多輪對話這些分類也全都是冠軍。

  • 能力強但難以糾正:它最大的弱點是「可引導性」只排第 17 名,萬一遇到它不會做或不想做的任務,使用者很難硬把它的方向拉回來

新的 Agent Arena 榜單是怎麼評估 AI 的?他們不看傳統的兩兩投票,而是用「因果追蹤」去跑幾百萬筆真實紀錄,看大家怎麼讓 AI 寫程式、除錯或查資料。評分主要看任務有沒有成功、會不會幻想出不存在的工具、終端機出錯能不能自己救回來等五個實際指標,來判斷 AI 在真實工作場景的表現。

RESEARCH
Recursive AI 自主研究破紀錄

NanoChat Autoresearch: best validation BPP over wall-clock time

Recursive 發布能自己想點子、寫程式、跑實驗跟驗證的自動化 AI 研究系統,且在三個效能測試中打破人類專家的紀錄。AI 已經能實際解決底層架構和最佳化的問題,將來可以大幅降低 AI 的訓練與運算成本

  • 自主拼出新架構:在 NanoChat 挑戰中,AI 自己找出把 Hash table 加進注意力機制的解法,花比人類社群少1.3 倍的訓練時間就達到一樣的成果

  • 訓練速度突破極限:NanoGPT Speedrun 這個項目被人類專家最佳化了兩年,但 AI 透過改動 FP8 精度和最佳化器,把訓練時間從79.7 秒縮短到 77.5 秒

  • 深入最佳化 GPU 底層運算:在 SOL-ExecBench 測試裡,AI 證明自己能幫 GPU 寫底層的 Kernel 程式,把跟硬體效能極限的差距縮小了 18%

AI 自己做研究時會不會為了拿高分而作弊?會。Recursive 團隊表示目前最大的挑戰是「Reward Hacking」,AI 會去鑽測試機制的漏洞(例如把結果快取起來)來洗分數,而不是真的提升效能。所以系統的防護和檢查機制必須跟著升級,這是未來的一大重點。

INSIGHT
AI 正逐步瓦解跨國外包產業

Kaz Nejatian Opendoor India operations note

Opendoor 靠 AI 把單筆交易人力從 11 人縮減到 1 人,並關掉印度辦公室。背後的關鍵是,AI 極低的運作成本,開始打破過去企業依賴跨國薪水落差的外包模式。

  • 系統整合淘汰「人力膠水」:過去企業外包往往是因為內部軟體系統沒串好,需要大量海外人力手動搬資料或處理 PDF。當系統打通並全面導入 AI後,這種用來當潤滑劑的勞力需求就跟著消失。

  • 推論成本打破薪資優勢:印度外包產業靠的是歐美跟當地的薪水差距。現在 AI 執行相同流程的推論成本只要大約 400 美元,任何人工薪水都沒辦法競爭

  • 員工轉型 AI 管理員:未來公司不再需要純粹只管人的主管。留下來的員工會變成混合型工作者,日常核心工作變成下指令,並管理多個 AI Agents來完成任務。

那是不是所有營運工作都會被 AI 取代?不完全是。AI 最先吃掉的是那種重複、全數位化而且不用人在現場的規律性工作。未來能存活的職缺,會是那些「最靠近客戶端」,並且能結合AI、軟體與人類專業知識的高價值工作。