Br!ef AI 電子報
 
Together with
 
Typeless logo

NEWS
AI 巨頭提議美國組聯盟排除中國

Anthropic CEO Dario Amodei at the G7 AI summit

Anthropic 和 Google DeepMind 執行長在 G7 閉門會議中提案,由美國主導成立 AI 聯盟,透過嚴格管制 frontier models 和晶片等資源,全面阻斷中國參與 AI 發展的機會。

  • 巨頭推動美國制定規則:Dario Amodei 和 Demis Hassabis 建議由美國帶頭,決定全球的 AI 標準和規範。

  • 嚴格管控模型與硬體:聯盟計畫從結構上限制 frontier models 以及晶片等關鍵零件的取得管道,直接把中國排除在外。

  • 防堵獨裁政權拿來用:這項基於國家安全的戰略提案,等於把 AI 競爭直接升級成高科技冷戰

G7 其他國家支持這個提案嗎?
加拿大總理 Mark Carney 已經表態同意讓美國主導;法國總統馬克宏也預告,九月會聯合幾個民主國家建立合作平台並宣布新規則,避免先進技術落入獨裁政權手裡。

ADVERTISING
讓 {{active_subscriber_count}}+ 位讀者認識你的產品

《Brief AI 電子報》讀者近 50% 擁有碩士以上學歷、管理階層超過 40%。超過 30 家國內外知名品牌合作,例如:Intel、數位時代、知識衛星...

看看合作方式

LAUNCH
Vercel 開源 eve 框架

Vercel eve agent trace and approval UI

Vercel 開源了用檔案目錄結構來定義 Agent 的框架 eve,讓開發者不用再自己處理底層架構,寫完就能直接上線

  • 像寫 Next.js 一樣:一個 TypeScript 檔當工具,一個 Markdown 檔當技能,eve 會自動把它們交給模型用。

  • 內建沙盒與中斷機制:Agent 寫的程式碼會被關在獨立沙盒裡跑,除了支援對話中斷重啟,也能設定特定動作要等人工確認才能繼續。

  • 一行指令接通訊軟體:只要下一行指令,就能讓同一個 Agent 直接跑在 Slack 或 Discord 上,也能透過 MCP 伺服器接外部資料。

如果任務太複雜,eve 可以讓 Agent 把工作分派出去嗎?
可以,eve 支援在目錄裡建立 Subagents,每個 Subagent 都有乾淨的上下文、專屬工具和沙盒;主 Agent 可以像呼叫一般工具那樣把工作發包給它們,做完再接收結果。

CHART
GLM 5.2 成為目前最強開源模型

Artificial Analysis GLM-5.2 Intelligence vs Cost per Task chart

Z ai 剛推出的 GLM-5.2 在 Artificial Analysis 拿到 51 分,超越 DeepSeek V4 Pro 和 MiniMax-M3,是目前評測表現最好的開源模型

  • 代理與推理能力明顯變強:它在測試真實世界任務的 GDPval-AA v2 拿到 1524 分,不只贏過全部開源模型,表現還跟 GPT-5.5 (xhigh)差不多,而且在 CritPt 和 HLE 等科學推理測驗也有雙位數的進步。

  • 參數沒變但支援百萬上下文:總參數和活躍參數維持跟上一代一樣的 744B 與 40B,不過上下文視窗從 20 萬擴展到了 100 萬 token

  • 輸出較長但單次任務很划算:它解一次任務平均會花 43k 個輸出 token,裡面有 37k 是在做推理,雖然 token 用得比同級對手多,但單次任務平均只要花 0.46 美元,花費還是同級裡最低的。

既然它每次任務用掉的輸出 token 比對手多,為什麼跑起來成本反而比較低?
因為 GLM-5.2 的 API 輸出定價很低,每 100 萬個輸出 token 只要 4.4 美元。所以就算它要花比較長的推理過程來解題,換算下來的單次任務總花費,依然是同級模型裡面最低的。

RESEARCH
AI 優化製藥化學反應

GPT-5.4 搭配 Molecule.one 的自動化實驗室,從讀文獻、提假設到分析數據,成功找出提高 Chan-Lam coupling 產率的新配方

  • AI 包辦核心推理工作:GPT-5.4 負責回顧文獻、產生並排序研究提案、設計實驗以及分析結果,證明模型已經能支援完整的科學研究流程

  • 系統自動執行上萬次測試:Maria AI 實際跑了 10,080 次實驗,確認加入 TEMPO 這個氧化劑後,能讓 88% 的測試硼酸和 83% 的磺醯胺產率顯著提升。

  • 人類轉向負責把關跟驗證:化學家負責引導研究方向、挑選要進實驗室測試的提案,最後再親自重做 14 組關鍵實驗來確認結果,整個專案只花了兩個半月

這代表 AI 已經可以獨立做完整個化學研究了嗎?
不是,人類化學家還是要負責決定大方向、挑選最終要測試的提案、修正實驗細節,最後還要親手重做實驗來驗證結果,在整個過程中扮演監督把關的角色。

INSIGHT
GPT Realtime 2 讓你用語音控制電腦

開發者利用 GPT-Realtime 2Tool Calls 功能寫了一套語音控制系統,不管是上網查資料、寫 Obsidian 筆記還是剪 Premiere 影片,都能直接用講的

  • 真的能幫你動手:它不只是語音助理,在對話中觸發 Tool Calls 後,它就能自己打開瀏覽器搜尋,還能靠視覺能力看懂畫面並點擊網頁連結。

  • 透過 MCP 取得軟體權限:只要把 Obsidian 這種支援 MCP 的軟體連上本地端,AI 就能拿到完整權限,讓你用語音直接新增、讀取或修改筆記。

  • 靠無障礙樹控制專業軟體:碰到 Premiere Pro 這種沒 API 的軟體,系統會去讀取 macOS 的無障礙樹(Accessibility Tree)來辨識畫面按鈕,再搭配開源工具 Agent Desktop 讓 AI 實際去點擊跟剪輯。

讓系統隨時聽指令的話,API 費用跟操作延遲可以接受嗎?
如果麥克風一直開著串流,API 費用會暴增。開發者的作法是設定 Push-to-talk(按鍵發話),有按快捷鍵才連線錄音,把每次指令的成本壓到幾美分,不過實際跑動作的時候還是會有一點延遲,沒辦法像自己用滑鼠點那麼即時。