| | | | Together with | | |  |
|
|
|
|
|
|  | Anthropic 和 Google DeepMind 執行長在 G7 閉門會議中提案,由美國主導成立 AI 聯盟,透過嚴格管制 frontier models 和晶片等資源,全面阻斷中國參與 AI 發展的機會。 | 巨頭推動美國制定規則:Dario Amodei 和 Demis Hassabis 建議由美國帶頭,決定全球的 AI 標準和規範。 嚴格管控模型與硬體:聯盟計畫從結構上限制 frontier models 以及晶片等關鍵零件的取得管道,直接把中國排除在外。 防堵獨裁政權拿來用:這項基於國家安全的戰略提案,等於把 AI 競爭直接升級成高科技冷戰。
| G7 其他國家支持這個提案嗎? 加拿大總理 Mark Carney 已經表態同意讓美國主導;法國總統馬克宏也預告,九月會聯合幾個民主國家建立合作平台並宣布新規則,避免先進技術落入獨裁政權手裡。 |
|
|
|
|
ADVERTISING 讓 {{active_subscriber_count}}+ 位讀者認識你的產品 | 《Brief AI 電子報》讀者近 50% 擁有碩士以上學歷、管理階層超過 40%。超過 30 家國內外知名品牌合作,例如:Intel、數位時代、知識衛星... | 看看合作方式 |
|
|
|
|  | Vercel 開源了用檔案目錄結構來定義 Agent 的框架 eve,讓開發者不用再自己處理底層架構,寫完就能直接上線。 | 像寫 Next.js 一樣:一個 TypeScript 檔當工具,一個 Markdown 檔當技能,eve 會自動把它們交給模型用。 內建沙盒與中斷機制:Agent 寫的程式碼會被關在獨立沙盒裡跑,除了支援對話中斷重啟,也能設定特定動作要等人工確認才能繼續。 一行指令接通訊軟體:只要下一行指令,就能讓同一個 Agent 直接跑在 Slack 或 Discord 上,也能透過 MCP 伺服器接外部資料。
| 如果任務太複雜,eve 可以讓 Agent 把工作分派出去嗎? 可以,eve 支援在目錄裡建立 Subagents,每個 Subagent 都有乾淨的上下文、專屬工具和沙盒;主 Agent 可以像呼叫一般工具那樣把工作發包給它們,做完再接收結果。 |
|
|
|
|  | Z ai 剛推出的 GLM-5.2 在 Artificial Analysis 拿到 51 分,超越 DeepSeek V4 Pro 和 MiniMax-M3,是目前評測表現最好的開源模型。 | 代理與推理能力明顯變強:它在測試真實世界任務的 GDPval-AA v2 拿到 1524 分,不只贏過全部開源模型,表現還跟 GPT-5.5 (xhigh)差不多,而且在 CritPt 和 HLE 等科學推理測驗也有雙位數的進步。 參數沒變但支援百萬上下文:總參數和活躍參數維持跟上一代一樣的 744B 與 40B,不過上下文視窗從 20 萬擴展到了 100 萬 token。 輸出較長但單次任務很划算:它解一次任務平均會花 43k 個輸出 token,裡面有 37k 是在做推理,雖然 token 用得比同級對手多,但單次任務平均只要花 0.46 美元,花費還是同級裡最低的。
| 既然它每次任務用掉的輸出 token 比對手多,為什麼跑起來成本反而比較低? 因為 GLM-5.2 的 API 輸出定價很低,每 100 萬個輸出 token 只要 4.4 美元。所以就算它要花比較長的推理過程來解題,換算下來的單次任務總花費,依然是同級模型裡面最低的。 |
|
|
|
| | GPT-5.4 搭配 Molecule.one 的自動化實驗室,從讀文獻、提假設到分析數據,成功找出提高 Chan-Lam coupling 產率的新配方。 | AI 包辦核心推理工作:GPT-5.4 負責回顧文獻、產生並排序研究提案、設計實驗以及分析結果,證明模型已經能支援完整的科學研究流程。 系統自動執行上萬次測試:Maria AI 實際跑了 10,080 次實驗,確認加入 TEMPO 這個氧化劑後,能讓 88% 的測試硼酸和 83% 的磺醯胺產率顯著提升。 人類轉向負責把關跟驗證:化學家負責引導研究方向、挑選要進實驗室測試的提案,最後再親自重做 14 組關鍵實驗來確認結果,整個專案只花了兩個半月。
| 這代表 AI 已經可以獨立做完整個化學研究了嗎? 不是,人類化學家還是要負責決定大方向、挑選最終要測試的提案、修正實驗細節,最後還要親手重做實驗來驗證結果,在整個過程中扮演監督把關的角色。 |
|
|
|
| | 開發者利用 GPT-Realtime 2 的 Tool Calls 功能寫了一套語音控制系統,不管是上網查資料、寫 Obsidian 筆記還是剪 Premiere 影片,都能直接用講的。 | 真的能幫你動手:它不只是語音助理,在對話中觸發 Tool Calls 後,它就能自己打開瀏覽器搜尋,還能靠視覺能力看懂畫面並點擊網頁連結。 透過 MCP 取得軟體權限:只要把 Obsidian 這種支援 MCP 的軟體連上本地端,AI 就能拿到完整權限,讓你用語音直接新增、讀取或修改筆記。 靠無障礙樹控制專業軟體:碰到 Premiere Pro 這種沒 API 的軟體,系統會去讀取 macOS 的無障礙樹(Accessibility Tree)來辨識畫面按鈕,再搭配開源工具 Agent Desktop 讓 AI 實際去點擊跟剪輯。
| 讓系統隨時聽指令的話,API 費用跟操作延遲可以接受嗎? 如果麥克風一直開著串流,API 費用會暴增。開發者的作法是設定 Push-to-talk(按鍵發話),有按快捷鍵才連線錄音,把每次指令的成本壓到幾美分,不過實際跑動作的時候還是會有一點延遲,沒辦法像自己用滑鼠點那麼即時。 |
|
|
|