TODAY’S AI BRIEF
🗞️|Qwen 發佈「開源」推理模型
🚀|ElevenLabs 推出 GenFM 功能
📊|一張圖看:目前 AI Agents 發展
🧭|如何善用 Claude Styles 功能?
🔬|AI 比專家更能預測研究結果
🔍|4 小時能用 Google Gemini 做出什麼應用程式?

圖片來源:Qwen
阿里巴巴 Qwen 團隊最新推出「開源」推理實驗模型 QwQ-32B-Preview,測試表現媲美 OpenAI 推理模型 o1-Preview。
深度推理:透過逐步分解的方式推導答案,並自我檢討答案的正確性。
推理表現:數學、程式能力表現出色,但在其他領域仍有提升空間,測試表現與 OpenAI o1-Preview 接近。(參考上圖)
模型限制:目前版本處理複雜問題時,偶爾會陷入推理循環;回答時也可能混合不同語言。
實際測試:我在模型 Demo 中測試,發現確實偶爾會出現「推理循環」,但還是能正確回答;相同邏輯題目 GPT-4o 回答錯誤,o1-Preview 回答正確、速度更快。
出現開源:距離 OpenAI 推出「推理模型 o1-Preview」還不到 3 個月,就已經開始出現開源的版本,進步速度驚人。
🧰 TOOLS
AI 簡報工具 Gamma:把簡報交給 AI 做!

來自合作夥伴:Gamma
Gamma 是一款 AI 驅動的簡報工具,只需要不到一分鐘的時間,就能自動完成一份簡報、文件甚至是網頁!
你不再需要簡報模板
只需一鍵,就能重新設計整份簡報
能夠線上分享你的簡報,獲得數據分析
能在任何設備上分享:筆型、平板、手機
能夠嵌入任何内容:GIF、影片、圖表、網站
我自己也很常使用 Gamma,除了 AI 功能外,它能在簡報嵌入各種的內容真的非常方便,推薦還沒使用過 Gamma 的讀者,可以免費嘗試看看!
🚀 LAUNCH
ElevenLabs 推出 GenFM 功能生成 Podcast
AI 語音生成新創 ElevenLabs 在 ElevenReader iOS app 推出 GenFM 功能,用戶可以上傳內容生成 32 種語言的 Podcast。
支援上傳:YouTube 影片、PDF、文章、電子書,生成 2 位 AI 主持人的 Podcast。
擬真對話:增加語助詞、停頓、笑聲、呼吸聲,模仿人類之間的自然對話。
你能用在:瀏覽最新消息、聆聽書籍評論、課前準備、故事時間。
NotebookLM 競爭對手:這次推出的功能類似 Google 前陣子推出的 NotebookLM,不過 ElevenLabs 更進一步支援 32 種語言。
實際測試:中文語音還是很國外口音,但已經是能聽得懂的程度,我測試將上期電子報上傳生成 Podcast,你聽完再跟我分享想法!
你覺得效果如何?
📊 CHART
一張圖看:目前 AI Agents 發展

圖片來源:Large Language Model-Brained GUI Agents: A Survey
最近一篇研究深入探討了目前「LLMs 驅動的 GUI Agents」,其中一張圖可以清楚看到近年來 GUI Agents 的發展。
什麼是 GUI:圖形使用者介面(GUI)一直是人們操作電腦和軟體的直觀方式,例如:點擊按鈕、填寫表單等。
隨著 LLMs 的出現:這些模型開始能夠「理解自然語言」甚至「處理視覺元素」,因此開發出可以自動操作 GUI 的 AI Agents。
多步驟自動化:不需要我們手動完成操作,它們可以自動完成跨頁面、多步驟的任務。
應用廣泛:可以用於網頁瀏覽、手機應用互動、桌面軟體的操作等,讓我們和軟體的互動變得更簡單高效。
可以發現:近期各家公司都開始陸續推出 AI Agents,我猜明年很有機會看到像 ChatGPT 那樣突破的 AI Agents 產品出現。
🧭 GUIDE
如何善用 Claude 最新推出的 Styles 功能?

圖片來源:Anthropic
Claude 宣布推出「自訂風格 Choose Style」功能,讓你可以調整 AI 的回應方式,保存、重新使用自己喜愛的寫作風格。
3 種預設風格:正式(Formal)、簡潔(Concise)、說明(Explanatory)
自訂回應風格:能夠上傳範例,或是直接指定偏好語氣與結構。
可以做到:設定工作文件專業語氣、定義品牌文字風格、保存技術文件標準。
這部 10 分鐘教學影片:預設風格、如何創建自訂風格,如何使用這項功能節省時間的小撇步。
🔬 RESEARCH
AI 比神經科學專家更能有效預測研究結果

圖片來源:Large language models surpass human experts in predicting neuroscience results
最近英國倫敦大學的一篇研究發現:AI 比神經科學專家更能有效預測研究結果。
實驗設計:用 BrainBench 測試了 15 種 AI 和 171 位神經科學專家的能力,讓他們判斷研究結果是「真」還是「假」。
實驗結果:AI 的準確率 81%,專家只有 63%,特別是訓練過神經科學資料的「BrainGPT」更高達 86%。
關鍵發現:科學研究結果的規律比預期更容易被發現,而 AI 能有效利用這些規律來優化實驗設計。
🔍 INSIGHT
4 小時能用 Google Gemini 做出什麼應用程式?
這部影片很有趣,他們舉辦了一場網頁開發挑戰賽:要在 4 小時內,跟 Google Gemini 一起開發出一款關於「感謝」的應用程式。
他們 4 人只用 4 個小時就分別作出:
感謝卡生成工具:輸入寄件人和收件人資訊,使用 Gemini 生成卡片文字、圖片。
Hypedawg:在 VS Code 中加入一個動畫狗,能夠分析程式,並提供建議回饋。
#ThankADev 平台:搜尋 GitHub 專案,為每個軟體庫生成感謝信,並提供分享到 Twitter。
公開感謝平台:讓用戶創建私人或公開的感謝信,並將其儲存至資料庫。
雖然他們 4 人本來就是開發者,但都認為 Google Gemini 能有效提升開發效率,特別是在生成程式、內容方面。
🤝 ADVERTISING
與 15,000+ 位讀者分享你的產品與服務
《Brief AI 電子報》讀者近 50% 擁有碩士以上學歷;管理階層超過 40%,資深職員超過 30%;來自國內外多間知名企業…





