🤖 Gemini Pro:用聲音和 AI 溝通?

PLUS:Llama 3 語言模型再更新!

本期電子報由 AI Tool Report 合作發布

AI Tool Report 是全英文的 AI 電子報

全球已經超過 550,000 位讀者訂閱

是我每天必讀的 AI 電子報之一

習慣閱讀英文資訊的讀者,千萬不要錯過了!

Learn AI in 5 Minutes a Day

AI Tool Report is one of the fastest-growing and most respected newsletters in the world, with over 550,000 readers from companies like OpenAI, Nvidia, Meta, Microsoft, and more.

Our research team spends hundreds of hours a week summarizing the latest news, and finding you the best opportunities to save time and earn more using AI.

TODAY’S MENU

  • 🗞️|Llama 3:語言模型再更新!

  • 🚀|Gemini Pro:用聲音和 AI 溝通?

  • 📊|Command R+:最佳的開放模型

  • 🧭|LayerNorm:用 C 語言訓練 LLM

  • 🔬|全新框架:個性化的圖像編輯!

  • 🔍|AI 的下一步將何去何從!

🗞️
NEWS

閱讀時間: 3 分鐘

今早 Meta 公布最新消息,將在未來一個月內推出全新的 Llama3 語言模型,提供使用者更加豐富與準確的回應。

Llama 3 擁有的高達 1,400 億 的可調參數,相較於前代 Llama2 僅有的 700 億,提升了約兩倍的數量。除此之外, Llama 系列模型都具有開源的特色,吸引許多開發者的青睞

然而,在 Meta 團隊內部也傳出了不同的聲音,Yann LeCun 便主張生成式 AI 有其局限性,應更加重視 JEPA 等各種模型訓練機器學習的方式。

🚀
LAUNCH

閱讀時間:2 分鐘

兩個月前,Google 開放了 180 個國家的使用者在 Google AI Studio 上使用 Gemini 1.5 Pro 模型進行訓練與部署,並累積破百萬次的應用。

近期,Gemini 1.5 Pro 迎來了重大更新,除了讓使用者能以圖片聲音的方式進行輸入外,更支援 JSON 檔案輸出,讓使用者能從結果中提取結構化的數據資料,以後續的分析

我相信這次的更新只是對 Gemini API 優化的開始,如果想探索更多,歡迎參考Gemini 官方技術手冊

📊
CHART

閱讀時間:2 分鐘

Chatbot Arena 是一個關於大型語言模型的排行榜,透過 BLEUROUGE 等指標,比較不同語言模型間的性能差異

而近期,Chatbot Arena 公布了最新排名,Command R+ 奪下第 6 名的位置,和 GPT-4-0314 不相上下,被視為當前最好的開源模型

從結果中,可以看到 Command R+ 等開源模型逐漸追上商業模型,除此之外,Qwen1.5-32B-ChatGemma-1.1-7B-it 等小型模型也展現出了強大的競爭力。

🧭
GUIDE

閱讀時間:8 分鐘

Andrej Karpathy 只透過大約 1,000 行程式碼就成功在 CPU/fp32 訓練 GPT-2

他先透過 PyTorch 手寫實現了 LayerNorm,然後再不使用其他框架(如 TensorFlow)的前提下,使用單純的 C 語言實現了相同的功能。

LayerNorm 是一種常用於 Deep Learning 中的技術,透過對樣本特徵的標準化,提升模型的訓練速度與穩定性

本文包含了更多的技術知識實踐過程,對於過去沒有接觸過 Deep Learning 的讀者可能會較有挑戰

🔬
RESEARCH

閱讀時間:3 分鐘

研究中提出了名為 SwapAnything 的全新框架,為使用者提供個性化的照片編輯功能,更能針對圖中的部分範圍進行微調

SwapAnything 也支持文字輸入,根據使用者的文字敘述進行照片的編輯,並確保背景細節的保留。

目前尚未展示該框架在不同領域的應用,希望能盡快看到 SwapAnything 被應用在視覺效果、娛樂等相關領域的實際案例。

🔍
INSIGHT

閱讀時間:9 分鐘

Ethan Mollick 表示,當前的大型語言模型平均在 5 至 14 個月就會完成一次更新,提供更有效率與準確的回應。除了知名的 GPT-4 外,Claude3Gemini 的能力不遑多讓。

AI 模型在特定領域,如辦論數據處理等,已經展現出超越人類的表現,隨著 AI Agent 的概念出現,未來將有機會看到 AI 作為員工與人類一起工作的場景。

作者也在文末補充,我們需清楚地了解 AI 的潛在好處與風險,並透過制定政策和法規,確保 AI 被用於社會的進步上。

⭐️ Br!ef 全新主題電子報
《Br!ef Crypto 電子報》3 分鐘掌握 Crypto 趨勢

平日為你整理當日最新加密貨幣資訊,獲取最重要的第一手區塊鏈知識最新 Crypto 新聞、 Crypto 領域深度觀點、最前沿的 Crypto 項目加入 1,000+ 位讀者,收到每日最新的 Crypto 電子報

Brief Crypto 電子報3 分鐘掌握最新的加密貨幣資訊!

🤝 商業合作 PARTNERSHIP
與 15,000+ 位知識工作者分享您的產品與服務

《Brief AI 電子報》是繁體中文圈最具影響力且成長速度最快的「AI 電子報」。讀者多為企業家、經理人、投資人、高階主管、工程師、分析師、創作者…等專業知識工作者。PARTNERSHIP 欄位協助企業品牌推廣產品、服務、活動、工作職缺...等等 👉 了解更多