🤖 最新中文 AI 影片生成模型 Vidu

PLUS:4 個與 Gemini 有效對話的方法

TODAY’S MENU

  • 🗞️|Apple 即將與 OpenAI 合作

  • 🚀|Vidu:中文 AI 影片生成模型

  • 📊|近兩年的人形機器人比較

  • 🧭|4 個與 Gemini 有效對話的方法

  • 🔬|讓 AI 模型一點一點來思考

  • 🔍|Mustafa Suleyman:AI 到底是什麼?

🗞️
NEWS

閱讀時間:2 分鐘

根據 Bloomberg 最新的報導,Apple 正在與 OpenAI 進行協商,希望能透過 OpenAI 的技術來設計下一代的 iOS18

Apple 在上個月公布 WWDC 2024 的舉辦時間,許多外國媒體正在猜測,Apple 將在今年的發表會上,公布全新的 AI 應用與服務,或許我們會有機會看到 Apple GPT 的出現 XD

除了 OpenAI 外,Apple 也曾與 Google 討論過 Gemini使用授權,但無論最後與誰進行合作,透過這些 AI 公司的幫忙,將能大幅加速 Apple 在生成式 AI 上的應用發展。

🧰
TOOLS

合作夥伴:Anyword

Boost Your Marketing Performance with Anyword

Trusted by over 1M marketers, Anyword's AI generates optimized content trained on your marketing channels, with predictive scoring for any copy, channel, and audience – so you don’t have to guess what content will perform best.

Anyword 已經超過 100 萬位行銷人員使用,透過學習你的行銷方式,自動生成優化內容,告訴你哪些內容會有更好的表現,幫助你更有效地推廣產品、服務

🤝 商業合作 PARTNERSHIP
與 15,000+ 位知識工作者分享您的產品與服務

《Brief AI 電子報》是繁體中文圈最具影響力且成長速度最快的「AI 電子報」。讀者多為企業家、經理人、投資人、高階主管、工程師、分析師、創作者…等專業知識工作者。協助企業品牌推廣產品、服務、活動、工作職缺...等等 👉 了解更多

🚀
LAUNCH

閱讀時間:3 分鐘

生數科技上周公布全新的生成模型 Vidu,被視為 OpenAI AI 影片生成模型 Sora 的競爭對手,同時,這也是中國首個一鍵生成長達 16 秒、高達 1080P 畫質的影片模型。

Vidu架構結合了目前很流行的兩種技術,包含 DiffusionTransformer 模型,設計出原創的 U-ViT 架構,從官方公布的影片中,我們可以看到 Vidu 對中國元素(熊貓、龍)的理解與生成,掌握度非常高。

雖然現在很多模型都有多模態功能,或支援多語言輸入,但看到中文圈也能積極地參與生成式 AI 的發展,發展出自己的模型,實在是非常開心!

📊
CHART

閱讀時間:1 分鐘

Alan Thompson 整理了近兩年人型機器人的發展狀況,包含 Agility 推出的 DigitTesla 開發的 Optimus Gen 2 等等。

從圖中我們可以看到,Boston Dynamics 最近剛淘汰舊款的 HD Atelas,並引入新款的 Atlas,而在機器人的開發國家部分,仍然是以美國為主,只有兩家公司是來自加拿大中國

不知道各位看到這張圖表的時候,有沒有熟悉的感覺,裡面的 PhonenixAltas 都曾出現在前幾期的電子報中,歡迎大家回去複習XD

🧭
GUIDE

閱讀時間:3 分鐘

在上一期的 Guide 當中,我們知道一個有效的 Prompt 需要有 4 個部分,包含角色、任務、語境格式

而在今天的內容當中,我們將深入介紹如何跟 Gemini 進行有效的互動,根據 Google 的官方說明,以下 4 個技巧提高對話的品質

  1. 使用自然語言:撰寫完整的句子,並想像在與另一個人對話

  2. 重覆且具體:提供充足的背景資訊,能讓生成更順利

  3. 簡單明瞭直接明瞭地提出需求,同時避免過多專業術語

  4. 延續對話:根據上一次的對話進行微調,讓 Gemini優化生成結果

希望上面的內容能更好的幫助大家掌握 Gemini 的使用,如果想看到 Gemini特定任務上的應用方法,也歡迎大家在電子報的最後投票並提出喔!

🔬
RESEARCH

論文長度:17 頁

目前的語言模型多使用 Chain of thought 來作為推理的方式,雖然可以提升效率,但卻被質疑結果推理的過程不相符

因此作者嘗試使用重複且無意義的 Filler tokens ,例如一連串的點,來讓模型進行推理,從上面的圖中可以發現,即使我們無法了解中間的推理過程,但模型仍能完成準確的計算

但同時也提到,要讓模型能學會使用 Filler tokens 非常困難,需要有更加嚴謹的訓練過程,除此之外,其他的大型語言模型,如 Claude 2GPT-3.5,使用 Filler tokens未能提升問答的測驗分數,但不排除是被訓練過程或模型架構所影響。

🔍
INSIGHT

觀看時間:22 分鐘

Microsoft AI CEO Mustafa Suleyman 在他的 TED 演講中,回顧了他在 AI 領域工作 15 年的經歷,看到了 AGI一開始被低估,到在每個領域上,如文字翻譯、圖片理解、下棋等,逐漸超過人類的表現

但回到一個最基本的問題AI 到底是什麼?

根據 Suleyman 的演講, 過去我們常常將 AI 當成一種數位工具,用來服務人類,但這樣的描述已經不能回答 AI 的定義,現在的 AI 有個性、用人類語言溝通、甚至能創造一些新事物

Suleyman AI 比喻為一種數位生物,但也不是全新的生物。AI 整合了人類從過去到現在的所有發展,換句話說,AI 就是我們每一個人的集合,我們唯一要做的事情就是讓 AI 能反映出人類的良善,包含同理心、善良、好奇心與創意

我個人非常喜歡 Suleyman 的這場演講,讓我們能暫時將 AI 的發展與突破放在一旁,回過頭來思考 AI 的基本定義,很推薦大家去看完!

⭐️ Br!ef 全新主題電子報
《Br!ef Crypto 電子報》3 分鐘掌握 Crypto 趨勢

平日為你整理當日最新加密貨幣資訊,獲取最重要的第一手區塊鏈知識最新 Crypto 新聞、 Crypto 領域深度觀點、最前沿的 Crypto 項目加入 1,000+ 位讀者,收到每日最新的 Crypto 電子報

Brief Crypto 電子報3 分鐘掌握最新的加密貨幣資訊!