蘋果公佈Manzano多模態模型，兼具理解與生成能力

人工智慧 01.16.26

根據外媒報道，蘋果公司發布了一篇重要研究論文，詳細介紹了其全新的多模態AI模型「Manzano」。該模型的最大亮點在於，能近乎無損地同時實現精準的“視覺理解”與高質量的“文本生成圖像”，有望解決行業內長期存在的任務衝突難題。

傳統多模態模型同時處理影像理解與影像生成時，往往因視覺資料處理方式的內在矛盾而被迫做出表現妥協。 Manzano透過創新的三段式架構攻克了這個挑戰：首先，其「混合視覺分詞器」能同步產生連續與離散的視覺表示；接著，大語言模型負責預測影像語意；最後，「擴散解碼器」進行精細的像素級渲染。

這種設計使得Manzano不僅能準確理解圖像內容，還能根據複雜的文字指令產生高品質圖片。在測試中，面對「一隻鳥在大像下方飛翔」等反直覺指令，其邏輯準確性與GPT-4o等頂尖模型表現相當。此外，它還能處理深度估計、風格遷移等進階任務。

研究團隊驗證了從3億到300億參數的不同版本，證實架構具備良好的擴展性。儘管Manzano目前仍處於研究階段，尚未整合至具體產品中，但業界普遍認為，這項技術未來很可能被應用於「圖樂園」等功能，為使用者帶來更智慧的影像編輯與生成體驗，從而增強蘋果在端側AI領域的綜合競爭力。

微軟更新Windows 11開發版與測試版帶來進階相機設定和Emoji 16.0表情符號

微軟更新 Windows 11 開發版和測試版帶來高級相機設定和 Emoji 16.0 表情符號，說起來 16.0 之前添加過但因為有問題就給撤回，現在重新帶來 Emoji 16.0。還有一個功能是高級

02.10.26 3

YouTube Music將歌詞功能設定為付費訂閱權益不開會員只能看五次歌詞

YouTube Music 嘗試將歌詞功能設定為付費訂閱權限，未開通 YouTube Premium 訂閱會員最多只能查看五次歌詞。從去年開始谷歌就在測試這個付費牆，現在似乎在擴大範圍，因為更多

02.10.26 2

Discord自3月起預設將所有使用者設定為青少年模式驗證後才能存取成人內容

社群通訊應用程式 Discord 從 3 月開始將預設為所有用戶開啟青少年模式，只有提交臉部影片或證件驗證後才能解除青少年模式。不解除的話用戶將無法存取成人內容 / NSFW 內容

02.10.26 3

微軟推送Win11新測試版：新增表情與相機雲台控制

微軟於2月9日透過官方部落格宣布，向Beta和Dev頻道的Windows Insider專案成員推送了最新預覽版更新。此次更新後，Beta頻道系統版本號將升至Build 26220.7755，Dev頻道則升至Buil

02.10.26 3

OpenAI在美測試廣告功能，免費及低價用戶將看到廣告

當地時間週一，OpenAI正式宣布開始在美國為免費用戶及新推出的低價Go訂閱用戶測試廣告功能。 Go套餐定價為每月8美元，已於今年1月在全球上線。本公司強調，所有付費訂閱用戶，包括P

02.10.26 2

馬斯克預言：三年內太空將成為AI算力成本最低之地

根據彭博社報道，Google母公司Alphabet計劃透過發行美元債券籌集高達200億美元資金，這一規模超出了先前市場預期的150億美元。此次發債中，期限最長的債券將於2066年到期，其定價

02.10.26 3

谷歌母公司擬發債融資200億美元，加碼AI基礎設施

02.10.26 3

OpenAI否認在超級碗洩露硬體產品視頻

隨著美國「超級盃」賽事結束，科技圈卻因一則關於OpenAI的傳言而泛起漣漪。近日，一位自稱OpenAI員工的網友在Reddit平台發文稱，公司原計劃在賽事期間投放廣告卻未能播出，並隨之

02.10.26 3

網路檔案館與WP合作解決404問題將自動儲存文章並在不可用時跳到快照

互聯網檔案館與 WordPress 合作解決 404 問題，將自動保存 WordPress 網站上的文章到互聯網檔案館，檢測到文章被刪除時自動重定向到互聯網檔案館的快照頁面。這個外掛程式基

02.09.26 2

X/Twitter推出按量付費API 一般用戶也可以透過API快速抓取/發佈內容

社群網站 X/Twitter 推出按量付費 API，一般用戶可以使用 API 快速抓取或發佈內容，沒有固定月費使用成本更低。按量付費 API 主打的就是按實際使用次數收費，例如讀取 1 條推文

02.09.26 2

推進實名制打擊濫用：Google宣布Google Voice號碼需要完成身份驗證才能使用

推進實名制打擊濫用行為：Google宣布 Google Voice 號碼需要完成身份驗證後才能使用，此政策僅限於新申請號碼的用戶。申請後用戶必須提交身份證件進行驗證，未通過驗證前不能收

02.09.26 2

Linux Kernel 6.19正式版發布涉及底層安全架構/網路協定/檔案系統等多面向改進

Linux Kernel 6.19 正式版發布，涉及底層安全架構、網路協定、檔案系統、圖形管線、新硬體支援等多方面的改進。另外 6.19 也是 Linux Kernel 6.x 的最終版，Linus Torvalds

02.09.26 3

蘋果即將推出iPhone 17e 晶片換成A19 基頻晶片採用C1X並支援磁吸式充電等

蘋果即將推出 iPhone 17e 機型，屬於 iPhone 16e 平平無奇的升級版，外觀基本上沒有變化，主要升級內部晶片組。 iPhone 17e 系列將採用 A19 晶片、基頻晶片使用 C1X、網路晶片

02.09.26 3

英特爾終止軟體定義矽片付費解鎖計畫相關儲存庫已被歸檔停止維護

英特爾終結軟體定義矽片付費解鎖計劃，相關儲存庫已經歸檔並停止維護。該項目原本是要求客戶購買 CPU 後再根據需求額外付費解鎖功能的，主要面向的是至強伺服器處理器，但推出後

02.09.26 2

Bithumb更新誤發60萬枚比特幣後續：已自購被用戶出售的1,788枚比特幣補充餘額

韓國交易所 Bithumb 就誤發 2,000 比特幣事件發布後續：已經自購 1,788 枚比特幣補充庫存，這些就是被收到空投的用戶賣掉的比特幣。另外 Bithumb 承擔所有損失，包括閃崩期間被

02.09.26 4

蘋果公佈Manzano多模態模型，兼具理解與生成能力

微軟更新Windows 11開發版與測試版 帶來進階相機設定和Emoji 16.0表情符號

YouTube Music將歌詞功能設定為付費訂閱權益 不開會員只能看五次歌詞

Discord自3月起預設將所有使用者設定為青少年模式 驗證後才能存取成人內容

微軟推送Win11新測試版：新增表情與相機雲台控制

OpenAI在美測試廣告功能，免費及低價用戶將看到廣告

馬斯克預言：三年內太空將成為AI算力成本最低之地

谷歌母公司擬發債融資200億美元，加碼AI基礎設施

OpenAI否認在超級碗洩露硬體產品視頻

網路檔案館與WP合作解決404問題 將自動儲存文章並在不可用時跳到快照

X/Twitter推出按量付費API 一般用戶也可以透過API快速抓取/發佈內容

推進實名制打擊濫用：Google宣布Google Voice號碼需要完成身份驗證才能使用

Linux Kernel 6.19正式版發布 涉及底層安全架構/網路協定/檔案系統等多面向改進

蘋果即將推出iPhone 17e 晶片換成A19 基頻晶片採用C1X並支援磁吸式充電等

英特爾終止軟體定義矽片付費解鎖計畫 相關儲存庫已被歸檔停止維護

Bithumb更新誤發60萬枚比特幣後續：已自購被用戶出售的1,788枚比特幣補充餘額

微軟更新Windows 11開發版與測試版帶來進階相機設定和Emoji 16.0表情符號

YouTube Music將歌詞功能設定為付費訂閱權益不開會員只能看五次歌詞

Discord自3月起預設將所有使用者設定為青少年模式驗證後才能存取成人內容

網路檔案館與WP合作解決404問題將自動儲存文章並在不可用時跳到快照

Linux Kernel 6.19正式版發布涉及底層安全架構/網路協定/檔案系統等多面向改進

英特爾終止軟體定義矽片付費解鎖計畫相關儲存庫已被歸檔停止維護