AI 工具生態
Members

當 Liquid AI 把 8B MoE 塞進筆電:LFM2.5-8B-A1B 每秒 253 token,亞洲手機與筆電廠的「代理 on-device」倒數開始

Asia AI Association2026年5月30日
當 Liquid AI 把 8B MoE 塞進筆電:LFM2.5-8B-A1B 每秒 253 token,亞洲手機與筆電廠的「代理 on-device」倒數開始
#AI_Tools#AI_News

2026 年 5 月 28 日,由 MIT CSAIL 分拆而出、估值已突破 20 億美元的 Liquid AI 在官方部落格悄然放上一篇技術報告——LFM2.5-8B-A1B 正式發佈。表面上,這只是 LFM2 家族的又一次小幅更新,但模型卡上的兩行數字足以讓亞洲所有手機、筆電與 NPU 廠商重新檢視自己的產品路線圖:在 Apple M5 Max 上,每秒 253 個 token 的解碼速度,記憶體佔用低於 6 GB。

這代表什麼?它意味著一台搭載最新蘋果晶片的 MacBook Pro,第一次能夠在完全離線、無雲端依賴的條件下,跑出與 GPT-4o-mini API 旗鼓相當的回應速度,並且能夠連續呼叫工具、執行多步代理任務。「代理 on-device」這個過去 18 個月一直停留在概念展示階段的口號,從這一天起,正式成為產品經理必須面對的硬指標。

一個 MoE,兩種記憶力:8B 總參數、1.5B 啟動參數的工程權衡

會員專屬內容

登入或註冊即可閱讀完整文章。