當 Liquid AI 把 8B MoE 塞進筆電：LFM2.5-8B-A1B 每秒 253 token，亞洲手機與筆電廠的「代理 on-device」倒數開始

2026 年 5 月 28 日，由 MIT CSAIL 分拆而出、估值已突破 20 億美元的 Liquid AI 在官方部落格悄然放上一篇技術報告——LFM2.5-8B-A1B 正式發佈。表面上，這只是 LFM2 家族的又一次小幅更新，但模型卡上的兩行數字足以讓亞洲所有手機、筆電與 NPU 廠商重新檢視自己的產品路線圖：在 Apple M5 Max 上，每秒 253 個 token 的解碼速度，記憶體佔用低於 6 GB。

這代表什麼？它意味著一台搭載最新蘋果晶片的 MacBook Pro，第一次能夠在完全離線、無雲端依賴的條件下，跑出與 GPT-4o-mini API 旗鼓相當的回應速度，並且能夠連續呼叫工具、執行多步代理任務。「代理 on-device」這個過去 18 個月一直停留在概念展示階段的口號，從這一天起，正式成為產品經理必須面對的硬指標。

當 Liquid AI 把 8B MoE 塞進筆電：LFM2.5-8B-A1B 每秒 253 token，亞洲手機與筆電廠的「代理 on-device」倒數開始

一個 MoE，兩種記憶力：8B 總參數、1.5B 啟動參數的工程權衡

會員專屬內容