当本地跑大模型这件事,真的「变香了」:Vicki Boykis 用一台 2022 年的 Mac,把 75% 的 AI 编程搬到了自己笔记本上
AI技术

当本地跑大模型这件事,真的「变香了」:Vicki Boykis 用一台 2022 年的 Mac,把 75% 的 AI 编程搬到了自己笔记本上

Vicki Boykis 在 6 月 15 日发了一篇 6000 字长文,用一台 2022 年款的 M2 Mac,加上 Gemma 4 与 LM Studio,把 AI 编程的「自己用」做到了前沿模型 75% 的水平。文章在 Hacker News 上 1081 分、444 条评论,被普遍解读为「端侧推理真正跨过可用门槛」的标志性事件。这篇文章不打算复述她的工程细节,而是想回答一个更基础的问题:为什么是「现在」?为什么是「Mac」?为什么是一件过去 30 年都没有真正解决的事情,突然在 2026 年中这件事变得「够用」了?

1-bit 跑在 iPhone 上:PrismML 的 Bonsai Image 4B 为什么让本地 GenAI 拐点提前到来
技术解读

1-bit 跑在 iPhone 上:PrismML 的 Bonsai Image 4B 为什么让本地 GenAI 拐点提前到来

PrismML 发布的 Bonsai Image 4B 通过 1-bit 和 ternary 极低比特量化技术,把 4B 图像生成模型从 7.75 GB 压缩到 1 GB 以下,同时保留 88-95% 的性能。这是第一个能直接跑在 iPhone 上的同级别图像模型。本文用通俗语言拆解它的技术原理、关键工程、对端侧 GenAI 拐点的意义,以及三类典型应用场景。