PinnedPinnedPrivate
simonwillison.net

大型语言模型正在迎来稳定的扩散时刻

大型语言模型正在经历类似 Stable Diffusion 的开放拐点:原本只能通过少数公司 API 使用的强大模型,开始能在个人设备上运行和改造。LLaMA 的发布证明,用公开数据训练的较小模型也能接近 GPT-3 级能力;llama.cpp 又通过 C++ 移植和 4 位量化,把 7B、13B 模型压到普通笔记本可承受的范围。模型文件外流让控制权进一步扩散,研究预览迅速变成全球开发者的实验材料。这个变化削弱了平台对使用方式的约束,也带来滥用风险:自动化操纵、虚假内容、难以追责的本地部署都会变得更容易。但同样重要的是,个人和小团队终于能探索本地 AI 的正向用途,包括学习、编程、文档处理和离线工具。真正的竞争将转向完全开放、可商用、可在消费级硬件运行的语言模型,生成式 AI 的创新重心也会从封闭服务扩散到开源生态。