真·ChatGPT平替：无需显卡，MacBook、树莓派就能运转LLaMA

Meta 在上个月末发布了一系列开源大模型 ——LLaMA（Large Language Model Meta AI），参数量从 70 亿到 650 亿不等。由于模型参数量较少，只需单张显卡即可运转，LLaMA 因此被称为 ChatGPT 的平替。发布以来，已有多位开发者尝试在自己的设备上运转 LLaMA 模型，并分享经验。

虽然相比于 ChatGPT 等需要大量算力资源的超大规模的说话模型，单张显卡的要求已经很低了，但还能更低！最近有开发者实行了在 MacBook 上运转 LLaMA，还有开发者胜利在 4GB RAM 的树莓派上运转了 LLaMA 7B。

这些都得益于一个名为 llama.cpp 的新项目，该项目在 GitHub 上线三天，狂揽 4.6k star。

项目地址：https://github.com/ggerganov/llama.cpp

Georgi Gerganov 是资深的开源社区开发者，曾为 OpenAI 的 Whisper 自动语音识别模型开发 whisper.cpp。

这次，llama.cpp 项目的目标是在 MacBook 上使用 4-bit 量化胜利运转 LLaMA 模型，具体包括：

没有依赖项的普通 C/C++ 实行；

Apple silicon first-class citizen—— 通过 Arm Neon 和 Accelerate 框架；

AVX2 支持 x86 架构；

混合 F16 / F32 精度；

4-bit 量化支持；

在 CPU 上运转。

llama.cpp 让开发者在没有 GPU 的条件下也能运转 LLaMA 模型。项目发布后，很快就有开发者尝试在 MacBook 上运转 LLaMA，并胜利在 64GB M2 MacBook Pro 上运转了 LLaMA 7B 和 LLaMA 13B。

真·ChatGPT平替：无需显卡，MacBook、树莓派就能运转LLaMA

在 M2 MacBook 上运转 LLaMA 的方式：https://til.simonwillison.net/llms/llama-7b-m2

如果 M2 芯片 MacBook 这个条件还是有点高，没关系，M1 芯片的 MacBook 也可以。另一位开发者分享了借助 llama.cpp 在 M1 Mac 上运转 LLaMA 模型的方式。

真·ChatGPT平替：无需显卡，MacBook、树莓派就能运转LLaMA

在 M1 Mac 上运转 LLaMA 的方式：https://dev.l1x.be/posts/2023/03/12/using-llama-with-m1-mac/

除了在 MacBook 上运转，还有开发者借助 llama.cpp 在 4GB RAM Raspberry Pi 4 上胜利运转了 LLaMA 7B 模型。Meta 首席 AI 科学家、图灵奖得主 Yann LeCun 也点赞转发了。

真·ChatGPT平替：无需显卡，MacBook、树莓派就能运转LLaMA

以上是 3 个在普通硬件设备上胜利运转 LLaMA 模型的例子，几位开发者都是借助 llama.cpp 实行的，可见 llama.cpp 项目的实用与强大。

看来，LLaMA 将在 Meta 和开源社区的共同努力下，成为众多开发者钻研大规模说话模型的入口。

{{userData.name}}已认证

真·ChatGPT平替：无需显卡，MacBook、树莓派就能运转LLaMA

科技巨头持续血拼：微软豪掷数亿造ChatGPT超算，google加急测试Big Bard

腾讯获国际信息检索畛域国际权威比赛两项冠军，展示AI大模型技术实力

AI 架构 Transformer 再进化：谷歌新方法突破长文本处理，注意力模块内存需求可降至 1/47

微软开源 bitnet.cpp 1-bit LLM 推理框架：不靠 GPU 可本地运行千亿参数 AI 模型，能耗最多降低 82.2%

英伟达 CEO 黄仁勋展望公司未来：坐拥 5 万名员工、部署 1 亿个 AI 助手

秒变Midjourney高手！精选 52 条高级感的 sref 风格代码

Meta 用 AI 生成北极光图片，遭网友怒喷

字节跳动清华AIR成立联合研究中心推动大模型产学研合作

中国电信自研 AI 节能系统：年均节电 8 亿度，节约电费 5.2 亿元

从预测风暴到设计分子，微软的 AI 基础模型如何加速科学发现

{{userData.name}}已认证

科技巨头持续血拼：微软豪掷数亿造ChatGPT超算，google加急测试Big Bard

腾讯获国际信息检索畛域国际权威比赛两项冠军，展示AI大模型技术实力

AI 架构 Transformer 再进化：谷歌新方法突破长文本处理，注意力模块内存需求可降至 1/47

微软开源 bitnet.cpp 1-bit LLM 推理框架：不靠 GPU 可本地运行千亿参数 AI 模型，能耗最多降低 82.2%

英伟达 CEO 黄仁勋展望公司未来：坐拥 5 万名员工、部署 1 亿个 AI 助手

秒变Midjourney高手！精选 52 条高级感的 sref 风格代码

Meta 用 AI 生成北极光图片，遭网友怒喷

字节跳动清华AIR成立联合研究中心 推动大模型产学研合作

中国电信自研 AI 节能系统：年均节电 8 亿度，节约电费 5.2 亿元

从预测风暴到设计分子，微软的 AI 基础模型如何加速科学发现

字节跳动清华AIR成立联合研究中心推动大模型产学研合作