cpp

微软开源 bitnet.cpp 1-bit LLM 推理框架：不靠 GPU 可本地运行千亿参数 AI 模型，能耗最多降低 82.2%

科技媒体 marktechpost 昨日（10 月 18 日）发布博文，报道称微软公司开源了 bitnet.cpp，这是一个能够直接在 CPU 上运行、超高效的 1-bit 大语言模型（LLM）推理框架。用户通过 bitnet.cpp 框架，不需要借助 GPU，也能在本地设备上运行具有 1000 亿参数的大语言模型，实现 6.17 倍的速度提升，且能耗可以降低 82.2%。传统大语言模型通常需要庞大的 GPU 基础设施和大量电力，导致部署和维护成本高昂，而小型企业和个人用户因缺乏先进硬件而难以接触这些技术，而 bitnet.cpp 框架通过降低硬件要求，吸引更多用户以更低的成本使用 AI 技术。

10/19/2024 3:08:57 PM

故渊

真·ChatGPT平替：无需显卡，MacBook、树莓派就能运行LLaMA

Meta 在上个月末发布了一系列开源大模型 ——LLaMA（Large Language Model Meta AI），参数量从 70 亿到 650 亿不等。由于模型参数量较少，只需单张显卡即可运行，LLaMA 因此被称为 ChatGPT 的平替。发布以来，已有多位开发者尝试在自己的设备上运行 LLaMA 模型，并分享经验。

3/14/2023 2:16:00 PM

机器之心

资讯热榜

量大管饱！我整理了10个好用到爆的即梦4.0进阶玩法甲骨文公司股价飙升 27%，人工智能未来收入大幅增长全球高校 “猎杀” AI作业！学生如何应对 “人类化” 挑战？ Gemini加密交易所IPO价格大幅上调，目标估值超30亿美元！ AI 数据版权新纪元：Real Simple Licensing 协议引发行业关注 ChatGPT能随便连MCP了！对话就能开发票、帮退款…奥特曼的野心毕露：将OpenAI打造成全能型平台！开发者：太危险了不敢用 OpenAI进军韩国市场，携手三星与SK海力士共建AI未来！为什么 LangChain ReAct 机制值得关注？

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能 Meta 用户微软 GPT 学习技术图像 Gemini 智能体马斯克 AI新词 AI创作 Anthropic 英伟达论文训练代码算法 LLM Stable Diffusion 芯片腾讯苹果蛋白质 Claude 开发者 AI for Science Agent 生成式神经网络机器学习 3D xAI 研究人形机器人生成 AI视频百度计算工具 Sora GPU 大语言模型华为 RAG AI设计字节跳动具身智能搜索大型语言模型场景深度学习 AGI 视频生成预测视觉伟达架构 Transformer 神器推荐 DeepMind 亚马逊特斯拉编程 AI模型