斯坦福
Andrej Karpathy 盛赞!斯坦福团队新作,让Llama-1B 实现毫秒级推理
斯坦福 Hazy Research 团队刚刚公布了一项重量级优化成果:他们将开源模型 Llama-3.2-1B 的前向推理整合成了一个“Megakernel”,并将低延迟推理能力推向了极限。 在某些实时性极高的应用中,例如对话式 AI 和人类参与的交互式工作流中,大语言模型的响应速度不仅重要,甚至可以决定用户体验的成败。 团队认为限制 LLM 推理速度的瓶颈其实是在内存加载的问题上,他们经过研究发现,现有的开源推理引擎(如 vLLM、SGLang),在极低延迟的单序列生成任务下,即使在顶级 GPU(如 H100)上,也只能利用不到 50% 的内存带宽。
6/3/2025 12:49:00 PM
郑佳美
斯坦福 AI 指数报告发布:2024年美国 AI 私人投资约为中国的 12 倍、GPT3.5 级别模型推理成本下降 280 倍
4 月 7 日,斯坦福大学以人为本的人工智能研究所 (HAI) 发表了新的《2025年人工智能指数报告》,多项数据统计表明:中美 AI 的差距正在缩小,AI 技术的创新速度是过去十年的数倍之快。 该报告总篇幅接近 450 页,主要亮点包括:首先,报告指出,过去一年中美的 AI 投资都有了极大增长。 其中,美国 AI 私人投资金额增长至 1091 亿美元,几乎是中国的 12 倍(93 亿美元)与英国的 24 倍(45 亿美元)。
4/11/2025 4:48:00 PM
洪雨欣
全自动组装家具,斯坦福发布 IKEA Video Manuals 数据集
斯坦福大学推出的 IKEA Video Manuals 数据集,通过 4D 对齐组装视频和说明书,为 AI 理解和执行复杂空间任务提供了新的挑战和研究基准,让机器人或 AR 眼镜指导家具组装不再是梦。
12/3/2024 10:23:19 AM
汪淼
3D 视觉派:斯坦福具身智能人物关系图
作者 | 赖文昕 陈彩娴编辑 | 陈彩娴2009 年,当苏昊第一次走进位于斯坦福 Serra Mall 353 号的盖茨大楼时,他刚经历完一场对人工智能的思想挣扎。 那时他刚参加完搭建 ImageNet。 导师李飞飞从普林斯顿转到斯坦福任教后,他也随之从美国东部来到硅谷。
9/6/2024 3:02:00 PM
赖文昕
斯坦福团队为抄袭清华系面壁智能 AI 模型道歉:Llama3-V 模型将悉数撤下
近日斯坦福大学的 AI 研究团队的 Llama3-V 开源模型被指控抄袭了清华系明星创业公司面壁智能开发的开源模型“小钢炮”MiniCPM-Llama3-V 2.5,在网上引起热议。图源 Pexels5 月 29 日一个斯坦福 AI 团队在网上宣称只需 500 美元就可训练出一个超越 GPT-4V 的 SOTA 多模态大模型,但很快网友就发现该项目使用的模型结构和代码与“小钢炮”高度相似,仅有部分变量名被更改。面壁智能团队在 6 月 2 日深夜确认,斯坦福的模型不仅能识别出“清华简”中的战国古文字,而且连错误的识别
6/4/2024 10:59:19 AM
远洋
强如 GPT-4,也未通过伯克利与斯坦福共同设计的这项“剧本杀”测试
编译 | 赖文昕编辑 | 陈彩娴语言大模型能依据人类设定的规则生成内容吗? 这背后关乎人类用户使用大模型的安全问题。 例如,AI 科技评论想使用 GPT-4 制作一张包含对话框的图片,但没有针对目标生成对话的内容给予明确指示,而 GPT-4 生成的图文效果便如下,显示文本逻辑混乱、字不成章,还有部分“重影”:语言大模型能否遵循人类指示生成合格内容,是人类能否操控人工智能的重要评测标准之一。
3/13/2024 3:31:00 PM
赖文昕
谷歌研究总监Peter Norvig赴斯坦福任教,著有《人工智能:一种现代方法》
Peter Norvig:AI 在线课程 10 万报名只有 1.6 万人上完,这才是需要解决的问题。
10/12/2021 2:46:00 PM
机器之心
- 1
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
Meta
GPT
学习
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
英伟达
代码
Anthropic
芯片
开发者
生成式
蛋白质
腾讯
神经网络
训练
3D
研究
生成
智能体
苹果
计算
机器学习
Sora
AI设计
Claude
AI for Science
GPU
AI视频
人形机器人
搜索
华为
百度
场景
大语言模型
xAI
预测
伟达
深度学习
Transformer
LLM
字节跳动
Agent
模态
具身智能
神器推荐
工具
文本
视觉
LLaMA
算力
Copilot
驾驶
大型语言模型
API
RAG
应用
架构