SLM
浅析小语言模型在增强RAG系统中的作用
译者 | 布加迪审校 | 重楼小语言模型(SLM)是大语言模型(LLM)的紧凑版。 它们包含的参数通常少于大语言模型:大约30亿个参数或更少。 这使得它们相对轻量级,推理时间更快。
4/29/2025 8:09:39 AM
布加迪
GenAI遇上SLM:边缘计算的新纪元
小型语言模型(SLM)在效率、隐私和适应性之间实现了卓越的平衡,使其成为各种应用的理想选择。 译自GenAI Meets SLMs: A New Era for Edge Computing,作者 Pankaj Mendki。 让我们想象一个场景:一家医院的患者拥有自己的医疗记录。
4/3/2025 4:21:00 AM
岱军
解读小模型—SLM
大模型的世界几乎每天都在发生变化。 一方面,人们越来越重视开发更大、更强大的语言模型,以实现通用人工智能(AGI)。 这些大模型通常位于拥有数十万GPU的大型数据中心中。
12/2/2024 1:18:54 AM
曹洪伟
大模型已过时,小模型SLM才是未来?苹果正在研究这个
手机还是更适合小模型大模型虽然好,但我的笔记本和手机都跑不动呀。 就算勉强能跑起来,也是奇慢无比。 而与此同时,对适合移动和边缘设备的小模型的需求却在不断增长,因为这些模型似乎才能真正满足人们的日常需求。
10/31/2024 10:18:00 AM
机器之心
微软 Phi-3-vision 基准测试:和 Claude 3-haiku、Gemini 1.0 Pro 相当
微软在 Build 2024 大会上发布了 Phi-3 家族的最新成员--Phi-3-vision,主打“视觉能力”,能够理解图文内容,同时据称可以在移动平台上流畅高效运行。Phi-3-vision 是一款多模态小型语言模型(SLM),主要用于本地 AI 场景,该模型参数量为 42 亿,上下文长度为 128k token,能够为常规视觉推理任务和其他任务提供支持。那么 Phi-3-vision 有多厉害?微软今天发布了新的论文 [PDF],表示该 SLM 和 Claude 3-haiku、Gemini 1.0 Pr
5/28/2024 8:45:08 AM
故渊
- 1
资讯热榜
昆仑万维面向全球发布天工超级智能体Skywork Super Agents
昆仑万维天工超级智能体发布!AI Office革命来袭,Deep Research碾压OpenAI,成本仅40%!
3分钟生成UI源文件!实测谷歌最新UI设计神器Google Stitch
Anthropic拒绝为Windsurf提供Claude Sonnet 4与Opus 4支持,商战大戏开演!
进化智能体 AlphaEvolve:科学发现与算法优化的新引擎
从设计到开发一步到位!Figma 5大新功能深度解析!
《Nature》研究显示:ChatGPT 可使中小学生学习效果暴涨 86.7%
早报速读!2025年5月最新AI视频产品评测&优秀案例
标签云
人工智能
AI
OpenAI
AIGC
ChatGPT
模型
DeepSeek
AI绘画
机器人
数据
谷歌
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
芯片
英伟达
生成式
蛋白质
开发者
腾讯
Anthropic
神经网络
研究
3D
计算
机器学习
Sora
生成
AI设计
AI for Science
苹果
GPU
AI视频
训练
华为
Claude
搜索
场景
百度
人形机器人
预测
智能体
伟达
xAI
深度学习
Transformer
大语言模型
字节跳动
模态
LLaMA
文本
神器推荐
具身智能
Copilot
视觉
驾驶
API
算力
应用
Agent
工具
大型语言模型
安全
干货合集
视频生成