多模态智能体
那天,AI大模型想起了,被「失忆」所束缚的枷锁
记忆,你有我有,LLM 不一定有,但它们正在有。 前些天,谷歌宣布 Gemini 具备了记忆能力。 此前,它已经凭借长达 100 万 token 甚至更高的上下文长度,在「短期记忆」上有不错表现 —— 能够在一次会话中保留大量信息。
8/31/2025 6:19:00 PM
机器之心
字节Seed开源长线记忆多模态Agent,像人一样能听会看
不圆 发自 凹非寺. 量子位 | 公众号 QbitAI字节Seed发布全新多模态智能体框架——M3-Agent。 像人类一样能听会看、具备长期记忆,并且免费开源!
8/18/2025 4:04:41 PM
不圆
Agno框架介绍:用于构建多模态智能体的轻量库
译者 | 核子可乐审校 | 重楼在开发代理式AI时,开发者往往需要在速度、灵活性和资源利用率间反复权衡。 本文将向大家介绍Agno——一款用于构建多模态智能体的轻量化框架。 其速度号称比LangGraph快上万倍,内存使用量则仅为1/50。
4/14/2025 10:58:53 AM
核子可乐
现场Live震撼!OmAgent框架强势开源!行业应用已全面开花
第一个提出自动驾驶并进行研发的公司是 Google,巧的是,它发布的 Transformer 模型也为今天的大模型发展奠定了基础。自动驾驶已经完成从概念到现实的华丽转变,彻底重塑了传统驾车方式,而大模型行业正在经历的,恰如自动驾驶技术发展的传奇征程 ——最顶尖的研发团队竞相投身其中、不断加速抢跑的技术产品创新,以及持续被推向极致的用户体验。在大模型赛道中,有一家企业始终以领先的身位,推动着行业边界向前拓展。为什么是联汇科技?当行业刚开始关注大模型,他们已经锚定多模态大模型,并高分取得了工信部大模型检测的 001 号
7/6/2024 11:02:00 AM
机器之心
- 1
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
开源
AI新词
Meta
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
AI for Science
Agent
苹果
芯片
Claude
腾讯
Stable Diffusion
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
RAG
人形机器人
AI视频
研究
大语言模型
具身智能
生成
百度
Sora
工具
GPU
华为
计算
字节跳动
AI设计
大型语言模型
AGI
搜索
视频生成
场景
生成式AI
深度学习
架构
DeepMind
亚马逊
编程
特斯拉
视觉
Transformer
AI模型
预测
MCP