多模态智能体
那天,AI大模型想起了,被「失忆」所束缚的枷锁
记忆,你有我有,LLM 不一定有,但它们正在有。 前些天,谷歌宣布 Gemini 具备了记忆能力。 此前,它已经凭借长达 100 万 token 甚至更高的上下文长度,在「短期记忆」上有不错表现 —— 能够在一次会话中保留大量信息。
8/31/2025 6:19:00 PM
机器之心
字节Seed开源长线记忆多模态Agent,像人一样能听会看
不圆 发自 凹非寺. 量子位 | 公众号 QbitAI字节Seed发布全新多模态智能体框架——M3-Agent。 像人类一样能听会看、具备长期记忆,并且免费开源!
8/18/2025 4:04:41 PM
不圆
Agno框架介绍:用于构建多模态智能体的轻量库
译者 | 核子可乐审校 | 重楼在开发代理式AI时,开发者往往需要在速度、灵活性和资源利用率间反复权衡。 本文将向大家介绍Agno——一款用于构建多模态智能体的轻量化框架。 其速度号称比LangGraph快上万倍,内存使用量则仅为1/50。
4/14/2025 10:58:53 AM
核子可乐
现场Live震撼!OmAgent框架强势开源!行业应用已全面开花
第一个提出自动驾驶并进行研发的公司是 Google,巧的是,它发布的 Transformer 模型也为今天的大模型发展奠定了基础。自动驾驶已经完成从概念到现实的华丽转变,彻底重塑了传统驾车方式,而大模型行业正在经历的,恰如自动驾驶技术发展的传奇征程 ——最顶尖的研发团队竞相投身其中、不断加速抢跑的技术产品创新,以及持续被推向极致的用户体验。在大模型赛道中,有一家企业始终以领先的身位,推动着行业边界向前拓展。为什么是联汇科技?当行业刚开始关注大模型,他们已经锚定多模态大模型,并高分取得了工信部大模型检测的 001 号
7/6/2024 11:02:00 AM
机器之心
- 1
资讯热榜
独立开源大佬的疯狂实验:Claude Code蛮力出奇迹!40 分钟跑通 DeepSeek-OCR,我一行代码都没写
最强OCR竟然不是DeepSeek、Paddle!HuggingFace新作:六大顶尖开源OCR模型横评!继DS后又杀出匹黑马!
前两天刚被群嘲,ChatGPT转头就解决了一个数学难题
OpenAI 内部警示:ChatGPT Atlas 面临“即时注入”安全威胁
ChatGPT 涉嫌“诱导”美国 16 岁少年自杀,家属指控 OpenAI 事发前放松安全措施
如何把ChatGPT嵌入到自己的应用中?
FM Agent登顶OpenAI MLE-Bench,由百度智能云研发
微软AI主管苏莱曼:微软不会开发情色类AI,与OpenAI划清界限
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
大模型
数据
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
AI for Science
芯片
Agent
腾讯
Stable Diffusion
苹果
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
人形机器人
RAG
研究
AI视频
生成
大语言模型
Sora
工具
GPU
百度
具身智能
华为
计算
字节跳动
AI设计
搜索
大型语言模型
AGI
视频生成
场景
深度学习
架构
DeepMind
生成式AI
编程
视觉
预测
Transformer
AI模型
伟达
特斯拉
Copilot