GAiA

颠覆传统！新多智能体框架OWL获17K Star，超越OpenAI开创智能协作新时代

颠覆传统！新多智能体框架OWL获17K Star，超越OpenAI开创智能协作新时代

随着大型语言模型（LLM）的迅猛发展，单一智能体在应对复杂现实任务时显露出诸多局限。为了解决这个问题，香港大学与 camel-ai 等多家机构联合推出了一种名为 Workforce 的全新多智能体框架，并配套了一种名为 OWL(Optimized Workforce Learning)的训练方法。最近，这一创新成果在权威基准测试 GAIA 上获得了69.70% 的准确率，不仅刷新了开源系统的记录，还超越了 OpenAI Deep Research 等多家商业系统。

6/17/2025 3:01:49 PM AI在线

AMD发布GAIA开源项目助力本地大语言模型高效运行

AMD发布GAIA开源项目助力本地大语言模型高效运行

近日，AMD 宣布推出一款名为 GAIA 的开源应用，旨在为用户提供一种高效、本地化的方式来运行大语言模型（LLM）。目前，该应用已支持 Windows 平台，特别为锐龙 AI300系列处理器进行了优化，充分发挥了这些处理器在 AI 任务中的优势。 GAIA 是一个生成式 AI 应用，用户可以在个人电脑上私密地运行 LLM，确保数据隐私。

3/24/2025 9:40:00 AM AI在线

一张照片生成视频，张嘴、点头、喜怒哀乐，都可以打字控制

一张照片生成视频，张嘴、点头、喜怒哀乐，都可以打字控制

视频 PS 可以灵活到什么程度？最近，微软的一项研究提供了答案。在这项研究中，你只要给 AI 一张照片，它就能生成照片中人物的视频，而且人物的表情、动作都是可以通过文字进行控制的。比如，如果你给的指令是「张嘴」，视频中的人物就会真的张开嘴。如果你给的指令是「伤心」，她就会做出伤心的表情和头部动作。当给出指令「惊讶」，虚拟人物的抬头纹都挤到一起了。此外，你还可以给定一段语音，让虚拟人物的嘴型、动作都和语音对上。或者给定一段真人视频让虚拟人物去模仿。如果你对虚拟人物动作有更多的自定义编辑需求，比如让他们点头、转头或歪头

12/4/2023 11:12:00 AM 机器之心

人类考92分的题，GPT-4只能考15分：测试一升级，大模型全都现原形了

人类考92分的题，GPT-4只能考15分：测试一升级，大模型全都现原形了

AutoGPT 的得分也凉凉。GPT-4 自诞生以来一直是位「优等生」，在各种考试（基准）中都能得高分。但现在，它在一份新的测试中只拿到了 15 分，而人类能拿 92。这套名叫「GAIA」的测试题由来自 Meta-FAIR、Meta-GenAI、HuggingFace 和 AutoGPT 的团队制作，提出了一些需要一系列基本能力才能解决的问题，如推理、多模态处理、网页浏览和一般工具使用能力。这些问题对人类来说非常简单，但对大多数高级 AI 来说却极具挑战性。如果里面的问题都能解决，通关的模型将成为 AI 研究的重要

11/27/2023 11:07:00 AM 机器之心

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉