AI
推理大模型1年内就会撞墙,性能无法再扩展几个数量级 | FrontierMath团队最新研究
一年之内,大模型推理训练可能就会撞墙。 以上结论来自Epoch AI。 这是一个专注于人工智能研究和基准测试的非营利组织,之前名动一时的FrontierMath基准测试(评估AI模型数学推理能力)就出自它家。
OpenAI首席科学家Nature爆料:AI自主发现新科学!世界模型和RL是关键
ChatGPT推出后,迅速震惊了全球。 自那以后,OpenAI一直站在AI技术发展的最前沿。 去年9月,他们推出o系列模型,再次引领AI推理的浪潮。
xAI 承诺的安全报告未如期发布
近日,埃隆・马斯克创办的人工智能公司 xAI 未能如期发布一份有关 AI 安全的最终框架,这一消息引起了监测机构 “Midas Project” 的关注。 xAI 在 AI 安全方面的表现一直不尽如人意,其 AI 聊天机器人 Grok 在处理某些请求时,曾出现不当行为,比如不经意地处理女性照片。 同时,Grok 在语言表达上也比竞争对手如 Gemini 和 ChatGPT 更加粗俗,频繁使用脏话。
谷歌I/O2025:AI 眼镜原型震撼亮相,Gemini 助力无界面计算新时代
在即将到来的2025年谷歌 I/O 大会上,科技界的目光将再次聚焦于谷歌。 此次大会定于5月20日至21日举行,谷歌已经暗示将展示一款备受期待的 AI 智能眼镜原型。 这款眼镜不仅搭载微型显示屏,还配备了谷歌最新的 Gemini 人工智能助手,标志着无界面计算的新纪元。
谷歌搜索即将推出“AI Mode”或取代经典“手气不错”按钮
谷歌正在进行一项重要的搜索功能测试,可能会对用户的搜索体验产生影响。 根据新闻作者 Jess Weatherbed 在社交媒体平台 X 上的最新推文,谷歌正在测试将搜索首页的 “手气不错” 按钮替换为新的 “AI Mode”。 这一变化旨在增强用户在搜索时的智能体验。
告别AI“幻觉”?Vectara推出守护代理,声称能精准“纠错”
人工智能(AI)在企业中的应用日益广泛,但其固有的“幻觉”风险——即生成不真实或无根据的信息——一直是阻碍大规模部署的关键挑战。 尽管行业内涌现了众多旨在减少幻觉的技术和方法,如检索增强生成(RAG)、数据质量提升、护栏机制以及推理验证等,但效果往往有限。 近日,一家名为Vectara的公司推出了一种全新的解决方案:“Vectara 幻觉矫正器”,旨在通过监护代理自动识别、解释和纠正AI产生的幻觉,为企业级AI应用带来新的希望。
苹果推出革命性 AI 模型 Matrix3D:轻松将 3 张照片转化为 3D 场景
苹果机器学习团队与南京大学和香港科技大学合作,推出了一款名为 Matrix3D 的先进 AI 模型。 该模型的主要功能是从少量的2D 照片中重建真实的物体和场景,为用户提供高质量的3D 输出。 用户只需提供三张照片,Matrix3D 便能自动生成详细的3D 重建效果。
首个多模态统一CoT奖励模型来了,模型、数据集、训练脚本全开源
在多模态大模型快速发展的当下,如何精准评估其生成内容的质量,正成为多模态大模型与人类偏好对齐的核心挑战。 然而,当前主流多模态奖励模型往往只能直接给出评分决策,或仅具备浅层推理能力,缺乏对复杂奖励任务的深入理解与解释能力,在高复杂度场景中常出现 “失真失准”。 那么,奖励模型是否也能具备像人类一样的深度思考能力?
Epoch AI 预言:最快 1 年内,推理模型步伐将放缓
非营利 AI 研究机构 Epoch AI 最新发布报告,指出 AI 企业难以从推理模型中,持续榨取巨大性能收益,最快在一年内,推理模型的进步将放缓。
深度学习原来这么好懂?这篇大白话科普,让你轻松 get 新知识!
嘿,朋友们! 你是不是也经常在新闻、科技报道里看到“深度学习”这个词? 听起来是不是特别高大上,感觉像是只有顶尖科学家才能搞懂的神秘领域?
Cursor AI 系统提示词泄露:Vibe 编程的七大提示词技巧
在当前 AI 快速演进的背景下,语言模型展现出的“智能性”愈发惊艳。 即使用户输入的提示词模糊不清,Claude 3.5 或 Cursor 等系统依旧能准确“读懂心思”,给出相对贴切的回应。 这种智能表现,部分原因来自系统提示词(System Prompt)机制的设计。
三分之一的员工对AI的使用保密
员工对利用技术提高生产力的担忧日益加剧,同时对工作感到不满且缺乏工作动力。 事实上,根据Ivanti公司的调查,在工作中使用GenAI工具的员工中,有30%担心自己的工作可能被裁掉,27%的员工则出现了由AI引发的冒名顶替综合征,他们表示不希望别人质疑自己的能力。 “Ivanti的研究表明,员工仍然希望在工作生活中拥有更大的自主权,并希望得到能帮助他们做到最好的AI解决方案,”Ivanti的首席法律顾问兼人力资源与安全高级副总裁布鲁克·约翰逊(Brooke Johnson)表示,“为了应对这一问题,企业应考虑建立一个可持续的AI治理模型,将透明度放在首位,并通过创新来解决由AI引发的冒名顶替综合征这一复杂挑战。
3 张照片 → 全景 3D:苹果携手推出革命性 AI 模型 Matrix3D,简化 3D 重建过程
科技媒体 9to5Mac 昨日(5 月 13 日)发布博文,报道称苹果机器学习团队携手南京大学和香港科技大学,推出名为 Matrix3D 的 3D AI 模型,专注于从少数 2D 照片中重建真实世界的物体和场景。
智能体狂飙:深度智能化大变革来袭
在人工智能技术日新月异的当下,智能体(AI Agent)正突破实验室的局限,迈向规模化商用,成为全球科技巨头竞相角逐的战略高地。 从联想“超级智能体”的发布,到IBM企业级智能体平台的推出;从微软Copilot深度融入办公场景,到城市超级智能体在武夷山的落地,智能体技术凭借多模态交互、自主决策、跨生态协同等核心能力,正重塑人机协作模式,推动生产力范式向“认知操作系统”跃迁。 这一趋势不仅标志着AI技术从工具型助手向全场景智能伙伴的进化,更预示着个人、企业乃至城市将迎来一场深度智能化变革。
MCP如何实现Agentic AI工作流
Agentic AI工作流涌现! 本文揭秘如何用 Anthropic 的 MCP 赋能 LLM,实现自主决策。 通过 Todo List MCP Server 和 Calendar MCP Server 演示,展示 MCP 客户端如何协调工具和动态提示,构建模块化、可组合的智能自动化流程。
一口气讲清楚:FC、MCP、A2A
前面几篇文章中,我介绍了AI大模型领域常见的几种专业术语,分别是:AGI、RAG、AIGC、LLM、MCP、EMB、向量库、训练集、多模态。 了解基础概念和专业术语之后,有助于我们在工作和生活中深入学习和应用AI。 这个时候,可能有同学会产生疑问,这么多大模型、ChatBot、智能体等AI工具,我该如何将它们融入到自己的生活和工作场景中呢?
当AI智能体成了"打工人":我们还有饭碗吗?
"AI智能体要来抢我们饭碗了? " 这是最近在我们公司茶水间听到最多的一句话。 直到上周,我看到运营小张用一个智能体,3分钟就完成了以前需要整个团队忙活一整天的市场分析报告。
英国政府在 AI 版权战中遭遇挫折,文化创作者获更多保护
近日,英国政府在推动人工智能(AI)相关立法的过程中遭遇了重大挫折。 英国上议院 —— 即上院 —— 对政府的《数据(使用和访问)法案》进行了一项修正提案,旨在加强对内容创作者的保护,这一变化引发了广泛的关注与讨论。 根据现行法律,劳动党政府希望引入一个版权例外条款,允许商业性生成式 AI 在训练模型时无需获得创作者的许可,进而更容易访问相关数据。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
AI新词
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
算法
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
AI设计
大型语言模型
生成式AI
搜索
视频生成
亚马逊
AI模型
特斯拉
DeepMind
场景
深度学习
Transformer
Copilot
架构
MCP
编程
视觉