AI在线 AI在线

AI

2025智能体元年!斯坦福科学家8000字讲清所有要点

许多人认为「智能体」是AI发展的终极目标。 智能体在处理复杂任务时,展现出了巨大潜力。 从协助搭建网站、管理客户账户,到开展市场调研、自动录入数据,智能体的应用场景日益广泛。
1/24/2025 9:30:00 AM
新智元

会用ChatGPT≠工程师,谷歌资深员工发文,揭秘AI编程不为人知的真相

尽管程序员们纷纷反馈用上AI辅助之后,工作效率提升,但我们用到的软件中bug依旧不少。 针对这一现象,前谷歌产品经理Peter Szalontay,以及现任的谷歌Chrome的工程团队领导Addy Osmani都给出了自己的分析,并提供了一些如何使用AI辅助编程的建议。 AI编码工具的黑暗真相1月7日,前谷歌产品经理Peter Szalontay发推,并配上了一个令人惊心动魄的标题:「无人谈论的AI编码工具的黑暗真相」。
1/24/2025 9:10:00 AM
新智元

刚刚,OpenAI首个智能体提前曝光!高级编码AI剑指400万年薪L6级工程师

AGI或许就在本周? 刚刚外媒爆料称,OpenAI暗藏的首个智能体项目「Operator」即将发布。 网友发现Operator已登陆ChatGPT,不过可能Pro用户最先用上这款AI智能体将与ChatGPT深度集成,直接可以接管你的屏幕,自动化完成任务。
1/24/2025 9:00:00 AM
新智元

两分钟完成论文调研!ByteDance Research推出论文检索智能体PaSa,远超主流检索工具

2025 被称为 Agent 元年,新年伊始,ByteDance Research 就推出了一款基于强化学习的智能体应用:论文检索智能体。 它可以模仿人类研究者调用搜索引擎、看论文、查参考文献。 繁琐冗长的论文调研,现在,只需要两分钟。
1/24/2025 8:45:00 AM
机器之心

实测丨年底了,我用 AI 做了一份年终总结。

去年11月,自由画布在百度世界大会上首次亮相,各种 AI 新招式也是吊足了人们的胃口。 经过了一段时间的等待,我终于拿到了它的内测资格,成为了首批探索者。 激动之余,我和自由画布的相关负责人讨教了一下用法,听完之后第一感觉就是:好厉害、好复杂,需要好好摸索研究。
1/23/2025 6:00:00 PM
郑佳美

“自由画布”开启公测!百度文库AI功能MAU超9000万

1月21日,在百度AI DAY活动上,百度副总裁,文库事业部、网盘事业部负责人王颖透露,百度文库AI功能MAU已突破9000万,同时,由百度文库和百度网盘联合打造的AI创作新物种“自由画布”开启公测。  过去一年,百度文库用户数据呈高速增长,其AI功能MAU已突破9000万,AI DAU年同比增长230%;付费用户超4000万,位居全球第二、中国第一。 自依托文心大模型进行全面AI重构以来,百度文库推出智能PPT、智能写作、AI全网搜、智能有声画本、智能漫画等上百项AI能力,覆盖学习办公、家庭教育、兼职赚钱场景。
1/23/2025 5:52:00 PM
郑佳美

推理模型规划任务成功率从5%到95%,DeepMind遗传算法新研究火了

瞄准推理时扩展(Inference-time scaling),DeepMind新的进化搜索策略火了! 所提出的“Mind Evolution”(思维进化),能够优化大语言模型(LLMs)在规划和推理中的响应。 由于提升显著,Reddit/𝕏一时间出现了大量讨论:由于结合了遗传算法,使用Mind Evolution能让Gemini 1.5 Flash任务成功率从原本的5%左右,一下提升90个百分点。
1/23/2025 4:25:23 PM
量子位

自主操作电脑的多模态 Agent 升级,智谱 GLM-PC 开放体验

北京智谱华章科技有限公司今日发文宣布,旗下智谱 GLM-PC 开放体验,宣城“自主操作电脑的多模态 Agent 再升级”。
1/23/2025 2:12:56 PM
归泷(实习)

字节要亲手打造AGI了!神秘“Seed Edge”项目被曝光,已设置5大研究方向,探索下一代AI技术,算力不用愁!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)中国大厂开始发力AGI了! 据媒体报道,字节跳动 AGI 研究团队浮出水面,揭开了字节AGI的秘密布局! 报道称:1 月下旬,字节正式设立代号为“Seed Edge”的研究项目,核心目标是做比预训练和大模型迭代更长期、更基础的 AGI 前沿研究。
1/23/2025 2:02:14 PM
伊风

字节清华开源力作!UI-TARS原生AI智能体,人人都能拥有“智能助手”

年底国内各个AI玩家杀疯了,前两天完全开源的Deepseek R1 震撼整个AI业界,今天字节又联合清华整活,一个强大的原生的开源 AI Agent UI-TARS震撼上线看了UI-TARS的论文,我给大家划划重点【纯视觉感知】:告别文本依赖,像人眼一样“看”懂GUI! 传统的GUI自动化方案,很多都依赖于解析网页代码(HTML)或者软件的API接口。 但这种方式有两个致命缺陷:一是平台限制,不同平台、不同软件的底层代码和API都不一样,导致自动化方案难以通用;二是容易失效,一旦网页或软件界面改版,代码或API接口变动,自动化脚本就可能直接崩溃。
1/23/2025 1:05:42 PM
AI寒武纪

NVIDIA提出虚拟试衣新方法EARSB,让时尚与科技完美融合!

在数字化浪潮席卷全球的今天,科技正以前所未有的方式融入我们的生活,包括我们追求时尚的方式。 想象一下,无需亲临实体店,只需轻点屏幕,就能轻松试穿心仪的衣物,这不再是遥不可及的梦想。 NVIDIA联合波士顿大学提出了 EARSB,该模型能够智能地识别并修正初始试衣图像中的错误区域,能够针对特定错误进行精准修正,显著提升试衣效果的真实感和细节表现。
1/23/2025 10:08:00 AM
AIGC Studio

「AI没有墙超预期」Anthropic CEO达沃斯惊人预测:2027年实现超人类水平的AI

人类水平的AI或超越所有人类的AI将在两三年内到来,从内部来看,AI的发展没有遇到墙反而超预期                                                                                                                                                              --Anthropic CEO Dario Amodei华尔街日报在达沃斯世界经济论坛对 Anthropic 首席执行官 Dario Amodei 的最新采访。 采访内容主要围绕 Anthropic 的 AI 模型 Claude 的未来发展方向、AI 技术的进步速度及其对社会和劳动力市场的影响、以及 Anthropic 在行业竞争和政策监管方面的策略以下结合采访内容给大家划个重点Claude 的未来发展方向网络访问 (Web Access): Anthropic 正在积极开发 Claude 的网络访问功能,预计很快推出。 尽管企业用户是 Anthropic 的重点,但他们也认识到网络访问对于消费者和高级用户的重要性。
1/23/2025 9:37:00 AM
AI寒武纪

Anthropic CEO惊人预警:27年AI超越人类!Claude今年更新全剧透

失踪人口终于回归了! 在互联网消失一段时间后,Anthropic首席执行官Dario Amodei一上来就接受了WSJ、CNBC两家采访,连曝AI大瓜。 他坚定地认为,「2027年之前,AI完全可以超越人类智能!
1/23/2025 9:00:00 AM
新智元

Claude创始人:AI全面超越人类,只剩2-3年

在最新的对话访谈当中,Claude厂家Anthropic的CEO Dario Amodei谈论了他对于AI未来的看法。 他认为,AI确有可能在短期内替代部分人类的工作,但让AI与人类形成互补才是对生产力最有益的方式。 对于当下的年轻人,Amodei也给出了他的建议,鼓励其学会使用AI工具并培养批判思维能力。
1/23/2025 8:40:00 AM
量子位

最壕DeepSeek玩家8台Mac跑R1,10万+元凑496GB显存才能跑4bit量化版

DeepSeek-R1,正在接受全球网友真金白银的检验。 花30秒用manim代码制作解释勾股定理的动画,一次完成无错误。 为了玩上这样的模型,有人花上10多万元,组7台M4 Pro Mac mini 1台M4 Max Macbook Pro的家用超算。
1/23/2025 8:30:00 AM
量子位

Adobe Premiere Pro 新增 AI 视觉识别搜索功能:一句话快速找到视频片段

今日 Adobe 为其视频编辑软件 Premiere Pro 引入了一项基于 AI 视觉识别的搜索功能,用户可以通过描述视频内容来快速查找相关片段。这一功能是 Adobe 在 Premiere Pro、After Effects 和 Frame.io 中新增的多项提升用户体验的功能之一,这些功能旨在帮助视频编辑者节省时间。
1/22/2025 10:46:14 PM
远洋

谷歌母公司 Alphabet 总裁:美国 AI 技术未必会永远领先中国

据彭博社报道,Alphabet 公司总裁兼首席投资官鲁斯・波拉特(Ruth Porat)表示,美国在人工智能(AI)发展竞赛中未必能保持对中国的领先优势。
1/22/2025 7:20:56 PM
远洋

UC伯克利等提出具身智能「动作Tokenizer」,效率飙升5倍!

来自π,伯克利和斯坦福的研究者近期提出了FAST,一种为VLA模型设计的高效动作Tokenizer。 FAST旨在解决传统动作Tokenization方法在处理精细任务时面临的挑战,为VLA模型在更复杂、高频的机器人控制任务带来了显著改进。 将FAST与π0 VLA结合,在1万小时的机器人数据上对π0-FAST进行训练,效果与最先进的扩散VLA相当,训练时间最多缩短5倍。
1/22/2025 3:21:00 PM
新智元