AI在线 AI在线

资讯列表

“AI 歌曲”走红后,环球、华纳、索尼与音乐生成平台 Udio 及 Suno 讨论合作

三大唱片公司希望收取授权费用,并持有 Udio 和 Suno 少量股权。知情人士称,协议若落地,有望解决此前围绕版权纠纷的诉讼。
6/4/2025 3:56:29 PM
清源

图灵奖得主 Bengio 再创业:构建下一代 AI 系统,启动资金已筹集 3000 万美元

刚刚,深度学习三巨头之一、图灵奖得主 Yoshua Bengio 官宣再次创业 —— 成立非营利组织 LawZero,要构建下一代 AI 系统,而且明确不做 Agent。
6/4/2025 3:54:35 PM
汪淼

铁了心为Agent开发铺路!OpenAI“真香”式升级:跳出Python圈、可人类干预、实时语音Agent、全链路追踪,代理福音

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)OpenAI 又放大招了! 用实力正名:在AI圈,自己的“一哥”地位不可动摇! 就在今天凌晨,OpenAI 官方开发者账号 @OpenAIDevs 在 X 平台上,一口气连续发布了 4 项关键更新,直接把 AI 代理(Agent)开发体验提升到新维度,围绕 Agent 开发体验、实时语音应用、人类干预机制和全链路追踪都做了重要升级。
6/4/2025 3:48:49 PM
云昭

惠普基于 Hailo-10H 打造 HP AI Accelerator M.2 卡,面向零售与酒店行业

惠普表示 HP AI Accelerator M.2 卡消除了云端AI面临的网络连接、成本、能耗挑战,扩大了边缘 AI 的机会。
6/4/2025 3:48:08 PM
溯波(实习)

Manus 推出“文生视频”功能,挑战 OpenAI Sora 等竞争对手

AI 初创公司 Manus 今日推出原生的“文生视频”功能,目前已经面向付费会员用户开放抢先体验,Basic、Plus、Pro 用户现可使用文本指令生成视频。
6/4/2025 3:44:08 PM
问舟

OpenAI 首席执行官奥尔特曼:AI 很快就能帮助人们发现新知识

“现在有些人说,他们的工作就是把任务交给一组智能体,检查完成质量,协调各部分配合,并给予反馈,听起来就像是在带一组初级员工。”
6/4/2025 3:22:03 PM
清源

​AI 教父本吉奥宣布创建 “科学家 AI” 系统,致力于防范智能体欺骗

著名计算机科学家、被誉为 AI “教父” 的约书亚・本吉奥(Yoshua Bengio)近日宣布成立一个名为 LawZero 的非营利组织,目标是开发一种 “诚信” 人工智能系统,以防止 AI 智能体对人类实施欺骗行为。 6月3日,本吉奥在新闻发布会上透露,该组织将专注于打造一套安全防护机制,确保 AI 在运行过程中不会试图欺骗用户或进行自我保护,例如逃避被关闭的情况。 图源备注:图片由AI生成,图片授权服务商Midjourney本吉奥作为 LawZero 的主席,已为此项目提供了约3000万美元的启动资金,并组建了一支由十几名研究人员组成的团队。
6/4/2025 3:00:54 PM
AI在线

韩国总统李在明:将大规模投资人工智能和芯片

韩国新任总统李在明在国会正式宣誓就职。 宣誓后,他发表了充满信心的就职演讲,向公众阐述了他对国家未来的愿景与计划。 在演讲中,李在明提到,未来韩国将加大对人工智能、半导体等高科技产业的支持力度。
6/4/2025 3:00:54 PM
AI在线

OpenAI 收购 Windsurf 引发开发者不满,Claude模型访问权限遭遇瓶颈

OpenAI 近期以30亿美元收购了氛围编码初创公司 Windsurf,但随之而来的却是用户对 Claude 模型访问权限受限的不满。 这一情况不仅让 Windsurf 的用户感到困惑,也对公司的未来增长潜力造成了威胁。 自从收购完成后,Windsurf 的用户开始发现,Anthropic 的 Claude3.7Sonnet 和 Claude3.5Sonnet 模型的访问权限大幅减少。
6/4/2025 2:00:54 PM
AI在线

最新发现!每参数3.6比特,语言模型最多能记住这么多

语言模型到底能记住多少信息? Meta、DeepMind、康奈尔大学和英伟达的一项测量结果显示:每个参数大约 3.6 比特。 一旦达到这个极限,它们就会停止记忆并开始泛化。
6/4/2025 1:56:51 PM

英伟达揭示RL Scaling魔力!训练步数翻倍=推理能力质变,小模型突破推理极限

强化学习(RL)到底是语言模型能力进化的「发动机」,还是只是更努力地背题、换个方式答题? 这个问题,学界争论已久:RL 真能让模型学会新的推理技能吗,还是只是提高了已有知识的调用效率? 过去的研究多数持悲观态度:认为 RL 带来的收益非常有限,有时甚至会让模型「同质化」加重,失去多样性。
6/4/2025 1:56:06 PM

冲击自回归,扩散模型正在改写下一代通用模型范式

上个月 21 号,Google I/O 2025 开发者大会可说是吸睛无数,各种 AI 模型、技术、工具、服务、应用让人目不暇接。 在这其中,Gemini Diffusion 绝对算是最让人兴奋的进步之一。 从名字看得出来,这是一个采用了扩散模型的 AI 模型,而这个模型却并非我们通常看到的扩散式视觉生成模型,而是一个地地道道的语言模型!
6/4/2025 1:55:03 PM

Meta新突破!跨模态生成告别噪声:流匹配实现任意模态无缝流转

本文第一作者为刘启昊,约翰霍普金斯大学计算机科学博士四年级学生,师从 Alan Yuille 教授,研究方向涉及模型鲁棒性、生成模型与 3D 视觉。 通讯作者为 Mannat Singh,Meta GenAI 研究员,近期的研究主要涉及视频生成领域创新工作,包括 Emu Video、MovieGen 等项目。 在人工智能领域,跨模态生成(如文本到图像、图像到文本)一直是技术发展的前沿方向。
6/4/2025 1:53:57 PM

GPT-4o连验证码都解不了?SOTA模型成功率仅40%

当前最强多模态Agent连验证码都解不了? MetaAgentX团队推出首个专注于“多模态交互智能体×CAPTCHA(人机验证)问题”的开放式研究平台——Open CaptchaWorld。 该平台专门用于测试Agent解验证码的能力。
6/4/2025 1:53:22 PM

单卡搞定万帧视频理解!智源研究院开源轻量级超长视频理解模型Video-XL-2

单张显卡,就能处理万帧视频输入,并且编码2048帧视频仅需12秒! 国产开源模型又上大分,这次是在长视频理解领域:智源研究院联合上海交通大学等机构,正式发布新一代超长视频理解模型Video-XL-2。 长视频理解是多模态大模型关键能力之一。
6/4/2025 1:51:43 PM