资讯列表
炸裂登场!Qwen3:等了这一个月,开源AI新王带着“思考引擎”杀来了!
全世界的AI圈子,似乎都在屏息等待。 从各种小道消息到官方偶尔泄露的只言片语,过去这一个月,大家都在猜测阿里通义千问的下一代大模型——Qwen3,到底会带来怎样的惊喜。 今天,靴子终于落地!
不要思考过程,推理模型能力能够更强丨UC伯克利等最新研究
其实……不用大段大段思考,推理模型也能有效推理! 是不是有点反常识? 因为大家的一贯印象里,推理模型之所以能力强大、能给出准确的有效答案,靠的就是长篇累牍的推理过程。
AI知识库的真相,你知道吗?
很多人对AI知识库的想象是这样的,他们以为只需将所有资料一股脑地拖进AI客户端,比如 Cherry Studio 内。 图片这样,AI就会认真阅读所有内容,并自动生成完美结论。 然而,实际体验后,许多人发现AI知识库的效果远没有想象中理想,经常遇到各种奇怪的问题。
扎克伯格推出 Meta AI 独立应用,人工智能竞争加剧
马克・扎克伯格宣布推出 Meta AI 应用,旨在与 ChatGPT 竞争,标志着人工智能领域的激烈竞争即将展开。 新的 AI 助手将包含一个 “发现” 功能,用户可以查看朋友如何使用该工具,增强社交互动。 Meta AI 应用是 Meta 公司的一项新举措,它不仅可以在 WhatsApp、Instagram、Facebook 和 Messenger 等平台上使用,还将以独立应用的形式推出,以增加用户的使用频率。
程序员挑战极限:在古老的 DOS 系统上成功运行 Llama 2 模型
在科技飞速发展的今天,一位勇敢的程序员选择回归经典,尝试在老旧的 DOS 环境中运行 Meta 公司最新发布的大语言模型 Llama2。 Yeo Kheng Meng,这位因开发 ChatGPT DOS 客户端而声名鹊起的程序员,花费了一个周末的时间,成功地将这个大型语言模型移植到传统计算环境中,展现了无与伦比的技术创造力。 项目的起步得益于开源代码的便利。
Lyft 推出 “AI 收益助手”,助力司机优化接单策略
北美网约车巨头 Lyft 宣布推出一款名为 “收益助手” 的 AI 聊天工具,旨在帮助司机更高效地安排上路时间。 这款工具能够提供有关如何赚取更多收益的建议,并利用实时数据如机场抵达时间和当地活动情况,协助司机制定接单计划。 根据外媒 The Verge 的报道,“收益助手” 目前正处于早期测试阶段,司机需提前申请才能获得使用权限。
NotebookLM音频概览新增多语言支持 中文音频表现亮眼
2025 年 4 月 30 日 - AIbase报道:谷歌旗下AI研究助手NotebookLM迎来重大更新,其音频概述(Audio Overviews)功能现已支持超过 50 种语言,其中包括备受期待的中文音频支持。 这一突破性进展得益于谷歌Gemini模型的原生音频处理能力,为全球用户提供了更便捷的多语言学习与内容创作体验。 多语言支持打破语言壁垒NotebookLM的音频概述功能自 2024 年 9 月推出以来,以其将上传文档转化为类似播客的生动讨论而广受好评。
三星 Galaxy A 系列迎来 AI 助手新功能,侧键一键唤醒 Gemini
在数字化浪潮的推动下,三星电子于4月29日宣布,将在5月初为部分 Galaxy A 系列手机推送一项激动人心的软件更新。 这项更新将为 Galaxy A565G、A365G 及 A265G 等机型带来全新的功能:用户只需长按侧边按钮,即可迅速启动谷歌的 Gemini 人工智能助手,从而提高日常任务处理的效率。 这一功能的推出,旨在为用户提供更加便捷的操作体验。
RWKV7-G1 1.5B全球语言推理模型发布 支持100多种自然语言
4月29日,RWKV基金会宣布开源发布了RWKV7-G11.5B推理模型,这是一款具备强大推理能力和多语言支持的模型,特别适合在端侧设备(如手机)上运行。 该模型基于World v3.5数据集训练,包含小说、网页、数学、代码和推理数据,总数据量达到5.16T tokens。 RWKV7-G11.5B模型在推理逻辑性方面表现出色,能够完成多语言、数学和代码任务。
ICLR 2025|首个动态视觉-文本稀疏化框架来了,计算开销直降50%-75%
本文由华东师范大学和小红书联合完成,共同第一作者是华东师范大学在读硕士、小红书 NLP 团队实习生黄文轩和翟子杰,通讯作者是小红书 NLP 团队负责人曹绍升,以及华东师范大学林绍辉研究员。 多模态大模型(MLLMs)在视觉理解与推理等领域取得了显著成就。 然而,随着解码(decoding)阶段不断生成新的 token,推理过程的计算复杂度和 GPU 显存占用逐渐增加,这导致了多模态大模型推理效率的降低。
AI杀手级应用有苗头了,自主使用操作系统Agent智能体,开源!
最近微软开源了一个 Agent 叫 UFO,通过自然语言指令实现 Windows 操作系统上的自动化任务操作。 图片之前我们分享的 Agent 大多是自主使用浏览器,而 UFO 更进了一步,可以使用操作系统中的各种APP帮你完成任务。 下面是 UFO 的架构图UFO² architecture可以看到,它是一个多Agent系统,中间的 HostAgent 用来解析用户的自然语言,启动必要的应用程序。
OpenAI玩崩了!GPT-4o更新后变马屁精差评如潮,奥特曼:一周才能完全修复
GPT-4o更新后,有点失控了。 现在简简单单地问一句“天为什么是蓝的? ”,得到的都不是答案,而是先来一句花式夸夸:你这问题真是太有见地了——你有个美丽的心灵,我爱你。
美国众议院通过法案,重拳打击 AI 生成非自愿色情内容
当地时间周一,美国众议院通过一项法案,打击日益泛滥的由人工智能生成的非自愿色情内容,即所谓的“深伪复仇色情(deepfake revenge porn)”。目前,该法案已送交白宫签署。
北美网约车巨头 Lyft 推出“AI 收益助手”:可帮司机“赚更多钱”
“收益助手”可以向司机提供如何赚更多钱的建议,可以询问如何根据机场到达、当地活动等实时数据“优化”他们的班次。
谷歌推出 AI 语言练习工具:支持拍照识词、对话练地道口语
IT之家 4 月 30 日消息,谷歌今日宣布推出三项全新 AI 实验功能,旨在通过更个性化的方式帮助用户学习外语。 第一项实验能帮助用户快速掌握当前场景所需的表达,第二项则鼓励用户放下教科书式语言,用更地道、口语化的方式交流。 第三项实验则利用手机摄像头,让用户借助现实场景学习词汇。
艺电(EA)将裁员数百人,《泰坦陨落》系列新作遭砍
据彭博社报道,艺电正计划裁员数百人,并叫停由旗下Respawn Entertainment开发的一款《泰坦陨落》系列新作。
奥尔特曼:OpenAI 正逐步撤回 GPT-4o“过于奉承”的更新
奥尔特曼今日凌晨在 X 上表示,免费版 ChatGPT 用户的回退已经“完全完成”,预计付费用户的回退“今天也能完成”。他还透露:“我们正在调整模型的个性,未来几天会发布更多更新。”
Google 的 A2A 与 MCP 该如何选择?还是两种都用?
1.引言:协作式人工智能的曙光想想你是如何与同事合作完成那些复杂项目的 —— 你们互相分享信息、提出问题,并整合彼此的专业知识。 现在,请想象这些 AI Agent 也能做同样的事情,它们不再各自为战,而是通过协同工作来解决问题。 这正是 Google 于 2025 年 4 月 9 日发布的 Agent-to-Agent(A2A)协议[1]所追求的目标。