资讯列表
通义千问 Qwen 免费上线 AI“深入研究”:十几分钟完成数小时任务
通义千问 Qwen 官方公众号昨日(5 月 13 日)发布博文,宣布推出 Deep Research (深入研究),该智能助理系统能够逐步规划复杂的研究任务,综合大量在线信息,并协助用户完成复杂的科研任务。
o3完爆人类医生,OpenAI基准直击AGI!
最强AI,已击败了人类医生。 就在刚刚,全球60个国家,262名执业医生共同上阵,联手OpenAI打造出「最具AGI标志性」的AI健康系统评估标准——HealthBench。 这个基准包含了5,000个基于现实场景的健康对话,每个对话都有医生定制的评分标准,来评估模型的响应。
我花了整整两周,深度体验了五款最火的 AI 工具,发现它们都有个致命的问题......
Hello,大家好,我是 Sunday。 2025 年都来了,AI 工具已经不再是什么 “黑科技” 拉,而是实打实落地到我们每一个前端人日常开发流程中的 真 -- 提效神器。 但问题也来了,目前市面上 AI 工具越来越多,宣传都很猛,那么真的能用的到底几个呢?
Google 将 Gemini AI 助手扩展至Wear OS和Google TV,开启全新智能体验
在刚刚结束的 Android Show 上,恰逢 Google I/O 开发者大会前夕,Google 宣布了一个备受期待的消息:其最新的人工智能助手 Gemini 即将登陆 Wear OS 智能手表和 Google TV。 这一举措是 Google 计划在所有设备和平台上逐步取代 Google Assistant 的重大步骤。 用户们早已期待这一时刻,现在终于可以在多种设备上与 Gemini 进行互动。
TikTok 推出新 AI 工具 “AI Alive”,轻松将照片变成视频
最近,TikTok 推出了一款名为 “AI Alive” 的新工具,用户可以通过这一 AI 驱动的功能,将静态照片转换为短视频。 用户只需在描述框中输入他们想要的视频效果,系统就会为其生成生动的视频内容。 这一功能的推出使得无论用户是否具备编辑经验,都能够轻松制作出引人注目的短视频。
腾讯混元携手科研机构推出首个多模态统一CoT奖励模型并开源
近日,腾讯混元在与上海 AI Lab、复旦大学及上海创智学院的合作下,正式推出了全新研究成果 —— 统一多模态奖励模型(Unified Reward-Think),并宣布全面开源。 这一创新模型不仅具备了强大的长链推理能力,还首次实现了在视觉任务中 “思考” 的能力,使得奖励模型能够更准确地评估复杂的视觉生成与理解任务。 统一多模态奖励模型的推出,标志着奖励模型在各类视觉任务中的应用达到了新的高度。
英国政府推出 AI 工具“Consult”加速公众咨询
英国政府近日宣布将推出一款名为 “Consult” 的人工智能工具,该工具将用于快速分析公众对政府咨询的反馈。 这是该工具首次在政府咨询中被使用,旨在节省成本和人员时间。 最初,Consult 工具由苏格兰政府应用于对非手术美容程序(如填充唇部)的监管进行公众意见征集。
法律AI独角兽Harvey拥抱Anthropic与谷歌模型,打破OpenAI独家依赖
备受瞩目的法律人工智能工具 Harvey 近日宣布战略调整,未来将整合 Anthropic 和谷歌的领先基础模型,结束了此前完全依赖 OpenAI 技术的局面。 值得注意的是,Harvey 曾是 OpenAI 初创基金的明星投资项目之一,该基金旨在扶持基于 AI 技术(特别是 OpenAI 自研技术)的公司。 尽管 Harvey 强调不会放弃 OpenAI,只是增加了更多模型和云服务选项,但此举无疑对 OpenAI 的竞争对手来说是一次重要的胜利。
加州法官对律师事务所使用虚假 AI 研究提出严厉批评
近日,加州的一名法官对两家律师事务所的行为表示强烈不满,原因是它们在一份补充法律文件中使用了未披露的人工智能生成的研究材料。 法官迈克尔・威尔纳在上周的裁决中对这些律所处以31,000美元的罚款,理由是这份文件中存在大量虚假、不准确和误导性的法律引用和引文。 图源备注:图片由AI生成,图片授权服务商Midjourney法官威尔纳在判决书中提到,他阅读了该法律文件,并对其中引用的法律案例产生了兴趣,结果却发现这些案例根本不存在。
Google 将 Gemini AI 助手扩展至Wear OS和Google TV,开启全新智能体验
在刚刚结束的 Android Show 上,恰逢 Google I/O 开发者大会前夕,Google 宣布了一个备受期待的消息:其最新的人工智能助手 Gemini 即将登陆 Wear OS 智能手表和 Google TV。 这一举措是 Google 计划在所有设备和平台上逐步取代 Google Assistant 的重大步骤。 用户们早已期待这一时刻,现在终于可以在多种设备上与 Gemini 进行互动。
谷歌Android Auto迎来Gemini AI,打造更智能车载体验
在2025年 I/O 开发者大会前夕的 Android Show 上,谷歌宣布将在未来几个月内把其强大的生成式人工智能模型 Gemini 整合到所有支持 Android Auto 的汽车中。 该功能稍后也将扩展到运行谷歌内置操作系统的汽车。 谷歌表示,此举旨在让驾驶体验“更高效、更有趣”,预示着车载交互方式的重大变革。
突发,美商务部叫停「AI扩散规则」藏杀机!英伟达市值再破3万亿
《AI扩散规则》生效前夜,特朗普政府正式叫停。 13日晚,美商务部工业和安全局(BIS)宣布,撤销拜登签署的《AI扩散规则》(即将在5月15日生效)。 图片与此同时,他们又出台了加强全球半导体出口管制的新措施,这些限制可谓是又准又狠。
3D人脸黑科技!Pixel3DMM:单张RGB图像秒变3D人脸,姿势表情精准还原,几何精度碾压竞品15%!
慕尼黑工业大学和伦敦大学学院提出了一款经过微调的 DINO ViT模型 Pixel3DMM,用于逐像素表面法线和 UV 坐标预测。 从上到下,下图展示了 FFHQ 输入图像、估计的表面法线、根据预测的 UV 坐标估计的二维顶点,以及针对上述两个线索的 FLAME 拟合结果。 使用Pixel3DMM 进行野外追踪。
谷歌开源基于物理模拟的气象模型,能预测暴雨、台风、大干旱
传统的通用循环模型(GCMs)在天气预报和气候模拟方面发挥了重要作用,但在处理特殊状态的小尺度时存在局限性,例如,处理云、辐射和降水等未完全解析的物理过程时会使用半经验性参数化,会导致模型在匹配历史数据时的调参过程仍然依靠手动设置,且GCMs自身存在许多持续的错误和偏见。 。 所以为了克服这些困难,谷歌提出了基于物理模拟的神经通用环流气象模型NeuralGCM,并已经开源提供给各大气象机构测试和使用。
ICML Spotlight | MCU:全球首个生成式开放世界基准,革新通用AI评测范式
该工作由通用人工智能研究院 × 北京大学联手打造。 第一作者郑欣悦为通用人工智能研究院研究员,共同一作为北京大学人工智能研究院博士生林昊苇,通讯作者为北京大学助理教授梁一韬和通用人工智能研究院研究员郑子隆。 开发能在开放世界中完成多样任务的通用智能体,是AI领域的核心挑战。
Poe:DeepSeek使用率下降50%,快手崛起、OpenAI暴涨
今天凌晨,全球著名大模型整合应用平台Poe发布了,2025年春季AI模型使用趋势报告。 结果显示,DeepSeek R1的使用率从2月中旬的峰值7%下降到了4月底的3%,整体使用率下降超过50%;OpenAI由于在GPT-4o推出新的文生图功能后,例如,吉卜力风格、仿真自拍等类型图片,实现病毒式增长使用率暴涨。 下面「AIGC开放社区」将从文本、视频、推理、图像和音频5大领域为大家解读这份报告。
首次!流匹配模型引入GRPO,GenEval几近满分,组合生图能力远超GPT-4o
本文由香港中文大学与快手可灵等团队联合完成。 第一作者为香港中文大学 MMLab 博士生刘杰,他的研究方向为强化学习和生成模型,曾获 ACL Outstanding Paper Award。 流匹配模型因其坚实的理论基础和在生成高质量图像方面的优异性能,已成为图像生成(Stable Diffusion, Flux)和视频生成(可灵,WanX,Hunyuan)领域最先进模型的训练方法。
推理大模型1年内就会撞墙,性能无法再扩展几个数量级 | FrontierMath团队最新研究
一年之内,大模型推理训练可能就会撞墙。 以上结论来自Epoch AI。 这是一个专注于人工智能研究和基准测试的非营利组织,之前名动一时的FrontierMath基准测试(评估AI模型数学推理能力)就出自它家。