AI在线 AI在线

资讯列表

智能体版《苦涩的教训》,图灵奖得主Sutton、谷歌RL大佬Silver新作:超人智能靠经验

人类生成的数据推动了人工智能的惊人进步,但接下来会怎样呢? 几天前,Google DeepMind 强化学习副总裁 David Silver 参与了一场播客访谈节目,探讨了如何从依赖人类数据的时代迈向自主学习的时代。 与此同时,David Silver 和他的老师、2024 年图灵奖得主 Richard Sutton 合作撰写的论文《Welcome to the Era of Experience》称人们正站在人工智能新时代的门槛上,并有望达到前所未有的水平;同时展望了新一代智能体,认为它们将主要通过经验来学习,获得超越人类的能力。
4/17/2025 9:10:00 AM
机器之心

刚刚,OpenAI发布最强推理模型o3!图像深度思考首秀,开源编程智能体已揽5k+star

深夜,OpenAI 发布了 o 系列模型的最新成果 o3 和 o4-mini。 该系列模型经过训练,会在响应之前进行更长时间的思考。 OpenAI 表示,这是他们迄今为止发布的最智能模型,也标志着 ChatGPT 能力的巨大飞跃。
4/17/2025 9:02:00 AM
机器之心

月之暗面Kimi开源数学定理证明模型Kimina-Prover

Kimi 技术团队近日发布了 Kimina-Prover 预览版的技术报告,并开源了1.5B 和7B 参数的模型蒸馏版本、用于数据生成的 Kimina-Autoformalizer-7B 模型以及修订过的 miniF2F 基准测试数据集。 Kimina-Prover 是由 Numina 和 Kimi 团队联合研发的一款数学定理证明模型,它在形式化定理证明领域采用了一种新颖的、由推理驱动的探索范式,展现出极佳的性能。 Kimina-Prover 基于 Qwen2.5-72B 模型,并结合 Kimi k1.5的大规模强化学习(RL)流程进行训练。
4/17/2025 9:01:05 AM
AI在线

义乌商城集团接入阿里通义大模型 将打造“AI智能经营助手”

义乌商城集团宣布正式接入阿里通义大模型,结合阿里巴巴在云计算、大数据和电商等领域的优势,帮助210万中小商家利用 AI 技术实现精准经营并快速拓展海外市场。 此次合作标志着义乌商城集团在数字化转型和全球化布局方面迈出了重要一步,也展现了阿里巴巴在推动中小企业数字化转型中的重要作用。 义乌商城集团旗下的 Chinagoods 平台覆盖超过1200万种产品,服务7.5万家实体商铺及210万家中小微企业。
4/17/2025 9:01:05 AM
AI在线

Adobe 投资英国AI视频公司 Synthesia

近日,英国初创公司 Synthesia 凭借在企业 AI 生成视频领域的杰出表现,成功获得了 Adobe 的战略投资。 自成立以来,Synthesia 在 AI 视频化身技术上不断创新,目前已成为行业的领军者。 据悉,Synthesia 的年度经常性收入已突破1亿美元,成为众多企业视频解决方案的首选。
4/17/2025 9:01:05 AM
AI在线

OpenAI 推出全新推理模型 o3,实现图像思考能力

OpenAI 近期发布了其最新的推理模型 o3和 o4-mini,标志着人工智能领域的一次重大突破。 这两款模型不仅在推理能力上超越了以往的版本,还首次实现了图像思考的能力,能够将视觉信息直接融入到思维过程中。 o3被誉为 “天才级” 模型,尤其在编程和数学等任务中表现出色,准确率高达87.5%。
4/17/2025 9:01:05 AM
AI在线

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星

OpenAI 正式发布了其最新开源项目 Codex CLI,这是一款轻量级的代码智能体工具。 该工具的发布迅速引起了极大的关注,仅在短短5小时内,Codex CLI 便突破了5000颗星的评价,预计今天有望突破1万颗星,迅速成为 Github 上的一颗新星。 OpenAI 的联合创始人兼总裁 Greg Brockman 表示,Codex CLI 只是他们代码工具系列的第一款,未来将继续推出更多的智能体产品。
4/17/2025 9:01:05 AM
AI在线

上海人工智能实验室开源小语种多模态数据集万卷·丝路2.0

由上海人工智能实验室发布的“万卷·丝路2.0”多语言多模态语料库正式开源。 该语料库在原有的阿拉伯语、俄语、韩语、越南语、泰语等5个语种基础上,新增了塞尔维亚语、匈牙利语、捷克语3个稀缺语料数据,涵盖文本、图片、音频、视频四大模态,数据总量超过1150万条,音视频时长超过2.6万小时,成为小语种多模态领域的重要资源。 “万卷·丝路2.0”具有多语言、大规模、多模态、高质量的特点。
4/17/2025 9:01:05 AM
AI在线

谷歌 Gemini Live 功能全面开放,安卓用户迎来新体验

近日,谷歌宣布其 Gemini 应用中的 Gemini Live 功能将免费向所有安卓用户开放。 这一功能最早于本月早些时候仅限于 Pixel9和三星 Galaxy S25用户,通过 Gemini Advanced 订阅才能使用。 然而,随着用户对 Gemini Live 功能的积极反馈,谷歌决定改变策略,推动这一功能的普及。
4/17/2025 9:01:05 AM
AI在线

揭秘大模型的魔法:从零开始你的AI冒险

你好,我是写代码的中年人! 你有没有想过,那些能写诗、答题、甚至帮你 debug 代码的 AI 到底是怎么回事? 它们其实是“大型语言模型”(Large Language Models,简称 LLM)的产物。
4/17/2025 9:00:00 AM
写代码的中年人

OpenAI深夜发布满血o3和o4mini: 两个没想到

OpenAI刚刚宣布推出其最新的o系列模型:o3和o4-mini,与以往模型不同,o3和o4-mini被设计为真正的AI系统,模型甚至能连续调用超过600次工具来完成一项艰巨任务,它们在理解和导航大型代码库(比如OpenAI自己的代码库)方面,超越了人类工程师,极大地提高了开发效率这次发布会我有两个没想到:一是没想到o系列模型变成了一个融合的模型,另外一个是引入图像推理“Thinking with Images”,下面第一时间给大家划个重点全面工具访问与推理能力o3和o4-mini最显著的特点是首次实现了对ChatGPT内所有工具的智能使用和组合能力。 它们可以搜索网络、分析上传的文件、处理视觉输入、生成图像,并且能够智能地判断何时以及如何使用这些工具来解决复杂问题。 这些模型经过专门训练,能够在大约一分钟内提供详细且经过深思熟虑的答案,以适当的输出格式解决多方面的问题o3,o4mini性能OpenAI o3是目前最强大的推理模型,在编程、数学、科学、视觉感知等领域推动了技术边界。
4/17/2025 8:59:59 AM
AI寒武纪

围绕多智能体黑箱非凸优化共识难题,华南理工大学团队发表系列研究

多智能体系统分布式共识优化的一系列研究来了! 在智能城市、智能电网、无人系统等前沿应用不断扩展的今天,多智能体系统(Multi-Agent Systems, MAS)作为新一代智能协同的技术基础,正迎来前所未有的发展机遇。 在这些系统中,多个具备计算与通信能力的智能体需要在没有中心协调、通信受限的条件下实现任务协作、资源共享与一致性决策。
4/17/2025 8:55:24 AM
量子位

全网最全「吉卜力」AI神器总结!只要2分钟,照片秒变吉卜力

创建吉卜力风格的图像,现在很流行。 甚至还可以根据图像,生成吉卜力动画:「神秘的微笑」蒙娜丽莎,都会主动和你打招呼! 但是,97%的人可能不知道如何创建它们。
4/17/2025 8:51:20 AM
新智元

“最佳 AI 拍档”合作裂痕初现:OpenAI 谋求独立、微软转向自研

微软与OpenAI的合作关系出现裂痕,OpenAI宣布5000亿美元的Stargate项目,寻求独立发展,不再完全依赖微软云服务。微软则计划投入800亿美元用于AI研发,重心转向自身AI能力。#微软# #OpenAI#
4/17/2025 8:39:42 AM
故渊

开发者值得关注的六大AI调试工具

译者 | 核子可乐审校 | 重楼AI驱动的调试工具正在颠覆开发者识别、诊断和修复代码问题的方式。 这些工具利用机器学习和AI技术自动化传统调试流程,节省时间并提高代码质量。 本文将带大家了解六大最受欢迎的AI调试工具及其核心功能、所需技能和比较优势。
4/17/2025 8:36:30 AM
核子可乐

微软最新报告教你“防诈”:如何避开 AI 生成的虚假招聘与诈骗网站

微软16日发布了最新一期《网络安全信号报告》,详细说明了如何应对当今网络安全领域中的新型威胁、诈骗及欺诈行为,并阐述了AI如何使开发恶意软件变得“比以往任何时候都更加容易”。
4/17/2025 8:05:59 AM
清源

OpenAI发布两款多模态推理模型o4-mini、满血版o3

在今天凌晨1点的技术直播中,OpenAI正式推出其最新且最强大的多模态模型o4-mini和满血版o3。 这两款模型具备独特优势,不仅能同时处理文本、图像和音频,还可作为智能体自动调用网络搜索、图像生成、代码解析等工具,并且拥有深度思考模式,能在思维链中思考图像。 OpenAI公布的测试数据显示,o4-mini表现卓越。
4/17/2025 8:01:05 AM
AI在线

起亚探索 AI 驱动“声音景观”技术:让视障乘客用听觉“感知”旅行

该公司推出了一种名为“声音景观”的AI驱动概念,将外界景观转化为声音景观——从字面上讲,就是用声音呈现周围的自然景象。
4/17/2025 7:53:10 AM
清源