资讯列表
浙大&通义全面评测智能体复杂任务规划能力,18主流大模型全不及格|ICLR2025
大模型智能体正在迅速发展,能力已不再局限于 API 调用。 诸如OpenAI的Operator和Anthropic的Computer Use等,能够像人类一样直接与界面交互,执行复杂操作。 在处理这类复杂任务的过程中,大模型智能体将问题分解为可执行的工作流(Workflow)是关键的一步。
2/8/2025 2:10:00 PM
量子位
腾讯云上线DeepSeek-R1、V3原版模型API接口 支持联网搜索
2月8日,腾讯云宣布推出一项重大创新,将DeepSeek的R1和V3原版模型通过API接口接入腾讯云大模型知识引擎,并支持联网搜索功能。 这一举措使腾讯云成为国内率先实现此类能力的云服务提供商,为企业级AI应用的快速搭建和部署提供了全新的解决方案。 腾讯云此次推出的解决方案具有显著的优势。
2/8/2025 2:09:00 PM
AI在线
腾讯云上线DeepSeek全系API接口并打通联网搜索
腾讯云宣布完成对深度求索(DeepSeek)大模型的深度整合——正式上线DeepSeek-R1和V3原版模型的API接口,并创新性接入自研大模型知识引擎,同步开放联网搜索能力。 凭借腾讯云在推理并发和生成速率等方面的优化,用户可以获得更加稳定、安全、低门槛的使用体验。 开发者只需在云上简单三步即可实现API接口调用,并通过大模型知识引擎提供的文档解析、拆分、embedding、多轮改写等能力,灵活构建专属的AI服务。
2/8/2025 2:09:00 PM
AI在线
已故OpenAI举报人的父母起诉旧金山警方,指控掩盖谋杀真相
近日,已故 OpenAI 举报人苏奇尔・巴拉吉(Suchir Balaji)的父母向旧金山及旧金山警察局提起诉讼,声称他们的儿子并非自杀,而是被谋杀。 巴拉吉在去年11月被发现死于旧金山的公寓,时年26岁。 根据家属的说法,警方并未对他的死因进行充分调查,而是草率地将其定性为自杀。
2/8/2025 2:08:00 PM
AI在线
谷歌AI解决IMO中84%的几何问题,o1一道没做对!Nature:AI已超过金牌得主平均水平
谷歌DeepMind最新数学AI,一举解决了2000-2024年IMO竞赛中84%的几何问题。 AlphaGeometry2论文发布,在总共50道题中完成了42道,相比去年的一代多完成了15道。 作为对比,纯语言模型OpenAI o1和Gemini Flash Thinking一道都解决不了。
2/8/2025 2:00:00 PM
量子位
荣耀手机接入DeepSeek-R1 升级系统以及YOYO助理即可体验
近日,荣耀YOYO智能体商店宣布正式上线DeepSeek-R1尝鲜版,为荣耀手机用户带来全新的智能体验。 只要用户的荣耀手机系统版本达到MagicOS8.0及以上,并将YOYO助理升级到80.0.1.503版本及以上,即可率先体验这一功能。 DeepSeek-R1在代码编写、数学计算、逻辑推理等方面具有强大的智能问询服务能力,能够为用户提供便捷、高效的智能体验。
2/8/2025 1:44:00 PM
AI在线
DeepSeek下棋靠忽悠赢了ChatGPT,网友:孙子兵法都用上了
家人们,要笑不活了。 DeepSeek跟ChatGPT下了一把国际象棋,然后……通过忽悠的方式,竟让ChatGPT直接认输! DeepSeek在这场对决中有多离谱呢?
2/8/2025 1:40:00 PM
量子位
超越CoT!微软剑桥中科院提出MVoT,直接可视化多模态推理过程
大模型也学会了「空间想象力」? 还可以自己解释自己? 在大语言模型(LLMs)和多模态大语言模型(MLLMs)中,思维链(CoT)在复杂推理方面非常有效。
2/8/2025 1:30:00 PM
新智元
从数字化转型到AI优先:智能革命下的企业转型之道
也许我们一直以来对数字化转型的理解都是错误的,我们没有专注于“转型”的部分,反而做得转型很少,数字化很多,我们没有将数字视为业务的新范式,而是过度关注于将传统模型和流程数字化,以及将现有组织现代化。 结果,大多数企业仍然背负着复杂性、部门隔阂以及陈旧的工作方式。 AI的崛起给了我们所有人第二次机会,我们可以选择利用AI来做同样的事情,但更快、更好,或者,我们可以让正确的事情变得更高效,同时开辟一条新路径,利用这项技术真正转型为AI优先的企业。
2/8/2025 1:14:50 PM
Brian Solis
天才解法震惊人类!谷歌AI破天荒摘得奥数金牌,横扫IMO 42道几何难题
时隔6个多月,AlphaGeometry 2直接攻下IMO金牌! 刚刚,谷歌DeepMind一篇28页技术报告,公布了AG2最新突破——在2000-2024年IMO几何题上,解题率从54%飙升至84%。 论文地址:(50道),AG2横扫了42道。
2/8/2025 1:00:00 PM
新智元
苹果把台灯做成机器人!能用动作表达情绪,重新定义机器人交互
苹果首款机器人(试验版),居然是个台灯? ? 前段时间苹果布局机器人的消息频频传出,但究竟要做个什么样式儿的一直没有定论。
2/8/2025 12:45:08 PM
黑客论坛上2000万个OpenAI账户登录信息被售卖,用户需警惕风险
近日,一名自称 “emirking” 的俄罗斯黑客在著名的黑客市场 BreachForums 上发布了声称是2000万个 OpenAI ChatGPT 账户的登录信息,并将其标价出售。 此消息由 AI 创业公司 OpenAI 和网络安全公司 Malwarebytes Labs 于周五联合发布,显示出网络安全威胁的严重性。 图源备注:图片由AI生成,图片授权服务商Midjourney据 Malwarebytes 的博客介绍,emirking 在论坛上发布的帖子是用俄语写成,经过翻译后显示出这名黑客的嚣张态度。
2/8/2025 11:56:00 AM
AI在线
o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜
大语言模型,到底是学会了解决数学问题,还是只是背下了答案? LLM的「Generalize VS Memorize」之争,迎来最新进展。 苏黎世联邦理工的研究员Mislav Balunović,在X上公布了一众顶级AI推理模型在AIME 2025 I比赛中的结果。
2/8/2025 11:44:03 AM
新智元
山姆·奥特曼揭秘:Deepseek R1性价比之选!
在当今的人工智能领域,大模型之间的竞争日益激烈。 Deepseek 推出的 R1 模型引起了广泛关注。 山姆·奥特曼评价道:“Deepseek 的 R1 是一个令人印象深刻的模型,尤其是在他们能够以这个价格提供的东西方面。
2/8/2025 11:31:17 AM
AGI
新增AI Agent,GitHub Copilot重大更新,超强自动化编程
全球最大开源平台之一GitHub在官网宣布,对AI编程助手Copilot进行了重磅更新,增加AI Agent模式,可以自动迭代代码,识别并修复BUG。 GitHub同时还发布了另一个Agent—Project Padawan的预览版,主要协助开发人员自动执行一些重复、繁琐的开发流程,例如,设置开发环境、运行测试、合并代码等。 此外,GitHub在去年10月推出的Copilot.
2/8/2025 11:30:00 AM
AIGC开放社区
割韭菜?博主卖Deepseek付费课4天赚20万
近日,国产大模型 DeepSeek 的发布引起了科技圈和投资市场的广泛关注。 随着这一新技术的热度飙升,各类 DeepSeek 的付费培训课程也随之涌现。 据北京日报报道,春节假期后,网络上出现了大量与 DeepSeek 相关的课程,吸引了众多用户付费参与。
2/8/2025 11:30:00 AM
AI在线
SimilarWeb:DeepSeek 官网全球日访问量已超越谷歌 Gemini
在推出仅两个月后,DeepSeek 便迅速崛起,成为全球第二大受欢迎的人工智能聊天机器人。根据网站追踪公司 SimilarWeb 的数据,DeepSeek.com 的日访问量已经超过了谷歌的 Gemini 和 Character.AI。
2/8/2025 11:14:13 AM
远洋
零样本 | ZAPS:零样本扩散采样,3倍加速逆问题重建,重塑高效影像修复新范式
一、 一眼概览ZAPS(Zero-Shot Approximate Posterior Sampling)是一种针对扩散模型(Diffusion Models, DMs)在逆问题(Inverse Problems)中的高效采样方法。 它利用零样本学习(Zero-Shot Learning)进行自适应超参数优化,使得扩散采样步骤固定,同时提高重建质量并减少推理时间。 二、核心问题当前的扩散模型在解决逆问题(如去模糊、修复、超分辨率)时,存在以下挑战:需要大量的采样步骤,导致推理速度慢;现有的噪声调度策略(Noise Schedule)在逆问题场景下难以直接适用;传统方法使用手动调整的对数似然权重(Log-Likelihood Weights),不够鲁棒,容易导致次优解。
2/8/2025 11:12:34 AM
萍哥学AI