AI
工业AI革命将继续由人类推动
现在是时候挑战实体AI和机器人技术将成为就业杀手的错误观念了。 提升技能、重新培训、加强安全和提高生产力应是关注的重点领域。 2022年ChatGPT的发布让GenAI进入了公众视野。
2/8/2025 4:54:19 PM
Omar Asali
中小 AI 芯片企业感谢 DeepSeek R1:给了我们机会和订单
中国 AI 企业深度求索(DeepSeek)最新发布的推理模型 R1 撼动了美国主导的人工智能生态系统,导致芯片巨头英伟达(NVIDIA)市值缩水数千亿美元。在行业龙头应对冲击波之际,中小型 AI 企业却将此视为规模化发展的战略机遇。
2/8/2025 3:30:27 PM
小小
开源去背景抠图模型BEN2,图片和视频都能去除背景
近日,PramaLLC 推出了其最新的人工智能模型 —— 背景消除网络 BEN2(Background Erase Network),该模型在前景分割技术上做出了显著创新。 BEN2采用了信心引导抠图(Confidence Guided Matting,CGM)管道,利用一个精炼网络专门处理基础模型信心较低的像素,从而获得更为精准、可靠的抠图效果。 BEN2的训练数据集包括 DIS5k 以及 PramaLLC 自有的22K 分割数据集。
2/8/2025 2:37:00 PM
AI在线
浙大&通义全面评测智能体复杂任务规划能力,18主流大模型全不及格|ICLR2025
大模型智能体正在迅速发展,能力已不再局限于 API 调用。 诸如OpenAI的Operator和Anthropic的Computer Use等,能够像人类一样直接与界面交互,执行复杂操作。 在处理这类复杂任务的过程中,大模型智能体将问题分解为可执行的工作流(Workflow)是关键的一步。
2/8/2025 2:10:00 PM
量子位
谷歌AI解决IMO中84%的几何问题,o1一道没做对!Nature:AI已超过金牌得主平均水平
谷歌DeepMind最新数学AI,一举解决了2000-2024年IMO竞赛中84%的几何问题。 AlphaGeometry2论文发布,在总共50道题中完成了42道,相比去年的一代多完成了15道。 作为对比,纯语言模型OpenAI o1和Gemini Flash Thinking一道都解决不了。
2/8/2025 2:00:00 PM
量子位
DeepSeek下棋靠忽悠赢了ChatGPT,网友:孙子兵法都用上了
家人们,要笑不活了。 DeepSeek跟ChatGPT下了一把国际象棋,然后……通过忽悠的方式,竟让ChatGPT直接认输! DeepSeek在这场对决中有多离谱呢?
2/8/2025 1:40:00 PM
量子位
超越CoT!微软剑桥中科院提出MVoT,直接可视化多模态推理过程
大模型也学会了「空间想象力」? 还可以自己解释自己? 在大语言模型(LLMs)和多模态大语言模型(MLLMs)中,思维链(CoT)在复杂推理方面非常有效。
2/8/2025 1:30:00 PM
新智元
从数字化转型到AI优先:智能革命下的企业转型之道
也许我们一直以来对数字化转型的理解都是错误的,我们没有专注于“转型”的部分,反而做得转型很少,数字化很多,我们没有将数字视为业务的新范式,而是过度关注于将传统模型和流程数字化,以及将现有组织现代化。 结果,大多数企业仍然背负着复杂性、部门隔阂以及陈旧的工作方式。 AI的崛起给了我们所有人第二次机会,我们可以选择利用AI来做同样的事情,但更快、更好,或者,我们可以让正确的事情变得更高效,同时开辟一条新路径,利用这项技术真正转型为AI优先的企业。
2/8/2025 1:14:50 PM
Brian Solis
天才解法震惊人类!谷歌AI破天荒摘得奥数金牌,横扫IMO 42道几何难题
时隔6个多月,AlphaGeometry 2直接攻下IMO金牌! 刚刚,谷歌DeepMind一篇28页技术报告,公布了AG2最新突破——在2000-2024年IMO几何题上,解题率从54%飙升至84%。 论文地址:(50道),AG2横扫了42道。
2/8/2025 1:00:00 PM
新智元
新增AI Agent,GitHub Copilot重大更新,超强自动化编程
全球最大开源平台之一GitHub在官网宣布,对AI编程助手Copilot进行了重磅更新,增加AI Agent模式,可以自动迭代代码,识别并修复BUG。 GitHub同时还发布了另一个Agent—Project Padawan的预览版,主要协助开发人员自动执行一些重复、繁琐的开发流程,例如,设置开发环境、运行测试、合并代码等。 此外,GitHub在去年10月推出的Copilot.
2/8/2025 11:30:00 AM
AIGC开放社区
想要开发AI代理?首先,你需要了解这些
出品 | 51CTO技术栈(微信号:blog51cto)如何理解AI代理,它们如何工作? 想象一下开发一个生成式AI时代的API。 这个API将支持自然语言输入,利用大型语言模型的智能,通过与SaaS和企业系统的集成来自动化决策,并通过连接到其他生成式AI支持的API来实现业务流程编排。
2/8/2025 10:29:03 AM
DeepMind新AI系统AlphaGeometry2:超越国际数学奥林匹克金牌得主
谷歌 DeepMind 研究实验室最新推出的 AI 系统 AlphaGeometry2,在解决几何问题方面表现出色,超越了国际数学奥林匹克(IMO)比赛中的平均金牌得主。 该系统被认为是 AlphaGeometry 的改进版本,研究人员表示,AlphaGeometry2能够解决过去25年 IMO 中84% 的几何问题。 为什么 DeepMind 会关注这样的高中数学竞赛呢?他们认为,寻找解决复杂几何问题的新方法,特别是欧几里得几何,可能是提升 AI 能力的关键。
2/8/2025 9:56:00 AM
AI在线
图解系列|DeepSeek-R1的出众推理能力因何而来?
图片DeepSeek-R1 代表了人工智能发展的又一重要里程碑。 对于机器学习领域的研究人员与开发者群体而言,这次发布之所以备受关注,主要有以下两点:首先,这是一款开源权重的模型,并且提供了更小的、经过蒸馏的版本;其次,它公布并深入探讨了训练方法,该方法能够复现类似于 OpenAI O1 的推理模型。 本文将带您了解这一模型的构建过程。
2/8/2025 9:44:11 AM
追求卓越的
李飞飞、DeepSeek为何偏爱这个国产模型?
斯坦福李飞飞团队的一篇论文,近来在AI圈子掀起了一场飓风。 他们仅用1000个样本,在16块H100上监督微调26分钟,训出的新模型s1-32B,竟取得了和OpenAI o1、DeepSeek R1等尖端推理模型相当的数学和编码能力! 团队也再次证明了测试时Scaling的威力。
2/8/2025 9:30:00 AM
新智元
StochSync:可在任意空间中生成高质量360°全景图和3D网格纹理
本文经AIGC Studio公众号授权转载,转载请联系出处。 StochSync方法可以用于在任意空间中生成图像,尤其是360°全景图和3D网格纹理。 该方法利用了预训练的图像扩散模型,以实现zero-shot生成,消除了对新数据收集和单独训练生成模型的需求。
2/8/2025 9:23:08 AM
AIGC Studio
从 Anthropic 离职后,消息称 OpenAI 联合创始人舒尔曼将加入前 CTO 新公司
OpenAI 联合创始人约翰・舒尔曼(John Schulman)上周离开了人工智能初创公司 Anthropic,在该公司仅仅待了五个月。据《财富》杂志报道,他将加入 OpenAI 前首席技术官米拉・穆拉蒂(Mira Murati)的神秘新公司。
2/8/2025 9:08:33 AM
远洋
免费功能卷翻付费版ChatGPT,欧洲AI新贵叫板OpenAI
“欧洲OpenAI”Mistral AI有新动作了! Le Chat(法语“猫”)全新升级,官方自称它是“您生活和工作的终极AI助手”。 从今天开始,Le Chat上线移动端,iOS和Android都支持,不久也将对企业私有基础设施开放。
2/8/2025 8:50:00 AM
量子位
全球顶级AI科学家许主洪加盟阿里!IEEE Fellow,五万被引论文数,曾任Salesforce集团副总裁
AI的新进展频频,人才动态也愈加重磅。 新年第一则大牛人事动向,引发业内关注。 许主洪,IEEE Fellow,新加坡管理大学终身教授,被曝加盟阿里。
2/8/2025 8:40:00 AM
量子位
资讯热榜
昆仑万维面向全球发布天工超级智能体Skywork Super Agents
超多案例!让 Lovart 作图更好看更高效的提示词在这里了!
昆仑万维天工超级智能体发布!AI Office革命来袭,Deep Research碾压OpenAI,成本仅40%!
Flowith NEO发布!全球首款无限步骤、上下文与工具的AI Agent
谷歌发布Flow AI剪辑工具:Veo3 与Imagen4 驱动、镜头控制与场景扩展
告别“单打独斗”!AI 协作新范式 MoA,如何集结大模型“梦之队”?
字节跳动开源多模态模型 BAGEL:图文生成与编辑的新突破
Google搜索推出AI Mode实验,探索全新智能问答体验
标签云
人工智能
AI
OpenAI
AIGC
ChatGPT
模型
DeepSeek
AI绘画
机器人
数据
谷歌
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
芯片
英伟达
生成式
蛋白质
开发者
腾讯
Anthropic
神经网络
研究
3D
计算
Sora
机器学习
AI设计
AI for Science
生成
苹果
GPU
AI视频
搜索
场景
华为
百度
训练
人形机器人
Claude
预测
伟达
xAI
深度学习
Transformer
大语言模型
智能体
字节跳动
模态
文本
具身智能
神器推荐
Copilot
驾驶
LLaMA
视觉
API
算力
应用
安全
干货合集
工具
大型语言模型
视频生成
Agent