AI在线 AI在线

资讯列表

DeepSeek AI 助手登顶苹果商店:低成本、高效率,中国AI崛起引发全球关注

中国人工智能公司 DeepSeek 近日发布其推理模型 R1的开放版本,迅速在科技界引发热议。 其惊人的突破性成就不仅令风险投资家马克·安德森惊叹为“我见过的最令人惊叹、最令人印象深刻的突破之一”,更在AI基准测试中展现出匹敌甚至超越 OpenAI o1模型的实力。 尤其引人关注的是,DeepSeek 声称其模型训练成本仅为560万美元,而美国领先企业则需要数亿美元,这无疑颠覆了人们对AI模型开发成本的认知。
1/27/2025 11:01:00 AM
AI在线

朱啸虎称 DeepSeek 是技术理想主义者的胜利:专注于技术和创新,远胜投放买流量和 PR

深度求索旗下 AI 智能助手应用 DeepSeek 已在美区下载榜上超越 ChatGPT,并登顶苹果 App Store 免费应用榜。
1/27/2025 10:35:27 AM
汪淼

《黑神话:悟空》制作人冯骥“暴论”:DeepSeek 可能是个国运级别的科技成果

游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥昨日发文评价了深度求索旗下的 DeepSeek,称其拥有比肩 O1 的推理能力,并表示很开心这样震撼的突破来自一个纯粹的中国公司。
1/27/2025 9:54:44 AM
归泷(实习)

微软等开源AIOpsLab,可构建自主云AI Agent

微软、加州大学伯克利分校、伊利诺伊大学等研究人员联合开源了,一个专用于云自动化运维的AI Agents——AIOpsLab。 AIOpsLab能模拟真实云服务环境中的复杂操作任务,实现故障的自动化检测、定位和解决问题。 还具备高度的可观测性,能够收集和分析关键的遥测数据,确保对系统状态和应用环境的深入洞察。
1/27/2025 9:51:24 AM
AIGC开放社区

在2025年初,浅浅聊一聊世界模型 World Models

Update 1月10日:感谢评论区补充world model在RL中的定义! 感觉在RL中的定义,world model是针对一个具体子任务的模型,最近上述公司提到的World Model的尺度似乎更大、更加通用,更多从:Language Generation Model (ChatGPT)-Image Generation Model(StableDiffusion)-Video/3D Geneartion Model (二者各有侧重因此平级)-World Generation Model(同时具备时序和空间序建模)这么一个趋势。 当然这个World似乎想要包容一切,于是也并不清晰到底是什么样的表征:是否是video sequence?
1/27/2025 9:37:33 AM
原野寻踪

单张照片生成3D头部模型!Adobe提出FaceLift,从单一人脸图像重建360度头部模型

本文经AIGC Studio公众号授权转载,转载请联系出处。 FaceLift是Adobe和加州大学默塞德分校推出的单图像到3D头部模型的转换技术,能从单一的人脸图像中重建出360度的头部模型。 FaceLift基于两阶段的流程实现:基于扩散的多视图生成模型从单张人脸图像生成一致的侧面和背面视图;生成的视图被输入到GS-LRM重建器中,产出详细的3D高斯表示。
1/27/2025 9:32:23 AM
量子位

预定最强 AI:xAI Grok-3 有望下周登场,推理性能超 OpenAI o1

科技媒体 testingcatalog 今天(1 月 27 日)发布博文,报道称 xAI 官方虽然尚未公布,但 Grok-3 已短暂现身独立平台和 X 平台,开启内部测试,有望下周正式发布。
1/27/2025 9:11:46 AM
故渊

鄂维南李航领衔造高级论文搜索Agent,召回率和精准性超谷歌学术等,磕盐党狂喜

中科院院士鄂维南、字节AI实验室总监李航领衔,推出高级论文搜索Agent。 名为PaSa,两个Agent分别执行多轮搜索和判断论文是否满足查询要求的任务,模仿人类复杂学术搜索行为。 现在就有Demo可玩。
1/27/2025 9:00:00 AM
量子位

深度求索 DeepSeek 登顶苹果 App Store 免费应用榜

深度求索旗下 AI 智能助手应用 DeepSeek 已在美区下载榜上超越 ChatGPT,并登顶苹果 App Store 免费应用榜。
1/27/2025 8:44:00 AM
归泷(实习)

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷,巨头进入恐慌模式,外媒刷屏,大佬发声:中国AI已追上美国
1/27/2025 8:29:32 AM
deep

用Ray观测和监控大语言模型工作负载

译者 | 布加迪审校 | 重楼前言GPT-4、PHI2、BERT和T5等大语言模型(LLM)的出现已彻底改变了自然语言处理,这些模型支持高端应用程序,包括聊天机器人、推荐系统和分析。 然而,LLM中工作负载的规模和复杂性使得保证性能和可靠性成了一大挑战。 在这种情况下,在使用Ray等框架部署工作负载的同时进行监控和观测显得非常必要。
1/27/2025 8:23:41 AM
布加迪

十大机器蜜蜂:机器蜜蜂能拯救地球上所有的植物吗?

译者 | 张哲刚审校 | 重楼作为一个几乎每天都要吃蜂蜜吐司的人,在过去的几年里,我一直非常关注全球蜜蜂种群持续减少这个话题。 蜜蜂不仅仅是蜂蜜生产者,它们还是大自然中伟大的传粉者。 尽管,就传粉者而言,它们并不是唯一,但是,据我所知,它们是唯一能够生产蜂蜜的传粉者。
1/27/2025 8:00:00 AM
张哲刚

全球首个港口服务类大模型方舟 TaaS 开启公测,支持智能规划路线并估算费用

1 月 23 日,由山东港口青岛港与山东港口科技集团打造的全球首个港口服务类大模型 —— 方舟 TaaS(Trade as a Service,贸易即服务)大模型正式开启公测,覆盖六大核心应用场景。
1/27/2025 7:56:09 AM
浩渺

支持 100 万 Tokens 上下文,阿里通义千问推出 Qwen2.5-1M 开源模型

通义千问本次发布了两个新的开源模型,分别是 Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M,这是通义千问首次将开源的 Qwen 模型的上下文扩展到 1M 长度。
1/27/2025 7:14:12 AM
浩渺

MetaDiff:用扩散模型重塑元学习,攻克小样本学习瓶颈!

一眼概览MetaDiff 提出了一种基于条件扩散模型的创新元学习方法,通过将梯度下降优化建模为去噪过程,有效提升了小样本学习(FSL)的性能,显著减少了内循环优化中的内存负担和梯度消失风险。 核心问题小样本学习的主要挑战在于:如何在训练数据有限的情况下快速适应新任务,而不引入过拟合或内存瓶颈。 传统基于梯度的元学习方法需要计算内循环路径上的二阶导数,导致内存消耗高和梯度消失问题,从而影响性能。
1/27/2025 12:57:43 AM
萍哥学AI

全网最干喂饭教程!十个案例带你全方位玩转WHISK(中)

相关教程:. 全网最干喂饭教程! 10个案例带你全方位玩转WHISK(上)哈啰大家好,好久不见啦~~2025 年好呀~~这里是和你一起探索 AIGC 美学边界的戏呱皮 DC。
1/27/2025 12:31:35 AM
戏呱皮DC

2025年,更多AI,更多软件开发者面临的问题

组织准备好应对AI生成代码可能带来的繁琐工作、漏洞和开发者倦怠了吗? 译自More AI, More Problems for Software Developers in 2025,作者 Jennifer Riggins。 生成式AI创造了比以往任何时候都更多的代码。
1/27/2025 12:23:15 AM
岱军

Meta 首席科学家杨立昆谈 DeepSeek 震撼硅谷:这就是开源的力量

他表示:“他们提出了新想法,并基于其他人的工作进行创新。由于他们的工作是公开和开源的,所有人都能从中获益。这就是开源研究和开源技术的力量。”
1/26/2025 10:36:38 PM
清源