AI
DeepSeek同款GRPO训练大提速!魔搭开源全流程方案,支持多模态训练、训练加速和评测全链路
GRPO训练又有新的工具链可以用,这次来自于ModelScope魔搭社区。 随着DeepSeek-R1的成功出圈,其使用的GRPO算法受到了业界的广泛关注。 GRPO训练是来自于PPO算法的一种改进,旨在利用采样原理对value model进行简化,以增大训练的稳定性和可维护性。
3/10/2025 9:10:00 AM
量子位
大模型本地部署的“隐形炸弹”,你的数据安全吗?
作者 | 朱雀实验室随着DeepSeek R1等开源大模型的火爆,越来越多的开发者、企业甚至开始尝试在本地部署大语言模型,享受AI带来的便利。 然而近期腾讯混元安全团队-朱雀实验室发现:这些广受欢迎的AI工具中有不少存在安全隐患。 如果使用不当,攻击者可能窃取用户数据、滥用算力资源,甚至控制用户设备。
3/10/2025 9:10:00 AM
腾讯技术工程
让SFT重新伟大!CMU等华人学者提出全新「批判式微调」,媲美复刻版DeepSeek
模仿是传统语言模型训练的主要方式。 LLM在解决现实世界问题方面之所以表现出前所未有的性能,其中一项核心技术是监督微调(SFT)。 在SFT的过程中,模型被要求模仿人类标注或合成的高质量回复,以增强通用指令遵循能力。
3/10/2025 9:00:00 AM
新智元
DeepSeek占比升至9.6%,稳居全球第二!「全球生成式AI行业趋势」发布
近日,SimilarWeb发布了最新的「全球生成式AI行业趋势」报告。 报告中详细分析了截至2月28日,全球生成式AI工具在各个领域的趋势和表现。 报告链接:,AI工具在过去12周的增速约为20%,其中代码自动补全与DevOps增长高达72%。
3/10/2025 8:55:00 AM
新智元
世界首个人类脑细胞计算机诞生!能编程还能活体计算,售价3万5美金
就在刚刚,世界上第一台「合成生物智能」生物计算机诞生了! Cortical lab推出的这款计算机,是由人类神经元直接集成到硅芯片上,可以编程和自适应,甚至还能活体计算。 合成生物智能,再次创造奇迹。
3/10/2025 8:52:00 AM
新智元
狂揽1.3亿美金!AlphaGo大神组队Gemini大牛,用RL打造超级智能,英伟达抢投
正如Ilya所说,AI的下一步,就是「超级智能」。 近日,由DeepMind近12年老将、做出AlphaGo/AlphaZero/MuZero等项目的超级天才Ioannis Antonoglou,和Gemini强化学习的核心负责人Misha Laskin,联合成立的初创Reflection AI终于浮出了水面。 Reflection AI的目标十分明确——构建超级智能自主系统!
3/10/2025 8:38:00 AM
新智元
ICLR 2025 Spotlight |「免费」多模态信息助力3D小样本分割
该文章的第一作者安照崇,目前在哥本哈根大学攻读博士学位,导师为 Serge Belongie。 他硕士毕业于苏黎世联邦理工学院(ETH Zurich),在硕士期间,他跟随导师 Luc Van Gool 进行了多个研究项目。 他的主要研究方向包括场景理解、小样本学习以及多模态学习。
3/10/2025 8:25:00 AM
机器之心
攻破OpenAI o1/o3、DeepSeek R1防线,安全推理过程反成大模型「阿喀琉斯之踵」
本文共同第一作者是杜克大学计算进化智能中心的博士生郭士霆、张健一,导师为陈怡然教授。 在通往 AGI 的道路上,大型推理模型(LRMs)正以前所未有的速度迭代进化:OpenAI 的 o 系列模型凭借类人推理能力刷新多项基准,DeepSeek-R1 以极低的训练成本实现完全不输 o 系列模型的性能突破。 然而,在这股追求推理性能的浪潮之下,一个关乎技术伦理的隐忧正在浮现 —— 当模型运用自身强大的推理能力进行安全审查时,「展示安全推理思维链」这种透明化机制是否会暴露安全隐患?
3/10/2025 8:10:00 AM
机器之心
平衡AI创新与风险的两个框架
风险从未如此之高。 未能适应的企业将成为AI时代的宝丽来和百视达,然而,仓促实施也会带来自身的危险。 2021年2月,Zillow宣布将开始购买由机器学习算法估值的房产,这一举动被广泛赞誉为迈入AI新世界的勇敢一步,然而八个月后,这个新业务部门以约3亿美元的亏损告终。
3/10/2025 8:00:00 AM
Faisal Hoque
Anthropic预测26年AI智力堪比诺奖得主!美国AI行动计划发布在即,五角大楼紧急布局
截止到2026-2027年,AI智力水平将达到诺奖级得主。 Anthropic最新长文,再次宣告,人类离超级智能体近在咫尺。 报告地址:,CEO Dario Amodei在「Machines of Loving Grace」一文中,曾大胆预测——2026年底-2027年初,人类将见证强大AI系统诞生。
3/10/2025 7:30:00 AM
新智元
GenAI的五大应用陷阱:管理者如何避开误区和把握机遇?
随着GenAI在各企业中的普及应用,一些潜在陷阱可能消解其带来的效益。 唯有建立正确思维模式,方能规避这些风险。 凯捷咨询管理实验室专家Elisa Farri与Gabriele Rosani在其新著的《哈佛商业评论GenAI管理指南》中,深入剖析了GenAI应用中的典型误区。
3/10/2025 7:00:00 AM
Joe McKendrick
AI技术:一文带大家了解全球首款自主AI Agent产品Manus
在科技飞速发展的今天,人工智能(AI)已经不再是遥不可及的概念,而是逐渐融入我们的日常生活。 2025年3月6日,一个名叫Manus的AI产品横空出世,它可不是一般的AI助手,而是全球首款通用型AI代理! 那么,Manus到底是什么?
3/10/2025 4:00:00 AM
郝光明
C#+AI暴力变现:自动生成小红书爆款笔记,单账号月流水破10万源码解析
在数字化营销与内容创作深度融合的当下,利用技术手段实现高效内容产出与商业变现成为众多从业者关注的焦点。 C# 语言与AI技术的结合,为小红书爆款笔记的自动生成提供了有力支持,通过构建多平台矩阵运营,实现了单账号月流水破10万的惊人收益。 本文将深入解析其中的技术细节、多平台运营策略及收益数据背后的逻辑。
3/10/2025 1:07:13 AM
conan
Manus肖弘:套壳也要与时俱进!AI产品演进有规律、可预判,把握提前入场的窗口期!不跟风向:做自己最重要!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)22年9月,肖弘看到了一篇报道红杉美国的文章,其中说:生成式 AI 会改变世界。 肖弘将这篇文章转发给了他的联创,两人开始着手研究起AI这一领域和方向。 “蝴蝶效应”由此开始,直到Manus在AI圈掀起了一场飓风。
3/10/2025 1:02:14 AM
伊风
中国智造“Manus”横空出世:邀请码炒到10W?半天就翻车了?
今日科技圈上演 "抢码大战",Manus 内测邀请函引发全民抢购热潮。 据不完全统计,二手交易平台已有超 200 个卖家挂售邀请码,报价从 5.8 万元至 10 万元不等,部分稀缺时段码源溢价率高达 300%。 有科技博主戏称:"现在邀请码的含金量,堪比当年比特币矿机预售资格。
3/10/2025 12:35:00 AM
派大星
最新版DeepSeek保姆喂饭级安装教程:本地部署+避坑指南(升级版)
本文旨在提供一个全面且详细的DeepSeek本地部署指南,帮助大家在自己的设备上成功运行DeepSeek模型。 无论你是AI领域的初学者还是经验丰富的开发者,都能通过本文的指导,轻松完成DeepSeek的本地部署。 一、本地部署的适用场景DeepSeek本地部署适合以下场景:高性能硬件配置:如果你的电脑配置较高,特别是拥有独立显卡和足够的存储空间,那么本地部署将能充分利用这些硬件资源。
3/10/2025 12:00:00 AM
冰河
Manus是智能体的"DeepSeek时刻"?DeepSeek本尊怎么看?
Manus从一夜爆火到一码难求,市场开始出现不同的声音。 支持者认为,Manus是智能体的"DeepSeek时刻";反对者认为,Manus是一场精心策划的“炒作”。 Manus成色究竟如何,不妨来听听作为对标对象的DeepSeek的回答。
3/10/2025 12:00:00 AM
极客AI
GPT-4o举步维艰、Claude 3.7险胜,《超级马里奥》成为了检验大模型的新试金石?
一直以来,AI 领域的研究者都喜欢让模型去挑战那些人类热衷的经典游戏,以此来检验 AI 的「智能程度」。 例如,在 Atari 游戏、围棋(如 AlphaGo)或《星际争霸》等环境中,游戏规则明确,边界清晰,研究者可以精确控制变量(如难度、初始状态、随机性等),确保实验的可重复性。 而 AlphaGo 的胜利能直接证明其策略能力,是因为游戏的胜负、得分或任务完成度也天然提供了直观的评估标准(如胜率、通关时间、得分高低),无需设计复杂的评价指标。
3/9/2025 7:32:00 PM
机器之心
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
LLaMA
Copilot
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind