AI在线 AI在线

理论

DeepSeek同款GRPO训练大提速!魔搭开源全流程方案,支持多模态训练、训练加速和评测全链路

GRPO训练又有新的工具链可以用,这次来自于ModelScope魔搭社区。 随着DeepSeek-R1的成功出圈,其使用的GRPO算法受到了业界的广泛关注。 GRPO训练是来自于PPO算法的一种改进,旨在利用采样原理对value model进行简化,以增大训练的稳定性和可维护性。
3/10/2025 9:10:00 AM
量子位

大模型本地部署的“隐形炸弹”,你的数据安全吗?

作者 | 朱雀实验室随着DeepSeek R1等开源大模型的火爆,越来越多的开发者、企业甚至开始尝试在本地部署大语言模型,享受AI带来的便利。 然而近期腾讯混元安全团队-朱雀实验室发现:这些广受欢迎的AI工具中有不少存在安全隐患。 如果使用不当,攻击者可能窃取用户数据、滥用算力资源,甚至控制用户设备。
3/10/2025 9:10:00 AM
腾讯技术工程

Ollama的配置修改与接口调用

一、修改环境变量1.1  配置远程访问在我们本地部署好ollama之后,仅支持本机访问,我们可以通过修改环境变量让其他人可以远程访问。 在wins电脑上增加环境变量:复制1.2  配置本地模型路径1.2.1 本地模型默认路径wins本地模型默认路径:C:\Users\%username%\.ollama\models。 这里 %username% 是当前登录的用户名。
3/10/2025 9:00:00 AM
Python伊甸园

让SFT重新伟大!CMU等华人学者提出全新「批判式微调」,媲美复刻版DeepSeek

模仿是传统语言模型训练的主要方式。 LLM在解决现实世界问题方面之所以表现出前所未有的性能,其中一项核心技术是监督微调(SFT)。 在SFT的过程中,模型被要求模仿人类标注或合成的高质量回复,以增强通用指令遵循能力。
3/10/2025 9:00:00 AM
新智元

DeepSeek占比升至9.6%,稳居全球第二!「全球生成式AI行业趋势」发布

近日,SimilarWeb发布了最新的「全球生成式AI行业趋势」报告。 报告中详细分析了截至2月28日,全球生成式AI工具在各个领域的趋势和表现。 报告链接:,AI工具在过去12周的增速约为20%,其中代码自动补全与DevOps增长高达72%。
3/10/2025 8:55:00 AM
新智元

世界首个人类脑细胞计算机诞生!能编程还能活体计算,售价3万5美金

就在刚刚,世界上第一台「合成生物智能」生物计算机诞生了! Cortical lab推出的这款计算机,是由人类神经元直接集成到硅芯片上,可以编程和自适应,甚至还能活体计算。 合成生物智能,再次创造奇迹。
3/10/2025 8:52:00 AM
新智元

狂揽1.3亿美金!AlphaGo大神组队Gemini大牛,用RL打造超级智能,英伟达抢投

正如Ilya所说,AI的下一步,就是「超级智能」。 近日,由DeepMind近12年老将、做出AlphaGo/AlphaZero/MuZero等项目的超级天才Ioannis Antonoglou,和Gemini强化学习的核心负责人Misha Laskin,联合成立的初创Reflection AI终于浮出了水面。 Reflection AI的目标十分明确——构建超级智能自主系统!
3/10/2025 8:38:00 AM
新智元

Ollama的介绍与测试

一、Ollama介绍Ollama是一个开源工具,专为在本地机器上便捷部署和运行大型语言模型(LLM)而设计。 它提供了一个简洁高效的界面,让用户能够轻松地创建、执行和管理这些复杂的模型。 此外,Ollama还配备了一个丰富的预构建模型库,使得这些模型能够无缝集成到各种应用程序之中,大大提升了开发效率和用户体验。
3/10/2025 8:30:00 AM
Python伊甸园

ICLR 2025 Spotlight |「免费」多模态信息助力3D小样本分割

该文章的第一作者安照崇,目前在哥本哈根大学攻读博士学位,导师为 Serge Belongie。 他硕士毕业于苏黎世联邦理工学院(ETH Zurich),在硕士期间,他跟随导师 Luc Van Gool 进行了多个研究项目。 他的主要研究方向包括场景理解、小样本学习以及多模态学习。
3/10/2025 8:25:00 AM
机器之心

攻破OpenAI o1/o3、DeepSeek R1防线,安全推理过程反成大模型「阿喀琉斯之踵」

本文共同第一作者是杜克大学计算进化智能中心的博士生郭士霆、张健一,导师为陈怡然教授。 在通往 AGI 的道路上,大型推理模型(LRMs)正以前所未有的速度迭代进化:OpenAI 的 o 系列模型凭借类人推理能力刷新多项基准,DeepSeek-R1 以极低的训练成本实现完全不输 o 系列模型的性能突破。 然而,在这股追求推理性能的浪潮之下,一个关乎技术伦理的隐忧正在浮现 —— 当模型运用自身强大的推理能力进行安全审查时,「展示安全推理思维链」这种透明化机制是否会暴露安全隐患?
3/10/2025 8:10:00 AM
机器之心

平衡AI创新与风险的两个框架

风险从未如此之高。 未能适应的企业将成为AI时代的宝丽来和百视达,然而,仓促实施也会带来自身的危险。 2021年2月,Zillow宣布将开始购买由机器学习算法估值的房产,这一举动被广泛赞誉为迈入AI新世界的勇敢一步,然而八个月后,这个新业务部门以约3亿美元的亏损告终。
3/10/2025 8:00:00 AM
Faisal Hoque

Anthropic预测26年AI智力堪比诺奖得主!美国AI行动计划发布在即,五角大楼紧急布局

截止到2026-2027年,AI智力水平将达到诺奖级得主。 Anthropic最新长文,再次宣告,人类离超级智能体近在咫尺。 报告地址:,CEO Dario Amodei在「Machines of Loving Grace」一文中,曾大胆预测——2026年底-2027年初,人类将见证强大AI系统诞生。
3/10/2025 7:30:00 AM
新智元

GenAI的五大应用陷阱:管理者如何避开误区和把握机遇?

随着GenAI在各企业中的普及应用,一些潜在陷阱可能消解其带来的效益。 唯有建立正确思维模式,方能规避这些风险。 凯捷咨询管理实验室专家Elisa Farri与Gabriele Rosani在其新著的《哈佛商业评论GenAI管理指南》中,深入剖析了GenAI应用中的典型误区。
3/10/2025 7:00:00 AM
Joe McKendrick

AI技术:一文带大家了解全球首款自主AI Agent产品Manus

在科技飞速发展的今天,人工智能(AI)已经不再是遥不可及的概念,而是逐渐融入我们的日常生活。 2025年3月6日,一个名叫Manus的AI产品横空出世,它可不是一般的AI助手,而是全球首款通用型AI代理! 那么,Manus到底是什么?
3/10/2025 4:00:00 AM
郝光明

Phi-4-multimodal:图、文、音频统一的多模态大模型架构、训练方法、数据细节

Phi-4-Multimodal 是一种参数高效的多模态模型,通过 LoRA 适配器和模式特定路由器实现文本、视觉和语音/音频的无缝集成。 训练过程包括多阶段优化,确保在不同模式和任务上的性能,数据来源多样,覆盖高质量合成数据。 它的设计体现了小型语言模型在多模态任务上的潜力。
3/10/2025 2:00:00 AM
余俊晖

C#+AI暴力变现:自动生成小红书爆款笔记,单账号月流水破10万源码解析

在数字化营销与内容创作深度融合的当下,利用技术手段实现高效内容产出与商业变现成为众多从业者关注的焦点。 C# 语言与AI技术的结合,为小红书爆款笔记的自动生成提供了有力支持,通过构建多平台矩阵运营,实现了单账号月流水破10万的惊人收益。 本文将深入解析其中的技术细节、多平台运营策略及收益数据背后的逻辑。
3/10/2025 1:07:13 AM
conan

Manus肖弘:套壳也要与时俱进!AI产品演进有规律、可预判,把握提前入场的窗口期!不跟风向:做自己最重要!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)22年9月,肖弘看到了一篇报道红杉美国的文章,其中说:生成式 AI 会改变世界。 肖弘将这篇文章转发给了他的联创,两人开始着手研究起AI这一领域和方向。 “蝴蝶效应”由此开始,直到Manus在AI圈掀起了一场飓风。
3/10/2025 1:02:14 AM
伊风

7B的DeepSeek蒸馏Qwen数学超o1!在测试时间强化学习,MIT积分题大赛考93分

见识过32B的QwQ追平671的DeepSeek R1后——刚刚,7B的DeepSeek蒸馏Qwen模型超越o1又是怎么一回事? 图片新方法LADDER,通过递归问题分解实现AI模型的自我改进,同时不需要人工标注数据。 使Deepseek-R1蒸馏的Qwen2.5 7B模型在麻省理工学院积分大赛(MIT Integration Bee)上达到90分超越o1。
3/10/2025 1:00:00 AM