AI在线 AI在线

理论

阿里开源全能视频模型!生成编辑都精通,1.3B版本消费级显卡可跑

业界功能最全、消费级显卡可跑、而且还是开源的? 不卖关子了,这就是阿里最新开源的通义万相Wan2.1-VACE,号称当前业界功能最全的视频生成与编辑模型。 有多全呢?
5/16/2025 9:08:00 AM

个人开发者训400亿参数大模型:分布式算力,DeepSeek架构,3090单卡部署

打破科技巨头算力垄断,个人开发者联手也能训练超大规模AI模型? Nous Research宣布推出Psyche Network,可以将全球算力整合起来训练强大的人工智能。 Psyche是一个基于Deepseek的V3 MLA架构的去中心化训练网络,测试网首次启动时直接对40B参数LLM进行预训练,可以在单个H/DGX上训练,并在3090 GPU上运行。
5/16/2025 9:06:00 AM

梁文锋署名DeepSeek新论文:公开V3大模型降本方法

梁文锋亲自参与的DeepSeek最新论文,来了! 这一次,团队把DeepSeek-V3在训练和推理过程中,如何解决“硬件瓶颈”的方法公布了出来。 具体而言,DeepSeek-V3之所以可以只用2048块H800,就能达到超大规模集群(如数万块GPU)相当的训练效果,核心在于四项创新技术:内存优化多头潜在注意力(MLA)计算优化混合专家模型(MoE)与FP8低精度训练通信优化多层网络拓扑与低延迟设计推理加速多token预测(MTP)那么这四项优化具体又是如何起到作用的,我们继续往下看。
5/16/2025 9:02:00 AM

DeepSeek发布最新论文,5大杀手锏让大模型训练、推理暴涨

昨天,全球著名开源大模型平台DeepSeek在huggingface发布了,超强开源模型V3的论文。 主要从硬件架构和模型设计的双视角探讨如何在不牺牲性能的前提下实现更高效的大规模训练和推理以突破硬件瓶颈。 其中,DeepSeek-MoE和多头潜在注意力、FP8混合精度训练以及多标记预测等成为关键创新技术。
5/16/2025 8:58:09 AM

ICML 2025 | 大模型深度思考新范式:交替「推理-擦除」解决所有可计算问题

作者介绍:本文第一作者是丰田工业大学芝加哥 PhD 学生杨晨晓,研究兴趣是机器学习理论和大模型推理,在 ICML,NeurIPS,ICLR 等顶级会议上发表过论文。 本文提出一个交替「推理 - 擦除」的深度思考新范式 PENCIL,比传统 CoT 更高效地解决更复杂的推理任务。 理论上,我们证明 PENCIL 可用最优空间与最优时间下解决所有可计算问题,而这对于传统的 CoT 是不可能的!
5/16/2025 8:44:01 AM

「边思考、边搜索、边写作」WebThinker开启AI搜索&研究新纪元!

李晓熙目前就读于中国人民大学高瓴人工智能学院,博士二年级,导师为窦志成教授,研究方向主要包括检索增强生成、大语言模型推理等。 在国际顶级会议和期刊如 AAAI,SIGIR,TOIS 等发表多篇论文,代表工作包括 Search-o1, WebThinker, RetroLLM, GenIR-Survey, CorpusLM, UniGen 等。 共同第一作者还包括人大高瓴博士生金佳杰和董冠廷。
5/16/2025 8:37:35 AM

体验Fellou AI,告别谷歌和ChatGPT

译者 | 李睿审校 | 重楼网页搜索体验如今正在快速改进,用户无需浏览大量网页即可获取准确信息。 Fellou作为新的浏览代理工具,能够理解用户需求,自动搜索、创建报告、跨网站工作、安全登录私人网站,为用户节省时间,提升搜索体验。 回顾过去一年,人们浏览网页的方式发生了翻天覆地的变化。
5/16/2025 8:35:07 AM
李睿

42岁软件工程师,因AI裁员!千份简历石沉大海,送外卖维生

AI造成的失业大潮来势汹汹。 OpenAI前研究员预测27年会开发出比人更快、更便宜的超级智能体,全面超越人类。 而一位名叫肖恩的软件工程师的故事,似乎只是这场变革的开始。
5/16/2025 8:31:50 AM

从工程视角看 Langflow:一站式 AI Agent 工作流解决方案解析

众所周知,随着技术不断的迭代,构建复杂的 AI 应用,特别是需要整合各种外部服务(API)、不同模型和多样化数据源(数据库)时,往往涉及繁琐的编码和巨大的集成工作量。 对于开发者而言,如何高效地将这些独立的组件连接起来,构建出功能强大的 AI 代理或自动化工作流,是一个普遍的痛点。 正是在这样的背景下,Langflow 应运而生。
5/16/2025 8:25:00 AM
Luga Lee

Spring AI + MCP + DeepSeek-R1-7B + SSE 全流程实战指南

本教程将带你从 0 到 1 实现一个完整的 AI 流式问答应用,整合以下组件:Spring Boot Spring AI 构建服务框架MCP(Model Connector Plugin) 用于统一管理本地/云端大模型DeepSeek-R1-7B 国产高性能大模型(OpenAI API 兼容)SSE(Server-Sent Events) 实现前后端实时流式响应Ollama(可选) 更便捷地部署 DeepSeek-R1-7B 模型并提供 OpenAI 接口支持模型部署方式推荐:Ollama 运行 DeepSeek-R1-7B安装 Ollama访问:(以 DeepSeek 为例)复制也可以加载其它模型,如 llama3, qwen:chat, yi:34b, phi3, mistral 等。 启动 Ollama复制Ollama 会自动监听 OpenAI 风格接口(http://localhost:11434/v1/chat/completions),兼容 stream: true。 Spring Boot 接入 SSE 流式输出服务添加依赖(pom.xml)复制WebClient 配置类复制请求体结构封装复制DeepSeek-R1-7B 接口封装(支持 stream: true)复制控制器对外暴露 SSE 接口复制前端 JS 接入 SSE 实现流式展示复制总结通过以上步骤,我们成功实现了:Ollama 部署并运行 DeepSeek-R1-7B 本地大模型Spring Boot 封装 OpenAI 接口 stream: true实现后端 SSE 推流 前端实时 Token 渲染支持国产开源模型的类 ChatGPT 对话功能
5/16/2025 7:50:58 AM
编程疏影

构建AI技能时应实现的四个目标

在发现从外部聘请AI专家成本高昂后,一些CIO开始探索在企业内部(而不仅仅是IT部门内部)培养AI技能的方法。 许多早期采用者针对AI培训项目采用了四种独特的方法,这些方法现在值得任何企业考虑。 提高办公效率建筑服务公司Arco设立了首个AI培训项目,旨在帮助员工使用Microsoft Copilot进行会议记录、创建行动项,并将其插入Microsoft Planner中。
5/16/2025 7:20:00 AM
Pat Brans

黑暗袭来——AI谄媚和黑暗模式的隐患

当OpenAI在2025年4月中旬推出其ChatGPT-4o更新时,用户和AI社区都惊呆了——不是因为任何突破性的功能或能力,而是因为一些令人深感不安的事情:更新后的模型倾向于过度谄媚,它不分青红皂白地奉承用户,表现出无条件的赞同,甚至支持有害或危险的想法,包括与恐怖主义相关的阴谋。 反对声浪迅速且广泛,引发了公众的谴责,包括来自该公司前临时CEO的谴责。 OpenAI迅速回滚了更新,并发布了多份声明来解释发生了什么。
5/16/2025 7:00:00 AM
Leon Yen

最新总结,不同抽取任务哪个模型最能打

图片在人工智能的浪潮中,多模态大模型(VLM)正以前所未有的速度改变着我们的世界。 从自然语言处理(NLP)到计算机视觉(CV),从大型语言模型(LLM)到检索增强生成(RAG)和智能体(Agent),AI的边界不断被拓展。 而今天,我们将聚焦于一个关键领域——文档结构化抽取,看看12种顶尖的VLM多模态大模型,谁才是真正的强者!
5/16/2025 1:10:00 AM
哎呀AIYA

基于人工智能的以数据为中心的数据架构方法

一、企业数据解决方案的范围即使您并非数据解决方案架构师,您仍然需要参与一个或多个架构领域,以构建集成数据架构。 如果没有良好的数据架构,您的数据部分就不太可能满足服务级别的特性,例如数据互操作性、可扩展性或数据管理。 本文重点探讨企业数据架构(以下简称数据架构),它是企业解决方案架构 (ESA)的重点考量,它连接企业架构和解决方案架构,协调各种战略方向和能力。
5/16/2025 1:00:00 AM
晓晓

腾讯Q1开支暴涨,狂投275亿!马化腾:看好微信专属智能体!加大元宝和微信融合,投入AI将获得长期、可观的回报

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)昨日,腾讯发布了2025年Q1财报! 腾讯正在AI的道路上狂奔——而“元宝”显然是腾讯AI战略里最受关注的一颗明星。 先来看成绩单:腾讯今年一季度收入1,800亿元,同比增长13%,毛利润达到1,005亿元,同比增长20%,经营表现亮眼。
5/15/2025 4:47:41 PM
伊风

Cursor之父自曝产品模型策略及防抄袭方法,如何招聘世界级顶尖人才?面试安排两整天的上班任务,万字访谈还原Cursor出圈历程

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)Cursor 火了,但 Cursor 究竟是如何诞生、发迹的? 为什么只有它可以从众多“套壳”应用中破茧,从 0 到年收入 1 亿 美元仅仅只用了 18 个月? 这款“靠感觉编程”的 Vibe Coding 神器是如成功摆脱“套壳”的标签的?
5/15/2025 2:56:59 PM
云昭

Switch 2芯片细节曝光!英伟达专门定制支持DLSS,网友:掌机模式相当于PS4

Switch 2处理器,细节被实锤! 数毛社(Digital Foundry)消息,已经确定Switch 2采用的是英伟达真·定制版芯片,包含8核CPU和12GB LPDDR5X内存。 GPU则基于Ampere架构,和30系显卡同款,拥有1536个CUDA核心,支持DLSS。
5/15/2025 2:40:24 PM

新版Claude曝光:“极限推理”成最大亮点

O家(OpenAI)刚免费上线GPT-4.1,A家(Anthropic)这边也被曝出新消息——新版Claude Sonnet和Claude Opus,已经在路上了! 这一消息来自The Information,根据它的说法,新版模型最大的亮点,就是“极限推理”(Extreme reasoning)。 简单来说,这个新功能是通过在推理和工具使用之间建立动态循环,能够更智能地处理问题。
5/15/2025 2:39:17 PM