AI在线 AI在线

DeepSeek

感谢 DeepSeek,春节后中国 AI 创企融资井喷

DeepSeek 在人工智能领域取得的突破性进展正在中国风投界掀起波澜,结束了连续三年的下滑趋势。
3/13/2025 11:20:46 PM
小小

DeepSeek 3FS 架构分析和思考(上篇)

2025 年 2 月28 日,DeepSeek 在其开源周最后一天压轴发布了自研的并行文件系统 Fire-Flyer File System,简称 3FS。 该系统支撑了 DeepSeek V3&R1 模型训练、推理的全流程,在数据预处理、数据集加载、CheckPoint、KVCache 等场景发挥了重要作用。 项目一经发布,就获得了存储领域的广泛关注。
3/13/2025 1:51:46 PM
火山引擎存储团队

人工智能代理不是玩具,而是工人

为什么必须像评估劳动力一样评估LLM代理,而不仅仅是评估软件。 如果组织仅通过代码行数或聊天完成度等指标来衡量 AI 代理,则可能会低估其最具变革性的价值。 在许多方面,AI 代理更像员工,而不是传统的软件程序:它们可以学习、适应,甚至与人类团队合作。
3/13/2025 1:29:32 PM
佚名

DeepSeek玩家能提前拿苹果新品!只要15万元,在家跑满血版R1

号称地表最强的M3 Ultra,本地跑满血版DeepSeek R1,效果到底如何? 其实,有些DeepSeek玩家们已经提前拿到手做过实测了。 例如这位Alex老哥就是其中之一:他提前拿到了两台搭载M3 Ultra的Mac Studio,配置是这样的:M3 Ultra(32 核中央处理器、80 核图形处理器和 32 核神经网络引擎)512G统一内存1TB固态硬盘具体来说,Alex老哥用配备Thunderbolt 5互连技术(传输速率为 80Gbps)的EXO Labs设备,来运行完整的DeepSeek R1模型(671B、8-bit)。
3/13/2025 12:41:37 PM
量子位

DeepSeek 开源 EPLB,世界上从来没有什么腾空出世!

deepseek开源DualPipe的同一天,还开源了EPLB。 今天来简单聊聊EPLB,包懂。 EPLB是干嘛的?
3/13/2025 10:31:20 AM
架构师之路

DeepSeek-R1的方法迁移到多模态大模型-开源Vision-R1实现方法思路

刚开始琢磨使用DeepSeek-R1风格训练多模态R1模型,就看到这个工作,本文一起看看,供参考。 先提出问题,仅靠 RL 是否足以激励 MLLM 的推理能力? 结论:不能,因为如果 RL 能有效激励推理能力,Vision-R1-Zero 应该表现出生成复杂 CoT 的能力,并在基准测试中提升准确率。
3/13/2025 8:13:47 AM
余俊晖

H20芯片困局:在DeepSeek崛起下的挑战与反思

在当今全球科技竞争的宏大棋局之中,美国针对中国半导体和人工智能芯片发起的制裁行动,恰似汹涌暗潮,正以悄无声息却又极具颠覆性的方式,重塑着中国人工智能产业的发展格局。 在这一复杂局势下,H20 芯片作为特殊的存在进入中国市场,看似是为国内企业送来的“及时雨”,实则暗藏玄机,背后隐藏着诸多亟待剖析的问题。 近年来,美国对我国人工智能发展的制裁手段可谓层层加码、环环相扣。
3/12/2025 5:59:31 PM
徐勇

32B IOI奥赛击败DeepSeek-R1!Open R1开源复刻第三弹,下一步R1-Zero

Hugging Face的Open R1再度升级! Hugging Face的Open R1是一个社区驱动的项目,目标是创建一个完全开源的DeepSeek-R1版本。 目前,已有模型如OlympicCoder-32B和数据集如codeforces发布,显示了项目的进展。
3/12/2025 1:55:05 PM
新智元

使用 VLLM 部署 DeepSeek:基于 Ubuntu 22.04 + RTX 4090 + Docker 的完整指南

最近,大语言模型(LLM)的部署已经成为 AI 开发者绕不开的核心技能。 而 VLLM 作为一款高性能、低延迟的推理引擎,在大模型推理领域迅速崛起。 今天,我就带大家从零开始,在 Ubuntu 22.04 RTX 4090 Docker 环境下,部署 DeepSeek模型,并让它跑起来!
3/12/2025 12:37:50 PM
写代码的中年人

DeepSeek 开源的 DualPipe,居然是梁文峰写的,你感性?

继DeepGEMM之后,deepseek开源了第四弹DualPipe。 今天来简单聊聊DualPipe,包懂。 DualPipe是干嘛的?
3/12/2025 10:36:32 AM
架构师之路

让DeepSeek推荐客户!6个章节深度聊聊设计师如何让私单来找你

若干天之前,有位客户添加我的微信咨询包装设计,一番常规沟通之后,她竟然说是通过 DeepSeek 的推荐找到我的。 当时的我大为震惊,大家看图:与客户的沟通截图. 于是我马上通过 DeepSeek 去询问远麦刘斌的知名度如何,又获得了让我吃惊的答案,DeepSeek 接近 80%还原了我近 10 年来在互联网留下的痕迹,并给出了结论性概括。
3/12/2025 7:17:54 AM
设计史太浓

王炸组合DeepSeek+剪映!手把手教你打造小红书爆款视频!

内容视频化正在成为大势所趋,尤其在小红书平台"破圈"后。 相比图文载体,视频具备 3 倍以上的信息触达效率和优秀的用户留存率,但传统视频制作的高时间成本始终是设计师的最大创作瓶颈。 本文将带你解锁零剪辑基础也能快速产出优质视频内容的方法:AI 提效:从脚本到成片的智能创作链路.
3/12/2025 6:45:30 AM
团队58UXD

用DeepSeek辅助,让竞品分析更有效的3个方法

很多时候,我们辛苦做的竞品分析没有达到预期效果,往往是因为报告里只罗列了信息,却缺乏观点和行动建议。 又或者结论和信息不一致,难以支撑观点。 无论是产出正式的多页报告,还是简短到一页的陈述,目的都是告知竞品调研的结论,为接下来的设计能达成一致作出贡献。
3/12/2025 12:42:02 AM
林影落

欧洲银行纷纷尝试 DeepSeek

The Information 报道,据相关人士透露,自今年 1 月以来,包括汇丰银行、英国国民西敏寺银行(英国四大银行之一)以及西班牙对外银行(BBVA)在内的欧洲主要金融机构,一直在将 DeepSeek 与其他 AI 模型一起进行测试。这和美国银行拒绝使用 DeepSeek 的态度截然不同。
3/11/2025 11:11:18 PM
陈俊熹

DeepSeek 官方:“R2 将在 3 月 17 日发布”为假消息

据蓝鲸新闻报道,针对 DeepSeek 将在 3 月 17 日发布下一代 R2 模型的传闻,DeepSeek 官方企业咨询账号在用户群中回应称,“辟谣:R2 发布为假消息”。
3/11/2025 7:54:51 PM
远洋

阿里巴巴AI搜索引擎Accio用户突破百万 新增AI功能赋能全球贸易

阿里巴巴旗下AI搜索引擎Accio用户数量已于3月11日突破100万里程碑。 该搜索引擎近期推出了一系列新的人工智能功能,旨在为全球贸易中的中小企业提供支持。 根据先前报道,阿里国际于2月28日宣布其面向全球B2B买家的首个AI搜索引擎Accio已接入DeepSeek等先进推理模型,并正式上线深度研究、商业探索等功能。
3/11/2025 4:32:00 PM
AI在线

“新神登场”,消息称 DeepSeek-R2 AI 模型将于 3 月 17 日发布

媒体智通财经援引“消息人士”,称 DeepSeek 下一代 AI 模型 DeepSeek-R2 将于 3 月 17 日发布。
3/11/2025 3:01:26 PM
漾仔

基于Dify与DeepSeek:零门槛训练自己的专属AI大模型

在人工智能(AI)技术日益普及的今天,训练属于自己的AI大模型不再是遥不可及的梦想。 随着DeepSeek  R1的发布,其部署成本仅为ChatGPT的十分之一,这一突破让更多企业和个人能够轻松参与AI开发。 未来,垂直领域的AI大模型和应用将如雨后春笋般涌现,这无疑是一个巨大的机遇。
3/11/2025 10:51:35 AM
冰河技术