DeepSeek
感谢 DeepSeek,春节后中国 AI 创企融资井喷
DeepSeek 在人工智能领域取得的突破性进展正在中国风投界掀起波澜,结束了连续三年的下滑趋势。
3/13/2025 11:20:46 PM
小小
DeepSeek 3FS 架构分析和思考(上篇)
2025 年 2 月28 日,DeepSeek 在其开源周最后一天压轴发布了自研的并行文件系统 Fire-Flyer File System,简称 3FS。 该系统支撑了 DeepSeek V3&R1 模型训练、推理的全流程,在数据预处理、数据集加载、CheckPoint、KVCache 等场景发挥了重要作用。 项目一经发布,就获得了存储领域的广泛关注。
3/13/2025 1:51:46 PM
火山引擎存储团队
人工智能代理不是玩具,而是工人
为什么必须像评估劳动力一样评估LLM代理,而不仅仅是评估软件。 如果组织仅通过代码行数或聊天完成度等指标来衡量 AI 代理,则可能会低估其最具变革性的价值。 在许多方面,AI 代理更像员工,而不是传统的软件程序:它们可以学习、适应,甚至与人类团队合作。
3/13/2025 1:29:32 PM
佚名
DeepSeek玩家能提前拿苹果新品!只要15万元,在家跑满血版R1
号称地表最强的M3 Ultra,本地跑满血版DeepSeek R1,效果到底如何? 其实,有些DeepSeek玩家们已经提前拿到手做过实测了。 例如这位Alex老哥就是其中之一:他提前拿到了两台搭载M3 Ultra的Mac Studio,配置是这样的:M3 Ultra(32 核中央处理器、80 核图形处理器和 32 核神经网络引擎)512G统一内存1TB固态硬盘具体来说,Alex老哥用配备Thunderbolt 5互连技术(传输速率为 80Gbps)的EXO Labs设备,来运行完整的DeepSeek R1模型(671B、8-bit)。
3/13/2025 12:41:37 PM
量子位
DeepSeek 开源 EPLB,世界上从来没有什么腾空出世!
deepseek开源DualPipe的同一天,还开源了EPLB。 今天来简单聊聊EPLB,包懂。 EPLB是干嘛的?
3/13/2025 10:31:20 AM
架构师之路
DeepSeek-R1的方法迁移到多模态大模型-开源Vision-R1实现方法思路
刚开始琢磨使用DeepSeek-R1风格训练多模态R1模型,就看到这个工作,本文一起看看,供参考。 先提出问题,仅靠 RL 是否足以激励 MLLM 的推理能力? 结论:不能,因为如果 RL 能有效激励推理能力,Vision-R1-Zero 应该表现出生成复杂 CoT 的能力,并在基准测试中提升准确率。
3/13/2025 8:13:47 AM
余俊晖
H20芯片困局:在DeepSeek崛起下的挑战与反思
在当今全球科技竞争的宏大棋局之中,美国针对中国半导体和人工智能芯片发起的制裁行动,恰似汹涌暗潮,正以悄无声息却又极具颠覆性的方式,重塑着中国人工智能产业的发展格局。 在这一复杂局势下,H20 芯片作为特殊的存在进入中国市场,看似是为国内企业送来的“及时雨”,实则暗藏玄机,背后隐藏着诸多亟待剖析的问题。 近年来,美国对我国人工智能发展的制裁手段可谓层层加码、环环相扣。
3/12/2025 5:59:31 PM
徐勇
32B IOI奥赛击败DeepSeek-R1!Open R1开源复刻第三弹,下一步R1-Zero
Hugging Face的Open R1再度升级! Hugging Face的Open R1是一个社区驱动的项目,目标是创建一个完全开源的DeepSeek-R1版本。 目前,已有模型如OlympicCoder-32B和数据集如codeforces发布,显示了项目的进展。
3/12/2025 1:55:05 PM
新智元
使用 VLLM 部署 DeepSeek:基于 Ubuntu 22.04 + RTX 4090 + Docker 的完整指南
最近,大语言模型(LLM)的部署已经成为 AI 开发者绕不开的核心技能。 而 VLLM 作为一款高性能、低延迟的推理引擎,在大模型推理领域迅速崛起。 今天,我就带大家从零开始,在 Ubuntu 22.04 RTX 4090 Docker 环境下,部署 DeepSeek模型,并让它跑起来!
3/12/2025 12:37:50 PM
写代码的中年人
DeepSeek 开源的 DualPipe,居然是梁文峰写的,你感性?
继DeepGEMM之后,deepseek开源了第四弹DualPipe。 今天来简单聊聊DualPipe,包懂。 DualPipe是干嘛的?
3/12/2025 10:36:32 AM
架构师之路
让DeepSeek推荐客户!6个章节深度聊聊设计师如何让私单来找你
若干天之前,有位客户添加我的微信咨询包装设计,一番常规沟通之后,她竟然说是通过 DeepSeek 的推荐找到我的。 当时的我大为震惊,大家看图:与客户的沟通截图. 于是我马上通过 DeepSeek 去询问远麦刘斌的知名度如何,又获得了让我吃惊的答案,DeepSeek 接近 80%还原了我近 10 年来在互联网留下的痕迹,并给出了结论性概括。
3/12/2025 7:17:54 AM
设计史太浓
王炸组合DeepSeek+剪映!手把手教你打造小红书爆款视频!
内容视频化正在成为大势所趋,尤其在小红书平台"破圈"后。 相比图文载体,视频具备 3 倍以上的信息触达效率和优秀的用户留存率,但传统视频制作的高时间成本始终是设计师的最大创作瓶颈。 本文将带你解锁零剪辑基础也能快速产出优质视频内容的方法:AI 提效:从脚本到成片的智能创作链路.
3/12/2025 6:45:30 AM
团队58UXD
用DeepSeek辅助,让竞品分析更有效的3个方法
很多时候,我们辛苦做的竞品分析没有达到预期效果,往往是因为报告里只罗列了信息,却缺乏观点和行动建议。 又或者结论和信息不一致,难以支撑观点。 无论是产出正式的多页报告,还是简短到一页的陈述,目的都是告知竞品调研的结论,为接下来的设计能达成一致作出贡献。
3/12/2025 12:42:02 AM
林影落
欧洲银行纷纷尝试 DeepSeek
The Information 报道,据相关人士透露,自今年 1 月以来,包括汇丰银行、英国国民西敏寺银行(英国四大银行之一)以及西班牙对外银行(BBVA)在内的欧洲主要金融机构,一直在将 DeepSeek 与其他 AI 模型一起进行测试。这和美国银行拒绝使用 DeepSeek 的态度截然不同。
3/11/2025 11:11:18 PM
陈俊熹
DeepSeek 官方:“R2 将在 3 月 17 日发布”为假消息
据蓝鲸新闻报道,针对 DeepSeek 将在 3 月 17 日发布下一代 R2 模型的传闻,DeepSeek 官方企业咨询账号在用户群中回应称,“辟谣:R2 发布为假消息”。
3/11/2025 7:54:51 PM
远洋
阿里巴巴AI搜索引擎Accio用户突破百万 新增AI功能赋能全球贸易
阿里巴巴旗下AI搜索引擎Accio用户数量已于3月11日突破100万里程碑。 该搜索引擎近期推出了一系列新的人工智能功能,旨在为全球贸易中的中小企业提供支持。 根据先前报道,阿里国际于2月28日宣布其面向全球B2B买家的首个AI搜索引擎Accio已接入DeepSeek等先进推理模型,并正式上线深度研究、商业探索等功能。
3/11/2025 4:32:00 PM
AI在线
“新神登场”,消息称 DeepSeek-R2 AI 模型将于 3 月 17 日发布
媒体智通财经援引“消息人士”,称 DeepSeek 下一代 AI 模型 DeepSeek-R2 将于 3 月 17 日发布。
3/11/2025 3:01:26 PM
漾仔
基于Dify与DeepSeek:零门槛训练自己的专属AI大模型
在人工智能(AI)技术日益普及的今天,训练属于自己的AI大模型不再是遥不可及的梦想。 随着DeepSeek R1的发布,其部署成本仅为ChatGPT的十分之一,这一突破让更多企业和个人能够轻松参与AI开发。 未来,垂直领域的AI大模型和应用将如雨后春笋般涌现,这无疑是一个巨大的机遇。
3/11/2025 10:51:35 AM
冰河技术
资讯热榜
智谱AI全新企业级超级助手Agent CoCo正式上线
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
ChatGPT 语音功能升级,实时翻译对话更自然流畅
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
苹果向开发者开放本地AI能力,推出全新Foundation Models框架
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊