DeepSeek
AI大模型专栏正式开撸:DeepSeek本地部署+避坑指南
本文旨在提供一个全面且详细的DeepSeek本地部署指南,帮助大家在自己的设备上成功运行DeepSeek模型。 无论你是AI领域的初学者还是经验丰富的开发者,都能通过本文的指导,轻松完成DeepSeek的本地部署。 一、本地部署的适用场景DeepSeek本地部署适合以下场景:高性能硬件配置:如果你的电脑配置较高,特别是拥有独立显卡和足够的存储空间,那么本地部署将能充分利用这些硬件资源。
10/28/2025 2:00:00 AM
冰河
DeepSeek最会讨好,LLM太懂人情世故了,超人类50%
用过大模型的都知道,它们多多少少存在一些迎合人类的行为,但万万没想到,AI 模型的迎合性比人类高出 50%。 在一篇论文中,研究人员测试了 11 种 LLM 如何回应超过 11500 条寻求建议的查询,其中许多查询描述了不当行为或伤害。 结果发现 LLM 附和用户行为的频率比人类高出 50%,即便用户的提问涉及操纵、欺骗或其他人际伤害等情境,模型仍倾向于给予肯定回应。
10/27/2025 2:29:00 PM
机器之心
最强OCR竟然不是DeepSeek、Paddle!HuggingFace新作:六大顶尖开源OCR模型横评!继DS后又杀出匹黑马!
编辑 | 听雨在AI快速进化的浪潮中,文字和图像的界限正在被重新定义。 那些能“看懂”文件、理解图表、读出语义的视觉语言模型(VLM),正在让传统OCR(光学字符识别)进入一个全新的智能阶段。 如果你还以为OCR只是“识字”的工具,那你可能错过了它真正的革命性变化。
10/24/2025 4:42:09 PM
听雨
独立开源大佬的疯狂实验:Claude Code蛮力出奇迹!40 分钟跑通 DeepSeek-OCR,我一行代码都没写
编辑 | 听雨出品 | 51CTO技术栈(微信号:blog51cto)当 AI 不再只是“写代码”,而是开始自己装环境、跑模型、记笔记——那种感觉,像是它在学会独立思考。 最近,开源工具Datasette创建者、Django 框架联合创始人 Simon Willison 做了一个疯狂实验:他让 Claude Code 全权接管,把 DeepSeek-OCR 在 NVIDIA Spark 上跑了起来。 听起来像是“让 AI 去安装另一个 AI”,但结果却令人震惊——部署成功、过程全自动、连错误都能自我修复。
10/23/2025 4:19:29 PM
听雨
全新开源的DeepSeek-OCR,可能是最近最惊喜的模型!
AI圈虽然天天卷,但是很多的模型,真的越来越无聊了。 每天就是跑分又多了几个点。 直到昨天,DeepSeek久违的发了一个新模型。
10/22/2025 7:01:42 AM
数字生命卡兹克
DeepSeek的新模型很疯狂:整个AI圈都在研究视觉路线,Karpathy不装了
「我很喜欢新的 DeepSeek-OCR 论文…… 也许更合理的是,LLM 的所有输入都应该是图像。 即使碰巧有纯文本输入,你更应该先渲染它,然后再输入。 」一夜之间,大模型的范式仿佛被 DeepSeek 新推出的模型给打破了。
10/21/2025 12:07:00 PM
机器之心
DeepSeek新模型被硅谷夸疯了!用二维视觉压缩一维文字,单GPU能跑,“谷歌核心机密被开源”
DeepSeek最新开源的模型,已经被硅谷夸疯了! 因为实在太DeepSeek了。 3B规模、指数级效能变革、大道至简,甚至被认为把谷歌Gemini严防死守的商业机密开源了。
10/21/2025 8:03:21 AM
从重复抽卡到脑洞大开?一句话让AI更聪明!
只要你平时用多了AI,可能会发现一个问题? 比如你让AI帮优化个文章,它总是动不动就给你用上冒号(:)跟破折号(——),文字间还特别喜欢用成语,喜欢用自问自答,还喜欢用序号(1,2,3,4...),有时候套话还挺多,甚至有时候当你反复抽卡时结果却越来越相似。 明明是不同的,有时甚至是同一个模型换个会话,问同一个开放性问题,得到的答案却总是很相似。
10/21/2025 5:02:24 AM
彩云Sky
太强了!DeepSeek刚刚开源新模型,用视觉方式压缩一切
我们或许能通过文本到图像的方法实现近 10 倍无损上下文压缩。 没想到吧,DeepSeek 刚刚开源了新模型,还是一款 OCR 模型。 可以看到,该模型的参数量为 3B,刚上线不久就已经有 100 多次下载量了。
10/20/2025 5:50:00 PM
机器之心
AI音乐创作成程序员新副业:单曲播放破200万,版权收入数万元
2025年,AI音乐创作工具的普及正在改变音乐行业的创作格局。 今年1月,一位《原神》玩家使用游戏台词结合AI作曲工具Suno创作的歌曲《奥奇坎竟是我自己》在B站获得近640万播放量,引发了关于AI创作能力的广泛讨论。 程序员群体成为AI音乐创作的活跃参与者。
10/17/2025 5:56:47 PM
AI在线
DeepSeek-V3.2-Exp:用稀疏注意力机制,开启长文本处理的“加速引擎”
随着人工智能技术的飞速发展,大语言模型在各个领域都展现出了巨大的潜力。 然而,传统的大语言模型在处理长文本时面临着效率低下和计算成本高昂的问题。 为了解决这一难题,DeepSeek-AI推出了实验性版本DeepSeek-V3.2-Exp,该模型通过引入DeepSeek稀疏注意力机制(DSA),在保持与V3.1-Terminus相当性能的同时,显著提升了长文本处理的效率。
10/14/2025 9:00:48 AM
AGI小兵
华为CloudMatrix384超节点支持DeepSeek-V3.2-Exp:第一时间上线
9 月 29 日,DeepSeek 发布并开源了最新一代大语言模型 DeepSeek-V3.2-Exp,引发了全网关注。 该模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。 与此同时,国内 AI 算力厂商也宣布对新模型实现了适配。
9/29/2025 11:21:00 PM
新闻助手
刚刚,DeepSeek开源V3.2-Exp,公开新稀疏注意力机制DSA
还是熟悉的节奏! 在假期前一天,DeepSeek 果然搞事了。 刚刚,DeepSeek-V3.2-Exp 开源了!
9/29/2025 6:36:00 PM
机器之心
运维新突破:Prometheus+DeepSeek+Dify实现自动巡检
作者 | 崔皓审校 | 重楼整体思路在日常运维中,经常会遇到类似的问题:明明系统前一天运行正常,第二天登录量突然下降,却要花费大量时间去手工检查日志、排查 Prometheus 指标,再整理成报告发给业务方。 这类重复、耗时的工作不仅影响效率,还容易出现遗漏。 于是,我就产生了一个想法:能不能把这种巡检工作自动化?
9/26/2025 8:36:43 AM
崔皓
DeepSeek终极版震撼发布!
从15.9分跳到21.7分——当我看到DeepSeek V3.1-Terminus在"人类终极测试"中的得分时,第一反应是检查了下数据有没有看错。 36%的提升幅度,这在AI模型优化中简直是质的飞跃。 图片昨天DeepSeek正式发布了V3.1-Terminus"终极版",这个名字挺有意思。
9/24/2025 9:13:29 AM
阿丸笔记
DeepSeek 更新了!
昨日,Deepseek推出了V3.1-Terminus,据介绍,这是其混合AI模型Deepseek-V3.1的改进版本。 新模型首先解决了语言区分问题,能够更准确地区分中文与英文,从而避免出现随机特殊字符等低级错误。 同时,Deepseek对内置的代码和搜索代理进行了调整,这让模型在调用外部工具时的稳定性更高,结果也更可靠。
9/23/2025 6:18:41 PM
历史性突破!中国AI首登《自然》封面,DeepSeek重新定义大模型标准
一个明显的趋势是,中国在AI基础研究领域正在从"跟跑者"悄然转变为"领跑者"。 而这一转变的标志性事件,就是昨天DeepSeek-R1研究论文登上《自然》封面这件事。 说实话,当我看到这个消息的时候,第一反应是有点震撼。
9/19/2025 9:13:43 AM
阿丸笔记
警惕诈骗!DeepSeek官方提醒用户防范“算力租赁”及“股权融资”骗局
DeepSeek(深度求索)于9月18日晚发布官方声明,揭示了近期有不法分子冒充公司或其在职员工,利用伪造的工牌及营业执照等资料,在多个平台进行诈骗。 这些骗子以提供“算力租赁”或进行“股权融资”为名义,向用户非法收取费用,此举不仅严重侵害了用户的财产安全,也损害了公司的声誉。 DeepSeek在声明中郑重强调,公司从未要求用户向任何个人账户或非官方账户转账,任何要求私下付款的行为均为诈骗。
9/18/2025 3:41:18 PM
AI在线
资讯热榜
全新开源的DeepSeek-OCR,可能是最近最惊喜的模型!
AI 模型“炒股”比拼!DeepSeek 收益超14%,Gemini2.5Pro 惨亏四成
具身智能学界业界思想「惊人的统一」?美团在IROS开了个学术年会
OpenAI强化Sora 2保护政策,确保艺人声音与肖像权不被侵犯
刚刚,ChatGPT终于可以走遍整个互联网了!OpenAI深夜炸街:原生ChatGPT集成、即时理解、主动执行,浏览器赛道鲨疯了
OpenAI首款ChatGPT浏览器发布!现在就能免费下载使用
告别抽卡!Vidu Q2多图参考生视频功能重磅上线
Andrej Karpathy评DeepSeek-OCR论文:图像输入可能成为大语言模型新方向
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
芯片
腾讯
AI for Science
Stable Diffusion
苹果
Agent
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
人形机器人
研究
AI视频
生成
RAG
大语言模型
百度
具身智能
Sora
工具
GPU
华为
计算
字节跳动
AI设计
搜索
大型语言模型
AGI
视频生成
场景
深度学习
DeepMind
架构
视觉
生成式AI
预测
Transformer
编程
AI模型
伟达
特斯拉
Copilot