DeepSeek
网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一
编程王者Claude地位不稳了? ? 大模型竞技场最新战报出炉,DeepSeek新版R1拿下网页编程第一,小胜Claude Opus 4。
DeepSeek-R1编程问鼎,媲美Claude 4!2025 AI上半场战报来袭
编程新王,又有一位玩家成功晋级。 刚刚,LMArena公布了最新WebDev Arena排行榜,DeepSeek-R1(0528)冲进第一。 新版DeepSeek-R1编程能力,现与Gemini 2.5 Pro、Claude Opus 4并驾齐驱。
本命周!MiniMax M1有多猛?网友:仅用40k思考预算就干翻Gemini,实测:真·超DS!生产环境下更划算!但还不够美观
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)大模型的内卷远远没有结束了。 今天凌晨,MiniMax 扔出了一记重磅炸弹——MiniMax-M1。 先来看看,M1 有多猛?
DeepSeek R1模型震撼AI界:低成本高效能引领行业“效率”新赛道
今年1月,DeepSeek发布的R1模型不仅是一次普通的AI公告,更被誉为科技行业的“分水岭”,其影响力震动了整个科技行业,迫使行业领导者重新思考AI开发的基本方法。 DeepSeek的非凡成就并非源于新颖的功能,而是它以极低的成本实现了与科技巨头相媲美的成果,这标志着AI发展正沿着“效率”和“计算”两条并行轨道快速前进。 在约束中创新:低成本实现高性能DeepSeek的异军突起令人瞩目,它展现了即使在重大限制下,创新也能蓬勃发展的能力。
DeepSeek R1 Model Shocks the AI World: Low-Cost, High Efficiency Leads a New Industry Track
In January of this year, the release of DeepSeek's R1 model was not just an ordinary AI announcement; it was hailed as a "watershed moment" in the tech industry, causing a significant stir across the entire technology sector and forcing industry leaders to rethink their fundamental approaches to AI development. DeepSeek's extraordinary achievements did not stem from novel features but from its ability to deliver results comparable to those of tech giants at a fraction of the cost, marking the rapid progress of AI along two parallel tracks: "efficiency" and "computing."Innovation Under Constraints: High Performance at Low CostDeepSeek's emergence has been remarkable, showcasing the capability for innovation even under significant constraints. In response to U.S.
Former DeepSeek executive secretly starts new AI Agent project, already backed by top VC
According to the news from Tiger嗅, a core executive of the domestic large model company DeepSeek has quietly left and started a new business half a year ago, and plans to launch its first Agent product around Christmas in 2025.Sources close to the matter told Tiger嗅 that the executive once held the role of "CTO" at DeepSeek. However, some insiders pointed out that DeepSeek's internal structure does not clearly set up a "CTO" position. In name, this position may not exist, but there is indeed an executive who takes on technical coordination and R&D decision-making responsibilities similar to those of a CTO.Reliable sources also revealed that this startup project has already received financing support from a leading VC, with the specific amount undisclosed.
如何在本地运行量化版的DeepSeek-R1-0528?
译者 | 布加迪审校 | 重楼DeepSeek-R1-0528是DeepSeek R1 推理模型的最新版本,需要715GB的磁盘空间,使其成为市面上最大的开源模型之一。 然而由于来自Unsloth 的先进的量化技术,该模型的大小可以缩减至162GB,整整缩减了80%。 这使得用户能够以显著降低的硬件要求体验模型的全部功能,尽管性能略有下降。
阿里巴巴蔡崇信自曝:被 DeepSeek 逼急了,工程师春节睡办公室搞研发
阿里巴巴董事会主席蔡崇信坦言公司曾“迷失方向”,如今全力押注AI。面对DeepSeek的竞争压力,阿里工程师春节不休,加速推出Qwen系列模型。蔡崇信表示开源Qwen是为了推动AI普及,反哺云计算业务。#阿里巴巴AI战略# #Qwen开源模型#
免费GPU算力部署DeepSeek-R1 32B
前言DeepSeek-R1发布最新版本DeepSeek-R1-0528,显著提升了模型的思维深度与推理能力,在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。 另外,API接口还增加了Function Calling和JsonOutput 的支持。 DeepSeek-R1团队已经证明,大模型的推理模式可以蒸馏到小模型中,与通过强化学习在小模型上发现的推理模式相比,性能更优。
Mistral 将推出其首个推理模型 Magistral,与 OpenAI 和 DeepSeek 展开竞争
在伦敦科技周的炉边谈话中,门施告诉 CNBC:Mistral 的新模型“擅长数学,也擅长编码”。他强调,该模型“具备与所有其他模型的竞争力”,包括 OpenAI o1 及 DeepSeek R1。
ColorOS 小布助手月活量达 1.5 亿,OPPO 手机(含一加)接入 DeepSeek 设备量行业第一
OPPO、一加手机操作系统官方微博 @ColorOS 今日发文宣布:截至 2025 年 5 月,小布助手月活量已达 1.5 亿,OPPO 手机(含一加)接入 DeepSeek 设备量行业第一。
DeepSeek R1- 0528 在OpenRouter支持本地工具调用
人工智能领域持续快速发展,DeepSeek对其R1-0528模型的最新更新引发了开发者社区的广泛关注。 据AIbase报道,升级后的DeepSeek R1-0528现已支持OpenRouter上的本地工具调用,这一重大改进使开发者能够将本地工具无缝集成到AI工作流中。 本地工具调用提升工作流效率DeepSeek R1-0528是一款开源推理模型,以其可媲美OpenAI o3和Google Gemini2.5Pro等专有模型的性能而闻名。
科大讯飞董事长刘庆峰揭晓:讯飞星火 X1 升级版即将来袭,性能更强大!
科大讯飞在庆祝成立26周年之际,董事长刘庆峰在内部讲话中透露了一项重磅消息 —— 讯飞星火 X1将于7月推出升级版。 这一消息引发了业界的广泛关注,尤其是在今年的高考中,星火 X1(420版)凭借其卓越的表现,成功证明了其在多学科应用中的强大能力。 刘庆峰在讲话中强调,讯飞星火 X1在高考科目的表现令人瞩目,显示出其在数学、代码、逻辑推理、文本生成、语言理解和知识问答等多个领域的显著进步。
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
据虎嗅消息,国内大模型公司DeepSeek的一位核心高管已于半年前悄然离职创业,并计划在2025年圣诞节前后推出其首款Agent产品。 有接近人士向虎嗅透露,该高管曾担任DeepSeek的“CTO”角色,不过也有知情人指出,DeepSeek内部架构中并无明确设置“CTO”职位。 该职位在名义上可能并不存在,但确有高管承担类似的技术统筹与研发决策职责。
高考作文“抽象”上热搜,大模型来战能拿几分?
6月7日上午,2025年全国高考正式拉开帷幕。 首场语文考试结束后,作文题目便迅速成为众人讨论的焦点。 有网友表示,今年的高考作文太难了,甚至是有些抽象。
OPPO ColorOS 小布助手完成 DeepSeek R1 最新版升级
OPPO、一加手机操作系统官方微博 @ColorOS 今日发文宣布,OPPO 小布助手已率先升级 DeepSeek-R1 全新版本(海报显示为“最新版”),号称“从此思考更深,推理更强”。
Qwen和DeepSeek为何都选YaRN?
这篇文章,我们还是从面试官的视角出发,一起来分析一下,如果你在面试现场被问到这个题目,应该如何回答? 1.面试官心理分析首先还是分析一下面试官的心理,面试官问这个问题,主要是想考察三点:第一,你知不知道长度外推这个概念? 很多同学可能听都没听过这个概念,那这个问题当然也就无从答起了。
互联网女皇最新报告:全球 AI 竞争格局生变 中国与开源AI全面突围
硅谷投资人Mary Meeker最新发布的AI报告揭示:全球AI竞争格局正经历深刻重塑。 中国力量与开源浪潮正在撼动OpenAI等头部公司主导的生态,全球进入“群雄逐鹿”的新阶段。 中国AI:性能逼近国际一线,产业融合爆发报告指出,中国在大型语言模型发布节奏上正快速逼近美国,DeepSeek、阿里Qwen、百度文心一言等模型在代码生成与数学推理等核心任务中表现优异。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉