DeepSeek
4500美元复刻DeepSeek神话,1.5B战胜o1-preview只用RL!训练细节全公开
强化学习迎来重大突破! 近日,来自UC伯克利的研究团队基于Deepseek-R1-Distilled-Qwen-1.5B,通过简单的强化学习(RL)微调,得到了全新的DeepScaleR-1.5B-Preview。 在AIME2024基准中,模型的Pass@1准确率达高达43.1% ——不仅比基础模型提高了14.3%,而且在只有1.5B参数的情况下超越了OpenAI o1-preview!
2/11/2025 4:17:42 PM
新智元
5000字揭秘!DeepSeek-R1-Zero自我进化的三大特点和三大基石
当前 AI 在推理能力提升上遇到了诸多瓶颈,这在一定程度上限制了其进一步发展和广泛应用。 在传统的 AI 训练中,模型对大量监督数据的依赖是一个显著问题。 监督学习需要大量带有标注的数据来训练模型,使其能够对新的数据进行准确的分类或预测。
2/11/2025 4:15:09 PM
小智
一文速通 DeepSeek 家族核心技术点:从 LLM 到 R1!
DeepSeek横空出世并迅速走红,引发了全球科技圈的强烈震动,NVIDIA股价暴跌18%,全球科技股市市值蒸发近1万亿美元。 特朗普也居然公开称赞DeepSeek的崛起具有“积极意义”,并表示这给美国敲响了“警钟”。 Anthropic一方面肯定了DeepSeek的成就,另一方面却呼吁美国政府加强对华芯片管制。
2/11/2025 3:56:18 PM
小喵学AI
在 DeepSeek 的帮助下,我在 GitHub “战绩区”涂鸦
在每个人的 GitHub 的主页上,有一块儿区域特别显眼,就是 Contributions 日历图,也就是下面这个绿色的小方格子部分。 image.pngGitHub 会记录你每天是否有提交代码,提交了多少代码。 哪年比较勤劳,哪年偷懒了,一眼就能看出来。
2/11/2025 3:53:29 PM
风筝
DeepSeek梁文峰或成亚洲顶级科技富豪,估值高达1500亿美元
近日,DeepSeek 的创始人梁文峰凭借其在人工智能领域的成功,可能会成为亚洲顶级科技富豪之一。 根据彭博社对多位初创公司创始人和 AI 专家的调研,DeepSeek 的估值预计将在10亿美元到超过1500亿美元之间。 这意味着梁文峰持有的84% 股份,可能使他跻身亚洲最富有的科技大亨之列。
2/11/2025 3:19:00 PM
AI在线
不卡顿、免费的满血版DeepSeek-R1 API,在无问芯穹这里用上了,更有异构算力鼎力相助
还在为 DeepSeek R1 官网的卡顿抓狂? 无问芯穹大模型服务平台现已上线满血版 DeepSeek-R1、V3,无需邀请即可免费用 Token! 另有异构算力鼎力相助,支持通过 Infini-AI 异构云平台一键获取 DeepSeek 系列模型与多元异构自主算力服务。
2/11/2025 2:41:00 PM
机器之心
IBM 企业级 AI 开发平台 watsonx.ai 上线 DeepSeek R1 蒸馏模型
根据官方介绍,DeepSeek 还借助知识蒸馏技术,利用 R1 模型生成的数据优化了多个 Llama 和 Qwen 变体。
2/11/2025 12:36:07 PM
清源
DeepSeek本地部署详细指南!从 Ollama 到个人知识库应用
作者:lushen一、系统介绍mbp pro:二、Ollama 安装与配置1. 跨平台安装指南Ollama 作为本地运行大模型的利器,支持三大主流操作系统:复制2. 服务验证复制出现上述则表示安装成功,可浏览器访问http://localhost:11434/验证。
2/11/2025 12:15:57 PM
腾讯技术工程
全国首批金融机构,重庆农商行与腾讯云合作落地 DeepSeek 大模型联网应用
重庆农村商业银行10日宣布借助腾讯云大模型知识引擎的能力,在企业微信上线基于DeepSeek模型的智能助手应用“AI小渝”,成为全国首批接入DeepSeek大模型应用的金融机构。
2/11/2025 11:22:22 AM
清源
极狐阿尔法 S5 官宣深度融合 DeepSeek,接入北汽自研“百模汇创平台”
基于该平台架构,该车能够实现行业首个多模型协同,用户可自由切换DeepSeek、minimax等多模型,智能助手还能按需匹配最佳模型,此功能将于4月份通过OTA更新正式上线。
2/11/2025 11:15:40 AM
清源
从 DeepSeek 看25年前端的一个小趋势
从 DeepSeek 看25年前端的一个小趋势大家好,我卡颂。 最近DeepSeek R1爆火。 有多火呢?
2/11/2025 10:17:19 AM
卡颂
知网华知大模型接入DeepSeek AI学术研究助手能力跃升
近日,中国知网宣布其全新的知识服务解决方案——华知大模型与DeepSeek的融合应用正式亮相。 这一组合旨在通过全学科、全领域的专业知识服务能力和深度思考模式,为用户提供更为精准、全面的知识解答。 据悉,中国知网作为数据与技术双轮驱动的知识服务提供商,一直致力于满足用户研究、学习和决策需求。
2/11/2025 10:15:00 AM
AI在线
一文读懂!DeepSeek超简易本地部署教程
概述DeepSeek-R1模型在各项指标直逼甚至超越OpenAI及同类产品,迅速成为业界焦点。 更令人惊喜的是该模型基于MIT协议免费开源,允许任何公司或个人自由商用,无需任何授权限制,一时间在AI界掀起了巨大波澜。 最近DeepSeek服务被外海攻击,有时候无法访问,既然DeepSeek-R1是开源的,那么我们其实可以部署自己的DeepSeek-R1模型,如果再结合Webman AI,效果将更加完美。
2/11/2025 9:29:07 AM
walkor
“DeepSeek出了一个昏招!”
前两天和几个朋友聚会,有个朋友说:“DeepSeek这么厉害,为什么要开源? 美国人都知道了,那着高端显卡一练,一下子就把你超了,开源就是昏招,你看人家OpenAI就不开源。 ”我虽然当了很久的码农,也知道开源的巨大好处,但是他突然这么一说,我一时还不好反驳。
2/11/2025 9:17:57 AM
liuxin
QQ音乐自研AI助手宣布接入满血版DeepSeek-R1
近日,QQ音乐宣布了一项重要技术进展,其自研AI助手已完成对DeepSeek-R1完整版大模型的部署。 这是DeepSeek技术首次在音乐平台上的应用,标志着QQ音乐在智能化服务方面迈出了重要一步。 据悉,集成DeepSeek-R1后的QQ音乐AI助手,将依托该模型的深度思考能力,在歌曲内容推荐、音乐知识问答以及明星资讯搜索等方面,为用户提供更全面、更精准的答复。
2/11/2025 8:36:00 AM
AI在线
DeepSeek R1 震撼登场:从介绍到使用
春节期间,DeepSeek 掀起了一股热潮,成为了科技领域的热门话题。 身边很多非圈内人士茶余饭后也在讨论 DeepSeek,足以见得其火爆程度。 介绍DeepSeek 全称:杭州深度求索人工智能基础技术研究有限公司,成立于 2023 年 7 月 17 日。
2/11/2025 8:35:30 AM
oec2003
推荐一个支持 Deepseek 模型的 AIOPS 平台
介绍Keep 是一个开源的 AI 驱动的监控和告警平台,旨在通过自动化和智能化手段简化运维工作,帮助团队更高效地管理和监控复杂的基础设施和应用。 它结合了传统的监控工具和现代的人工智能技术,实现了 AIOps(人工智能运维) 的核心功能,如异常检测、根因分析、告警降噪和自动化修复。 Keep 的核心目标是通过 AI 技术减少运维团队的负担,提高系统的可靠性和可维护性,同时降低误报和漏报的风险。
2/11/2025 8:20:00 AM
IT运维技术圈
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
马斯克
智能体
AI创作
Anthropic
英伟达
论文
AI新词
代码
训练
算法
Stable Diffusion
LLM
芯片
蛋白质
腾讯
开发者
Claude
苹果
生成式
AI for Science
Agent
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
工具
华为
RAG
AI设计
大语言模型
搜索
字节跳动
具身智能
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
神器推荐
亚马逊
Copilot
特斯拉
应用
DeepMind