AI在线 AI在线

DeepSeek

4500美元复刻DeepSeek神话,1.5B战胜o1-preview只用RL!训练细节全公开

强化学习迎来重大突破! 近日,来自UC伯克利的研究团队基于Deepseek-R1-Distilled-Qwen-1.5B,通过简单的强化学习(RL)微调,得到了全新的DeepScaleR-1.5B-Preview。 在AIME2024基准中,模型的Pass@1准确率达高达43.1% ——不仅比基础模型提高了14.3%,而且在只有1.5B参数的情况下超越了OpenAI o1-preview!
2/11/2025 4:17:42 PM
新智元

5000字揭秘!DeepSeek-R1-Zero自我进化的三大特点和三大基石

当前 AI 在推理能力提升上遇到了诸多瓶颈,这在一定程度上限制了其进一步发展和广泛应用。 在传统的 AI 训练中,模型对大量监督数据的依赖是一个显著问题。 监督学习需要大量带有标注的数据来训练模型,使其能够对新的数据进行准确的分类或预测。
2/11/2025 4:15:09 PM
小智

一文速通 DeepSeek 家族核心技术点:从 LLM 到 R1!

DeepSeek横空出世并迅速走红,引发了全球科技圈的强烈震动,NVIDIA股价暴跌18%,全球科技股市市值蒸发近1万亿美元。 特朗普也居然公开称赞DeepSeek的崛起具有“积极意义”,并表示这给美国敲响了“警钟”。 Anthropic一方面肯定了DeepSeek的成就,另一方面却呼吁美国政府加强对华芯片管制。
2/11/2025 3:56:18 PM
小喵学AI

在 DeepSeek 的帮助下,我在 GitHub “战绩区”涂鸦

在每个人的 GitHub 的主页上,有一块儿区域特别显眼,就是 Contributions 日历图,也就是下面这个绿色的小方格子部分。 image.pngGitHub 会记录你每天是否有提交代码,提交了多少代码。 哪年比较勤劳,哪年偷懒了,一眼就能看出来。
2/11/2025 3:53:29 PM
风筝

​DeepSeek梁文峰或成亚洲顶级科技富豪,估值高达1500亿美元

近日,DeepSeek 的创始人梁文峰凭借其在人工智能领域的成功,可能会成为亚洲顶级科技富豪之一。 根据彭博社对多位初创公司创始人和 AI 专家的调研,DeepSeek 的估值预计将在10亿美元到超过1500亿美元之间。 这意味着梁文峰持有的84% 股份,可能使他跻身亚洲最富有的科技大亨之列。
2/11/2025 3:19:00 PM
AI在线

不卡顿、免费的满血版DeepSeek-R1 API,在无问芯穹这里用上了,更有异构算力鼎力相助

还在为 DeepSeek R1 官网的卡顿抓狂? 无问芯穹大模型服务平台现已上线满血版 DeepSeek-R1、V3,无需邀请即可免费用 Token! 另有异构算力鼎力相助,支持通过 Infini-AI 异构云平台一键获取 DeepSeek 系列模型与多元异构自主算力服务。
2/11/2025 2:41:00 PM
机器之心

IBM 企业级 AI 开发平台 watsonx.ai 上线 DeepSeek R1 蒸馏模型

根据官方介绍,DeepSeek 还借助知识蒸馏技术,利用 R1 模型生成的数据优化了多个 Llama 和 Qwen 变体。
2/11/2025 12:36:07 PM
清源

DeepSeek本地部署详细指南!从 Ollama 到个人知识库应用

作者:lushen一、系统介绍mbp pro:二、Ollama 安装与配置1. 跨平台安装指南Ollama 作为本地运行大模型的利器,支持三大主流操作系统:复制2. 服务验证复制出现上述则表示安装成功,可浏览器访问http://localhost:11434/验证。
2/11/2025 12:15:57 PM
腾讯技术工程

全国首批金融机构,重庆农商行与腾讯云合作落地 DeepSeek 大模型联网应用

重庆农村商业银行10日宣布借助腾讯云大模型知识引擎的能力,在企业微信上线基于DeepSeek模型的智能助手应用“AI小渝”,成为全国首批接入DeepSeek大模型应用的金融机构。
2/11/2025 11:22:22 AM
清源

极狐阿尔法 S5 官宣深度融合 DeepSeek,接入北汽自研“百模汇创平台”

基于该平台架构,该车能够实现行业首个多模型协同,用户可自由切换DeepSeek、minimax等多模型,智能助手还能按需匹配最佳模型,此功能将于4月份通过OTA更新正式上线。
2/11/2025 11:15:40 AM
清源

从 DeepSeek 看25年前端的一个小趋势

从 DeepSeek 看25年前端的一个小趋势大家好,我卡颂。 最近DeepSeek R1爆火。 有多火呢?
2/11/2025 10:17:19 AM
卡颂

知网华知大模型接入DeepSeek AI学术研究助手能力跃升

近日,中国知网宣布其全新的知识服务解决方案——华知大模型与DeepSeek的融合应用正式亮相。 这一组合旨在通过全学科、全领域的专业知识服务能力和深度思考模式,为用户提供更为精准、全面的知识解答。 据悉,中国知网作为数据与技术双轮驱动的知识服务提供商,一直致力于满足用户研究、学习和决策需求。
2/11/2025 10:15:00 AM
AI在线

一文读懂!DeepSeek超简易本地部署教程

概述DeepSeek-R1模型在各项指标直逼甚至超越OpenAI及同类产品,迅速成为业界焦点。 更令人惊喜的是该模型基于MIT协议免费开源,允许任何公司或个人自由商用,无需任何授权限制,一时间在AI界掀起了巨大波澜。 最近DeepSeek服务被外海攻击,有时候无法访问,既然DeepSeek-R1是开源的,那么我们其实可以部署自己的DeepSeek-R1模型,如果再结合Webman AI,效果将更加完美。
2/11/2025 9:29:07 AM
walkor

“DeepSeek出了一个昏招!”

前两天和几个朋友聚会,有个朋友说:“DeepSeek这么厉害,为什么要开源? 美国人都知道了,那着高端显卡一练,一下子就把你超了,开源就是昏招,你看人家OpenAI就不开源。 ”我虽然当了很久的码农,也知道开源的巨大好处,但是他突然这么一说,我一时还不好反驳。
2/11/2025 9:17:57 AM
liuxin

QQ音乐自研AI助手宣布接入满血版DeepSeek-R1

近日,QQ音乐宣布了一项重要技术进展,其自研AI助手已完成对DeepSeek-R1完整版大模型的部署。 这是DeepSeek技术首次在音乐平台上的应用,标志着QQ音乐在智能化服务方面迈出了重要一步。 据悉,集成DeepSeek-R1后的QQ音乐AI助手,将依托该模型的深度思考能力,在歌曲内容推荐、音乐知识问答以及明星资讯搜索等方面,为用户提供更全面、更精准的答复。
2/11/2025 8:36:00 AM
AI在线

DeepSeek R1 震撼登场:从介绍到使用

春节期间,DeepSeek 掀起了一股热潮,成为了科技领域的热门话题。 身边很多非圈内人士茶余饭后也在讨论 DeepSeek,足以见得其火爆程度。 介绍DeepSeek 全称:杭州深度求索人工智能基础技术研究有限公司,成立于 2023 年 7 月 17 日。
2/11/2025 8:35:30 AM
oec2003

推荐一个支持 Deepseek 模型的 AIOPS 平台

介绍Keep 是一个开源的 AI 驱动的监控和告警平台,旨在通过自动化和智能化手段简化运维工作,帮助团队更高效地管理和监控复杂的基础设施和应用。 它结合了传统的监控工具和现代的人工智能技术,实现了 AIOps(人工智能运维) 的核心功能,如异常检测、根因分析、告警降噪和自动化修复。 Keep 的核心目标是通过 AI 技术减少运维团队的负担,提高系统的可靠性和可维护性,同时降低误报和漏报的风险。
2/11/2025 8:20:00 AM
IT运维技术圈