DeepSeek
如何高效使用DeepSeek-R1:推理大模型调优指南
如何高效使用DeepSeek-R1:推理大模型提示工程调优指南LLM 中 DeepSeek-R1 与传统非推理模型的交互方式存在本质差异。 在数学推导、代码生成等复杂任务中展现出色能力。 但与通用大模型不同,推理型模型需要特殊的交互策略,博文内容列举几个常见的优化手段,帮助开发者构建高效的交互范式。
强到离谱!如何用DeepSeek快速搞定3D建模+PPT+短视频?
在设计领域,效率与创意是永恒的追求。 随着 AI 技术的迅猛发展,Deepseek 等 AI 工具为设计师带来了前所未有的创作体验。 今天,就来看看 Deepseek 与其他 AI 产品强强联合,如何打破传统设计的边界,解锁无限可能。
算能推出 SRA3-40:全球首款支持 DeepSeek 的 RISC-V 众核服务器
SRA3-40 属于计算服务器范畴,基于算能旗下算丰团队开发的新一代服务器级 64 核心 RISC-V 处理器 SG2044。
视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源
今天给大家重磅推荐一个突破性的视觉强化微调开源项目 —— Visual-RFT (Visual Reinforcement Fine-Tuning)。 论文地址: : Visual-RFT 将 DeepSeek-R1 背后的基于规则奖励的强化学习方法和 OpenAI 的强化微调(Reinforcement Fine-Tuning,RFT)范式成功从纯文本大语言模型拓展到了视觉语言大模型(LVLM)。 通过针对视觉的细分类、目标检测等任务设计对应的规则奖励,Visual-RFT 打破了 DeepSeek-R1 方法局限于文本、数学推理、代码等少数领域的认知,为视觉语言模型的训练开辟了全新路径!
飞猪推出 AI 行程助手:在线旅游行业首个融合多模型智能产品
阿里巴巴旗下领先在线旅游平台飞猪宣布,将于3月5日正式推出在线旅游行业首个融合多个大模型的 AI 产品——“AI 行程助手”。 这一创新产品集成了 DeepSeek-R1和阿里云通义千问旗下主力模型的强大能力,旨在以秒级响应速度为用户提供高度个性化的旅行方案。 此消息一经发布,便在 X 上引发热烈讨论,被视为 AI 技术在旅游行业落地的新里程碑。
小红书AI搜索神器「点点」接入DeepSeek,我们拿它单挑百度
AI好好用报道编辑:杨文啃了10亿 篇小红书、还接入DeepSeek的AI搜索神器「点点」实力如何? 周末在小红书冲浪,刷到一个帖子:小红书旗下独立 AI 搜索 App「点点」上线「深度思考」功能。 而且,看样子也是接入了 DeepSeek R1。
DeepSeek R1与OpenAI模型文风相似度高达74.2%?新研究质疑DeepSeek训练数据
在 DeepSeek 生成的文本中,有 74.2% 的文本在风格上与 OpenAI 模型具有惊人的相似性? 这是一项新研究得出的结论。 这项研究来自 Copyleaks—— 一个专注于检测文本中的抄袭和 AI 生成内容的平台。
三星Galaxy S25系列国行版接入DeepSeek-R1:AI能力全面升级
三星近日宣布,中国市场发售的Galaxy S25系列正式整合DeepSeek-R1大模型,进一步提升其AI功能。 据三星中国官方消息,用户无需额外下载App或注册账号,只需将三星生活助手升级至最新版本,或通过三星智慧主页、Bixby中的“智能体中心”选择DeepSeek-R1智能体,即可体验包括深度思考、联网搜索、情绪价值、上下文记忆及视觉解析在内的多项AI功能。 通过接入DeepSeek-R1,Galaxy S25系列实现了多模态感知与跨应用执行能力的显著提升。
国内第一波弃用 DeepSeek 的公司:潞晨科技官宣暂停相关 API 访问
3 天前,DeepSeek 官方公布线上系统理论成本利润率达 545%。几乎同一时间,“清华系”AI Infra 企业 —— 潞晨科技,突然宣布暂停 DeepSeek API 访问服务。
腾讯元宝下载量超DeepSeek 登顶苹果免费App下载榜第一
腾讯旗下的大模型AI应用——腾讯元宝,在苹果中国区App Store的免费App下载排行榜上实现了突破性进展,成功超越DeepSeek,占据了榜首位置。 目前,免费榜前五的App依次为腾讯元宝、DeepSeek、个人所得税、豆包以及红果短剧。 腾讯元宝自接入DeepSeek以来,腾讯公司便加大了对其的推广力度。
DeepSeek提示词超能手册:五大核心技巧,榨干AI生产力!
🎯 技巧1:R-T-F黄金三件套——角色 任务 格式锁定AI身份,输出不跑偏! R (Role):角色,明确AI需要扮演的身份或专家领域。 T (Task):任务,清晰定义AI需完成的具体目标。
用上DeepSeek,改简历快人一步:AI简历优化保姆级教程
作为科技博主,我测评过上百款AI工具,今天给大家安利一个简历优化的"外挂神器"——DeepSeek。 它能让你的简历从"已读不回"变成"收割offer",操作比美图秀秀还简单,特别适合没经验的应届生和转行小白。 一、为什么需要AI改简历?
DeepSeek推出后,移动端AI风向要变
或许下一波 AI 创新,不是比谁的模型更大,而是比谁的模型离你更近。 DeepSeek R1 正在对整个科技领域产生巨大影响,颠覆人们有关 AI 的认知。 在移动端,革新正在快速发生。
万字梳理:揭秘 DeepSeek 中的 RL 与 AGI 下一步丨AIR 2025
在 DeepSeek 能够破圈而出的一众原因中,完全摒弃传统的监督微调(SFT)、转而采用大规模强化学习(RL)的创新之处是关键所在,这使得模型推理能力在质上取得显著突破,更证明了强化学习在提升大语言模型推理能力方面的巨大潜力。 近几年,学界和业界关于 RL 和 LLM 也涌现出了颇多具备开创性意义的研究成果。 在 AI 智能体推理与决策研讨会(AIR 2025)上,来自伦敦大学学院、加州大学伯克利分校、普林斯顿大学、华盛顿大学、卡内基梅隆大学、Meta、华为等多位学术界和工业界的研究人员围绕强化学习、推理决策、AI 智能体展开讨论,回答了诸多问题,例如:AI 系统如何模拟类人推理和决策过程?
中信特钢成功接入 DeepSeek-R1 大模型,推进数字化转型
中信特钢在数字化转型领域迈出了重要一步,近日在互动平台上宣布已成功接入 DeepSeek-R1大模型。 公司表示,未来将致力于推动数字技术与实体经济的深度融合,以此为基础进行全方位的改革,力求加快构建数据资产并挖掘数据的潜在价值。 中信特钢在推进智能运维方面的努力,是企业在激烈市场竞争中的一项战略举措。
大模型是一场新的搜索战争,OpenAI不会赢家通吃,一家最好被收购!硅谷知名投资人曝料特朗普希望马斯克更积极裁撤美政府预算
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)最近DeepSeek开源周带来了很多惊喜与热议。 但小编发现大家对于马斯克的Grok3的讨论却远远不够充分。 作为“大模型球赛”的最不可捉摸的强大力量,马斯克的xAI最新模型已经上线,便迅速登顶了iPhone的下载排行榜,引起的轰动同样不可小觑。
字节跳动AI编程产品Trae国内版发布 配置豆包1.5pro、满血版DeepSeek模型
2025年3月3日,中国首款AI原生集成开发环境(AI IDE)Trae国内版正式上线。 该产品由字节跳动技术团队推出,旨在为开发者提供更高效、智能化的编程体验。 Trae国内版配置了Doubao-1.5-pro,并支持切换满血版DeepSeek R1、V3模型,能够显著提升编程速度,助力开发者应对复杂技术挑战。
DeepSeek开源周第六天:极致推理优化系统,提高GPU计算效率
在人工智能(AI)技术快速发展的今天,DeepSeek 团队推出了其全新的 DeepSeek-V3/R1推理系统。 这一系统旨在通过更高的吞吐量和更低的延迟,推动 AGI(通用人工智能)的高效发展。 为了实现这一目标,DeepSeek 采用了跨节点专家并行(Expert Parallelism,EP)技术,显著提高了 GPU 的计算效率,并在降低延迟的同时,扩展了批处理规模。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉