AI在线 AI在线

DeepSeek

Spring Boot + DeepSeek:解锁 AI 开发新姿势

在当今数字化时代,人工智能(AI)技术正以前所未有的速度改变着我们的生活和工作方式。 作为开发者,我们一直在寻找更高效、更智能的方式来构建应用程序。 今天,我们要为大家介绍一个强大的组合:Spring Boot DeepSeek,这将为你的应用注入智能新动力,开启 AI 开发的新篇章。
2/19/2025 12:00:00 PM
Java技术营地

DeepSeek V3+R1满血微调工具上线!一键启动,硬件要求降10倍

DeepSeek V3/ R1 火爆全网,基于原始模型的解决方案和 API 服务已随处可见,陷入低价和免费内卷。 如何站在巨人肩膀上,通过后训练(post-training)结合专业领域数据,低成本打造高质量私有模型,提升业务竞争力与价值? 已收获近 4 万 GitHub Star 的 Colossal-AI,发布开源大模型后训练工具箱,包含:DeepSeek V3/ R1 满血 671B LoRA 低成本 SFT 微调;完整的强化学习工具链 PPO,GRPO,DPO,SimPO 等;无缝适配 DeepSeek 系列蒸馏模型在内的 HuggingFace 开源模型;兼容支持英伟达 GPU、华为昇腾 NPU 等多种硬件;支持混合精度训练,gradient checkpoint 等训练加速降低成本;灵活的训练配置接口,支持自定义奖励函数、损失函数等;提供灵活的并行策略配置接口,包括数据并行、模型并行、专家并行、ZeRO 和 Offload 等,以适应不同硬件规模。
2/19/2025 11:56:00 AM
机器之心

百度旗下小度官宣接入DeepSeek

今日,百度旗下小度正式官宣接入DeepSeek。 据了解,在此之前,百度地图、百度搜索、百度 Apollo智舱大模型、文心一言、文小言App等已相继接入DeepSeek。 2月13日,百度发文透露,随着文心大模型的迭代升级和成本的不断优化,文心一言将于4月1日起全面免费开放,届时所有PC端和APP端用户都将有机会体验到文心系列的最新模型。
2/19/2025 11:16:00 AM
AI在线

DeepSeek-V3深入解读!

上一篇文章对DeepSeek-R1进行了详细的介绍,今天来看看DeepSeek-R1的基座模型DeepSeek-V3。 项目地址::现有的开源模型在性能和训练成本之间往往难以达到理想的平衡。 一方面,为了提升模型性能,需要增加模型规模和训练数据量,这会导致训练成本急剧上升;另一方面,高效的训练和推理架构对于降低计算资源消耗至关重要。
2/19/2025 10:49:30 AM
Glodma

腾讯新搞了个深度思考模型,我们拿它和DeepSeek掐架

AI好好用报道编辑:杨文这波「左右互搏」有看头了。 腾讯向来以「慢」著称。 无论是游戏、搜索还是音乐、短视频,腾讯都比其他家慢了半拍。
2/19/2025 10:27:00 AM
AI好好用

神州信息引入国产开源大模型 DeepSeek

近日,神州信息宣布引入国产开源大模型 DeepSeek,旨在实现其全栈金融解决方案的智能化升级。 这一举措不仅标志着技术的迭代,也为银行客户带来了低成本且安全的私域环境部署。 通过 DeepSeek 的接入,神州信息旗下九大产品线及30多款关键业务解决方案得到了智能化的全面提升,涵盖了零售客户运营、数字化渠道、开放银行、信贷业务、数据智能及企业级中台等多个领域。
2/19/2025 10:04:00 AM
AI在线

李彦宏解读文心大模型 4.5 开源的意义:开源促进技术普及

在最近的财报电话会上,百度创始人李彦宏就文心大模型4.5系列的开源决策进行了深入的分析。 他表示,从其自主研发的 DeepSeek 项目中,百度深刻认识到开源的最佳模型将大大推动用户的使用和接受程度。 当一个强大的模型实现开源时,自然会吸引更多的人出于好奇心进行尝试,这样的行为不仅能够促进技术的普及,也会带来更广泛的应用。
2/19/2025 10:02:00 AM
AI在线

Deepseek 这么厉害,普通人怎么用好它?

最近,Deepseek 的风头可谓是一时无两,相关消息一波接着一波。 它强大的能力让人惊叹不已,写代码、做翻译、生成文案……简直无所不能! 不少小伙伴跃跃欲试,却又担心自己不是程序员、不会写代码,用不好这么“高大上”的工具。
2/19/2025 8:50:05 AM
架构精进之路

掀桌子了!DeepSeek开源“双脑模型”Janus-Pro:左脑识图,右脑画图!

DeepSeek 这次直接把桌子掀了! 继把大模型价格打到地板价后,他们最新开源的多模态模型更狠——不仅看得懂《清明上河图》的细节,还能照着你的描述生图。 这个多模态模型就是他们悄悄开源的“双脑”视觉模型 Janus-Pro,被称为“左脑能当福尔摩斯解密图片,右脑能当画家挥毫泼墨。
2/19/2025 8:45:43 AM
言川Artie

短期高估、长期低估:微信接入DeepSeek的产品深度思考

微信搜索接入 DeepSeek 后,我看到了太多 DeepSeek 生成的水文,也看到了太多“王炸”、“里程碑”、“深水炸弹”、“重构 AI 搜索”、“游戏终结”等虎狼之词。 比如这篇,直接把 DeepSeek 幻觉搬上来了. 实在忍不住了,决定出来基于事实和逻辑来一版的冷静分析。
2/19/2025 8:41:48 AM

DeepSeek-R1详细解读!

DeepSeek-R1爆火,今天来详细看下。 论文地址::::现有LLMs在推理任务上的改进主要依赖监督微调(SFT)和后训练(Post-Training)方法,但这些方法需要大量人工标注数据且成本高昂。 OpenAI的o1系列模型虽通过扩展推理链(Chain-of-Thought, CoT)提升了性能,但其测试时扩展仍存在挑战。
2/19/2025 8:00:00 AM
GoldMa

基于Deepseek的安全分析工具设计实践

一、分享背景DeepSeek近日红的发紫,春节前发现一个叫Deepseek的LLM送 10 RMB的Token!!!,正巧符合生产工作中拥抱大模型的主旋律,又本着有羊毛必薅的原则配合B站ollama本地部署喂饭视频起了阿里qwen2.5(1.5b)就行Coding辅助。 ollama本地部署Coding模型复制step2:step3:效果:二、工具需求分析GUI化,免去命令行操作,12-80年龄段各类人群均适用。 固定的LLM回复结果,使每一次提问都能得到相同格式的回答(区分在线提问和工具脚本的关键)。
2/19/2025 7:59:06 AM
沈家伟

超简单:三步教你搞定DeepSeek本地部署

最近,国产AI神器DeepSeek爆火,其深度思考能力完美的体现了DeepSeek先进的算力和优越的性能。 可以这么说,DeepSeek的问世,推动了AI大模型的跨越式发展。 作为一款AI领域的现象级产品,DeepSeek的用户量在短时间内暴增,服务器也被大量攻击,不少小伙伴在使用DeepSeek时,经常会出现服务器繁忙的提示。
2/19/2025 7:53:19 AM
冰河

网易云音乐接入 DeepSeek-R1 大模型,用于歌曲智能推荐等领域

网易云音乐18日宣布,其面向创作者研发的“音乐播客生成工具”与“对谈播客生成工具”已完成国产开源大模型DeepSeek-R1的全能力接入。
2/19/2025 7:26:11 AM
清源

新手必看:用DeepSeek轻松产出爆款,三分钟掌握自媒体全流程

今天来分享如何利用 DeepSeek 高效创作自媒体文章,自媒体账号的打造和内容创作是一个系统性工程。 本文将详细拆解如何利用 DeepSeek 完成从账号定位到爆款内容创作的全流程,帮助你快速脱颖而出。 一、账号定位与赛道分析:知己知彼,精准切入1.
2/19/2025 12:07:56 AM
宇宙之一粟

荣耀手机 YOYO 助理灰度更新“深度思考”功能

荣耀手机 YOYO 助理正灰度更新“深度思考”功能(YOYO 助理需更新至 90.0.1.406 版本、语音服务需更新至 9.0.0.177 版本),用户更新后可在对话框处点击 YOYO 头像启用 / 关闭深度思考功能。
2/18/2025 9:58:48 PM
归泷(实习)

一加手机陆续安排接入 DeepSeek 满血版

一加中国区总裁李杰今日发文确认,一加品牌机型正陆续安排接入 DeepSeek。并且他表示接入的 DeepSeek 模型为“满血版”。
2/18/2025 9:35:31 PM
归泷(实习)

理想同学App全新升级,接入DeepSeek R1与V3模型

近日,“理想同学” APP 发布了重要更新,宣布接入 DeepSeek 的 R1 和 V3 模型。 这一升级为用户带来了更加丰富的功能,特别是在深度思考和联网搜索方面的能力提升。 用户可以通过 APP 首页右下方的切换功能,体验 R1 模型所带来的深度思考、联网搜索和连续对话等丰富功能。
2/18/2025 8:42:00 PM
AI在线