理论
使用 DeepSeek R1 和 Ollama 搭建一个 RAG 系统(包含完整代码)
你有没有想过,能不能像跟人聊天一样,直接问 PDF 文件或技术手册问题? 比如你有一本很厚的说明书,不想一页页翻,只想问它:“这个功能怎么用? ”或者“这个参数是什么意思?
2/10/2025 11:27:37 AM
wayn
DeepSeek本地部署教程,小白也能搞定!
安装环境操作系统:Windows 10及以上准备工具:轻量级AI模型调用工具Ollama,调用AI模型为deepseek-r1AI 模型管理工具Cherry-Studio或AnythingLLM(二选一)资源链接:复制安装步骤第一步、下载安装Ollama并修改环境变量要运行大模型,首先需要一个好用的工具,推荐使用 Ollama ,它是一个轻量级的工具,支持快速安装和运行大语言模型(如deepseek、Llama、Qwen 等)。 ollama下载地址 :官网链接(文章开头)选择合适的操作系统下载,默认安装完成即可。 这里注意,ollama安装完成后先不要启用,因为它默认是会将模型下载到C盘的,deepseek、Qwen等模型最小也有好几个GB会占用C盘空间,所以需要先设置ollama的环境变量。
2/10/2025 11:11:47 AM
小云君网络
ICLR 2025 | Diffusion Planner: 基于扩散模型的自动驾驶规划算法,nuPlan SOTA!
本文介绍了清华大学联合毫末智行、自动化所、港中文、上海交大、上海人工智能实验室的发表于ICLR 2025的最新研究成果《Diffusion-based Planning for Autonomous Driving with Flexible Guidance》。 该算法创新性地设计了基于 Diffusion Transformer 的自动驾驶规划模型架构,高效处理复杂场景输入,并联合建模周车运动预测与自车规划中的多模态驾驶行为,充分发挥扩散模型在闭环规划中的潜力,解决了现有基于学习的规划方法对后处理的严重依赖问题。 此外,借助扩散模型的引导机制,模型在部署阶段能够灵活适应不同的驾驶需求,提高泛化能力与实用性。
2/10/2025 11:01:00 AM
新闻助手
Deepseek4j再更新:Java应用一行代码集成DeepSeek
deepseek4j 是什么deepseek4j() 是一个专为 Java 开发者打造的 DeepSeek 模型集成框架。 通过优雅的 API 设计,只需一行代码,即可实现接入 DeepSeek,并获得以下核心能力:完整思维链保留:完美保留 DeepSeek 模型的推理过程,让 AI 的思考过程可追溯流式输出体验:基于 Reactor 实现的流式响应,带来类 ChatGPT 的打字机效果复制使用 deepseek4j,您可以专注于业务逻辑开发,而无需关心底层细节。 一、v1.3 更新内容1.1 联网搜索支持1739118403新版本最重要的更新是引入了联网搜索能力,这一功能带来三个关键优势:突破时间边界:模型不再受限于预训练数据的时间范围,可以获取和处理最新信息实时信息获取:通过高质量信息源获取实时资讯,提供更精准的问答服务差异化竞争:在大模型同质化严重的当下,联网搜索成为关键的差异化竞争点复制1.2 智能系统提示词1739118117系统提示词(System Prompt)是基于模型开发的应用程序内置的指令,让决定了模型在特定上下文中的表现方式、回答风格和功能范围。
2/10/2025 10:49:51 AM
冷冷
关于自动驾驶,尤其是端到端自动驾驶:到底有哪些可能的量产技术路线?
0.1 什么是端到端? 首先定义端到端,当然有很多说法。 我觉得,起码说相对于分阶段而言,规划不只是根据感知和预测的结果,而是其隐特征。
2/10/2025 10:35:00 AM
南木
如何应对生成式人工智能给出的无穷无尽的正确答案
生成式人工智能 (GenAI) 似乎承诺带来前所未有的创新和自动化机会……然而,许多领导者难以清楚地表达 GenAI在组织层面提供的实际、有形价值。 那么,这种明显的 GenAI 价值差距背后是什么? 我们能做些什么来解决这个问题?
2/10/2025 10:24:36 AM
晓晓
2025 年主数据管理和数据质量的十大趋势
随着 2024 年的结束,现在是时候展望并确定 2025 年影响主数据管理 (MDM) 和数据质量的关键趋势了。 从人工智能的进步到业务用户的赋能,以下是十大趋势:1.人工智能驱动的框架占据主导地位2025 年,AI 代理框架将成为焦点。 这些系统将通过识别异常、诊断问题和自主提出修复建议来简化数据质量和 MDM 流程。
2/10/2025 10:06:18 AM
晓晓
利用人工智能提升航空安全
人工智能在航空安全中的整合变得越来越重要,特别是随着空中交通的增长、人为错误问题的不断出现以及对飞行员需求的增加。 虽然航空旅行仍然是最安全的交通方式之一,但最近发生的悲剧事件和众多紧急事件凸显了采取更先进安全措施的必要性。 上周美国一架陆军UH-60黑鹰直升机与一架美国航空公司客机在华盛顿特区里根国家机场着陆后不久在空中发生致命碰撞,震惊了航空业。
2/10/2025 10:00:33 AM
AI情报室
十个DeepSeek使用入口,附详细流程
最近 DeepSeek 火爆全网,但很多小伙伴在使用过程中都遇到了卡顿、服务器繁忙的问题。 别担心,今天我为大家整理了超全的免费体验入口,无论是手机还是电脑,都能让你丝滑体验 DeepSeek R1! 一、官网入口DeepSeek 官网()是大家最熟悉的方式。
2/10/2025 9:54:42 AM
子龙
刚刚,奥特曼给出AGI三个判断:Scaling Law保持不变,没理由放缓投资
刚刚,OpenAI奥特曼的最新AI观察出炉:Scaling Law将保持不变,短时间内没有理由停止对AI进行指数增长级的投资! 具体共有3点1、AI能力与投入资源呈对数关系2、AI使用成本每年降低约10倍3、AI带来的社会经济价值呈超级指数增长图片在最新发布的博客里,他给出对于AGI当下及未来的细致判断。 等到2035年,每个人都可以调动相当于2025年所有人智慧总和的能力。
2/10/2025 9:53:19 AM
刚刚,Sam Altman深夜发文,AI Agent将重塑世界经济
今天凌晨5点,OpenAI联合创始人兼首席执行官Sam. Altman在其个人博客,发布了一篇深度文章《Three Observations》。 主要对AI世界提出了3点观察,AI模型的智能水平大致等于用于训练和运行它的资源的对数;使用特定水平AI的成本大约每12个月下降10倍,而更低的价格会带来更多的使用;线性增长的智能所创造的社会经济价值是超指数增长。
2/10/2025 9:35:06 AM
AIGC开放社区
SFT并非必需!推理模型仅靠RL就能获得长思维链能力,清华CMU团队破解黑盒
DeepSeek-R1慢思考、长推理的表现,展现了训练步骤增加,会导致长CoT的涌现。 它通过模拟人类思维逐步推导答案,提升了AI大模型的推理能力和可解释性。 但长CoT的触发条件是什么?
2/10/2025 9:35:00 AM
量子位
OpenAI内部模型曝光!编程能力跻身全球Top50程序员,年底不再有人类对手
除了o1/o3,OpenAI另一个尚未公开的内部推理模型曝光了。 爆料者正是CEO奥特曼本人。 据他透露,与全球顶尖程序员相比,当前这一内部模型的编程能力已达Top50,甚至今年年底将排名第一。
2/10/2025 9:20:00 AM
量子位
谷歌AlphaGeometry2攻克IMO几何难题,已超越金牌得主平均水准
OpenAI 与 DeepSeek 卷得不可开交的时候,谷歌 DeepMind 的数学推理模型又偷偷惊艳了所有人。 在最新的一篇论文中,谷歌 DeepMind 介绍了全新进化的 AlphaGeometry 2,该系统在解决奥林匹克几何问题方面已经超过了金牌得主的平均水准。 论文标题:Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2论文链接:(IMO)是一项面向全球高中生的著名数学竞赛。
2/10/2025 9:10:00 AM
机器之心
别TM浪费算力了,这样才能最大限度发挥deepseek的潜能 - MOE
最近几周自学deepseek原理 应用 实践,一些成果,和大家分享:小众关心的,deepseek核心技术原理;大众关心的,提示词要怎么写;今天和大家聊聊,deepseek的核心机制之一的混合专家MOE。 什么是混合专家MOE? 混合专家,Miture of Experts,该模型思路不再追求大而全,转而追求多而专精。
2/10/2025 9:00:00 AM
58沈剑
斯坦福华人博士生打破58年僵局!牛顿提出的亲吻数问题有了新突破
牛顿想出的“球体亲吻数”(kissing number)难题,华人学者取得新进展。 n维空间中,给定一个n维球体,最多有几个相同的球体可以与它接触而不重叠? 斯坦福博士生Anqi Li在微软实习期间完成这项研究,导师Henry Cohn本意是让她用计算机辅助,她却创造性地找到了数学上的新解法。
2/10/2025 8:52:00 AM
量子位
一文读懂多模态 embeddings
传统上,AI研究被划分为不同的领域:自然语言处理(NLP)、计算机视觉(CV)、机器人学、人机交互(HCI)等。 然而,无数实际任务需要整合这些不同的研究领域,例如自动驾驶汽车(CV 机器人学)、AI代理(NLP CV HCI)、个性化学习(NLP HCI)等。 尽管这些领域旨在解决不同的问题并处理不同的数据类型,但它们都共享一个基本过程。
2/10/2025 7:10:00 AM
二旺
DeepSeek服务器繁忙的真相大揭秘,程序员必看
最近DeepSeek的“服务器繁忙”让不少网友破防,某些博主更是各种编故事、造谣生事。 作为一个负责任的程序员,咱们不能看着这些不实信息乱飞,必须站出来科普一下! 以下就是关于DeepSeek那些你应该知道的真相,读完请给个三连支持,别让真相被谣言淹没!
2/10/2025 7:00:00 AM
阿森
资讯热榜
李沐B站更新了!教你手搓语音大模型,代码全开源还能在线试玩
考试提分新工具:网页版 ChatGPT 测试“学习和掌握”功能,AI 助你成学霸
AI时代设计师如何突围?D20峰会揭示未来设计师生存法则
一盘大棋!OpenAI「截胡」IMO金牌,奥特曼为GPT-5献上「核弹级」预热
终结Coding?ShellAgent三句话造出马斯克同款「AI女友」!
DeepRare 重磅发布:全球首个可循证智能体诊断系统,直击医学Last Exam难题
阿里云通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文,可与 Claude Sonnet4 媲美
“思维链”窗口正在关闭!OpenAI、谷歌、Anthropic联合研究:我们正在失去理解 AI 的能力
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
Anthropic
英伟达
代码
智能体
算法
Stable Diffusion
训练
芯片
开发者
蛋白质
腾讯
生成式
苹果
LLM
神经网络
AI新词
Claude
3D
研究
生成
机器学习
AI for Science
xAI
计算
人形机器人
Sora
AI视频
Agent
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
RAG
预测
大型语言模型
深度学习
伟达
Transformer
具身智能
视觉
神器推荐
亚马逊
视频生成
AGI
Copilot
DeepMind
模态
架构
LLaMA