理论
DeepSeek671B提到的MOE是什么?图解MOE(混合专家模型)
本文仅做记录,图挺形象的。 原文:,你可能会在标题中看到“MoE”这个词。 那么,这个“MoE”到底代表什么?
2/17/2025 3:00:00 AM
Grootendorst
“RAG界的DeepSeek”开源-企业复杂私域知识理解与推理框架PIKE-RAG
PIKE-RAG框架的设计目标是提供一个灵活且可扩展的RAG系统,应对工业应用中复杂多样的任务需求。 框架的核心是通过有效的知识提取、理解和组织,以及构建连贯的推理逻辑,解决了RAG系统在工业应用中的局限性。 下面来看下PIKE-RAG框架及其实现过程,供参考。
2/17/2025 3:00:00 AM
余俊晖
网络安全是Agentic AI成功的关键,我们该怎么做?
根据专家预测,Agentic AI将带来两到三倍于当前大语言模型(LLM)的生产力提升,因此2025年或将成为Agentic AI的元年。 然而,就如任何强大的新技术一样, Agentic AI具有巨大的潜力,但也存在着重大的安全风险。 一旦这些自主系统偏离预期轨道,后果可能是灾难性的。
2/17/2025 1:00:00 AM
安全牛
Spring 宣布接入 DeepSeek
DeepSeek 是深度求索公司发布的大模型,是国产之光。 大家应该学会如何使用 DeepSeek 大模型,下面我们将看下如何开发基于 DeepSeek 大模型的智能应用。 DeepSeek 大模型DeepSeek 推出两款模型;DeepSeek V 系列,对于V系列主要 对话,模型名称:deepseek-chatDeepSeek R 系统,对于R系统主要 推理, 模型名称:deepseek-reasonerDeepSeek 官方更新日志,可以看到模型发布和演化的过程。
2/17/2025 12:25:00 AM
不才陈某
DeepSeek R1遇难题142次"I give up",研究还称需增加推理时机控制机制
最新大语言模型推理测试引众议,DeepSeek R1常常在提供错误答案前就“我放弃”了? ? Cursor刚刚参与了一项研究,他们基于NPR周日谜题挑战(The Sunday Puzzle),构建了一个包含近600个问题新基准测试。
2/17/2025 12:00:10 AM
全面拥抱 AI 时代:DeepSeek 生态工具大集合
随着人工智能技术的快速发展,越来越多优秀的AI工具正在改变我们的工作和生活方式。 今天给大家介绍一下 DeepSeek(深度求索)生态系统中的实用工具集合,帮助你在各种场景下更好地使用AI能力。 📱 日常应用篇桌面应用如果你想在电脑上体验AI助手,这些应用一定不要错过:Chatbox:一款支持Windows、Mac和Linux的多模型桌面客户端,界面简洁,使用方便。
2/17/2025 12:00:03 AM
wayn
TikTok 推出新 IDE Trae,用于快速构建 AI 应用
字节跳动(TikTok 的母公司)最近发布了一款名为 Trae 的集成开发环境(IDE),基于 Visual Studio Code(VS Code)进一步定制。 在 VS Code 原本的强大功能上,Trae 附加了 AI 模块,帮助开发者更轻松地编写、调试和优化代码,有时甚至无需手写任何代码。 如果你用过 Cursor AI,应该会觉得 Trae 有点类似。
2/17/2025 12:00:00 AM
我用 AI 创作了一首专属前端的歌《像素诗人》,送给各位前端er,还挺好听!
听完这首歌,你觉得怎么样? 下面就来简单看看这首歌的创作过程。 首先,使用 DeepSeek()来生成歌词,提问时打开深度思考和联网搜索。
2/17/2025 12:00:00 AM
CUGGZ
联想智能云深度集成DeepSeek R1大模型驱动企业“智能进阶”
记者今天从联想集团了解到,联想智能云(xCloud)解决方案已将DeepSeek R1及其蒸馏系列大模型全面集成到产品矩阵中,覆盖模型服务、模型开发、智能体构建、智能运维等核心环节。 据了解,联想智能云(xCloud)解决方案支持DeepSeek大模型的多种部署方式,包括云端、私有化和一体机/工作站等,可通过完整的AI能力体系和技术整合、场景创新与开源生态的构建,为企业智能化转型注入新动能。 全面支持DeepSeek R1-671B满血模型等全系模型。
2/15/2025 8:15:04 AM
首个AI儿科医生“上岗” 与13位儿科专家共同完成疑难病例会诊
2025年2月13日,国家儿童医学中心首都医科大学附属北京儿童医院开展了国内首次“AI儿科医生 多学科专家”的双医并行多学科会诊。 在此次特殊的多学科会诊中,不仅有包括倪鑫院长在内的,来自耳鼻咽喉头颈外科,肿瘤外科,肿瘤内科,神经外科,神经内科,精神科,感染内科,免疫科,骨科,医学影像中心,超声科,放疗科和口腔科等科室的13位知名专家。 还有一位引人瞩目的特殊专家——由北京儿童医院与百川智能、小儿方健康科技联合研发,以Baichuan M1大模型为底座打造的“AI儿科医生”!
2/14/2025 6:24:25 PM
复旦团队提出Transformer生成的原子嵌入策略,可通过ML提高晶体特性的预测准确性
编辑 | 白菜叶近年来,在化学分子性质与结构预测领域出现了大量基于 Transformer 的训练方法和预测模型,例如 OrbNet、3D-Transformer 等。 科学家们认为这些方法和模型,能够充分发挥 Transformer 架构在处理原子相互作用和捕捉三维结构方面的优势,从而高效地表示原子间复杂的相互作用。 在这些进步的推动下,复旦大学的研究人员开发了自制的 CrystalTransformer 模型,基于 Transformer 架构生成称为 ct-UAE 的通用原子嵌入,该模型为每个原子学习独特的「指纹」,捕捉它们在材料中的功能和相互作用的本质。
2/14/2025 4:47:00 PM
ScienceAI
Science新登,David Baker团队用AI从头设计栩栩如生的酶,比同类设计好6万倍
编辑 | 萝卜皮科学家使用人工智能(AI)从头设计酶的研究往往收效甚微,产生的酶通常在反应的第一步后就会停止。 设计具有复杂活性位点并介导多步反应的酶仍然是一项艰巨的挑战。 以丝氨酸水解酶为模型系统,华盛顿大学 David Baker 团队将 RFdiffusion 的生成能力与用于评估活性位点预组织的集成生成方法相结合,从最小活性位点描述开始设计酶。
2/14/2025 4:43:00 PM
ScienceAI
改进云基础设施以实现通用人工智能AGI
人工通用智能(AGI)是人工智能领域最具雄心的目标。 AGI旨在模拟类似人类的认知能力,包括在不同领域的推理、理解和学习。 当前的云基础设施尚不足以支持AGI系统所需的计算和学习需求。
2/14/2025 4:08:19 PM
被AI妆到了!DeepSeek教网友化妆,竟像极了「石矶娘娘」
AI好好用报道编辑:杨文DeepSeek的风吹到了美妆区。 DeepSeek 又又又来搞抽象了! 继上次做人类从未见过的菜之后,网友又想到了个新路数:教化妆。
2/14/2025 3:49:00 PM
AI好好用
Grok 3两周内发布,要夺回大模型王座;DeepSeek现象后,AI会改变方向…蔡崇信、李彦宏、马斯克,大佬们在迪拜峰会说了啥
出品 | 51CTO技术栈(微信号:blog51cto)2025年世界政府峰会于2月11日在阿联酋迪拜开幕,不少科技大佬都参与了峰会,并表达了自己的真知灼见。 在这个关口谈论科技创新,AI无可避免地成为了绝对的主角。 马斯克吹捧Grok 3将成为有史以来最聪明的AI,“这(指新模型发布之前)可能是其他模型最后一次超过Grok”。
2/14/2025 3:18:27 PM
实锤!李彦宏要搞开源!!!百度官宣:文心大模型4.5系列将开源,6月30日见真章,继文小言免费后的又一大动作
出品 | 51CTO技术栈(微信号:blog51cto)好家伙! ! 字少事大啊!
2/14/2025 11:45:37 AM
模型过剩危机:OpenAI壮士断腕,能否终结开发者'选择恐惧症'?
OpenAI要“动手”了,它计划对自己的模型产品阵容来一场大“瘦身”!就在它准备推出最后一个非推理模型GPT-4.5之际,这家科技巨头罕见地承认,之前的产品发布在客户眼里竟然没啥区别,这让市场有点懵。 OpenAI的首席执行官萨姆·奥特曼最近在X平台上更新了产品路线图,他坦诚地说,公司最近的一些发布确实让市场感到有点困惑。 “我们得把预定路线图分享得更清楚,还得在产品阵容简化上多下点功夫。
2/14/2025 11:25:45 AM
Emilia David
信我,有你想要的!最大化DeepSeek潜能:动态注意力机制
deepseek原理 应用 实践,和大家分享:小众的,deepseek核心技术原理;大众的,提示词要怎么写;今天和大家聊聊,deepseek的核心技术之一的动态注意力机制。 要搞懂这个,先得知道什么是注意力机制? 这是一种通过计算…查询向量(Query)…键向量(Key)…值向量(Value)…,最终得到...的技术。
2/14/2025 11:22:34 AM
58沈剑
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
Sora
3D
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
LLaMA
Copilot
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind