AI在线 AI在线

理论

DeepSeek671B提到的MOE是什么?图解MOE(混合专家模型)

本文仅做记录,图挺形象的。 原文:,你可能会在标题中看到“MoE”这个词。 那么,这个“MoE”到底代表什么?
2/17/2025 3:00:00 AM
Grootendorst

“RAG界的DeepSeek”开源-企业复杂私域知识理解与推理框架PIKE-RAG

PIKE-RAG框架的设计目标是提供一个灵活且可扩展的RAG系统,应对工业应用中复杂多样的任务需求。 框架的核心是通过有效的知识提取、理解和组织,以及构建连贯的推理逻辑,解决了RAG系统在工业应用中的局限性。 下面来看下PIKE-RAG框架及其实现过程,供参考。
2/17/2025 3:00:00 AM
余俊晖

网络安全是Agentic AI成功的关键,我们该怎么做?

根据专家预测,Agentic AI将带来两到三倍于当前大语言模型(LLM)的生产力提升,因此2025年或将成为Agentic AI的元年。 然而,就如任何强大的新技术一样, Agentic AI具有巨大的潜力,但也存在着重大的安全风险。 一旦这些自主系统偏离预期轨道,后果可能是灾难性的。
2/17/2025 1:00:00 AM
安全牛

Spring 宣布接入 DeepSeek

DeepSeek 是深度求索公司发布的大模型,是国产之光。 大家应该学会如何使用 DeepSeek 大模型,下面我们将看下如何开发基于 DeepSeek 大模型的智能应用。 DeepSeek 大模型DeepSeek 推出两款模型;DeepSeek V 系列,对于V系列主要 对话,模型名称:deepseek-chatDeepSeek R 系统,对于R系统主要 推理, 模型名称:deepseek-reasonerDeepSeek 官方更新日志,可以看到模型发布和演化的过程。
2/17/2025 12:25:00 AM
不才陈某

DeepSeek R1遇难题142次"I give up",研究还称需增加推理时机控制机制

最新大语言模型推理测试引众议,DeepSeek R1常常在提供错误答案前就“我放弃”了? ? Cursor刚刚参与了一项研究,他们基于NPR周日谜题挑战(The Sunday Puzzle),构建了一个包含近600个问题新基准测试。
2/17/2025 12:00:10 AM

全面拥抱 AI 时代:DeepSeek 生态工具大集合

随着人工智能技术的快速发展,越来越多优秀的AI工具正在改变我们的工作和生活方式。 今天给大家介绍一下 DeepSeek(深度求索)生态系统中的实用工具集合,帮助你在各种场景下更好地使用AI能力。 📱 日常应用篇桌面应用如果你想在电脑上体验AI助手,这些应用一定不要错过:Chatbox:一款支持Windows、Mac和Linux的多模型桌面客户端,界面简洁,使用方便。
2/17/2025 12:00:03 AM
wayn

TikTok 推出新 IDE Trae,用于快速构建 AI 应用

字节跳动(TikTok 的母公司)最近发布了一款名为 Trae 的集成开发环境(IDE),基于 Visual Studio Code(VS Code)进一步定制。 在 VS Code 原本的强大功能上,Trae 附加了 AI 模块,帮助开发者更轻松地编写、调试和优化代码,有时甚至无需手写任何代码。 如果你用过 Cursor AI,应该会觉得 Trae 有点类似。
2/17/2025 12:00:00 AM

我用 AI 创作了一首专属前端的歌《像素诗人》,送给各位前端er,还挺好听!

听完这首歌,你觉得怎么样? 下面就来简单看看这首歌的创作过程。 首先,使用 DeepSeek()来生成歌词,提问时打开深度思考和联网搜索。
2/17/2025 12:00:00 AM
CUGGZ

联想智能云深度集成DeepSeek R1大模型驱动企业“智能进阶”​

记者今天从联想集团了解到,联想智能云(xCloud)解决方案已将DeepSeek R1及其蒸馏系列大模型全面集成到产品矩阵中,覆盖模型服务、模型开发、智能体构建、智能运维等核心环节。 据了解,联想智能云(xCloud)解决方案支持DeepSeek大模型的多种部署方式,包括云端、私有化和一体机/工作站等,可通过完整的AI能力体系和技术整合、场景创新与开源生态的构建,为企业智能化转型注入新动能。 全面支持DeepSeek R1-671B满血模型等全系模型。
2/15/2025 8:15:04 AM

首个AI儿科医生“上岗” 与13位儿科专家共同完成疑难病例会诊

2025年2月13日,国家儿童医学中心首都医科大学附属北京儿童医院开展了国内首次“AI儿科医生 多学科专家”的双医并行多学科会诊。 在此次特殊的多学科会诊中,不仅有包括倪鑫院长在内的,来自耳鼻咽喉头颈外科,肿瘤外科,肿瘤内科,神经外科,神经内科,精神科,感染内科,免疫科,骨科,医学影像中心,超声科,放疗科和口腔科等科室的13位知名专家。 还有一位引人瞩目的特殊专家——由北京儿童医院与百川智能、小儿方健康科技联合研发,以Baichuan M1大模型为底座打造的“AI儿科医生”!
2/14/2025 6:24:25 PM

复旦团队提出Transformer生成的原子嵌入策略,可通过ML提高晶体特性的预测准确性

编辑 | 白菜叶近年来,在化学分子性质与结构预测领域出现了大量基于 Transformer 的训练方法和预测模型,例如 OrbNet、3D-Transformer 等。 科学家们认为这些方法和模型,能够充分发挥 Transformer 架构在处理原子相互作用和捕捉三维结构方面的优势,从而高效地表示原子间复杂的相互作用。 在这些进步的推动下,复旦大学的研究人员开发了自制的 CrystalTransformer 模型,基于 Transformer 架构生成称为 ct-UAE 的通用原子嵌入,该模型为每个原子学习独特的「指纹」,捕捉它们在材料中的功能和相互作用的本质。
2/14/2025 4:47:00 PM
ScienceAI

Science新登,David Baker团队用AI从头设计栩栩如生的酶,比同类设计好6万倍

编辑 | 萝卜皮科学家使用人工智能(AI)从头设计酶的研究往往收效甚微,产生的酶通常在反应的第一步后就会停止。 设计具有复杂活性位点并介导多步反应的酶仍然是一项艰巨的挑战。 以丝氨酸水解酶为模型系统,华盛顿大学 David Baker 团队将 RFdiffusion 的生成能力与用于评估活性位点预组织的集成生成方法相结合,从最小活性位点描述开始设计酶。
2/14/2025 4:43:00 PM
ScienceAI

改进云基础设施以实现通用人工智能AGI​

人工通用智能(AGI)是人工智能领域最具雄心的目标。 AGI旨在模拟类似人类的认知能力,包括在不同领域的推理、理解和学习。 当前的云基础设施尚不足以支持AGI系统所需的计算和学习需求。
2/14/2025 4:08:19 PM

被AI妆到了!DeepSeek教网友化妆,竟像极了「石矶娘娘」

AI好好用报道编辑:杨文DeepSeek的风吹到了美妆区。 DeepSeek 又又又来搞抽象了! 继上次做人类从未见过的菜之后,网友又想到了个新路数:教化妆。
2/14/2025 3:49:00 PM
AI好好用

Grok 3两周内发布,要夺回大模型王座;DeepSeek现象后,AI会改变方向…蔡崇信、李彦宏、马斯克,大佬们在迪拜峰会说了啥

出品 | 51CTO技术栈(微信号:blog51cto)2025年世界政府峰会于2月11日在阿联酋迪拜开幕,不少科技大佬都参与了峰会,并表达了自己的真知灼见。 在这个关口谈论科技创新,AI无可避免地成为了绝对的主角。 马斯克吹捧Grok 3将成为有史以来最聪明的AI,“这(指新模型发布之前)可能是其他模型最后一次超过Grok”。
2/14/2025 3:18:27 PM

实锤!李彦宏要搞开源!!!百度官宣:文心大模型4.5系列将开源,6月30日见真章,继文小言免费后的又一大动作

出品 | 51CTO技术栈(微信号:blog51cto)好家伙! ! 字少事大啊!
2/14/2025 11:45:37 AM

模型过剩危机:OpenAI壮士断腕,能否终结开发者'选择恐惧症'?

OpenAI要“动手”了,它计划对自己的模型产品阵容来一场大“瘦身”!就在它准备推出最后一个非推理模型GPT-4.5之际,这家科技巨头罕见地承认,之前的产品发布在客户眼里竟然没啥区别,这让市场有点懵。 OpenAI的首席执行官萨姆·奥特曼最近在X平台上更新了产品路线图,他坦诚地说,公司最近的一些发布确实让市场感到有点困惑。 “我们得把预定路线图分享得更清楚,还得在产品阵容简化上多下点功夫。
2/14/2025 11:25:45 AM
Emilia David

信我,有你想要的!最大化DeepSeek潜能:动态注意力机制

deepseek原理 应用 实践,和大家分享:小众的,deepseek核心技术原理;大众的,提示词要怎么写;今天和大家聊聊,deepseek的核心技术之一的动态注意力机制。 要搞懂这个,先得知道什么是注意力机制? 这是一种通过计算…查询向量(Query)…键向量(Key)…值向量(Value)…,最终得到...的技术。
2/14/2025 11:22:34 AM
58沈剑