理论
推理模型新路线开源!与DeepSeek截然不同,抛弃思维链不用人类语言思考
开源推理大模型新架构来了,采用与Deepseek-R1/OpenAI o1截然不同的路线:抛弃长思维链和人类的语言,直接在连续的高维潜空间用隐藏状态推理,可自适应地花费更多计算来思考更长时间。 例如问题:Claire每天早餐都会做一个3个鸡蛋的煎蛋卷。 她在4周内会吃多少个鸡蛋?
2/12/2025 9:00:00 AM
量子位
20个很强的DeepSeek提问公式
大家好,我是汤师爷~今天直接给大家分享DeepSeek干货内容。 要获得精准的AI回答,关键在于提问方式。 这里为你整理了20个高效提问公式,直接提升回答质量。
2/12/2025 8:54:54 AM
架构师汤师爷
一文读懂DeepSeek-V3 技术报告
2023年7月17日,DeepSeek正式成立,由幻方量化提供资金支持。 梁文锋凭借其在金融和AI领域的深厚背景,带领团队开始探索生成式AI技术。 同年11月2日,DeepSeek推出首款开源模型DeepSeek Coder,支持多种编程语言的代码生成、调试和数据分析任务,为AI领域的应用奠定了基础,直到 2024 年 12 月,DeepSeek-V3的发布引发了行业震动和社会广泛关注,在他们的最新技术报告《DeepSeek-V3技术报告》中,团队详细介绍了其最新成果——DeepSeek-V3模型。
2/12/2025 8:30:18 AM
FlerkenS
研究表明:AI工具能悄无声息地改变我们的观点
大型语言模型,那些能对我们的提示给出人类回答的智能聊天机器人,会影响我们的观点吗? 《IEEE智能系统》杂志中描述的一项实验表明,答案是肯定的。 这项研究的影响对教师批改论文、员工评估以及许多其他可能影响我们生活的情况都有深远意义。
2/12/2025 8:30:00 AM
Yu
本地部署DeepSeek就这么简单...
引言DeepSeek 作为一款优秀的语言模型,结合 Ollama 和 Cherry Studio 可以轻松实现本地部署。 本文将深入浅出地介绍如何使用 Ollama 与 Cherry Studio 本地部署 DeepSeek。 Oallam简介Ollama 是一个简单易用的工具,它允许用户在本地快速部署和运行各种语言模型。
2/12/2025 8:21:55 AM
了不起
企业AI数据泄露风险加剧:CISO如何应对?
企业员工正以惊人的速度通过未授权和已授权的GenAI应用泄露敏感企业数据。 堵住这些泄露至关重要,以降低风险暴露。 员工通过GenAI泄露数据正成为企业的噩梦。
2/12/2025 8:00:00 AM
Evan Schuman
简易指南:运用AI/ML技术检测实时欺诈行为
译者 | 核子可乐审校 | 重楼随着技术的飞速发展,欺诈检测的重要意义也日益凸显。 根据注册欺诈审查师协会(ACFE)公布的数据,全球范围内的欺诈活动给企业造成的损失高达数万亿美元,占年销售总额的近5%。 随着欺诈手段愈发老练复杂,企业也开始借助AI与机器学习(ML)等前沿技术辅助分析,探索打击欺诈的新途径。
2/12/2025 8:00:00 AM
核子可乐
普通人也能轻松掌握的20个DeepSeek高频提示词(2025版)
一、基础原则1.说人话最重要"不用专业术语,就像和朋友聊天一样描述需求"。 ❌️ 错误示范:"请用SWOT分析法输出新能源汽车行业报告"。 ✅ 正确示范:"我要给老板汇报比亚迪谈判进展,完全不懂电池技术,请用买菜大妈都能听懂的话说明:他们的核心技术强在哪?
2/12/2025 12:00:10 AM
磊哥
ICLR 2025 | Deep Signature 高效表征生物大分子复杂运动的新方法
编辑 | ScienceAI理解蛋白质动力学行为对于解析其功能机制和开发分子疗法至关重要。 然而,生物过程通常涉及复杂的高维动力学以及原子间相互作用,这对现有计算处理技术构成了巨大挑战。 本文介绍了来自香港城市大学李皓亮研究团队所提出的 Deep Signature,一个用于生物大分子复杂运动表征学习的深度学习框架。
2/11/2025 5:30:00 PM
ScienceAI
登Science,MIT团队推出新蛋白质语言模型ProtGPS,预测蛋白在活细胞内的功能位置
编辑 | 萝卜皮蛋白质是维持细胞运转的主要动力,细胞中有成千上万种蛋白质,每种蛋白质都发挥着特殊的功能。 研究人员早就知道,蛋白质的结构决定了它的功能。 最近,科学家逐渐意识到,蛋白质的定位对其功能也至关重要。
2/11/2025 5:29:00 PM
ScienceAI
4500美元复刻DeepSeek神话,1.5B战胜o1-preview只用RL!训练细节全公开
强化学习迎来重大突破! 近日,来自UC伯克利的研究团队基于Deepseek-R1-Distilled-Qwen-1.5B,通过简单的强化学习(RL)微调,得到了全新的DeepScaleR-1.5B-Preview。 在AIME2024基准中,模型的Pass@1准确率达高达43.1% ——不仅比基础模型提高了14.3%,而且在只有1.5B参数的情况下超越了OpenAI o1-preview!
2/11/2025 4:17:42 PM
新智元
5000字揭秘!DeepSeek-R1-Zero自我进化的三大特点和三大基石
当前 AI 在推理能力提升上遇到了诸多瓶颈,这在一定程度上限制了其进一步发展和广泛应用。 在传统的 AI 训练中,模型对大量监督数据的依赖是一个显著问题。 监督学习需要大量带有标注的数据来训练模型,使其能够对新的数据进行准确的分类或预测。
2/11/2025 4:15:09 PM
小智
一文速通 DeepSeek 家族核心技术点:从 LLM 到 R1!
DeepSeek横空出世并迅速走红,引发了全球科技圈的强烈震动,NVIDIA股价暴跌18%,全球科技股市市值蒸发近1万亿美元。 特朗普也居然公开称赞DeepSeek的崛起具有“积极意义”,并表示这给美国敲响了“警钟”。 Anthropic一方面肯定了DeepSeek的成就,另一方面却呼吁美国政府加强对华芯片管制。
2/11/2025 3:56:18 PM
小喵学AI
在 DeepSeek 的帮助下,我在 GitHub “战绩区”涂鸦
在每个人的 GitHub 的主页上,有一块儿区域特别显眼,就是 Contributions 日历图,也就是下面这个绿色的小方格子部分。 image.pngGitHub 会记录你每天是否有提交代码,提交了多少代码。 哪年比较勤劳,哪年偷懒了,一眼就能看出来。
2/11/2025 3:53:29 PM
风筝
Claude 4要来了?Anthropic发布38页经济指数报告,43%人类工作正被AI取代!
Claude 3.5 Opus无了,Anthropic本周可能会提前放出Claude 4。 网友爆料称,除了Claude 4,还有推理模型也将首亮相,评分全面超越o3。 Anthropic已经沉寂太久了,去年曾被传出内部模型研发受阻。
2/11/2025 1:00:00 PM
新智元
Meta AI推出非入侵式脑机技术Brain2Qwerty,可将大脑信号转换为文本
2月11日消息,据外媒报道,Meta AI推出了Brain2Qwerty,这是一种新的人工智能系统,可以在不需要手术的情况下将大脑信号转换为文本。 该系统使用非侵入性方法,包括脑电图(EEG)和脑磁图(MEG)来记录大脑活动。 在这项研究中,健康的志愿者记住句子,然后在QWERTY键盘上打字,同时捕捉他们的大脑信号。
2/11/2025 12:41:57 PM
Yu
Copilot 键引争议,微软拟在 Windows 11 24H2 中让其支持打开上下文菜单
2 月 11 日消息,微软可能将在未来的 Windows 1124H2 版本中允许用户重新映射 Copilot 键,这一功能源于部分用户对 Copilot 笔记本电脑中 Copilot . 键的不满。 目前,微软尚未发布官方声明,但据最新消息,该功能有望在 Windows 11 24H2 中实现,甚至 23H2 版本也会支持。
2/11/2025 12:38:32 PM
远洋
DeepSeek本地部署详细指南!从 Ollama 到个人知识库应用
作者:lushen一、系统介绍mbp pro:二、Ollama 安装与配置1. 跨平台安装指南Ollama 作为本地运行大模型的利器,支持三大主流操作系统:复制2. 服务验证复制出现上述则表示安装成功,可浏览器访问http://localhost:11434/验证。
2/11/2025 12:15:57 PM
腾讯技术工程
资讯热榜
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
Microsoft Releases 700 Real AI Cases to Explore New Intelligent Work Models
微软发布 700 个真实 AI 案例,探索智能化工作新模式
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
Li Hang, head of ByteDance AI Lab, resigns; Seed team enters adjustment period
苹果向开发者开放本地AI能力,推出全新Foundation Models框架
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
Meta
学习
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
英伟达
代码
Anthropic
芯片
开发者
生成式
蛋白质
腾讯
神经网络
训练
3D
研究
生成
智能体
苹果
计算
机器学习
Sora
Claude
AI设计
AI for Science
GPU
AI视频
人形机器人
搜索
华为
百度
场景
大语言模型
xAI
预测
伟达
深度学习
LLM
字节跳动
Transformer
Agent
模态
具身智能
神器推荐
工具
文本
视觉
LLaMA
算力
Copilot
驾驶
大型语言模型
API
RAG
应用
架构