理论
1分钟学会DeepSeek本地部署,小白也能搞定!
DeepSeek 是国内顶尖 AI 团队「深度求索」开发的多模态大模型,具备数学推理、代码生成等深度能力,堪称"AI界的六边形战士"。 DeepSeek 身上的标签有很多,其中最具代表性的标签有以下两个:低成本(不挑硬件、开源)高性能(推理能力极强、回答准确)一、为什么要部署本地DeepSeek? 相信大家在使用 DeepSeek 时都会遇到这样的问题:图片这是由于 DeepSeek 大火之后访问量比较大,再加上漂亮国大规模、持续的恶意攻击,导致 DeepSeek 的服务器很不稳定。
2/10/2025 12:00:10 AM
磊
DeepSeek安全:AI网络安全评估与防护策略
一、引言近年来,人工智能技术在全球范围内引发了深刻的科技变革与产业变革,而中国人工智能初创公司 DeepSeek 凭借其低成本、高性能的 AI 模型(如 DeepSeek-R1)迅速崛起,成为全球科技领域的焦点之一。 在当前全球数字化加速推进、网络安全威胁日益复杂的背景下,DeepSeek 技术架构与市场定位不仅为行业带来了新的可能性,同时也引发了广泛的网络安全关切。 本文基于现有的公开资料,从企业资深网络安全专家的视角,系统梳理DeepSeek技术在网络安全领域的潜在贡献与核心风险,并结合中国自主可控的发展战略,提出针对性的应对策略,旨在为相关企业和机构提供全面、深入的参考,以更好地应对人工智能时代的网络安全挑战。
2/10/2025 12:00:00 AM
Sebastian Raschka:关于DeepSeek R1和推理模型,我有几点看法
著名 AI 研究者和博主 Sebastian Raschka 又更新博客了。 这一次,他将立足于 DeepSeek 技术报告,介绍用于构建推理模型的四种主要方法,也就是如何通过推理能力来增强 LLM。 Sebastian Raschka 表示:「我希望这能提供有价值的见解,并帮助你了解围绕这一主题的快速演变的文献和话题炒作。
2/9/2025 2:42:00 PM
机器之心
外国专家解读DeepSeek:预算有限,如何复制R1推理模型?纯强化学习不现实!不是任何问题都得问DeepSeek!
出品 | 51CTO技术栈(微信号:blog51cto)Sebastian Raschka是一位外国知名的AI专家。 特别在大型语言模型(LLM)研究方面,有着丰富的研究经验。 近日DeepSeek-R1推理模型的推出,将“任何一款不是o1的模型快速蒸馏成具备强推理能力的o1”成为了可能,而且所需的成本和算力都大大降低。
2/8/2025 5:47:08 PM
OpenAI公开了大模型o3-mini的推理思维链
2月8日消息,据外媒报道,OpenAI更新了o3-mini AI模型的“思维链”功能,让用户可以看到模型的思考过程。 这是在DeepSeek-R1发布之后发生的,DeepSeek-R1是一个竞争对手的推理模型,也显示了其反应背后的思维过程。 推理模型旨在逐步分解其决策过程,因此需要更长的时间来生成响应。
2/8/2025 5:00:11 PM
Yu
NeurIPS 2024 | 用LLM探寻隐秘的因果世界
因果发现的现实挑战:稀缺的高级变量寻找并分析因果关系是科学研究中的重要一环,而现有的因果发现算法依赖由专家预先定义的高级变量。 现实场景中的原始数据往往是图片、文本等高维非结构化数据, 结构化的高级变量是十分稀缺的,导致现有的因果发现和学习算法难以用于至更广泛的数据。 因此,香港浸会大学与MBZUAI、卡内基梅隆大学、香港中文大学、悉尼大学以及墨尔本大学合作发表论文《Discovery of the Hidden World with Large Language Models》,提出了一个名为 COAT 的新型框架,旨在利用大型语言模型和因果发现方法的优势,突破传统因果发现方法的局限性,更有效地在现实世界中定义高级变量、理解因果关系。
2/8/2025 4:56:00 PM
新闻助手
工业AI革命将继续由人类推动
现在是时候挑战实体AI和机器人技术将成为就业杀手的错误观念了。 提升技能、重新培训、加强安全和提高生产力应是关注的重点领域。 2022年ChatGPT的发布让GenAI进入了公众视野。
2/8/2025 4:54:19 PM
Omar Asali
从纳米到秒级:NanoPyx用AI技术革新显微镜图像处理,效率大幅提升!
编辑 | 2049随着显微镜技术的飞速发展,尤其是超分辨率显微镜(Super-Resolution Microscopy)的出现,生物学家们得以在纳米尺度上观察细胞内部的动态过程,揭示了许多以往无法捕捉的生物学现象。 然而,这种技术进步也带来了新的挑战:显微镜图像的数据量呈指数级增长,传统的图像处理工具在处理这些大规模数据时显得力不从心,尤其是在处理高分辨率、多维度的图像时,计算效率成为制约研究进展的瓶颈。 与此同时,AI 技术在高性能计算和图像处理领域的突破,为解决这一问题提供了新的思路。
2/8/2025 2:27:00 PM
ScienceAI
AI+超材料双向突破,浙大综述揭示超材料研究进展,登Nature子刊
编辑 | 2049在电磁波调控的舞台上,超材料曾凭借其人工设计的亚波长结构,打破了自然材料的物理限制,实现了负折射、隐身斗篷等奇异现象。 然而,当工程师试图将这类「魔法材料」应用于动态环境时,却发现传统超材料如同精密的机械手表 —— 虽能精准运行,却无法根据环境变化自主调整。 这种矛盾在自动驾驶、智能通信等实时场景中尤为突出,亟待新的技术范式突破。
2/8/2025 2:25:00 PM
ScienceAI
浙大&通义全面评测智能体复杂任务规划能力,18主流大模型全不及格|ICLR2025
大模型智能体正在迅速发展,能力已不再局限于 API 调用。 诸如OpenAI的Operator和Anthropic的Computer Use等,能够像人类一样直接与界面交互,执行复杂操作。 在处理这类复杂任务的过程中,大模型智能体将问题分解为可执行的工作流(Workflow)是关键的一步。
2/8/2025 2:10:00 PM
量子位
谷歌AI解决IMO中84%的几何问题,o1一道没做对!Nature:AI已超过金牌得主平均水平
谷歌DeepMind最新数学AI,一举解决了2000-2024年IMO竞赛中84%的几何问题。 AlphaGeometry2论文发布,在总共50道题中完成了42道,相比去年的一代多完成了15道。 作为对比,纯语言模型OpenAI o1和Gemini Flash Thinking一道都解决不了。
2/8/2025 2:00:00 PM
量子位
DeepSeek下棋靠忽悠赢了ChatGPT,网友:孙子兵法都用上了
家人们,要笑不活了。 DeepSeek跟ChatGPT下了一把国际象棋,然后……通过忽悠的方式,竟让ChatGPT直接认输! DeepSeek在这场对决中有多离谱呢?
2/8/2025 1:40:00 PM
量子位
超越CoT!微软剑桥中科院提出MVoT,直接可视化多模态推理过程
大模型也学会了「空间想象力」? 还可以自己解释自己? 在大语言模型(LLMs)和多模态大语言模型(MLLMs)中,思维链(CoT)在复杂推理方面非常有效。
2/8/2025 1:30:00 PM
新智元
从数字化转型到AI优先:智能革命下的企业转型之道
也许我们一直以来对数字化转型的理解都是错误的,我们没有专注于“转型”的部分,反而做得转型很少,数字化很多,我们没有将数字视为业务的新范式,而是过度关注于将传统模型和流程数字化,以及将现有组织现代化。 结果,大多数企业仍然背负着复杂性、部门隔阂以及陈旧的工作方式。 AI的崛起给了我们所有人第二次机会,我们可以选择利用AI来做同样的事情,但更快、更好,或者,我们可以让正确的事情变得更高效,同时开辟一条新路径,利用这项技术真正转型为AI优先的企业。
2/8/2025 1:14:50 PM
Brian Solis
天才解法震惊人类!谷歌AI破天荒摘得奥数金牌,横扫IMO 42道几何难题
时隔6个多月,AlphaGeometry 2直接攻下IMO金牌! 刚刚,谷歌DeepMind一篇28页技术报告,公布了AG2最新突破——在2000-2024年IMO几何题上,解题率从54%飙升至84%。 论文地址:(50道),AG2横扫了42道。
2/8/2025 1:00:00 PM
新智元
苹果把台灯做成机器人!能用动作表达情绪,重新定义机器人交互
苹果首款机器人(试验版),居然是个台灯? ? 前段时间苹果布局机器人的消息频频传出,但究竟要做个什么样式儿的一直没有定论。
2/8/2025 12:45:08 PM
o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜
大语言模型,到底是学会了解决数学问题,还是只是背下了答案? LLM的「Generalize VS Memorize」之争,迎来最新进展。 苏黎世联邦理工的研究员Mislav Balunović,在X上公布了一众顶级AI推理模型在AIME 2025 I比赛中的结果。
2/8/2025 11:44:03 AM
新智元
山姆·奥特曼揭秘:Deepseek R1性价比之选!
在当今的人工智能领域,大模型之间的竞争日益激烈。 Deepseek 推出的 R1 模型引起了广泛关注。 山姆·奥特曼评价道:“Deepseek 的 R1 是一个令人印象深刻的模型,尤其是在他们能够以这个价格提供的东西方面。
2/8/2025 11:31:17 AM
AGI
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
Copilot
视觉