大模型

OpenAI突然公开o3思维链！网友：让我们谢谢DeepSeek

刚刚，OpenAI把o3-mini的推理思维链公开了。从今日起，免费用户和付费用户都可以看到模型的思维过程，OpenAI终于Open一回。图片评论区网友纷纷：让我们谢谢DeepSeek。

2/7/2025 9:05:36 AM

网易有道全面拥抱DeepSeek-R1，推理大模型加速个性化教学升级

1月20日，DeepSeek震撼发布DeepSeek-R1，这款推理大模型在数学、编程及逻辑推理等多个领域展现出了与OpenAI顶尖模型比肩的实力，同时实现了API调用成本90%-95%的大幅缩减，无疑为科技界投下了一颗开年“重磅炸弹”。 DeepSeek-R1的深度推理能力不仅为AI产业的多元化发展开辟了新航道，也为包括教育在内的多个行业带来了革新动力。作为教育科技企业，网易有道坚持深入挖掘教育场景下的大模型应用价值。

2/6/2025 7:37:00 PM 新闻助手

百度智能云上架DeepSeek R1/V3，上线首日超1.5万家客户调用

2月3日百度智能云宣布 DeepSeek-R1和 DeepSeek-V3模型上架百度智能云千帆平台，并宣布提供行业领先的超低推理价格。模型上线首日，已有超1.5万家客户通过千帆平台进行模型调用。为降低模型使用成本，百度智能云在推理引擎性能优化技术、推理服务工程架构创新以及推理服务全链路安全保障上的进行深度融合。

2/6/2025 6:19:00 PM 新闻助手

在 TKE 上部署 AI 大模型（以DeepSeek-R1为例）

概述本文介绍如何在 TKE 上部署 AI 大模型，以 DeepSeek-R1 为例。部署思路使用 Ollama 运行 AI 大模型，再通过 OpenWebUI 暴露一个聊天交互的界面，OpenWebUI 会调用 ollama 提供的 API 来与大模型交互。 Ollama 与 OpenWebUI 介绍Ollama 是一个运行大模型的工具，可以看成是大模型领域的 Docker，可以下载所需的大模型并暴露 API。

2/6/2025 10:18:45 AM I am roc roc

DeepSeek 大模型引爆市场：概念股开盘集体涨停

2月5日，A股市场开盘后，DeepSeek 概念股集体爆发，每日互动、美格智能、天娱数科、航锦科技、南威软件等多只股票竞价涨停。此外，飞利信、万兴科技、昆仑万维、海光信息等个股也涨幅靠前。这一市场热潮的背后，是中国 AI 初创公司深度求索（DeepSeek）发布的两款大模型——DeepSeek-V3和 DeepSeek-R1。

2/5/2025 10:50:00 AM AI在线

消息称阿里引入顶级人工智能科学家或将加码AI To C业务

近期，阿里巴巴在AI领域迎来了一位重量级人物。据业内人士透露，一位全球顶级人工智能科学家已于近期正式入职阿里巴巴，未来或将专注于AI To C业务的基础大模型研发与应用。这位科学家在工业界和学术界均拥有超过20年的经验，尤其在多模态AI领域成果丰硕，曾主导发表过上百篇大模型顶级论文。

2/4/2025 2:08:00 PM AI在线

硅谷巨头要学会接受：「DeepSeek 现象」只是开始

2025 年的春节无疑已被 DeepSeek 霸屏。过去三年每年的春节都有一次重磅的 AI 讨论：2023 年是 ChatGPT、2024 年是 Sora，这两股风潮都是由 OpenAI 掀起，而 2025 年则是 DeepSeek 的 V3 与 R1。除夕当天 1 月 28 日，DeepSeek 更是趁热发布了文生图模型 Janus-Pro，但后者没有 V3 与 R1 吸引的关注大，原因在于其没有像前者一样动摇了过去基座大模型的「奇迹」来源：算力。

1/31/2025 8:57:00 PM 陈彩娴

ChatGPT回应DeepSeek超越:排名变化或为暂时现象

DeepSeek应用超越ChatGPT，登顶苹果美国区免费App下载排行榜，引发市场热议。这家被称为“大模型版拼多多”的中国公司，其应用的快速上升让海内外技术同行和投资机构都密切关注。对于这一排名变化，ChatGPT回应称，DeepSeek可能在某些方面有独特优势或满足了用户特定需求，但这样的排名变化也许是暂时的，同时也表明AI应用市场竞争激烈，创新空间巨大。

1/28/2025 10:45:00 AM AI在线

DeepSeek称遭到大规模恶意攻击，注册或受影响

DeepSeek发布公告称其线上服务近期遭受了大规模恶意攻击，导致注册过程可能变得繁忙。 DeepSeek提醒用户，如果遇到注册困难，可以稍等后重试。已注册用户可以正常登录，不受影响。

1/28/2025 10:37:00 AM AI在线

“DeepSeek或彻底改变游戏规则”！中国大模型“搅动”硅谷

“DeepSeek或彻底改变游戏规则”！中国大模型“搅动”硅谷，巨头进入恐慌模式，外媒刷屏，大佬发声：中国AI已追上美国

1/27/2025 8:29:32 AM deep

百川智能上线开源全模态模型 Omni-1.5，号称多项能力超越 GPT-4o mini

官方宣称，其在视觉、语音及多模态流式处理等方面，Baichuan-Omni-1.5 的表现均优于 GPT-4omini；在多模态医疗应用领域，其具备更突出的领先优势。

1/26/2025 3:32:39 PM 清源

太惨，一个月仅23个下载！盘点2024“理想丰满现实骨感”的大模型们！

整理 | 言征出品 | 51CTO技术栈（微信号：blog51cto）大型语言模型的竞争似乎正在结束，只有少数几个明显的赢家。其中，DeepSeek V3 已成为 2024 年的焦点，引领中国开源模型的发展。据 Hugging Face 称，DeepSeek V3 与 GPT-4 和 Claude 3.5 等闭源巨头正面交锋，上个月的下载量为 45,499 次，与Meta 的 Llama 3.1（491,629 次下载）和谷歌的 Gemma 2（377,651 次下载）并驾齐驱。

1/26/2025 11:38:54 AM 言征

Meta杨立昆引燃全民大讨论：美政府有些人被洗脑了，监管让开源变得像非法一样！Meta也犯过错！大模型不如猫，保质期就3年！

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto）1月23日，在冬季达沃斯论坛的“辩论技术”环节，Meta公司副总裁兼首席人工智能科学家Yann Lecun、麻省理工学院媒体实验室主任 Dava Newman、Axios首席技术记者Ina Turpen Fried（主持人）就未来十年前沿科技进行了时长47分钟的“全民”大讨论，话题涵盖了LLM、智能体、消费机器人、脑机接口、跨物种、太空探索，也讨论了非常让Meta敏感的“技术作恶”、审查监管、开闭源之争。观众们更是抓住机会让两位嘉宾抖出了很多猛料。 Lecun表示，现在的大模型并没有达到预期效果，在很多方面都存在不足：“我认为当前 LLM范式的保质期相当短，可能只有3到5年。

1/26/2025 11:35:05 AM 言征

TeleAI “复杂推理大模型” 达竞赛级数学表现，评分超 o1-preview

近日，中国电信人工智能研究院（TeleAI）“复杂推理大模型” TeleAI-t1-preview 正式发布，即将上线天翼 AI 开放平台。 TeleAI-t1-preview 使用了强化学习训练方法，通过引入探索、反思等思考范式，大幅提升模型在数学推导、逻辑推理等复杂问题的准确性。早在 1500 多年前，数学家祖冲之就曾在《辩戴法兴难新历》中指出，复杂事物的运行规律并非超自然现象，而是可以通过实际观测、数据推理而严谨求得。

1/26/2025 9:41:00 AM 新闻助手

中国电信发布“复杂推理大模型”TeleAI-t1-preview：能解《九章算术》题目

据介绍，TeleAI-t1-preview 使用了强化学习训练方法，通过引入探索、反思等思考范式，大幅提升模型在逻辑推理、数学推导等复杂问题的准确性。

1/25/2025 5:57:55 PM 清源

字节启动AGI长期研究计划，代号Seed Edge

1月23日，据媒体报道，字节豆包大模型团队已在内部组建AGI长期研究团队，代号“Seed Edge”，鼓励项目成员探索更长周期、具有不确定性和大胆的AGI研究课题。接近字节的知情人士透露，Seed Edge的目标是探索AGI的新方法，代号名中Seed是豆包大模型团队名称，Edge代表最前沿的AGI探索。 Seed Edge鼓励跨模态、跨团队合作，为项目成员提供宽松的研究环境，实行采用更长周期的考核方式，以保障挑战真正颠覆性的AGI课题。

1/23/2025 9:29:00 AM 新闻助手

有道子曰推理模型“子曰-o1”发布即开源，14B小参数复现OpenAI o1强推理效果

2025开年，AI行业掀起大模型“推理潮”，自OpenAI发布o1后，各式推理模型不断涌现，模型的高阶推理能力迎来爆发增强，其应用价值也愈发获得业界的广泛关注。 1月22日，网易有道正式推出国内首个输出分步式讲解的推理模型“子曰-o1”。作为14B轻量级单模型，子曰-o1支持在消费级显卡上进行部署，采用思维链技术，能够提供细致解题过程，以强逻辑和推理能力，实现更高的解题准确性，并提供中文逻辑推理。

1/22/2025 11:32:00 AM 新闻助手

几个开发大模型应用常用的 Python 库

一、应用层开发1. FastAPIFastAPI是构建API的优选。顾名思义，它快速、简单，并能与Pydantic完美集成，实现无缝数据验证。

1/22/2025 10:33:44 AM zone7

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

大模型

OpenAI突然公开o3思维链！网友：让我们谢谢DeepSeek

网易有道全面拥抱DeepSeek-R1，推理大模型加速个性化教学升级

百度智能云上架DeepSeek R1/V3，上线首日超1.5万家客户调用

在 TKE 上部署 AI 大模型（以DeepSeek-R1为例）

DeepSeek 大模型引爆市场：概念股开盘集体涨停

消息称阿里引入顶级人工智能科学家 或将加码AI To C业务

硅谷巨头要学会接受：「DeepSeek 现象」只是开始

ChatGPT回应DeepSeek超越:排名变化或为暂时现象

DeepSeek称遭到大规模恶意攻击，注册或受影响

“DeepSeek或彻底改变游戏规则”！中国大模型“搅动”硅谷

百川智能上线开源全模态模型 Omni-1.5，号称多项能力超越 GPT-4o mini

太惨，一个月仅23个下载！盘点2024“理想丰满现实骨感”的大模型们！

Meta杨立昆引燃全民大讨论：美政府有些人被洗脑了，监管让开源变得像非法一样！Meta也犯过错！大模型不如猫，保质期就3年！

TeleAI “复杂推理大模型” 达竞赛级数学表现，评分超 o1-preview

中国电信发布“复杂推理大模型”TeleAI-t1-preview：能解《九章算术》题目

字节启动AGI长期研究计划，代号Seed Edge

有道子曰推理模型“子曰-o1”发布即开源，14B小参数复现OpenAI o1强推理效果

几个开发大模型应用常用的 Python 库

消息称阿里引入顶级人工智能科学家或将加码AI To C业务