理论

DeepSeek V3来了老外评测结果：很不错

近期，DeepSeek-V3-0324正式发布，迅速在全球AI领域引发热议。相较于前作，V3版本虽未实现颠覆性创新，却在推理和编程两大关键领域取得进步，为用户带来新的惊喜。 DeepSeek向来秉持低调策略，在推出新版本时，既不发布白皮书进行详细阐述，也没有召开盛大发布会，仅将模型上传至Hugging Face平台。

3/31/2025 12:00:00 AM

小刀

估价天崩！英伟达亲儿子冲刺IPO遇冰雹！阿里董事长蔡崇信警告：开始看到泡沫迹象了

编辑 | 云昭早在20天前，“英伟达的亲儿子”CoreWeave，做了一件破天荒的事情。 CoreWeave 野心勃勃地向Sec提交了 IPO S-1 文件，表示要在未来三个月内以350亿美元的估值筹集35~40亿美元。可以说这波操作，是目前为止生成式AI浪潮中估值最高的天价IPO。

3/28/2025 2:50:01 PM

解密神经元活动变异性：艾伦研究所与清华揭示大脑状态如何动态调节神经编码

编辑 | 2049神经元对相同刺激的反应为什么会表现出显著差异？这种变异性是否仅仅是「噪声」？传统研究往往假设神经活动变异性是静态的，但真实大脑状态在秒级尺度内快速切换，导致编码效率的动态波动。

3/28/2025 2:02:00 PM

ScienceAI

Manus欲以37亿估值硅谷寻融资！发布仅三周，线下用户聚会场场满员

“首个通用智能体”Manus背后公司被曝正在硅谷寻求融资——以5亿美元估值，折合人民币37.5亿元，而距离它横空出世也不过才三周时间。从官方消息看，这几天他们确实也在硅谷面对面开用户聚会，据说是场场满员的那种。图片图片除了新的市场消息外，Manus产品本身也推出了一些新功能和新示例EDUCATION 2.0。

3/28/2025 12:13:54 PM

GPT-4o「吉卜力风」一夜爆火，奥特曼连夜换头像！宫崎骏痛批AI侮辱生命

估计连OpenAI也没想到，GPT-4o原生图像出道即顶流！过去一天，全网被吉卜力风格的AI图片淹没，甚至有网友戏称AGI，就是All Ghibli Images。图片图片图片图片图片图片图片网红表情包、名人恶搞、经典名场面，甚至是每个人生活照，全没逃过「吉卜力化」。

3/28/2025 12:10:30 PM

新智元

OpenAI破大防，拒绝率从98%骤降2%！陈怡然团队提出全新思维链劫持攻击

随着通向通用人工智能（AGI）的进展，大语言模型正进化出复杂推理能力，衍生出所谓「大型推理模型」（Large Reasoning Models, LRMs）。 OpenAI 的o系列模型凭借接近人类的推理水准刷新了诸多基准，另一边新的模型DeepSeek-R1也以更低成本实现了与o系列相当的性能。这些模型不仅能逐步推理复杂问题，还开始将思维链（Chain-of-Thought, CoT）用于安全审查，在回答用户请求前通过内部推理判断内容是否违规，这种思路其实为平衡实用性和安全性提供了一个很有前景方向。

3/28/2025 11:59:10 AM

新智元

一文读懂AI驱动的Data Agent

周末晚上，深夜11点，一位数据分析师还在办公室加班处理紧急的月度分析报告。面对复杂的数据库和繁琐的SQL查询，他挣扎了几个小时，不禁叹了口气："要是有个助手能理解我的问题，自动生成SQL查询，告诉我想要的答案就好了。 " 如今，这个愿望已经成为现实。

3/28/2025 11:47:38 AM

大数据AI智能圈

AI招聘迷局：当机器人既当裁判又当选手，人类如何突围？

一幅迷宫的概念图代表了求职招聘的流程。在迷宫中，代表AI的机器人阻挡着路径。这幅图还描绘了招聘人员争抢着走出迷宫，而迷宫的结构恰好形成了“AI”一词。

3/28/2025 11:41:33 AM

Taylor Telford

AI算法 | SFT数据篇

1、SFT需要多少条数据SFT所需数据量一般任务：对于大多数常见的自然语言处理任务（如文本分类、情感分析、简单对话等），SFT的数据量通常在2k-10k之间。这个范围的数据量既能保证模型学习到足够的领域知识，又不会因为数据量过大而导致训练成本过高。复杂任务：对于复杂的任务，如数学推理、代码生成、多轮对话等，可能需要更多的数据来训练。

3/28/2025 11:10:44 AM

Goldma

大模型不再是路痴！空间推理的答案是RAG：旅游规划、附近推荐全解锁

近年来，大型语言模型（LLMs）的进展已经在机器学习（ML）的许多领域带来了变革，特别是在理解和生成类人文本方面，激发了人们通过直接从LLMs中提取空间知识来弥合空间问答与自然语言之间的差距，研究成果涵盖了广泛的应用，包括地理百科全书问答、地理定位和自动高精度地图生成等。然而，当涉及到空间推理任务时，LLMs的表现却显得力不从心，甚至在处理基本的空间任务时也遇到困难，例如地理解析和理解相对空间关系。这种差距在处理现实世界的空间推理任务时尤为明显，例如图1中所示的场景：图1 现实世界中空间推理问题示例。

3/28/2025 10:42:17 AM

新智元

大多数人工智能项目为何失败：应避免的十个错误

令人震惊的事实：70-80％的人工智能项目都失败了！尽管人工智能 (AI) 及其彻底改变行业的潜力备受关注，但令人惊讶的是，70-80% 的 AI 项目都失败了——这真是一个现实的考验！为什么这么多充满希望和潜力的人工智能计划最终都以失败告终？

3/28/2025 10:21:50 AM

晓晓

SWEET-RL：基于训练时信息的多轮LLM代理强化学习框架

SWEET-RL（Step-WisE Evaluation from Training-time information，基于训练时信息的逐步评估）是多轮大型语言模型（LLM）代理强化学习领域的重要技术进展。该算法相较于现有最先进的方法，成功率提升了6%，使Llama-3.1-8B等小型开源模型能够达到甚至超越GPT-4O等大型专有模型的性能水平。本文将深入分析SWEET-RL如何改进AI代理在复杂协作任务中的训练方法。

3/28/2025 10:16:15 AM

Jenray

时间序列异常检测：MSET-SPRT组合方法的原理和Python代码实现

在异常检测领域，尤其针对工业机械、核反应堆和网络安全等复杂系统，传统方法往往难以有效处理高维度且相互关联的数据流。多元状态估计技术(MSET) 与序贯概率比检验(SPRT) 的组合方法在此类场景中展现出显著优势。 MSET-SPRT是一种结合机器学习状态估计与统计假设检验的混合技术框架，通过其高精度和稳健性，被广泛应用于关键任务系统的监控与分析。

3/28/2025 10:10:30 AM

Abish Pius

AI算法 | 领域模型Continue PreTrain数据篇

在当今人工智能的浪潮中，领域模型的构建与发展正成为推动行业进步的关键力量。从医疗诊断到金融风险预测，从自然语言处理到图像识别，领域模型以其精准的适应性和强大的性能，为各个专业领域带来了前所未有的机遇。而在这背后，Continue Pretrain（持续预训练）技术更是为领域模型的成长提供了源源不断的动力。

3/28/2025 9:46:05 AM

Goldma

DeepSeek倒逼成功！OpenAI 宣布实质性升级 GPT-4o，将面向免费用户数周后开放！数学和编码排名第一！

3 月 28 日，OpenAI 官方宣布为 ChatGPT 中的?GPT-4o 带来了一些功能上的更新，并确认升级版?GPT-4o 已面向所有付费用户开放，而免费用户还要再等几周。 GPT-4o 本次更新聚焦四大核心部分：. 多指令解析优化：显著提升对包含多重需求的复杂指令理解能力.

3/28/2025 9:07:05 AM

安卓突然终止「开源」，开发者遭背叛？社区炸锅了

据Android Authority报道，谷歌已经向其确认，谷歌将很快在私有环境中开发Android开源项目（AOSP，Android Open Source Project），但依然会开源代码。网站地址：，我的安卓手机不能用了？目前来看，谷歌私下开发AOSP项目还不至于到「天塌下来」的地步，普通手机用户更是几乎感觉不到什么变化。

3/28/2025 9:00:00 AM

新智元

CISO保护AI模型的指南

在AI应用中，机器学习(ML)模型是推动预测、推荐和自主行动的核心决策引擎。与依赖预定义规则和静态算法的传统IT应用不同，ML模型具有动态性——它们通过分析训练数据来形成自己的内部模式和决策过程。随着从新数据中学习，它们的行为会发生变化。