理论
DeepSeek V3来了 老外评测结果:很不错
近期,DeepSeek-V3-0324正式发布,迅速在全球AI领域引发热议。 相较于前作,V3版本虽未实现颠覆性创新,却在推理和编程两大关键领域取得进步,为用户带来新的惊喜。 DeepSeek向来秉持低调策略,在推出新版本时,既不发布白皮书进行详细阐述,也没有召开盛大发布会,仅将模型上传至Hugging Face平台。
3/31/2025 12:00:00 AM
小刀
估价天崩!英伟达亲儿子冲刺IPO遇冰雹!阿里董事长蔡崇信警告:开始看到泡沫迹象了
编辑 | 云昭早在20天前,“英伟达的亲儿子”CoreWeave,做了一件破天荒的事情。 CoreWeave 野心勃勃地向Sec提交了 IPO S-1 文件,表示要在未来三个月内以350亿美元的估值筹集35~40亿美元。 可以说这波操作,是目前为止生成式AI浪潮中估值最高的天价IPO。
3/28/2025 2:50:01 PM
解密神经元活动变异性:艾伦研究所与清华揭示大脑状态如何动态调节神经编码
编辑 | 2049神经元对相同刺激的反应为什么会表现出显著差异? 这种变异性是否仅仅是「噪声」? 传统研究往往假设神经活动变异性是静态的,但真实大脑状态在秒级尺度内快速切换,导致编码效率的动态波动。
3/28/2025 2:02:00 PM
ScienceAI
Manus欲以37亿估值硅谷寻融资!发布仅三周,线下用户聚会场场满员
“首个通用智能体”Manus背后公司被曝正在硅谷寻求融资——以5亿美元估值,折合人民币37.5亿元,而距离它横空出世也不过才三周时间。 从官方消息看,这几天他们确实也在硅谷面对面开用户聚会,据说是场场满员的那种。 图片图片除了新的市场消息外,Manus产品本身也推出了一些新功能和新示例EDUCATION 2.0。
3/28/2025 12:13:54 PM
GPT-4o「吉卜力风」一夜爆火,奥特曼连夜换头像!宫崎骏痛批AI侮辱生命
估计连OpenAI也没想到,GPT-4o原生图像出道即顶流! 过去一天,全网被吉卜力风格的AI图片淹没,甚至有网友戏称AGI,就是All Ghibli Images。 图片图片图片图片图片图片图片网红表情包、名人恶搞、经典名场面,甚至是每个人生活照, 全没逃过「吉卜力化」。
3/28/2025 12:10:30 PM
新智元
OpenAI破大防,拒绝率从98%骤降2%!陈怡然团队提出全新思维链劫持攻击
随着通向通用人工智能(AGI)的进展,大语言模型正进化出复杂推理能力,衍生出所谓「大型推理模型」(Large Reasoning Models, LRMs)。 OpenAI 的o系列模型凭借接近人类的推理水准刷新了诸多基准,另一边新的模型DeepSeek-R1也以更低成本实现了与o系列相当的性能。 这些模型不仅能逐步推理复杂问题,还开始将思维链(Chain-of-Thought, CoT)用于安全审查,在回答用户请求前通过内部推理判断内容是否违规,这种思路其实为平衡实用性和安全性提供了一个很有前景方向。
3/28/2025 11:59:10 AM
新智元
一文读懂AI驱动的Data Agent
周末晚上,深夜11点,一位数据分析师还在办公室加班处理紧急的月度分析报告。 面对复杂的数据库和繁琐的SQL查询,他挣扎了几个小时,不禁叹了口气:"要是有个助手能理解我的问题,自动生成SQL查询,告诉我想要的答案就好了。 " 如今,这个愿望已经成为现实。
3/28/2025 11:47:38 AM
大数据AI智能圈
AI招聘迷局:当机器人既当裁判又当选手,人类如何突围?
一幅迷宫的概念图代表了求职招聘的流程。 在迷宫中,代表AI的机器人阻挡着路径。 这幅图还描绘了招聘人员争抢着走出迷宫,而迷宫的结构恰好形成了“AI”一词。
3/28/2025 11:41:33 AM
Taylor Telford
AI算法 | SFT数据篇
1、SFT需要多少条数据SFT所需数据量一般任务:对于大多数常见的自然语言处理任务(如文本分类、情感分析、简单对话等),SFT的数据量通常在2k-10k之间。 这个范围的数据量既能保证模型学习到足够的领域知识,又不会因为数据量过大而导致训练成本过高。 复杂任务:对于复杂的任务,如数学推理、代码生成、多轮对话等,可能需要更多的数据来训练。
3/28/2025 11:10:44 AM
Goldma
大模型不再是路痴!空间推理的答案是RAG:旅游规划、附近推荐全解锁
近年来,大型语言模型(LLMs)的进展已经在机器学习(ML)的许多领域带来了变革,特别是在理解和生成类人文本方面,激发了人们通过直接从LLMs中提取空间知识来弥合空间问答与自然语言之间的差距,研究成果涵盖了广泛的应用,包括地理百科全书问答、地理定位和自动高精度地图生成等。 然而,当涉及到空间推理任务时,LLMs的表现却显得力不从心,甚至在处理基本的空间任务时也遇到困难,例如地理解析和理解相对空间关系。 这种差距在处理现实世界的空间推理任务时尤为明显,例如图1中所示的场景:图1 现实世界中空间推理问题示例。
3/28/2025 10:42:17 AM
新智元
大多数人工智能项目为何失败:应避免的十个错误
令人震惊的事实:70-80%的人工智能项目都失败了! 尽管人工智能 (AI) 及其彻底改变行业的潜力备受关注,但令人惊讶的是,70-80% 的 AI 项目都失败了——这真是一个现实的考验! 为什么这么多充满希望和潜力的人工智能计划最终都以失败告终?
3/28/2025 10:21:50 AM
晓晓
SWEET-RL:基于训练时信息的多轮LLM代理强化学习框架
SWEET-RL(Step-WisE Evaluation from Training-time information,基于训练时信息的逐步评估)是多轮大型语言模型(LLM)代理强化学习领域的重要技术进展。 该算法相较于现有最先进的方法,成功率提升了6%,使Llama-3.1-8B等小型开源模型能够达到甚至超越GPT-4O等大型专有模型的性能水平。 本文将深入分析SWEET-RL如何改进AI代理在复杂协作任务中的训练方法。
3/28/2025 10:16:15 AM
Jenray
时间序列异常检测:MSET-SPRT组合方法的原理和Python代码实现
在异常检测领域,尤其针对工业机械、核反应堆和网络安全等复杂系统,传统方法往往难以有效处理高维度且相互关联的数据流。 多元状态估计技术(MSET) 与序贯概率比检验(SPRT) 的组合方法在此类场景中展现出显著优势。 MSET-SPRT是一种结合机器学习状态估计与统计假设检验的混合技术框架,通过其高精度和稳健性,被广泛应用于关键任务系统的监控与分析。
3/28/2025 10:10:30 AM
Abish Pius
AI算法 | 领域模型Continue PreTrain数据篇
在当今人工智能的浪潮中,领域模型的构建与发展正成为推动行业进步的关键力量。 从医疗诊断到金融风险预测,从自然语言处理到图像识别,领域模型以其精准的适应性和强大的性能,为各个专业领域带来了前所未有的机遇。 而在这背后,Continue Pretrain(持续预训练)技术更是为领域模型的成长提供了源源不断的动力。
3/28/2025 9:46:05 AM
Goldma
DeepSeek倒逼成功!OpenAI 宣布实质性升级 GPT-4o,将面向免费用户数周后开放!数学和编码排名第一!
3 月 28 日,OpenAI 官方宣布为 ChatGPT 中的?GPT-4o 带来了一些功能上的更新,并确认升级版?GPT-4o 已面向所有付费用户开放,而免费用户还要再等几周。 GPT-4o 本次更新聚焦四大核心部分:. 多指令解析优化:显著提升对包含多重需求的复杂指令理解能力.
3/28/2025 9:07:05 AM
安卓突然终止「开源」,开发者遭背叛?社区炸锅了
据Android Authority报道,谷歌已经向其确认,谷歌将很快在私有环境中开发Android开源项目(AOSP,Android Open Source Project),但依然会开源代码。 网站地址:,我的安卓手机不能用了? 目前来看,谷歌私下开发AOSP项目还不至于到「天塌下来」的地步,普通手机用户更是几乎感觉不到什么变化。
3/28/2025 9:00:00 AM
新智元
CISO保护AI模型的指南
在AI应用中,机器学习(ML)模型是推动预测、推荐和自主行动的核心决策引擎。 与依赖预定义规则和静态算法的传统IT应用不同,ML模型具有动态性——它们通过分析训练数据来形成自己的内部模式和决策过程。 随着从新数据中学习,它们的行为会发生变化。
3/28/2025 9:00:00 AM
Diana Kelly
2025年人工智能领域即将发生的四大变革
2025年AI四大变革! 开发团队拥抱AI,从被动到主动;科技巨头主导GPU/TPU基础设施;开源LLM质量飙升,加速AI民主化;ModelOps融入SDLC,DataOps MLOps成关键。 译自:Four Transformational Changes Coming to AI in 2025作者:David DeSanto在过去的两年里,人工智能在软件开发中的应用呈指数级增长,而且这种趋势将在明年继续。
3/28/2025 8:26:19 AM
岱军
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
AI新词
智能体
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
华为
大语言模型
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
编程
DeepMind
亚马逊
特斯拉
AI模型