AI在线 AI在线

理论

DeepSeek V3来了 老外评测结果:很不错

近期,DeepSeek-V3-0324正式发布,迅速在全球AI领域引发热议。 相较于前作,V3版本虽未实现颠覆性创新,却在推理和编程两大关键领域取得进步,为用户带来新的惊喜。 DeepSeek向来秉持低调策略,在推出新版本时,既不发布白皮书进行详细阐述,也没有召开盛大发布会,仅将模型上传至Hugging Face平台。
3/31/2025 12:00:00 AM
小刀

估价天崩!英伟达亲儿子冲刺IPO遇冰雹!阿里董事长蔡崇信警告:开始看到泡沫迹象了

编辑 | 云昭早在20天前,“英伟达的亲儿子”CoreWeave,做了一件破天荒的事情。 CoreWeave 野心勃勃地向Sec提交了 IPO S-1 文件,表示要在未来三个月内以350亿美元的估值筹集35~40亿美元。 可以说这波操作,是目前为止生成式AI浪潮中估值最高的天价IPO。
3/28/2025 2:50:01 PM

解密神经元活动变异性:艾伦研究所与清华揭示大脑状态如何动态调节神经编码

编辑 | 2049神经元对相同刺激的反应为什么会表现出显著差异? 这种变异性是否仅仅是「噪声」? 传统研究往往假设神经活动变异性是静态的,但真实大脑状态在秒级尺度内快速切换,导致编码效率的动态波动。
3/28/2025 2:02:00 PM
ScienceAI

Manus欲以37亿估值硅谷寻融资!发布仅三周,线下用户聚会场场满员

“首个通用智能体”Manus背后公司被曝正在硅谷寻求融资——以5亿美元估值,折合人民币37.5亿元,而距离它横空出世也不过才三周时间。 从官方消息看,这几天他们确实也在硅谷面对面开用户聚会,据说是场场满员的那种。 图片图片除了新的市场消息外,Manus产品本身也推出了一些新功能和新示例EDUCATION 2.0。
3/28/2025 12:13:54 PM

GPT-4o「吉卜力风」一夜爆火,奥特曼连夜换头像!宫崎骏痛批AI侮辱生命

估计连OpenAI也没想到,GPT-4o原生图像出道即顶流! 过去一天,全网被吉卜力风格的AI图片淹没,甚至有网友戏称AGI,就是All Ghibli Images。 图片图片图片图片图片图片图片网红表情包、名人恶搞、经典名场面,甚至是每个人生活照, 全没逃过「吉卜力化」。
3/28/2025 12:10:30 PM
新智元

OpenAI破大防,拒绝率从98%骤降2%!陈怡然团队提出全新思维链劫持攻击

随着通向通用人工智能(AGI)的进展,大语言模型正进化出复杂推理能力,衍生出所谓「大型推理模型」(Large Reasoning Models, LRMs)。 OpenAI 的o系列模型凭借接近人类的推理水准刷新了诸多基准,另一边新的模型DeepSeek-R1也以更低成本实现了与o系列相当的性能。 这些模型不仅能逐步推理复杂问题,还开始将思维链(Chain-of-Thought, CoT)用于安全审查,在回答用户请求前通过内部推理判断内容是否违规,这种思路其实为平衡实用性和安全性提供了一个很有前景方向。
3/28/2025 11:59:10 AM
新智元

一文读懂AI驱动的Data Agent

周末晚上,深夜11点,一位数据分析师还在办公室加班处理紧急的月度分析报告。  面对复杂的数据库和繁琐的SQL查询,他挣扎了几个小时,不禁叹了口气:"要是有个助手能理解我的问题,自动生成SQL查询,告诉我想要的答案就好了。 " 如今,这个愿望已经成为现实。
3/28/2025 11:47:38 AM
大数据AI智能圈

AI招聘迷局:当机器人既当裁判又当选手,人类如何突围?

一幅迷宫的概念图代表了求职招聘的流程。 在迷宫中,代表AI的机器人阻挡着路径。 这幅图还描绘了招聘人员争抢着走出迷宫,而迷宫的结构恰好形成了“AI”一词。
3/28/2025 11:41:33 AM
Taylor Telford

AI算法 | SFT数据篇

1、SFT需要多少条数据SFT所需数据量一般任务:对于大多数常见的自然语言处理任务(如文本分类、情感分析、简单对话等),SFT的数据量通常在2k-10k之间。 这个范围的数据量既能保证模型学习到足够的领域知识,又不会因为数据量过大而导致训练成本过高。 复杂任务:对于复杂的任务,如数学推理、代码生成、多轮对话等,可能需要更多的数据来训练。
3/28/2025 11:10:44 AM
Goldma

大模型不再是路痴!空间推理的答案是RAG:旅游规划、附近推荐全解锁

近年来,大型语言模型(LLMs)的进展已经在机器学习(ML)的许多领域带来了变革,特别是在理解和生成类人文本方面,激发了人们通过直接从LLMs中提取空间知识来弥合空间问答与自然语言之间的差距,研究成果涵盖了广泛的应用,包括地理百科全书问答、地理定位和自动高精度地图生成等。 然而,当涉及到空间推理任务时,LLMs的表现却显得力不从心,甚至在处理基本的空间任务时也遇到困难,例如地理解析和理解相对空间关系。 这种差距在处理现实世界的空间推理任务时尤为明显,例如图1中所示的场景:图1 现实世界中空间推理问题示例。
3/28/2025 10:42:17 AM
新智元

大多数人工智能项目为何失败:应避免的十个错误

令人震惊的事实:70-80%的人工智能项目都失败了! 尽管人工智能 (AI) 及其彻底改变行业的潜力备受关注,但令人惊讶的是,70-80% 的 AI 项目都失败了——这真是一个现实的考验! 为什么这么多充满希望和潜力的人工智能计划最终都以失败告终?
3/28/2025 10:21:50 AM
晓晓

SWEET-RL:基于训练时信息的多轮LLM代理强化学习框架

SWEET-RL(Step-WisE Evaluation from Training-time information,基于训练时信息的逐步评估)是多轮大型语言模型(LLM)代理强化学习领域的重要技术进展。 该算法相较于现有最先进的方法,成功率提升了6%,使Llama-3.1-8B等小型开源模型能够达到甚至超越GPT-4O等大型专有模型的性能水平。 本文将深入分析SWEET-RL如何改进AI代理在复杂协作任务中的训练方法。
3/28/2025 10:16:15 AM
Jenray

时间序列异常检测:MSET-SPRT组合方法的原理和Python代码实现

在异常检测领域,尤其针对工业机械、核反应堆和网络安全等复杂系统,传统方法往往难以有效处理高维度且相互关联的数据流。 多元状态估计技术(MSET) 与序贯概率比检验(SPRT) 的组合方法在此类场景中展现出显著优势。 MSET-SPRT是一种结合机器学习状态估计与统计假设检验的混合技术框架,通过其高精度和稳健性,被广泛应用于关键任务系统的监控与分析。
3/28/2025 10:10:30 AM
Abish Pius

AI算法 | 领域模型Continue PreTrain数据篇

在当今人工智能的浪潮中,领域模型的构建与发展正成为推动行业进步的关键力量。 从医疗诊断到金融风险预测,从自然语言处理到图像识别,领域模型以其精准的适应性和强大的性能,为各个专业领域带来了前所未有的机遇。 而在这背后,Continue Pretrain(持续预训练)技术更是为领域模型的成长提供了源源不断的动力。
3/28/2025 9:46:05 AM
Goldma

DeepSeek倒逼成功!OpenAI 宣布实质性升级 GPT-4o,将面向免费用户数周后开放!数学和编码排名第一!

3 月 28 日,OpenAI 官方宣布为 ChatGPT 中的?GPT-4o 带来了一些功能上的更新,并确认升级版?GPT-4o 已面向所有付费用户开放,而免费用户还要再等几周。 GPT-4o 本次更新聚焦四大核心部分:. 多指令解析优化:显著提升对包含多重需求的复杂指令理解能力.
3/28/2025 9:07:05 AM

安卓突然终止「开源」,开发者遭背叛?社区炸锅了

据Android Authority报道,谷歌已经向其确认,谷歌将很快在私有环境中开发Android开源项目(AOSP,Android Open Source Project),但依然会开源代码。 网站地址:,我的安卓手机不能用了? 目前来看,谷歌私下开发AOSP项目还不至于到「天塌下来」的地步,普通手机用户更是几乎感觉不到什么变化。
3/28/2025 9:00:00 AM
新智元

CISO保护AI模型的指南

在AI应用中,机器学习(ML)模型是推动预测、推荐和自主行动的核心决策引擎。 与依赖预定义规则和静态算法的传统IT应用不同,ML模型具有动态性——它们通过分析训练数据来形成自己的内部模式和决策过程。 随着从新数据中学习,它们的行为会发生变化。
3/28/2025 9:00:00 AM
Diana Kelly

2025年人工智能领域即将发生的四大变革

2025年AI四大变革! 开发团队拥抱AI,从被动到主动;科技巨头主导GPU/TPU基础设施;开源LLM质量飙升,加速AI民主化;ModelOps融入SDLC,DataOps MLOps成关键。 译自:Four Transformational Changes Coming to AI in 2025作者:David DeSanto在过去的两年里,人工智能在软件开发中的应用呈指数级增长,而且这种趋势将在明年继续。
3/28/2025 8:26:19 AM
岱军