AI在线 AI在线

理论

AI自我纠错,Diffusion超越自回归!质量提升55%,已达理论证据下界

如果大语言模型(LLMs)能够发现并纠正自己的错误,那岂不是很好? 而且,如果能够直接从预训练中实现这一点,而无需任何监督微调(SFT)或强化学习(RL),那会怎样呢? 最新提出的离散扩散模型,称为GIDD,它能够做到这一点。
3/24/2025 9:35:00 AM
新智元

2030年,AGI概率至少10%!AI范式转变快,谁能预测GenAI下一代?

AGI已经来了? 还是快来了? 还是说AGI也是一种「技术乌托邦」?
3/24/2025 9:30:00 AM
新智元

奥特曼豪言:OpenAI第一个发布AGI!下一代人不可能比AI聪明,却没人在意

奥特曼再谈AGI信念! 最近,奥特曼在一期采访中坚定地表示,「OpenAI将第一个发布AGI,并没有人多少人在意」。 他承认,当AI变得更加自主,能够完成通常需要整个组织,才能实现的任务时,自己并不知道那一刻会发生什么。
3/24/2025 9:22:00 AM
新智元

每天2小时成绩逆袭全美前2%!AI助教让学生不再内卷

每天只用2小时就能搞定繁重的学习任务,剩下时间开发自己的兴趣项目,考试成绩还提高了。 这样的学校你愿意尝试吗? 据福克斯新闻报道,德克萨斯州一家名为Alpha School的私立学校在引入AI「助教」后,学生的考试成绩蹭蹭上涨,提高到了全美国的前2%。
3/24/2025 9:12:00 AM
新智元

Idea撞车何恺明「分形生成模型」!速度领先10倍,性能更强

前不久,大神何恺明刚刚放出新作「分形生成模型」,递归调用原子生成模块,构建了新型的生成模型,形成了自相似的分形架构,将GenAI模型的模块化层次提升到全新的高度。 论文地址: 地址:,澳大利亚国立大学的研究人员提出了一个全新的图像生成模型ARINAR,在思想上与分形生成模型不谋而合,但是在性能和速度上都显著提升,base模型的FID从11.8提升到2.75,生成时间从2分钟降低到12秒! ARINAR不仅超越了之前的扩散模型,与目前表现最好的自回归模型MAR相比,ARINAR生成质量相当,速度是MAR的5倍。
3/24/2025 9:08:00 AM
新智元

硅谷投资人爆料:AI爆炸率先发生在中国!芯片扩大1万倍,AI逼近物理极限

如果AI系统能自己设计出更强大的AI,智能爆炸可能很快就要到来了! 而人类,会被AI迅速甩在后面。 最近,硅谷投资人、EverFi CEO兼创始人Tom Davidson等人发表了一篇长文硬核博客,详细讨论了智能爆炸(Intelligence explosion, IE)的类型以及对应的发生概率。
3/24/2025 8:55:00 AM
新智元

AI PS卷起来了!谷歌Gemini动嘴P图火出圈,马斯克Grok连夜上线图像编辑

Grok连夜上线图片编辑功能。 昨晚,Grok上线图片编辑功能,可以通过文字描述直接修改图片。 比如你可以上传一张个人证件照,「动动嘴」让Grok给你PS一套全新的西服。
3/24/2025 8:43:00 AM
新智元

基于代理知识蒸馏技术克服文档提取和RAG策略失败问题

译者 | 朱先忠审校 | 重楼简介当下,许多生成式AI应用场景仍然围绕检索增强生成(RAG)展开,但始终未能满足用户的期望。 尽管对RAG改进的研究越来越多,甚至在流程中添加了代理技术,但许多解决方案仍然无法返回详尽的结果,遗漏了文档中很少提及的关键信息,需要多次搜索迭代,并且通常难以协调多个文档中的关键主题。 最糟糕的是,许多实现方案仍然依赖于将尽可能多的“相关”信息与详细的系统和用户提示一起塞入模型的上下文窗口。
3/24/2025 8:20:39 AM
朱先忠

数据越多越好?错了!关键在于如何“喂”给模型

咱们今天聊聊机器学习里的一个重点概念——特征工程。 我们人看东西、做判断,是不是得先抓住事物的关键特点? 比如说,你要判断一个苹果好不好吃,你会看它颜色、闻它香味、摸它硬度,甚至尝一口。
3/24/2025 6:40:00 AM
Python数智工坊

提升自我的十款顶级AI工具推荐

今天为大家精选了10款能帮助我们提升自我的AI工具,让成长变得更加高效。 1️⃣ BeforeSunset AI:你的专属生产力管家image.png时间总是不够用? BeforeSunset AI通过智能规划你的日程表,帮助你高效利用每一分钟,让你清晰有序地安排一天的任务。
3/24/2025 12:00:00 AM
dev

RAG(六)大语言模型应用中的分块策略详解

1、分块在不同应用场景的作用语义搜索在语义搜索中,索引一组文档,每个文档包含特定主题的有价值信息。 通过应用有效的分块策略,可以确保搜索结果准确捕捉用户查询的核心。 分块的大小和方式直接影响搜索结果的准确性和相关性:分块过小:可能会丢失上下文信息,导致搜索结果无法准确理解用户查询的意图。
3/21/2025 2:34:17 PM
Goldma

北欧初创企业IntuiCell发布全球首套人工智能数字神经系统

译者 | 涂承烨审校 | 重楼一家北欧深度科技初创公司宣布在人工智能领域取得突破性进展,成功创建了首个具备自主学习功能的“数字神经系统”。 2025年3月19日,隆德大学的衍生企业IntuiCell正式宣布,他们已成功研发出能够像生物有机体般学习和适应的人工智能,这项技术可能使当前众多应用场景中的传统AI范式面临淘汰。 这项创新技术彻底颠覆了传统的静态机器学习模型,通过模拟生物神经系统学习的核心原理实现突破。
3/21/2025 2:14:01 PM
涂承烨

AI浪潮下,对DeepSeek发展的哲学新思考

作者 | 黄宇审校 | 重楼2025年新春伊始,DeepSeek火爆全球,国产大模型横空出世,以“免费 易用 高性能”的组合成功破圈,震动全球科技界。 3月1日,DeepSeek官方披露,按照DeepSeek-R1的token定价水平,公司一日之内总收入为562027美元,成本利润率高达545%。 国产之光DeepSeek的朋友圈持续“扩容”,阿里、百度、腾讯等国内企业,微软、英伟达、亚马逊等国际科技巨头纷纷向DeepSeek抛出橄榄枝,“满血版DeepSeek”一时间成了互联网最新流量密码。
3/21/2025 2:11:19 PM
黄宇

生信工具评测方法:基于蛋白质对的计算机预测工具评估

编辑 | 白菜叶计算机模拟蛋白质功能注释对于缩小因测序加速而导致的对蛋白质活性理解的差距至关重要。 存在多种功能注释方法,而且它们的数量一直在增长,尤其是随着深度学习技术的发展。 但是,目前尚不清楚这些工具是否真的具有预测性。
3/21/2025 2:06:00 PM
ScienceAI

成效初显!基于DeepSeek强化学习的医疗VLM策略来了

编辑 | ScienceAI在人工智能跨界医疗的浪潮中,如何赋能视觉语言模型(VLM)去 “看懂” 多种类型的医学影像,并在疾病诊断、病灶分析等任务中给出可信解释,已成关键挑战。 近期,来自埃默里大学、南加州大学等机构的联合研究团队基于 DeepSeek 强化学习提出了一套医疗 VLM 策略,称之为 “Med-R1”,通过鼓励模型在 “推理过程” 上不断探索,大大提升了跨模态、跨任务的泛化能力。 本文将结合实验结果和推理案例,为大家展示 DeepSeek 在医疗 VLM 中的实战成效。
3/21/2025 2:05:00 PM
ScienceAI

13年后,AlexNet源代码终于公开:带注释的原版

想知道 AlexNet 2012 年的原始代码长什么样吗? 现在,机会来了! 刚刚,谷歌首席科学家 Jeff Dean 宣布,他们与计算机历史博物馆(CHM)合作,共同发布了 AlexNet 的源代码,并将长期保存这些代码。
3/21/2025 1:17:38 PM
机器之心

微软腾讯合体开大!上千网红爆款涌进桌面,PC手机次元壁崩塌

你,是否曾这样设想过:如果某一天,移动应用能和Windows PC无缝集成,就太好了。 如今,这个梦想可以成真了。 3月17日,微软应用商店(Microsoft Store)正式上线「腾讯应用宝专区」,1000 精选安卓应用和游戏强势入驻Windows生态。
3/21/2025 1:06:17 PM
新智元

原有的模型评测基准OUT了!12岁高中生建立了一个网站, 让AI模型发起 Minecraft 挑战

编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)由于传统的AI 基准测试技术已被证明不够充分,AI 开发者开始采用更具创造性的方式来评估生成式 AI 模型的能力。 对于一组开发者来说,这就是微软旗下的沙盒建造游戏 Minecraft。 Minecraft Benchmark (或 MC-Bench)网站是合作开发的,目的是让人工智能模型在面对面的挑战中相互竞争,用 Minecraft 创作来回答提示。
3/21/2025 1:05:18 PM
言征