AI在线 AI在线

理论

从自我进化视角出发,全面解析LLM的推理能力技术演进路径

论文标题:A Survey on LLM Complex Reasoning through the Lens of Self-Evolution论文链接::. 引言在人工智能领域,大型语言模型的复杂推理研究正成为学术界和工业界关注的焦点。 随着 OpenAI 的 O1 以及后续 DeepSeek R1 等突破性成果的发布,这一领域的研究热度持续升温,引发了广泛的学术讨论和实践探索。
3/6/2025 9:08:00 PM
机器之心

邀请码5万一个?ManusAl合伙人张涛紧急回应!中国产品再次引爆全球,首个通用AI代理跑分超OpenA1!最全梳理来了!

编辑 | 伊风Manus横空出世,彻底引爆了今天的AI圈! 刚刚我们在某站看了一下邀请码,已经被炒到5万块了(天呐! )图片自杭州疯狂上大分后,这泼天的AI富贵也轮到武汉了!
3/6/2025 5:50:17 PM
伊风

声网发布对话式AI引擎 AI对话1分钟不到1毛钱​

3月6日,声网在京举办了主题为“AI开口,互动无界”的产品发布会,正式发布了全球首个对话式AI引擎,凭借650ms 超低延时响应、优雅打断、全模型适配等五大能力,对话式AI引擎可支持任意文本大模型快速升级为“能说会道”的对话式多模态大模型。 同时,对话式 AI 引擎的价格也更为优惠,1分钟不到1毛钱,只需0.098元/分钟。 五大能力让任意大模型“能说会道”在生成式AI的浪潮下,行业普遍认为多模态大模型是实现AGI的必经之路,知名投资机构a16z最新关于Voice AI的报告也显示,随着大模型的不断进步,语音将成为一种关键的切入点。
3/6/2025 5:29:23 PM

Science子刊,AI与生物物理建模相结合,设计新型蛋白质

编辑 | 萝卜皮机器学习 (ML) 正在改变计算蛋白质设计的世界,数据驱动方法在实验成功率方面超越了基于生物物理的方法。 然而,它们通常被报告为案例研究,缺乏整合和标准化,因此很难进行客观比较。 在最新的研究中,德国莱比锡大学(Leipzig University)的跨学科研究团队在 Rosetta 软件框架内建立了一个精简且多样化的工具箱,用于预测氨基酸概率的方法,以便对这些模型进行并排比较。
3/6/2025 4:42:00 PM
ScienceAI

快1000倍,十万分之一误差,深度学习模型降低核聚变等离子体预测计算成本

编辑 | 2049在聚变能源研究领域,等离子体动力学模拟扮演着关键角色。 然而,非线性 Fokker-Planck-Landau(FPL)碰撞算子的计算成本极高,尤其在全托卡马克体积建模中,其计算时间随等离子体粒子种类数量 n 呈 O(n²) 增长,严重制约了模拟效率。 为突破这一瓶颈,来自蔚山国立科学技术院(UNIST)的研究人员开发了一种全新的深度学习框架——FPL-net,利用人工智能技术加速求解这一复杂问题。
3/6/2025 1:37:00 PM
ScienceAI

Nature:如何借助AI高效完成学术论文同行评审

编辑 | matrix许多研究人员都有这样的体验:接受审稿邀请往往意味着一整天的时间被占用。 他们花费数小时标注手稿,却发现自己需要更多时间来消化内容才能提供连贯的反馈。 因此,不少学者开始婉拒审稿邀请,以保护自己宝贵的时间和精力。
3/6/2025 1:36:00 PM
ScienceAI

我用DeepSeek做了一个AI获客工具

其实去年我就有做AI获客的想法了。 当时帮一个外贸公司做过自动分析客户级别以及自动生成邮件的项目,了解到他们对获取客户的需求非常迫切。 他们通常从谷歌浏览器、会展名单以及海关数据中获取客户信息,但是整个过程非常耗时。
3/6/2025 1:10:32 PM
贝塔街的万事屋

32B逆袭671BDeepSeek R1!阿里推理模型炸翻了:小到笔记本就能run,成本仅1/10!又是强化学习带来惊喜!

编辑 | 伊风太震撼了。 阿里直接扔了一张王炸! QwQ-32B,一个参数量如此小的小模型,居然追平了671B的DeepSeek-R1?
3/6/2025 12:43:03 PM
伊风

利用DeepSeek人工智能和人工智能可解释性预防银行欺诈

分析人工智能驱动的欺诈检测使用XGBoost、SHAP和实时仪表板提高了准确性和透明度,提供了可扩展的解决方案来打击欺诈。 随着人工智能(AI)和机器学习(ML)的发展,银行业的欺诈检测取得了显著进展。 然而,一个持续存在的挑战是欺诈决策的可解释性——我们如何证明为什么一个特定的交易被标记为欺诈?
3/6/2025 11:35:18 AM
Harris编译

离谱!OpenAI被曝博士级AI智能体2万美元/月,网友:DeepSeek快把价格打下去

什么样的AI,值得你花20000刀一个月? OpenAI告诉你:用我们的博士级AI智能体吧,它保管值! 今天这个消息,让所有人瞠目结舌:OpenAI的高管们计划发布三类智能体产品,价格分几档,最贵的一档月费高达2万美金。
3/6/2025 11:31:10 AM
新智元

选择AI供应商时必须考虑的三个因素

随着2025年AI技术逐渐融入日常业务,企业在选择AI项目和供应商时面临诸多挑战。 尽职调查和供应商审查成为确保项目成功、实现投资回报和获得董事会批准的关键。 本文将探讨企业如何甄选AI项目与供应商,以确保在AI领域取得竞争优势。
3/6/2025 11:24:38 AM
Pat Brans

全球首款通用AI助手发布 中国AI产品Manus一夜刷屏

近日,全球首款通用Agent(自主智能体)产品Manus正式开启了部分内测,这标志着AI自主智能领域迈出了关键性的一步。 Manus以其强大的独立思考、规划并执行复杂任务的能力,直接交付完整成果,展现了前所未有的通用性和执行能力。 与现有的AI助手相比,Manus不仅具备多任务操作能力,如Claude的Computer use等,更能在多个领域实现更高的执行质量。
3/6/2025 10:52:02 AM
站长之家

OpenAI计划推2万美元包月的博士级智能体,你愿意买单吗?

近日,OpenAI计划推出一款“博士级研究智能体”,每月收费高达2万美元(约合人民币14.5万元),引发了科技界的广泛关注。 这款智能体旨在处理学术研究和软件开发中的复杂任务,其强大的处理能力和深度学习算法,将为用户提供前所未有的服务体验。 OpenAI试水高端智能体OpenAI此次推出的博士级智能体并非单一产品,而是其AI智能体产品线中的高端版本。
3/6/2025 10:47:02 AM
小菲

谷歌推出纯AI版搜索引擎,完全由人工智能生成摘要界面

谷歌近日推出一款实验性的纯AI版搜索引擎,彻底摒弃了传统的10个蓝色链接展示形式,转而采用由人工智能生成的摘要界面。 这一功能被命名为“AI模式”,并已向Google One AI Premium订阅用户开放。 用户可以在搜索结果页面的侧边栏中点击新增的“AI模式”选项卡,体验这一全新的搜索方式。
3/6/2025 10:18:32 AM

图灵奖颁给强化学习师徒,一个造船改行写代码,一个痛批AI投身AGI

计算机最高奖图灵奖揭晓! 强化学习先驱Andrew Barto与Richard Sutton共同获奖,他们被评价为“引领基础AI技术开发的研究人员”。 值得一提的是,两位是师徒关系,Richard Sutton是Andrew Barto他第一位博士生。
3/6/2025 10:07:00 AM
量子位

360智脑开源Light-R1!1000美元数学上首次从零超越DeepSeek-R1-Distill

2025 年 3 月 4 日,360 智脑开源了 Light-R1-32B 模型,以及全部训练数据、代码。 仅需 12 台 H800 上 6 小时即可训练完成,从没有长思维链的 Qwen2.5-32B-Instruct 出发,仅使用 7 万条数学数据训练,得到 Light-R1-32B,在 AIME24 测试基准中取得 76.6 分、AIME25 取得 64.6 分,在数学评测上开源首次实现从零大幅超越 DeepSeek-R1-Distill-Qwen-32B 的 72.6 分和 54.9 分。 一周前,360 智脑联合北大开源了 TinyR1-32B-Preview,从 DeepSeek-R1-Distill-Qwen-32B 训练,在数学、科学和代码上取得了接近 DeepSeek-R1 满血版的优异效果。
3/6/2025 10:00:00 AM
机器之心

重磅!阿里深夜推出全新推理模型,仅1/20参数媲美DeepSeek R1

就在刚刚,阿里Qwen 团队 正式发布了他们最新的研究成果 —— QwQ-32B 大语言模型! 这款模型不仅名字萌萌哒 (QwQ),实力更是不容小觑! 😎相信关注大模型领域的朋友们都知道,模型参数量的大小往往与性能成正比。
3/6/2025 9:55:49 AM
AI寒武纪

AI屠戮白领,大学文凭变「废纸」!美高中重开体力课,年薪40万不是梦

OpenAI首个NextGenAI联盟正式成立! 联盟汇聚了15家领先研究机构,包括Caltech、MIT、哈佛等顶尖学府,创始阵容堪称豪华。 其中,研究资助、计算资金和API访问权限都将由OpenAI负责提供,全力支持学生、教育工作者和研究人员探索AI前沿应用。
3/6/2025 9:30:00 AM
新智元