AI在线 AI在线

资讯列表

广东:拟重点围绕人形机器人等方面组织实施“智能机器人”重大专项

广东省新闻办于今日上午 10 时举行《广东省推动人工智能与机器人产业创新发展若干政策措施》新闻发布会,广东省科学技术厅副厅长杨军表示,下一步,拟重点围绕人形机器人、工业机器人、服务及特种机器人等方面,组织实施“智能机器人”重大专项,重点加快灵巧手、空心杯电机、电子皮肤、一体化关节、运动控制、端到端机器人用大模型等核心技术攻关,全力打造全球人工智能与机器人产业高地。
4/1/2025 11:49:22 AM
远洋

ICLR 2025 Oral | IDEA联合清华北大提出ChartMoE:探究下游任务中多样化对齐MoE的表征和知识

最近,全球 AI 和机器学习顶会 ICLR 2025 公布了论文录取结果:由 IDEA、清华大学、北京大学、香港科技大学(广州)联合团队提出的 ChartMoE 成功入选 Oral (口头报告) 论文。 据了解,本届大会共收到 11672 篇论文,被选中做 Oral Presentation(口头报告)的比例约为 1.8%论文链接:::::不同于现阶段使用 MoE 架构的原始动机,ChartMoE 的目标不是扩展模型的容量,而是探究 MoE 这种 Sparse 结构在下游任务上的应用,通过对齐任务来增强模型对图表的理解能力,同时保持在其他通用任务上的性能。 不同于之前依赖 ramdom 或 co-upcycle 初始化的方法,ChartMoE 利用多样的对齐任务进行专家初始化。
4/1/2025 11:49:00 AM
机器之心

GPT-2后首次!OpenAI将开源带推理能力的开源权重模型!网友:能比DeepSeek R1强吗?

出品 | 51CTO技术栈(微信号:blog51cto)奥特曼发布X文,宣布了一个重磅推理开源权重模型:长话短说:我们即将在未来几个月发布一个强大的开源语言模型,具备推理能力,并希望与开发者交流如何让它更有用:! 我们计划发布自 GPT-2 以来的首个开源语言模型。 我们已经考虑了很久,但之前有其他优先事项。
4/1/2025 10:35:37 AM

刚刚,奥特曼官宣开源:自GPT-2之后,我们要发首个带推理能力的开放权重模型

OpenAI 终于又要「Open」一回了! 今天凌晨,奥特曼发推宣布,OpenAI 将在未来几个月发布一款具备推理能力的强大新型开放权重模型。 OpenAI 希望与广大开发者、研究者和社区交流合作,探讨如何让这个模型发挥最大作用。
4/1/2025 10:19:00 AM
机器之心

Runway最新视频模型Gen-4上线!保真度、一致性、可控性做到最强

这几天,GPT-4o 的生图功能杀疯了,没想到 AI 视频领域也传来了好消息。 就在昨天,AI 初创公司 Runway 发布了一款号称是迄今为止最高保真度的 AI 视频生成模型 ——Gen-4。 该模型在画面真实感、动态流畅度和创作可控性上取得重大进步。
4/1/2025 10:15:00 AM
机器之心

打工人必看!5步解锁Coze黑科技:文本秒变专业流程图/脑图

前言在很多工作场景中,尤其是项目管理、团队协作和知识整理时,流程图和思维导图已经成为不可或缺的工具。 然而,尽管市面上有许多绘图软件,如XMind、MindManager、Draw.io等,它们依然要求用户花费大量时间进行手动绘制和调整。 对于很多人来说,每次绘制图表时,不仅要花费时间去整理布局,还要在多个细节上不断修改,才能确保图表清晰、逻辑准确。
4/1/2025 10:11:12 AM
后端小肥肠

RAG回答准确率暴涨300%!用Coze工作流进行数据结构化(附完整提示词)

前言在生成式人工智能(Generative AI)快速发展的当下,大语言模型(LLMs)的幻觉问题始终是制约其落地应用的关键瓶颈。 检索增强生成(RAG)技术通过引入外部知识库,将动态检索与生成能力结合,为解决这一难题提供了重要思路。 然而,RAG系统的核心性能——数据召回率,高度依赖于底层数据的质量与组织形式。
4/1/2025 10:01:42 AM
后端小肥肠

AI算法 | 如何训练自己的大模型?

1、第一阶段:二次预训练模型选择与转换在开始训练之前,需要选择一个合适的基础模型。 本文以LLaMA-7B为例,简单介绍下。 为了方便后续的操作,将LLaMA-7B模型转换为Hugging Face格式。
4/1/2025 9:54:09 AM
Goldma

打工人自救指南:Manus+DeepSeek+Coze破局AI淘汰

前言2025年的中国AI竞技场中,三股技术浪潮正深度重构普通人的生存法则——DeepSeek让普通人年也能享受硅谷级智囊服务;Manus让小微企业人力成本直降70%(简历筛选、财务核算等);Coze的智能体孵化出了新兴职业(智能体架构师、智能体调教师等)。 当人们还在争论AI是否替代人类时,这三个现象级工具已悄然定义了智能技术的三种进化路径:认知突破、执行闭环与生态革命。 这场技术革命的核心分野,在于三者对人类能力的增强坐标差异:• DeepSeek强化认知维度:用强化学习与模型蒸馏技术,将专业决策的颗粒度细化至人类难以企及的层级(如投资策略模拟准确率达97.3%);• Manus重构执行范式:通过规划-执行-验证(PEV)架构,替代HR筛选、财务核算等流程性工作,实现企业人力成本大幅度降低;• Coze激活创新生态:其插件市场增长率达200%,催生“智能体调教师”“智能体架构师”等新职业,让技术民主化从口号变为现实。
4/1/2025 9:49:06 AM
后端小肥肠

OpenAI要Open了!奥特曼开源首个推理模型,ChatGPT一小时暴增百万用户

OpenAI终于要Open AI了! 一大早,奥特曼郑重官宣,「未来几个月,将开源一款强大的推理模型」。 这是自GPT-2以来,OpenAI首个开源的模型。
4/1/2025 9:46:08 AM
新智元

中科大提出动作价值表征学习新方法,率先填补长期决策信息的缺失

在视觉强化学习中,许多方法未考虑序列决策过程,导致所学表征缺乏关键的长期信息的空缺被填补上了。 来自中科大的研究人员在信息瓶颈(Information Bottleneck)框架下,提出了一种新颖的鲁棒动作价值表征学习方法ROUSER。 作者从理论上证明了ROUSER能够使用学习到的鲁棒表征准确估计动作价值,从而避免了智能体在测试环境中的决策能力遭到削弱。
4/1/2025 9:32:00 AM
量子位

使用PyTorch和Hugging Face构建一个自动语音识别系统

译者 | 布加迪审校 | 重楼从语音助手到转录服务,自动语音识别(ASR)是许多应用中的一项关键技术。 我们在本教程中旨在使用Hugging Face的预训练模型构建一条能够将语音转录为文本的ASR管道。 我们将使用轻量级数据集来提高效率,并使用Wav2Vec2这种强大的语音识别自监督模型。
4/1/2025 9:31:34 AM
布加迪

RAG(八)自反思检索增强生成--Self-RAG

大语言模型具有显著的能力,但它们常常因为仅依赖于其参数化知识而产生包含事实错误的响应。 传统的检索增强生成(Retrieval-Augmented Generation, RAG)方法虽然能减少这些问题,但是存在无差别地检索和结合固定数量的段落,没有考虑检索是否必要或检索结果的相关性,都会削弱语言模型的灵活性,或者导致无益的响应生成。 现在LLM RAG(检索增强)的技术方案已成为LLM在众多应用场景的主流。
4/1/2025 9:25:09 AM
Goldma

奥赛级AI基准来了:难倒所有模型,GPT-4o仅考34分,上海交大出品

为了进一步挑战AI系统,大家已经开始研究一些最困难的竞赛中的问题,特别是国际奥林匹克竞赛和算法挑战。 但目前尚无奥林匹克级别的、多学科的基准,能够全面评估综合解决问题的能力,以全面检验人工智能的综合认知能力。 上海交通大学生成式人工智能实验室 (GAIR Lab) 的研究团队推出多学科认知推理基准OlympicArena,即使是GPT-4o 也只达到了 34.01% 的整体准确率,而其他开源模型的整体准确率也难以达到20%。
4/1/2025 9:25:00 AM
量子位

OpenAI惊人内幕曝光!赶走奥特曼的PDF,是Ilya发的

奥特曼宫斗事件的背后推手,果然是Ilya! 他发出的两份PDF,掀起了此后OpenAI的惊天巨浪。 奥特曼的3个谎言被戳穿后,Ilya找到Murati和董事会成员,策划了一场「政变」。
4/1/2025 9:23:00 AM
新智元

推荐场景Scaling Law来了!中科大&华为诺亚方舟联合推出

当Scaling Law应用于推荐场景,模型又将如何表现? 中科大认知智能全国重点实验室陈恩红团队联合华为诺亚方舟实验室推出推荐模型性能定律,首次对模型的性能与模型、数据的规模和质量进行了定量分析。 针对现有工作只能对推荐大模型Scaling Law(扩展定律)做定性分析的局限性,论文首次尝试对推荐大模型性能扩展定律给出明确的定量预测。
4/1/2025 9:20:00 AM
量子位

别只看LLM!为什么知识图谱才是通往AGI的关键一步

智能时代,我们已经习惯让AI为我们提供各种服务。  当你问DeepSeek:"北京的天气怎么样"时,它能精准回答;当你让ChatGPT"用简单语言解释相对论",它能流畅作答...  这些AI能力的背后,除了神经网络的感知能力,还有一个关键支撑技术——知识图谱。
4/1/2025 9:17:10 AM
大数据AI智能圈

刚刚,谷歌最强Gemini 2.5 Pro免费了!数学碾压人类研究生,拿下全球TOP 1

虽然又被GPT-4o吉卜力生图的光芒掩盖了,但毫无疑问,上周的另一技术核弹Gemini 2.5 Pro,也是无可争议的强! 在试用过程中,网友们逐渐发现,这个模型真的强到发指。 在门萨Norway的IQ测试中,它已经突破了130。
4/1/2025 9:17:00 AM
新智元