AI在线 AI在线

资讯列表

AI“智商”大考变革!全新GAIA基准超越 ARC-AGI

人工智能(AI)的能力正在飞速发展,如何准确衡量其“智能”程度一直是行业关注的焦点。 然而,正如衡量人类智力一样,AI智能的测评也并非易事,现有的测试和基准往往只能提供近似的评估。 近年来,随着AI模型日益复杂,传统基准的局限性日益凸显,促使行业积极探索更全面、更能反映实际应用能力的新型评估体系。
4/14/2025 10:01:17 AM
AI在线

​Google表格集成AI功能,批量数据处理迈入新纪元

人工智能正在加速渗透日常生产工具。 近期,AIbase从社交媒体获悉,Google表格(Google Sheets)正式推出AI功能,通过内置的=AI()函数为用户提供高效的批量数据处理能力。 尽管这一功能目前处于Alpha测试阶段且面向特定用户,社交媒体上已有用户对其表现表示惊叹。
4/14/2025 10:01:17 AM
AI在线

Netflix测试OpenAI支持的搜索功能:让用户按"心情"找片

Netflix正在测试由OpenAI提供技术支持的全新搜索功能,该功能将允许用户使用更具体和个性化的术语来查找内容,包括根据用户"心情"进行搜索。 这一创新搜索工具将帮助用户进行"超越类型或演员姓名"的更复杂查询。 目前,这项功能仅向澳大利亚和新西兰的部分iOS用户开放测试,且为可选功能。
4/14/2025 10:01:17 AM
AI在线

Grok推出记忆功能,AI交互迈向更智能未来

人工智能的交互体验正在不断进化。 近期,AIbase注意到,xAI旗下的AI助手Grok正式推出了备受期待的记忆功能,能够记录用户之前的对话内容,为个性化交互打开了新篇章。 这一功能的上线引发了广泛关注,以下是AIbase基于最新信息的深度报道,带您了解Grok记忆功能的亮点与前景。
4/14/2025 10:01:17 AM
AI在线

科大讯飞旗下讯飞星辰Agent开发平台已全面支持MCP

科大讯飞宣布,为帮助开发者轻松、高效地构建Agent应用,讯飞星辰Agent开发平台已全面支持MCP。 开发者可以在平台上轻松配置、调用行业精品的MCP Server,也能一键发布自定义的MCP Server,让Agent扩展能力真正实现“即插即用”。 首批支持20 行业精品MCP Server,覆盖AI能力、生活服务、内容生成等多领域,支持开发者、企业一键托管自研MCP Server。
4/14/2025 10:01:17 AM
AI在线

百元成本炼成开源视频模型Pusa:基于Mochi微调,低成本复现高质量

人工智能(AI)驱动的视频生成技术正快速发展,近日,一款名为 Pusa 的开源视频模型引起了业界的关注。 该模型基于领先的开源视频生成系统 Mochi 进行微调,不仅展现了尚可的效果,更重要的是,完全开源了包括训练工具、数据集在内的整个微调过程,且训练成本仅为约100美元,为视频生成领域的研究和应用带来了新的可能性。 基于Mochi微调,初步展现视频生成能力Pusa-V0.5是 Pusa 模型的早期预览版本,其基础模型是 Artificial Analysis Leaderboard 上领先的开源视频生成系统 Mochi1-Preview。
4/14/2025 10:01:17 AM
AI在线

谢赛宁等新作上线,多模态理解生成大一统!思路竟与GPT-4o相似?

在不久之前机器之心报道文章《3D领域DeepSeek「源神」启动! 国产明星创业公司,一口气开源八大项目》中,我们曾介绍到,国内专注于构建通用 3D 大模型的创业公司 VAST 将持续开源一系列 3D 生成项目。 近日,新的开源项目它来了,包括针对任意三维模型生成完整可编辑部件的 HoloPart 与通用自动绑定框架 UniRig。
4/14/2025 9:38:00 AM
新智元

苹果AI首秀,竟然只有跑马灯是真的!长文揭秘苹果彻底搞砸AI

去年6月,苹果展示了AI版Siri。 随后的几个月,Siri团队对实现这些功能的基础技术方案摇摆不定。 据一位知情的前苹果员工透露,团队曾计划打造一小一大两种模型,分别命名为「迷你鼠」(Mini Mouse)和「大力鼠」(Mighty Mouse)。
4/14/2025 9:35:00 AM
新智元

最强32B中文推理大模型易主:开源免费商用,1/20 DeepSeek-R1参数量SOTA,权重代码数据集全开源

千亿参数内最强推理大模型,刚刚易主了。 32B——DeepSeek-R1的1/20参数量;免费商用;且全面开源——模型权重、训练数据集和完整训练代码,都开源了。 这就是刚刚亮相的Skywork-OR1 (Open Reasoner 1)系列模型——通用32B尺寸(Skywork-OR1-32B)完全超越同规模阿里QwQ-32B;代码生成媲美DeepSeek-R1,但性价比更高。
4/14/2025 9:27:00 AM
量子位

吉卜力爆红背后,关键推手另有其人!GPT-4o竟封奥特曼为AGI之王

AI版「三国杀」卡牌来了。 AI初创Nous Research联合创始人兼后训练负责人Teknium,有个好点子:把AI名流做成卡牌游戏怎么样? 上周,他用GPT-4o生一堆AI流行人物卡牌,结果非常棒。
4/14/2025 9:25:00 AM
新智元

AI席卷校园:百万条对话揭秘,Claude是代码救星还是作弊工具?

如今,AI不再只是专业的研究工具,它已成为大学生日常学习的好帮手。 随着AI越来越深入地融入教育环境,需要思考一系列关于学习、评估和技能培养的重要问题。 目前,大多数相关讨论都基于调查和对照实验,却缺乏学生在真实学习场景中自然融入AI的直接证据。
4/14/2025 9:22:00 AM
新智元

奥特曼:ChatGPT不是AGI!OpenAI最强开源模型直击DeepSeek

近了,近了! 全网多个流出的代码截图显示,满血版o3、o4-mini,以及o4-mini high,有极大概率在下周发布。 不仅如此,在OpenRouter平台上,一款神秘模型Optimus Alpha(ELO得分1387)直接霸榜,据称就是o4-mini。
4/14/2025 9:17:00 AM
新智元

AI奥数大奖出炉,英伟达摘桂冠!14B破解34题暴击DeepSeek R1

第二届人工智能数学奥林匹克竞赛(AIMO2)开奖了! 作为大赛顾问委员会的一员,陶哲轩激动地宣布了最新的结果——英伟达团队AI成功破解了34道题(共50题)。 这一次,50道测试题保持了与AIMO1相同「数值答案」形式基础上,进一步提升了「抗暴力破解」的难度。
4/14/2025 9:15:00 AM
新智元

人类一生所学不过4GB,加州理工顶刊新研究引热议

24小时不间断学习且不遗忘,一辈子也只有4GB的“知识储量”? 科学家们最新研究,计算出了人类学习积累上限,就这么多~~(甚至还不如一块U盘能装)。 这是来自Cell旗下神经科学顶刊Neuron上的一项工作,它提出了一个发人深省的悖论:人类信息处理速度仅为每秒10bit,而我们的感官系统却能以每秒10亿bit的速率收集数据。
4/14/2025 9:10:00 AM
量子位

上海AI实验室开源InternVL3系列多模态大型语言模型

4月11日,OpenGVLab开源发布了InternVL3系列模型,这标志着多模态大型语言模型(MLLM)领域迎来了新的里程碑。 InternVL3系列包含从1B到78B共7个尺寸的模型,能够同时处理文字、图片、视频等多种信息,展现出卓越的整体性能。 与前代产品InternVL2.5相比,InternVL3在多模态感知和推理能力上有了显著提升,其多模态能力进一步扩展至工具使用、GUI代理、工业图像分析、3D视觉感知等多个领域。
4/14/2025 9:01:07 AM
AI在线

昆仑万维开源Skywork-OR1系列模型 数学代码能力出色

4月13日,昆仑万维天工团队宣布推出全新升级的Skywork-OR1(Open Reasoner1)系列模型,这是继2025年2月发布首款中文逻辑推理大模型Skywork-o1之后的又一力作。 该系列模型在同等参数规模下实现了业界领先的推理性能,进一步突破了大模型在逻辑理解与复杂任务求解方面的能力瓶颈。 此次开源的Skywork-OR1系列模型包括三款高性能模型:Skywork-OR1-Math-7B聚焦数学领域的专项模型,同时也具备较强的代码能力;Skywork-OR1-7B-Preview融合数学与代码能力,兼具通用性与专业性;Skywork-OR1-32B-Preview则是面向更高复杂度任务、具备更强推理能力的旗舰版本。
4/14/2025 9:00:44 AM
AI在线

GPT-4.1偷偷开跑?神秘模型上线三天已被玩疯,网友发现大量OpenAI痕迹

上线仅三天的神秘模型,已经鲨疯了! 大模型聚合平台OpenRouter新推出的Optimus Alpha,已经处理了772亿Token,平均每天超过200亿。 并且这个数字还在上升,日Token处理已超过340亿,排名第二,并在Trending榜单上位列第一。
4/14/2025 9:00:00 AM
量子位

AI Agent 破局:MCP 与 A2A 定义安全新边界

作者 | Nicky,混元安全团队朱雀实验室通信协议是AI Agent加速落地的核心基础设施之一。 Anthropic推出的MCP已逐步确立其作为AI Agent连接外部工具的标准协议地位,而Google最新发布的A2A则聚焦于打破智能体协作壁垒,推动跨Agent协同体系的构建。 作为AI Agent时代最受关注的两大通信规范,它们的安全性直接关乎AI Agent的安全边界,任何安全问题都可能引发AI Agent被劫持与数据泄露等连锁风险。
4/14/2025 9:00:00 AM
腾讯技术工程