资讯列表
Microsoft 推出 Magentic-UI:网页多智能体,革新式人机协作
大家好,我是肆〇柒。 在当下,现代生产力与网页活动深度交织。 从信息检索、表单填写,到精准导航各类仪表盘,网页任务贯穿工作流程始终。
5/26/2025 10:03:42 AM
肆零柒
最新研究:ChatGPT 助力中小学生学习成效提升近87%
《Nature》子刊的研究表明,利用 ChatGPT 等大型语言模型可以显著提升 K12阶段(即中小学生)的学习成绩,整体学习效果提升达86.7%。 这项研究汇总了59项相关研究,揭示了 AI 在教育中的巨大潜力。 研究团队经过严谨的筛选和分析,最终选定51项相关研究进行元分析,这些研究都采用了随机双盲实验方法,并公开了实验数据,以确保结论的科学性和可靠性。
5/26/2025 10:01:01 AM
AI在线
智元机器人灵犀X2启动合作伙伴招募,目标2026年实现数千台出货
近日,国内具身智能领域的头部企业——智元机器人宣布,其全新一代人形机器人产品“灵犀X2”正式启动合作伙伴招募,涵盖灵犀X2(交互版)、X2Pro(探索版)、X2Ultra(旗舰版)三款型号。 根据智元机器人的规划,灵犀X2系列机器人将在2025年下半年实现规模化出货,并计划在2026年底前达成“数千台”的交付目标。 灵犀X2的核心竞争力在于其突破性的“情绪交互”能力。
5/26/2025 10:01:00 AM
AI在线
AI教育革命!VideoTutor一句话即可生成K12定制教学视频
人工智能在教育领域的应用再迎突破!一款名为VideoTutor的AI工具近日引发热议,其创新功能允许用户仅需输入一句话或上传问题截图,即可生成类似可汗学院风格的教学视频,覆盖K12教育及SAT备考等场景。 AIbase综合最新信息,为您深入解析这一教育科技新星的亮点与潜力。 一句话生成个性化教学视频VideoTutor的核心亮点在于其一键生成功能。
5/26/2025 10:01:00 AM
AI在线
AI开发神器Rork:一句话打造iOS+Android应用,零编程也能当开发者!
人工智能正在重塑移动应用开发的未来!一款名为Rork的AI驱动工具近期引发热议,只需用户输入一句简单的应用描述,Rork即可自动生成完整、可用于生产环境的移动应用,支持iOS和Android平台。 AIbase综合最新信息,为您深入解析这款工具如何让非技术人士也能轻松实现应用开发梦想。 一键生成,零编程门槛Rork的最大亮点在于其无代码开发能力。
5/26/2025 10:01:00 AM
AI在线
谷歌重磅发布三大Gemma模型变体,AI医疗、手语翻译与海豚语言解锁新可能!
近日,谷歌在人工智能领域再掀波澜,宣布推出基于Gemma模型的三款全新变体:MedGemma、SignGemma和DolphinGemma。 这些模型分别针对医疗、手语翻译和海豚语言研究领域,展现了AI技术在跨领域应用的巨大潜力。 以下,AIbase为您详细解读这三款模型的亮点与应用前景。
5/26/2025 10:01:00 AM
AI在线
谷歌通过 Gemini 应用扩展了其热门新视频机型 Veo 3 的访问权限
谷歌在其AI视频生成工具Veo3发布仅100小时后,迅速将其推广至全球71个新国家用户使用。 不过,这一波扩展仍未包括欧盟国家。 这一消息由谷歌Gemini副总裁Josh Woodward在X平台宣布。
5/26/2025 10:01:00 AM
AI在线
RAG系列:系统评估 - 基于LLM-as-judge实现评估系统
引言在 系统评估 - 五个主流评估指标详解 中,我们了解了 RAG 系统评估的 5 个主流指标,它们分别是 上下文召回率(Context Recall)、上下文相关性(Context Relevance)、答案忠实度(Faithfulness)、答案相关性(Answer Relevance)以及答案正确性(Answer Correctness),也简单了解了一些 RAG 系统的评估方法以及主流的评估系统。 今天我们将基于 LLM-as-judge 自己实现一套 RAG 系统评估系统,然后通过该评估系统评估我们在 基于 DeepSeek Chroma LangChain 开发一个简单 RAG 系统 中搭建好的基础版 RAG 系统,以基础版 RAG 系统这 5 个评估指标值作为基准,通过学习不同的优化方法来提升这 5 个指标。 因为是通过 LLM 来评估,所以评估 LLM 的能力越强,理论上评估就会越准确,因此在实际的业务场景中,尽可能选用能力更强的 LLM。
5/26/2025 9:57:46 AM
燃哥讲AI
散户组团挑战算力霸权,40B 模型 + 20 万亿 token 刷新世界纪录
全球网友用闲置显卡组团训练大模型。40B 大模型、20 万亿 token,创下了互联网上最大规模的预训练新纪录!去中心化 AI 的反攻,正式开始。OpenAI 等巨头的算力霸权,这次真要凉了?
5/26/2025 9:56:55 AM
汪淼
多模态混合检索与多智能体RAG的破局之道
AI的感知困境:一只眼睛的世界我们习惯了AI能够处理文字、分析数据,但在处理复杂信息时,传统AI面临着三大感知困境:文字与图像割裂好比戴着眼罩工作的设计师,AI只能读懂文字,却看不懂图表中的趋势线、饼图中的占比关系。 OCR技术让AI能提取图像中的文字,却无法理解一张财务图表所传达的"销售额正在快速增长"这类视觉信息。 这就像让一个人只通过摸索来理解一幅画,注定失之偏颇。
5/26/2025 9:49:59 AM
大数据AI智能圈
生成式人工智能永远不会取代人类的创造力
我记得第一次听说ChatGPT的时候;我错误地以为这只是又一股潮流,会随着时间的流逝而消逝。 也许我太天真了。 计算机怎么可能取代真正的创造力呢?
5/26/2025 9:47:34 AM
晓晓
硅谷顶级AI天才成「团宠」:布林请吃饭,奥特曼约打牌
硅谷巨头们,正掀起一场前所未有的人才争夺战。 如今,OpenAI、谷歌、xAI等公司不惜重金,争夺那些能够改变游戏规则的「超级明星研究员」。 路透爆料称,顶级AI研究人员的年薪已突破天际。
5/26/2025 9:46:08 AM
华为中科大联创大模型低比特量化算法,1‰数据实现昇腾无损压缩7倍
大模型,如今堪称AI界的「吞金巨兽」。 从写诗到解题,从对话到编程,它们几乎无所不能,但动辄千亿甚至万亿参数的规模,让部署成本高得离谱。 以FP16精度部署的DeepSeek-R1 671B为例,推理时大概需要1342GB的显存,如果是32GB 5090显卡,需要整整42张!
5/26/2025 9:41:26 AM
刷新世界记录!40B模型+20万亿token,散户组团挑战算力霸权
互联网上最大规模的预训练来了! Nous Research宣布正式推出Psyche网络(Psyche Network),通过去中心化方式革新人工智能(AI)训练。 Psyche网络利用区块链技术,汇聚全球计算资源,成功启动了40B参数大语言模型Consilience的预训练任务,总计20万亿token,创下了迄今为止互联网上最大规模的预训练纪录。
5/26/2025 9:39:15 AM
新智元
Gartner:到2029年,50%的云计算将用于AI工作负载
全球著名咨询调查机构Gartner在官网公布了,未来4年影响云计算增长的几大趋势。 分别包括对云的不满、AI/机器学习需求增加、多云和跨云、行业解决方案、数字主权和可持续性。 对云的不满尽管云采用仍在增长,但并非所有实施都成功。
5/26/2025 9:22:00 AM
312条轨迹激发241%性能!上交大与SII开源电脑智能体,超越 Claude 3.7
自 Anthropic 推出 Claude Computer Use,打响电脑智能体(Computer Use Agent)的第一枪后,OpenAI 也相继推出 Operator,用强化学习(RL)算法把电脑智能体的能力推向新高,引发全球范围广泛关注。 业界普遍认为,需要海量的轨迹数据或复杂的强化学习才能实现电脑智能体的水平突破——这可能意味着大量的人工轨迹标注,以及大规模虚拟机环境的构建,以支撑智能体的学习与优化。 然而,来自上海交通大学和 SII 的最新研究却给出了一个非共识答案:仅需 312 条人类标注轨迹,使用 Claude 3.7 Sonnet 合成更丰富的动作决策,就能激发模型 241% 的性能,甚至超越 Claude 3.7 Sonnet extended thinking 模式,成为 Windows 系统上开源电脑智能体的新一代 SOTA。
5/26/2025 9:21:00 AM
只用图像也能思考,强化学习造就推理模型新范式!复杂场景规划能力Max
近年来,LLM 及其多模态扩展(MLLM)在多种任务上的推理能力不断提升。 然而, 现有 MLLM 主要依赖文本作为表达和构建推理过程的媒介,即便是在处理视觉信息时也是如此 。 常见的 MLLM 结构。
5/26/2025 9:16:00 AM
机器之心
AI在「赚钱锦标赛」夺冠,比人类还会做生意!躺赚时代要来了?
如何用AI赚钱,可能是这个时代最常见的问题。 有些人选择用大模型写小说、写报告、写文案等等,但这些场景只是让模型在执行一些「短期且孤立」的任务。 如果能找到合适的应用场景,比如「用自动驾驶跑网约车」,并且模型还能够在长时间内保持连贯的输出,再那岂不是就能躺赚了?
5/26/2025 9:14:00 AM