AI在线 AI在线

资讯列表

谷歌重磅发布三大Gemma模型变体,AI医疗、手语翻译与海豚语言解锁新可能!

近日,谷歌在人工智能领域再掀波澜,宣布推出基于Gemma模型的三款全新变体:MedGemma、SignGemma和DolphinGemma。 这些模型分别针对医疗、手语翻译和海豚语言研究领域,展现了AI技术在跨领域应用的巨大潜力。 以下,AIbase为您详细解读这三款模型的亮点与应用前景。
5/26/2025 10:01:00 AM
AI在线

谷歌通过 Gemini 应用扩展了其热门新视频机型 Veo 3 的访问权限

谷歌在其AI视频生成工具Veo3发布仅100小时后,迅速将其推广至全球71个新国家用户使用。 不过,这一波扩展仍未包括欧盟国家。 这一消息由谷歌Gemini副总裁Josh Woodward在X平台宣布。
5/26/2025 10:01:00 AM
AI在线

RAG系列:系统评估 - 基于LLM-as-judge实现评估系统

引言在 系统评估 - 五个主流评估指标详解 中,我们了解了 RAG 系统评估的 5 个主流指标,它们分别是 上下文召回率(Context Recall)、上下文相关性(Context Relevance)、答案忠实度(Faithfulness)、答案相关性(Answer Relevance)以及答案正确性(Answer Correctness),也简单了解了一些 RAG 系统的评估方法以及主流的评估系统。 今天我们将基于 LLM-as-judge 自己实现一套 RAG 系统评估系统,然后通过该评估系统评估我们在 基于 DeepSeek Chroma LangChain 开发一个简单 RAG 系统 中搭建好的基础版 RAG 系统,以基础版 RAG 系统这 5 个评估指标值作为基准,通过学习不同的优化方法来提升这 5 个指标。 因为是通过 LLM 来评估,所以评估 LLM 的能力越强,理论上评估就会越准确,因此在实际的业务场景中,尽可能选用能力更强的 LLM。
5/26/2025 9:57:46 AM
燃哥讲AI

散户组团挑战算力霸权,40B 模型 + 20 万亿 token 刷新世界纪录

全球网友用闲置显卡组团训练大模型。40B 大模型、20 万亿 token,创下了互联网上最大规模的预训练新纪录!去中心化 AI 的反攻,正式开始。OpenAI 等巨头的算力霸权,这次真要凉了?
5/26/2025 9:56:55 AM
汪淼

多模态混合检索与多智能体RAG的破局之道

AI的感知困境:一只眼睛的世界我们习惯了AI能够处理文字、分析数据,但在处理复杂信息时,传统AI面临着三大感知困境:文字与图像割裂好比戴着眼罩工作的设计师,AI只能读懂文字,却看不懂图表中的趋势线、饼图中的占比关系。 OCR技术让AI能提取图像中的文字,却无法理解一张财务图表所传达的"销售额正在快速增长"这类视觉信息。 这就像让一个人只通过摸索来理解一幅画,注定失之偏颇。
5/26/2025 9:49:59 AM
大数据AI智能圈

生成式人工智能永远不会取代人类的创造力

我记得第一次听说ChatGPT的时候;我错误地以为这只是又一股潮流,会随着时间的流逝而消逝。 也许我太天真了。 计算机怎么可能取代真正的创造力呢?
5/26/2025 9:47:34 AM
晓晓

硅谷顶级AI天才成「团宠」:布林请吃饭,奥特曼约打牌

硅谷巨头们,正掀起一场前所未有的人才争夺战。 如今,OpenAI、谷歌、xAI等公司不惜重金,争夺那些能够改变游戏规则的「超级明星研究员」。 路透爆料称,顶级AI研究人员的年薪已突破天际。
5/26/2025 9:46:08 AM

华为中科大联创大模型低比特量化算法,1‰数据实现昇腾无损压缩7倍

大模型,如今堪称AI界的「吞金巨兽」。 从写诗到解题,从对话到编程,它们几乎无所不能,但动辄千亿甚至万亿参数的规模,让部署成本高得离谱。 以FP16精度部署的DeepSeek-R1 671B为例,推理时大概需要1342GB的显存,如果是32GB 5090显卡,需要整整42张!
5/26/2025 9:41:26 AM

刷新世界记录!40B模型+20万亿token,散户组团挑战算力霸权

互联网上最大规模的预训练来了! Nous Research宣布正式推出Psyche网络(Psyche Network),通过去中心化方式革新人工智能(AI)训练。 Psyche网络利用区块链技术,汇聚全球计算资源,成功启动了40B参数大语言模型Consilience的预训练任务,总计20万亿token,创下了迄今为止互联网上最大规模的预训练纪录。
5/26/2025 9:39:15 AM
新智元

Gartner:到2029年,50%的云计算将用于AI工作负载

全球著名咨询调查机构Gartner在官网公布了,未来4年影响云计算增长的几大趋势。 分别包括对云的不满、AI/机器学习需求增加、多云和跨云、行业解决方案、数字主权和可持续性。 对云的不满尽管云采用仍在增长,但并非所有实施都成功。
5/26/2025 9:22:00 AM

312条轨迹激发241%性能!上交大与SII开源电脑智能体,超越 Claude 3.7

自 Anthropic 推出 Claude Computer Use,打响电脑智能体(Computer Use Agent)的第一枪后,OpenAI 也相继推出 Operator,用强化学习(RL)算法把电脑智能体的能力推向新高,引发全球范围广泛关注。 业界普遍认为,需要海量的轨迹数据或复杂的强化学习才能实现电脑智能体的水平突破——这可能意味着大量的人工轨迹标注,以及大规模虚拟机环境的构建,以支撑智能体的学习与优化。 然而,来自上海交通大学和 SII 的最新研究却给出了一个非共识答案:仅需 312 条人类标注轨迹,使用 Claude 3.7 Sonnet 合成更丰富的动作决策,就能激发模型 241% 的性能,甚至超越 Claude 3.7 Sonnet extended thinking 模式,成为 Windows 系统上开源电脑智能体的新一代 SOTA。
5/26/2025 9:21:00 AM

只用图像也能思考,强化学习造就推理模型新范式!复杂场景规划能力Max

近年来,LLM 及其多模态扩展(MLLM)在多种任务上的推理能力不断提升。 然而, 现有 MLLM 主要依赖文本作为表达和构建推理过程的媒介,即便是在处理视觉信息时也是如此 。 常见的 MLLM 结构。
5/26/2025 9:16:00 AM
机器之心

AI在「赚钱锦标赛」夺冠,比人类还会做生意!躺赚时代要来了?

如何用AI赚钱,可能是这个时代最常见的问题。 有些人选择用大模型写小说、写报告、写文案等等,但这些场景只是让模型在执行一些「短期且孤立」的任务。 如果能找到合适的应用场景,比如「用自动驾驶跑网约车」,并且模型还能够在长时间内保持连贯的输出,再那岂不是就能躺赚了?
5/26/2025 9:14:00 AM

15亿美元AI独角兽崩塌,全是印度程序员冒充!微软亚马逊惨遭忽悠

印度老哥是真的有点猛啊! 今天要说的这位,是AI编程公司Builder.ai的创始人兼前CEO——Sachin Dev Duggal。 他不仅造了个「全是人工,没有智能」的假AI公司从软银、微软等巨头手里骗到了数亿美元融资,估值干到15亿而且还敢对投资人虚报300%的营收是的,这家公司的后台里并没有AI,有的只是一群印度老哥假装AI写代码。
5/26/2025 9:12:00 AM

H20之后,英伟达全新特供版GPU曝光!单GPU售价低至6500美元

过去,英伟达在中国AI芯片市场几乎「垄断」,出货占比95%。 然而,在美国出口限制以及国产芯片崛起的背景下,现在其在中国的市场份额已经跌至50%。 为了应对这一局面,黄仁勋即将亮出一颗「阉割版」的Blackwell GPU。
5/26/2025 9:10:00 AM

50年僵局打破!MIT最新证明:对于算法少量内存胜过大量时间

相信大家都曾有过这样的经历:运行某个程序时,电脑突然卡住,轻则恢复文件,重则重新创建;或者手机频繁弹出「内存不足」的警告,让我们不得不忍痛删除珍贵的照片或应用。 这些日常的烦恼,其实都指向了计算世界中两个至关重要的基本要素:时间和空间。  时间和空间(也称为内存)是计算中最基本的两种资源:任何算法在执行时都需要一定的时间,并在运行过程中占用一定的空间以存储数据。
5/26/2025 9:09:00 AM
机器之心

比甄嬛还狠!奥特曼「千面人设」被揭穿,MIT华人记者7年曝黑幕

OpenAI的「宫斗」往事,还有大瓜! 因为曝料实在太过惊人,奥特曼在相关书籍正式出版之前,否认三连,撇清关系。 但曝料人Karen Hao毕业于MIT,曝料过多家美国科技巨头的「黑幕」,因新闻报道获得多个奖项。
5/26/2025 9:07:00 AM

全球首款 Office 智能体:昆仑万维天工超级智能体 App 上线

昆仑万维集团今日宣布:昆仑万维天工超级智能体(Skywork Super Agents)App 正式上线。这是全球首款基于 AI Agent 架构的 Office 智能体手机 App,标志着“AI Office 智能体”时代从桌面端全面迈向移动端。
5/26/2025 9:06:10 AM
归泷