AI在线 AI在线

AI

英伟达推出 Cosmos-Reason1 系列模型,让 AI 理解物理常识

英伟达针对物理推理任务,设计推出了 Cosmos-Reason1 系列模型,提升了 AI 在物理常识和具身推理方面的表现,为机器人、自动驾驶车辆等领域带来实际应用潜力。
5/21/2025 2:53:40 PM
故渊

谷歌开源 MedGemma AI 模型,医疗图像与文本分析神器

MedGemma 基于 Gemma 3 架构,提供 4B 参数的多模态模型(分类)和 27B 参数的纯文本模型两种配置,4B 模型擅长分类和解读医疗图像,可生成诊断报告或解答图像相关问题;27B 模型则擅长临床文本,支持患者分诊和决策辅助。
5/21/2025 2:40:30 PM
故渊

谷歌发布 Gemma 3n 端侧多模态模型,2GB 内存也能玩转 AI

今天召开的 2025 年 I/O 开发者大会上,谷歌推出了 Gemma 3n 端侧多模态 AI 模型,可以在手机、平板和笔记本电脑上本地运行,处理音频、文本、图片和视频多种数据类型。
5/21/2025 2:30:27 PM
故渊

DeepSeek-V3新论文:软硬协同,砸碎“算力神话”!

当AI大模型越来越“吃”硬件,把内存、算力、带宽逼到极限,追赶者们,或者说整个行业,除了干等硬件升级,还能怎么办? ChatGPT横空出世,大模型竞赛白热化。 英伟达的GPU成了硬通货,算力就是一切。
5/21/2025 2:01:22 PM

苹果将开放AI模型给开发者,力求催生创新应用

苹果公司近日宣布,将向第三方开发者开放其人工智能模型,旨在激发新应用的创造力,并提升其设备的吸引力。 知情人士透露,这一计划将在6月9日的全球开发者大会(WWDC)上正式发布。 苹果希望通过提供软件开发工具包(SDK)和相关框架,让开发者能够基于其大型语言模型构建 AI 功能。
5/21/2025 2:01:08 PM
AI在线

ChatGPT转型计划曝光!不再只是回答问题,而是通过穿插使用工具变身行动助手

AI Agent今天是初级工程师,6个月后是高级工程师,一年后是架构师。 这是OpenAI CPO Kevin Weil在接受最新访谈时提出的构想。 他表示,ChatGPT将从回答问题转变为为用户做事。
5/21/2025 1:57:58 PM

纯靠“脑补”图像,大模型推理准确率狂飙80%丨剑桥谷歌新研究

不再依赖语言,仅凭图像就能完成模型推理? 大模型又双叒叕迎来新SOTA! 当你和大模型一起玩超级玛丽时,复杂环境下你会根据画面在脑海里自动规划步骤,但LLMs还需要先转成文字攻略一格格按照指令移动,效率又低、信息也可能会丢失,那难道就没有一个可以跳过“语言中介”的方法吗?
5/21/2025 1:56:37 PM

瘦身不降智!大模型训推效率提升30%,京东大模型开发计算研究登Nature旗下期刊

京东探索研究院关于大模型的最新研究,登上了Nature旗下期刊! 该项研究提出了一种在开放环境场景中训练、更新大模型,并与小模型协同部署的系统与方法。 它通过模型蒸馏、数据治理、训练优化与云边协同四大创新,这个项目将大模型推理效率平均提升30%,训练成本降低70%。
5/21/2025 1:54:20 PM

何恺明团队又发新作: MeanFlow单步图像生成SOTA,提升达50%

这段时间,大神何恺明真是接连不断地发布新研究。 这不,5 月 19 日,他又放出一篇新作! 论文标题:Mean Flows for One-step Generative Modeling 论文地址: MeanFlow 的单步生成建模框架,通过引入平均速度(average velocity)的概念来改进现有的流匹配方法,并在 ImageNet 256×256 数据集上取得了显著优于以往单步扩散 / 流模型的结果,FID 分数达到 3.43,且无需预训练、蒸馏或课程学习。
5/21/2025 1:53:49 PM

FaceAge登上「柳叶刀」!AI一张照片看穿你的真实年龄

你有没有发现,有些人看起来就是比其他人更老。 脸,不仅仅是我们的门面,还是一个人的「健康快照」,更是一张映射身体状态的「体检报告」。 最近的一项研究发现这其中还藏着更深的秘密,这项研究登上《柳叶刀数字健康》:Mass General Brigham团队用AI训练出一个模型FaceAge,从人脸照片里预测癌症患者的真实「生物年龄」以提供建议辅助治疗。
5/21/2025 1:51:12 PM

美图获阿里巴巴 2.5 亿美元投资,深度布局 AI 与电商领域

美图公司宣布与阿里巴巴签署了一项重大的战略投资协议,阿里巴巴将通过可转债形式向美图投资2.5亿美元。 这笔投资将为双方在电商平台、人工智能(AI)技术和云计算等多个领域的深度合作提供强大支持。 图源备注:图片由AI生成,图片授权服务商Midjourney根据协议,这项可转债的期限为三年,年利率为1%。
5/21/2025 12:01:16 PM
AI在线

京东云宣布五大AI营销产品限时免费,助力商家提升销售效率

在最新的公告中,京东宣布将免费向其 POP 商家推出五大人工智能(AI)营销产品。 这一举措旨在帮助商家利用先进技术提升销售效果和运营效率。 这些新工具包括直播数字人、商家客服智能体、短视频生成工具、京点点以及京麦 AI 助手,均为商家提供了更为高效的营销手段。
5/21/2025 12:01:16 PM
AI在线

Catena Labs获得1800万美元融资,打造AI原生金融机构

近日,人工智能初创公司 Catena Labs 在一份新闻稿中宣布,他们成功筹集了1800万美元的资金,旨在建设全球首个监管合规的 AI 原生金融机构,以支持 “代理经济” 的发展。 该公司由前 Circle 联合首席执行官肖恩・内维尔(Sean Neville)共同创办,他曾参与创建了 U SDC 稳定币。 本轮融资由知名风险投资公司 a16z Crypto 领投,参投方包括 Breyer Capital、Circle Ventures、Coinbase Ventures、CoinFund、Pillar VC、斯坦福工程风险基金等多个投资机构,以及包括 NFL 运动员汤姆・布雷迪、Twitch 联合创始人凯文・林和前 IBM 首席执行官山姆・帕尔米萨诺等知名天使投资人。
5/21/2025 12:01:16 PM
AI在线

华硕CEO预测:AI电脑距离全面落地仍需两年

在台北举行的 Computex 展会上,华硕共同首席执行官胡镇荣(Samson Hu)表示,当前一波新型人工智能(AI)电脑的普及将需要到2026年甚至更久才能真正推动市场发展。 尽管去年的 AI 电脑发布引发了不少期待,但胡镇荣指出,市场前景并没有因此而显著改善,尤其是在当前全球经济形势不佳的背景下。 随着技术的不断进步,从华硕到联想等众多厂商都推出了 AI 电脑,希望能够为疲软的笔记本市场带来新的生机。
5/21/2025 12:01:16 PM
AI在线

MarketWatch:谷歌加倍投入人工智能搜索,应对日益加剧的威胁

在近期举办的 I/O 开发者大会上,谷歌宣布将推出一系列新的人工智能(AI)功能,以巩固其在搜索引擎市场的领先地位。 随着 AI 技术的快速发展,尤其是来自 OpenAI 和 Perplexity 等新兴公司的竞争压力不断增大,谷歌似乎倍感压力。 因此,该公司推出了 “AI 模式”,这是其搜索引擎中 “最强大的 AI 搜索” 功能,具备更高级的推理和多模态能力。
5/21/2025 12:01:16 PM
AI在线

谷歌NotebookLM视频概览重磅上线!PDF、图片秒变动画短片

谷歌在I/O2025大会上宣布,NotebookLM将推出全新视频概览(Video Overviews)功能,允许用户通过上传的PDF、图片、文本等来源素材,自动生成动画风格的短片,深入浅出地讲解复杂内容。 这一功能面向所有用户开放,首版仅支持英语,引发全球教育、科研和内容创作社区的热烈讨论。 AIbase综合最新社交媒体动态,深入解析视频概览的技术亮点及其对AI辅助学习与创作的深远影响。
5/21/2025 11:01:06 AM
AI在线

DeepSeek发布大模型训练端到端论文,展示卓越工程深度

近日,DeepSeek发布了一篇关于大模型训练的最佳端到端技术论文,引发业界广泛关注。 该论文全面阐述了DeepSeek在大模型研发中的技术突破,涵盖软件、硬件及混合优化方案,展现了其令人惊叹的工程深度。 在**软件**层面,论文详细介绍了多头潜在注意力机制(MLA),显著降低推理过程中的内存占用;FP8混合精度训练通过低精度计算提升效率,同时保证数值稳定性;DeepEP通信库优化了专家并行(EP)通信,支持FP8低精度操作,加速MoE模型训练与推理;LogFMT对数浮点格式则通过均匀化激活分布,进一步优化计算效率。
5/21/2025 11:01:05 AM
AI在线

​苹果计划在 iOS 19 中向第三方开发者开放 AI 模型

根据彭博社记者马克・古尔曼的最新报道,苹果公司正在积极筹备在其即将发布的 iOS19中向第三方开发者开放其人工智能(AI)模型。 这一举措旨在促进软件开发,推动应用创新,并增强苹果自家硬件产品的吸引力。 据了解,苹果正在研发一套软件开发工具包(SDK)及相关框架,以便开发者能够利用 Apple Intelligence 所采用的大型语言模型来创建新功能。
5/21/2025 11:01:05 AM
AI在线