AI在线 AI在线

资讯列表

谷歌开源 MedGemma AI 模型,医疗图像与文本分析神器

MedGemma 基于 Gemma 3 架构,提供 4B 参数的多模态模型(分类)和 27B 参数的纯文本模型两种配置,4B 模型擅长分类和解读医疗图像,可生成诊断报告或解答图像相关问题;27B 模型则擅长临床文本,支持患者分诊和决策辅助。
5/21/2025 2:40:30 PM
故渊

谷歌发布 Gemma 3n 端侧多模态模型,2GB 内存也能玩转 AI

今天召开的 2025 年 I/O 开发者大会上,谷歌推出了 Gemma 3n 端侧多模态 AI 模型,可以在手机、平板和笔记本电脑上本地运行,处理音频、文本、图片和视频多种数据类型。
5/21/2025 2:30:27 PM
故渊

零代码配置多Agent,腾讯云正式发布“智能体开发平台”

2025年以来,随着 DeepSeek 等大模型技术的持续突破,AI 智能体热度持续攀升。 全球科技巨头与初创企业纷纷入局,智能体正加速向落地演进,成为企业实现降本增效、重塑业务流程的关键驱动力。 5月21日,在“2025腾讯云AI产业应用峰会”上,腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人吴运声宣布大模型知识引擎全面升级为“腾讯云智能体开发平台(TCADP)”。
5/21/2025 2:20:50 PM

AI语音劫持:你能多相信你的耳朵?

你有多确定自己能识别出AI克隆的声音?如果你认为自己完全有把握,那你可能错了。 为何其威胁日益加剧只需三秒钟的音频,犯罪分子现在就能克隆某人的声音,而这些音频很容易从网上或社交媒体上分享的视频中获取。 一位美国母亲差点成为虚拟绑架骗局的受害者,骗子用克隆的声音逼真地模仿了她女儿的求救声,这一案例显示了犯罪分子为达目的不择手段的残忍程度。
5/21/2025 2:03:46 PM
Sinisa

DeepSeek-V3新论文:软硬协同,砸碎“算力神话”!

当AI大模型越来越“吃”硬件,把内存、算力、带宽逼到极限,追赶者们,或者说整个行业,除了干等硬件升级,还能怎么办? ChatGPT横空出世,大模型竞赛白热化。 英伟达的GPU成了硬通货,算力就是一切。
5/21/2025 2:01:22 PM

腾讯混元宣布模型矩阵全面升级,新推视觉推理模型T1-Vision和语音通话模型混元Voice

今日,腾讯混元正式宣布其模型矩阵的全面升级,包括 旗舰快思考模型混元TurboS、深度思考模型混元T1升级,并基于TurboS基座,新推出视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice。 另外,腾讯混元图像2.0、腾讯混元3D v2.5及混元游戏视觉生成等一系列多模态模型同步“上新”。 此次升级不仅增强了混元在 AI 领域的竞争力,也标志着腾讯在多模态技术上的新进展。
5/21/2025 2:01:08 PM
AI在线

苹果将开放AI模型给开发者,力求催生创新应用

苹果公司近日宣布,将向第三方开发者开放其人工智能模型,旨在激发新应用的创造力,并提升其设备的吸引力。 知情人士透露,这一计划将在6月9日的全球开发者大会(WWDC)上正式发布。 苹果希望通过提供软件开发工具包(SDK)和相关框架,让开发者能够基于其大型语言模型构建 AI 功能。
5/21/2025 2:01:08 PM
AI在线

飞书将上线AI产品“知识问答” 革新企业知识管理

近日,飞书宣布即将推出全新AI产品“知识问答”,以智能化手段重塑企业知识管理模式,助力企业数字化转型。 “知识问答”是一款深度融合人工智能技术的问答工具,能整合企业员工在飞书上有权限访问的各类信息,包括文档、消息记录等,员工在工作中遇到业务、技术等各类问题,都能快速获取精准答案,极大提升工作效率。 在实际测试场景中,其表现亮眼。
5/21/2025 2:01:08 PM
AI在线

腾讯大模型战略亮相 Turbo S 与 T1 模型全面升级

5月21日,腾讯宣布其混元大模型矩阵全面升级,标志着腾讯在人工智能领域的技术能力持续提升。 此次升级涵盖了多个方面,包括旗舰快思考模型混元TurboS、深度思考模型混元T1的升级,以及基于TurboS基座新推出的视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice。 此外,腾讯还同步更新了混元图像2.0、混元3D v2.5及混元游戏视觉生成等一系列多模态模型。
5/21/2025 2:01:08 PM
AI在线

ChatGPT转型计划曝光!不再只是回答问题,而是通过穿插使用工具变身行动助手

AI Agent今天是初级工程师,6个月后是高级工程师,一年后是架构师。 这是OpenAI CPO Kevin Weil在接受最新访谈时提出的构想。 他表示,ChatGPT将从回答问题转变为为用户做事。
5/21/2025 1:57:58 PM

纯靠“脑补”图像,大模型推理准确率狂飙80%丨剑桥谷歌新研究

不再依赖语言,仅凭图像就能完成模型推理? 大模型又双叒叕迎来新SOTA! 当你和大模型一起玩超级玛丽时,复杂环境下你会根据画面在脑海里自动规划步骤,但LLMs还需要先转成文字攻略一格格按照指令移动,效率又低、信息也可能会丢失,那难道就没有一个可以跳过“语言中介”的方法吗?
5/21/2025 1:56:37 PM

瘦身不降智!大模型训推效率提升30%,京东大模型开发计算研究登Nature旗下期刊

京东探索研究院关于大模型的最新研究,登上了Nature旗下期刊! 该项研究提出了一种在开放环境场景中训练、更新大模型,并与小模型协同部署的系统与方法。 它通过模型蒸馏、数据治理、训练优化与云边协同四大创新,这个项目将大模型推理效率平均提升30%,训练成本降低70%。
5/21/2025 1:54:20 PM

何恺明团队又发新作: MeanFlow单步图像生成SOTA,提升达50%

这段时间,大神何恺明真是接连不断地发布新研究。 这不,5 月 19 日,他又放出一篇新作! 论文标题:Mean Flows for One-step Generative Modeling 论文地址: MeanFlow 的单步生成建模框架,通过引入平均速度(average velocity)的概念来改进现有的流匹配方法,并在 ImageNet 256×256 数据集上取得了显著优于以往单步扩散 / 流模型的结果,FID 分数达到 3.43,且无需预训练、蒸馏或课程学习。
5/21/2025 1:53:49 PM

策略学习助力LLM推理效率:MIT与谷歌团队提出异步并行生成新范式

金天,麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)博士五年级学生,师从 Michael Carbin 和 Jonathan Ragan-Kelley。 他主要研究机器学习与编程系统的结合。 此前曾在 IBM Research 主导实现深度神经网络在 IBM 主机上的推理部署。
5/21/2025 1:52:39 PM

FaceAge登上「柳叶刀」!AI一张照片看穿你的真实年龄

你有没有发现,有些人看起来就是比其他人更老。 脸,不仅仅是我们的门面,还是一个人的「健康快照」,更是一张映射身体状态的「体检报告」。 最近的一项研究发现这其中还藏着更深的秘密,这项研究登上《柳叶刀数字健康》:Mass General Brigham团队用AI训练出一个模型FaceAge,从人脸照片里预测癌症患者的真实「生物年龄」以提供建议辅助治疗。
5/21/2025 1:51:12 PM

美图获阿里巴巴 2.5 亿美元投资,深度布局 AI 与电商领域

美图公司宣布与阿里巴巴签署了一项重大的战略投资协议,阿里巴巴将通过可转债形式向美图投资2.5亿美元。 这笔投资将为双方在电商平台、人工智能(AI)技术和云计算等多个领域的深度合作提供强大支持。 图源备注:图片由AI生成,图片授权服务商Midjourney根据协议,这项可转债的期限为三年,年利率为1%。
5/21/2025 12:01:16 PM
AI在线

京东云宣布五大AI营销产品限时免费,助力商家提升销售效率

在最新的公告中,京东宣布将免费向其 POP 商家推出五大人工智能(AI)营销产品。 这一举措旨在帮助商家利用先进技术提升销售效果和运营效率。 这些新工具包括直播数字人、商家客服智能体、短视频生成工具、京点点以及京麦 AI 助手,均为商家提供了更为高效的营销手段。
5/21/2025 12:01:16 PM
AI在线

Catena Labs获得1800万美元融资,打造AI原生金融机构

近日,人工智能初创公司 Catena Labs 在一份新闻稿中宣布,他们成功筹集了1800万美元的资金,旨在建设全球首个监管合规的 AI 原生金融机构,以支持 “代理经济” 的发展。 该公司由前 Circle 联合首席执行官肖恩・内维尔(Sean Neville)共同创办,他曾参与创建了 U SDC 稳定币。 本轮融资由知名风险投资公司 a16z Crypto 领投,参投方包括 Breyer Capital、Circle Ventures、Coinbase Ventures、CoinFund、Pillar VC、斯坦福工程风险基金等多个投资机构,以及包括 NFL 运动员汤姆・布雷迪、Twitch 联合创始人凯文・林和前 IBM 首席执行官山姆・帕尔米萨诺等知名天使投资人。
5/21/2025 12:01:16 PM
AI在线