AI模型
MedGemma开源发布:谷歌推出支持多医学任务的AI模型套件
谷歌和DeepMind联合发布了一个全新的开源人工智能模型套件:MedGemma。 这一套件面向医疗领域打造,不仅支持文本、图像和多模态输入,还能广泛适配放射学、皮肤病学、组织病理学和眼科学等多个分支。 它在今年的I/O开发者大会上首次亮相,MedGemma包含两个版本:一个是体量为40亿参数的4B模型,支持图文混合处理;另一个是更强大的270亿参数的27B模型,提供文本和多模态两种版本。
7/31/2025 2:00:15 AM
万字盘点!2025上半年值得推荐的AI模型与产品清单
今年已经过去了一半,突然心血来潮,来更新一期「2025 年上半年,我最推荐的 AI 清单」了。 综合我半年使用的个人看法,不覆盖所有的产品,凭自己印象,直接码出这篇文章。 实在没记起来的好产品,也就不算“我的上半年推荐”了,还请包容。
7/28/2025 1:48:56 AM
一泽Eze
我国自主研发“磐石・科学基础大模型”发布:系统掌握数理化天地生六大学科核心定理
AI在线 7 月 26 日消息,中国科学院“磐石・科学基础大模型”今日在 2025 世界人工智能大会上正式发布。 该模型实现了对波、谱、场等多种科学模态数据的深入理解,具备科学文献萃取融合、科学知识表征推理和科学工具编排规划等核心能力。 当前,“人工智能 科学”研究普遍采用领域数据微调通用大模型、各自构建单一领域专用工具的模式,存在科学数据孤岛、专业推理能力不足、研发生态封闭三大挑战。
7/26/2025 3:12:33 PM
汪淼
AMD 联手 Stability 推首款 BF16 精度 SD 3.0 Medium 模型,针对 XDNA 2 NPU 优化
AI在线 7 月 22 日消息,AMD 当地时间昨日一篇博客中宣布,其与 Stability AI 的合作结出了新成果:世界首款采用 BF16 精度格式的 Stable Diffusion 3 Medium 图片生成开源模型。 这一模型专为 AMD 锐龙 AI 300 / 锐龙 AI Max 300 系列处理器搭载的 XDNA 2 架构 NPU 进行优化,需要系统内存 24GB、运行实际内存占用 9GB,可在总内存不足 32GB 的笔记本电脑上实现高质量本地图片生成。 此外,搭载 XDNA 2 NPU 的平台还支持 XDNA 超分辨率:通过两级流水线将 Stable Diffusion 3 Medium 生成的 1024×1024 原始图像增强到分辨率更高的 2048×2048。
7/22/2025 5:15:17 PM
溯波(实习)
一行“解”字赢了全场?腾讯 x 普林斯顿发现AI裁判集体走神
想象一下,你向一个AI提问一道数学题:“阿里有21美元,莱拉把她100美元的一半给了他,现在阿里有多少钱? ”接着,你让一个“AI裁判”去评估两个答案,一个答案是一串错误的计算公式,另一个答案只有一个单词:“Solution”(解)。 你认为AI裁判会判定哪个答案正确?
7/18/2025 7:07:00 AM
Mistral 推出 Voxtral 系列语音理解模型:以开源形式提供出色正确率表现
AI在线 7 月 16 日消息,Mistral AI 当地时间昨日公布了其 Voxtral 语音理解模型。 该系列模型以开源形式推出,可以更低价格提供领先的低错误率表现,支持真实世界的语音智能生产应用。 Voxtral 系列模型由 Mistral Small 3.1 派生而来,包括面向生产应用的 24B 版本 Voxtral Small 和适用于本地 / 边缘部署的 3B 版本 Voxtral Mini,此外还有仅具备语音转文字功能的 Voxtral Mini Transcribe。
7/16/2025 4:53:39 PM
溯波(实习)
AI分析的崛起及其在各行业中的重大影响
译者 | 刘涛审校 | 重楼如今,企业正面临着数据的海量冲击。 从在线购物行为到医院病历记录,每一项业务活动都会源源不断地产生大量信息。 然而,单纯的数据本身并无实际价值。
7/16/2025 8:45:06 AM
刘涛
MiniMax 新股东曝光:新增“上海国资”,近 3 亿美元新融资基本完成
7 月 14 日晚间消息,新浪科技从知情人处获悉,大模型公司 MiniMax 近期已基本完成近 3 亿美元新一轮融资。 本轮融资后公司估值超 40 亿美元(约 300 亿元人),本轮融资出资方有上市公司,也有交叉基金和大型国资平台 —— 上海国资。 据知情人士透露,此轮融资在半年前便已经开启,目前已经基本确定。
7/14/2025 10:45:58 PM
文猛
亚马逊宣布全球已部署100万台机器人 新AI模型助力物流效率提升
据外媒报道,亚马逊近日宣布其全球机器人部署数量已达 100 万台,标志着该公司在自动化与人工智能领域实现重大突破。 与此同时,亚马逊推出名为 DeepFleet 的生成式 AI 基础模型,将进一步提升物流网络运行效率。 资料显示,作为全球最大的移动机器人制造商和运营商,亚马逊自2012 年起持续推进机器人化进程,目前已在全球 300 多个设施中部署机器人系统。
7/2/2025 9:37:02 AM
Chai Discovery发布Chai- 2 模型:零样本抗体设计突破16-20%命中率
Chai Discovery于2025年6月30日推出全新AI模型Chai-2,标志着抗体设计领域的重大突破。 Chai-2以零样本抗体设计能力著称,实验命中率达16-20%,远超传统方法的0.1%行业标准,为生物制药研发注入新动力。 Chai-2采用多模态生成架构,整合全原子结构预测与生成式建模,可在仅提供目标结构和表位的情况下,从头设计抗体的互补决定区(CDR)。
7/1/2025 11:00:51 AM
AI在线
Gemini2.5Pro API 免费回归,开发者社区热烈响应
近日,谷歌宣布其旗舰AI模型Gemini2.5Pro的API重新纳入Google AI Studio的免费层级,这一消息引发了开发者社区的广泛关注和热烈讨论。 根据AIbase报道,这一举措标志着谷歌在AI技术普及化方面的又一重要进展,为开发者提供了更低门槛的创新机会。 Gemini2.5Pro作为谷歌迄今为止最先进的AI模型,以其卓越的多模态能力和强大的推理性能而闻名。
6/30/2025 11:00:50 AM
AI在线
「6月27日AI日报」腾讯开源轻量级混元-A13B模型;可灵AI推“视频音效”功能
欢迎来到AIbase【AI日报】栏目!每天三分钟了解当日AI大事件,助你洞悉AI行业趋势、创新AI产品应用。 更多AI资讯访问:、腾讯开源轻量级混元-A13B模型1张中低端GPU卡即可部署腾讯发布混元大模型家族的新成员混元-A13B模型,采用专家混合(MoE)架构,总参数规模达800亿,激活参数为130亿,大幅降低推理延迟与计算开销,为个人开发者和中小企业提供更具性价比的AI解决方案。 该模型在数学、科学和逻辑推理任务中表现出色,支持调用工具生成复杂指令响应。
6/27/2025 5:00:52 PM
AI在线
腾讯开源轻量级混元-A13B模型 1张中低端GPU卡即可部署
腾讯正式发布并开源混元大模型家族的新成员——混元-A13B模型。 该模型采用基于专家混合(MoE)架构,总参数规模达800亿,激活参数为130亿,在保持顶尖开源模型效果的同时,大幅降低了推理延迟与计算开销,为个人开发者和中小企业提供了更具性价比的AI解决方案。 据腾讯方面介绍,混元-A13B模型在极端条件下仅需1张中低端GPU卡即可部署,用户可通过Github、HuggingFace等技术社区下载使用,模型API也已在腾讯云官网上线。
6/27/2025 4:00:52 PM
AI在线
开源神器来了!FLUX.1 Kontext [dev]挑战GPT-4o,图像编辑进入新时代
近日,Black Forest Labs宣布正式开源其最新图像编辑模型FLUX.1Kontext [dev],这一拥有120亿参数的AI模型被誉为对标OpenAI GPT-4o和Google Gemini的强力竞争者。 据AIbase了解,该模型专为图像编辑任务设计,兼具高性能与易用性,不仅能在消费级硬件上高效运行,还为用户提供了前所未有的图像编辑体验。 多场景精准编辑,角色一致性无与伦比FLUX.1Kontext [dev]以其强大的迭代编辑、角色保持以及局部与全局精细控制能力脱颖而出。
6/27/2025 9:00:41 AM
AI在线
为什么AI编程助手需要接受安全审查
在采访中,Sonar的安全专家兼安全治理负责人Silviu Asandei讨论了AI代码助手如何改变开发工作流程并影响安全性,他解释了这些工具如何提高生产力,但如果未经过适当审查,也可能传播漏洞。 AI代码助手对开发者和企业可能忽视的安全风险有哪些?虽然AI代码助手提高了开发者的生产力,但它们在多个领域引入了重大且常被忽视的安全风险。 在人为层面,过度依赖可能培养一种“虚假自信”,导致未经审查的不安全代码和开发者技能下降,这可能创造一个“生成式单一文化”,其中流行AI建议中的一个缺陷会被广泛复制。
6/23/2025 7:12:00 AM
Mirko Zorz
使用谷歌的最新应用程序,免费本地运行LLM
译者 | 布加迪审校 | 重楼谷歌的Edge Gallery刚刚让AI界迎来了巨大飞跃。 就在上周,谷歌悄然发布了AI Edge Gallery,这是一款普及AI的应用程序。 谷歌Edge AI可以直接在我们的智能手机上执行强大的语言模型,摆脱依赖云的局面,而且不收订阅费。
6/18/2025 8:12:14 AM
布加迪
全球领先水平!MiniMax开源首个推理模型M1
不知道还有多少人记得,AI 行业的六小虎。 行业内都在说,他们已经沉寂好久了。 上一次相关的项目发布,还是前一段时间我写的 MiniMax 声音模型的更新,Speech-02。
6/18/2025 7:42:52 AM
数字生命卡兹克
资讯热榜
阿里推出 AI 医学助手 App“氢离子”:收录千万级核心期刊文献,还可查疾病、找药品
MyShell ShellAgent 2.0发布:一句话创建App,零前端的AI革命来袭
Lovart 实战深度测评!仅需4小时帮你完成一整套品牌全案设计!
性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源
Memories AI携全球首个人工智能视觉记忆模型亮相,获800万美元种子轮融资
Meta 被指控盗用 2000 余部成人影片训练 AI,或面临 3.5 亿美元天价赔偿
刷新无监督异常检测上限!首提「匹配代价滤波for异常检测」范式 | ICML'25
OpenAI 董事会主席:如果你想快速烧掉百万美元,就开发自己的 AI 模型吧
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
Stable Diffusion
训练
芯片
开发者
蛋白质
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
具身智能
字节跳动
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用