AI在线 AI在线

AI模型

用同一组提示词,横向测评30+热门AI绘画平台(中)

前言. 常见的 AI 生图模型大概有以下这些:黑森林的 flux kontext、flux krea、flux dev、flux pro、flux krea、flux1.1,谷歌的 imagen-4、nano-banana,OpenAI 的 Gpt-4o,以及国内的 Dreamina3.1、Qwen3、Wan2.2、星流,还有就是老牌的 Midjourney、Ideogram、即梦、豆包、可灵、海螺等其他平台。 当有设计需求,无论是要出主图还是找创意灵感时,我习惯根据具体使用场景,把提示词放到对应的平台上尝试。
9/14/2025 1:06:09 AM
AI设计师Lena

微软正加大投资训练自己的人工智能模型

微软正在进行重大的投资,以增强其用于训练自主 AI 模型的服务器能力。 这一举措标志着微软在人工智能领域的重要发展,尤其是他们在最近推出的 MAI-1-preview 模型的基础上。 微软 AI 负责人穆斯塔法・苏莱曼在公司内部会议上表示,微软正在为未来的前沿模型进行 “显著的投资”。
9/12/2025 9:11:02 AM
AI在线

维度的囚笼:Embedding 检索模型无法逾越的数学边界

大家好,我是肆〇柒。 今天要和大家分享一篇由Google DeepMind与约翰霍普金斯大学联合研究的重要论文《On the Theoretical Limitations of Embedding-Based Retrieval》。 这项研究揭示了一个令人震惊的事实:即使是"谁喜欢考拉袋鼠?
9/9/2025 9:15:12 AM
肆零柒

投资143亿、裁员200人、合作告急!Scale AI正驶向何方?

今年6月,Meta向数据标注公司Scale AI注资143亿美元,同时将其CEO Alexandr Wang及多位高管引入旗下的Meta超级智能实验室(MSL)。 这场高调合作被外界解读为Meta打造通用人工智能的重要一步。 但仅仅两个月后,裂痕便已浮现。
9/8/2025 3:00:00 AM

团队实战复盘!能让你立即上手的Lora模型训练指南

一、写在前面. 众所周知,训练符合特定品牌风格的LORA模型存在很多的落地痛点:如高质量素材和标注门槛高、训练周期长,且风格迁移易失准、后期迭代适配成本高,但是我们也知道它具有显著的应用价值,因此,本次雪球LORA模型训练总结并非单纯的经验复盘,其价值更在于为大家提供 “可参考、可复用、可落地” 的行动指南。 更多雪球设计干货:以往我们制作雪球资源位视觉图,需历经建模、渲染、后期三大环节,单图需投入1个人力1至2天的工作量。
9/1/2025 6:40:52 AM

超预期业绩!阿里云26%增速领跑,AI收入连续8季度三位数增长

AIbase报道 -8月29日,阿里巴巴集团发布2026财年第一季度财报,业绩表现远超市场预期。 剔除已出售业务影响,集团整体收入同比稳健增长10%,净利润同比大幅增长76%,充分展现了AI 云与消费两大战略领域投入的显著成效。 阿里云本季度表现尤为亮眼,收入同比增长26%,创下三年来最高增速。
8/29/2025 6:27:05 PM
AI在线

蚂蚁专用模型超越o3!仅用2K训练样本刷新医疗AI榜单纪录

不卷参数的专业模型,会不会被通用大模型取代? 在医疗领域,这个疑问正在被打破。 蚂蚁集团联合研究团队发布的《MedResearcher-R1: Expert-Level Medical Deep Researcher》技术报告,证明了一条关键路径:专业开源模型只要做好领域化设计,有机会在垂直赛道上“以小博大”,反超通用大模型。
8/29/2025 1:27:36 PM
闻乐

顶级邪修倾囊相授!8个案例教你速通Nano Banana

大家好,这里是歸藏(guizang),今天教大家如何最大程度发掘最强图片编辑模型 Nano Banana 的潜力。 往期报道:昨晚我们期盼了很久的图像编辑模型终于上线了,大家不再需要从竞技场吭哧瘪肚抽卡,可以爽玩,而且谷歌一如既往的发挥了财大气粗的优势,可以让你疯狂白嫖。 在做了一晚上的通宵测试之后,发现这玩意真的很离谱。
8/29/2025 7:10:31 AM
歸藏

免注册免费用!17种AI绘图模型一站式体验平台LMArena

从年初GPT4o的技惊四座,到年中Flux.1 Kontext的大放异彩,前不久Qwen的后来居上,再到前几天Nano-Banana的万众期待……近年来,国内外越来越多的AI绘图模型百花齐放,争奇斗艳。 这些模型各有所长又各有不足,面对复杂的设计需求很难做到一站式解决所有问题。 因此如何选择使用这些模型成了很多设计师朋友纠结和困扰的问题。
8/27/2025 7:15:37 AM
WeirdDesign

大规模数据管道困境正导致AI模型全面崩溃

你的神经网络在开发环境中表现完美,Transformer模型的基准成绩令同行侧目,智能体系统在受控环境下执行决策树毫无瑕疵。 可一旦部署到生产环境,一切便土崩瓦解——是不是很熟悉?问题不在于你的算法,不在于超参数调优,也不在于算力基础设施。 真正的隐患,是潜伏在AI堆栈之下的烂尾数据管道——它会把你精心打造的高精度模型,变成概率性的垃圾生成器。
8/27/2025 7:10:00 AM
Winston

用同一组提示词,横向测评30+热门AI绘画平台(上)

前言. 常见的 AI 生图模型大概有以下这些:黑森林的 flux kontext、flux krea、flux dev、flux pro、flux krea、flux1.1,谷歌的 imagen-4、nano-banana,OpenAI 的 Gpt-4o,以及国内的 Dreamina3.1、Qwen3、Wan2.2、星流,还有就是老牌的 Midjourney、Ideogram、即梦、豆包、可灵、海螺等其他平台。 当有设计需求,无论是要出主图还是找创意灵感时,我习惯根据具体使用场景,把提示词放到对应的平台上尝试。
8/25/2025 12:01:35 AM
AI设计师Lena

Kimi K2 高速版 AI 模型再提速,输出速度达每秒 100 Tokens ​

近日,月之暗面发布了有关 Kimi K2 高速版 AI 模型的最新消息。 经过工程师们的努力,Kimi K2 turbo-preview 模型的输出速度得到了显著提升,目前稳定输出速度已达到每秒 60 Tokens,最高可达每秒 100 Tokens。 这一进步标志着该模型在处理数据时的效率大幅提高,用户在应用时能够体验到更为流畅的服务。
8/22/2025 6:21:26 PM
AI在线

GPT-5空间智能大考:简单任务称王,复杂挑战平手,所有模型都输给了人类

大家好,我是肆〇柒。 今天我们要探讨一篇由 DeepMind 联合 Stanford HAI(斯坦福以人为本人工智能研究院)共同发布的重磅实证研究报告。 这份报告首次对GPT-5的空间智能能力进行了系统性、标准化的全面评估,其结论可能会更加清晰我们对当前AI能力边界的认知。
8/21/2025 2:10:43 PM
肆零柒

填补AI模型治理鸿沟:CISO必知的五大关键发现

尽管大多数企业都意识到对AI模型进行强有力治理的必要性,但许多企业仍在努力弥补可能减缓AI应用速度并增加风险的种种差距。 Anaconda一项针对300多名AI从业者和决策者的新调查结果凸显了开源工具存在的安全隐患、模型监控不一致以及AI工具链碎片化带来的运营挑战。 尽管经过验证,安全担忧依然居高不下开源软件是AI开发的核心,但同时也带来了需要谨慎管理的供应链风险,大多数受访者都制定了相关流程,以验证Python软件包的安全性和合规性,这些流程包括从自动化漏洞扫描到维护内部软件包注册表以及进行人工审查等多种方式。
8/20/2025 7:18:00 AM
Anamarija

Meta 发布 DINOv3,无需标注数据的通用图像处理 AI 新模型

Meta 近日宣布推出 DINOv3,这是一种无需标注数据的通用图像处理 AI 模型。 该模型基于 17亿张图像进行自监督学习训练,并构建了 70亿个参数,使其能够处理各种图像任务和领域,几乎无需任何调整。 这一特性使得 DINOv3在那些标注数据有限的专业领域,如卫星图像处理,具有尤其重要的应用价值。
8/18/2025 10:32:15 AM
AI在线

免费开源!超多案例实测AI生图模型Flux.1 Krea Dev

嗨大家好! 我是阿真! 7 月底 Black Forest Labs 和 Krea 合作开发的高级文本到图像生成模型 Flux.1 Krea Dev,最近终于有时间进行测评了。
8/9/2025 12:46:03 AM
阿真Irene

全新的AI模型带来更快速的漏洞检测方案

一组研究人员开发出一种名为White-Basilisk的新型AI模型,该模型检测软件漏洞的效率高于许多大型系统。 当前,开发人员和安全团队在保障复杂代码库安全方面面临着越来越大的压力,且往往缺乏部署大规模AI工具的资源,该模型正是在这一背景下发布的。 小模型,大成效与需要数十亿参数和强大计算能力的大型语言模型(LLM)不同,White-Basilisk模型非常紧凑,仅有2亿个参数,然而,在多个用于漏洞检测的公共基准测试中,它的表现优于规模超过其30倍的模型,这至少在专门的安全任务方面,对“模型越大越好”的观点提出了质疑。
8/1/2025 2:38:14 PM
Mirko Zorz

MedGemma开源发布:谷歌推出支持多医学任务的AI模型套件

谷歌和DeepMind联合发布了一个全新的开源人工智能模型套件:MedGemma。 这一套件面向医疗领域打造,不仅支持文本、图像和多模态输入,还能广泛适配放射学、皮肤病学、组织病理学和眼科学等多个分支。 它在今年的I/O开发者大会上首次亮相,MedGemma包含两个版本:一个是体量为40亿参数的4B模型,支持图文混合处理;另一个是更强大的270亿参数的27B模型,提供文本和多模态两种版本。
7/31/2025 2:00:15 AM