AI在线 AI在线

AI

AI 文生图新王者:Reve Image 1.0 登顶,低价高质挑战 Midjourney 和 Flux

AI图像生成领域正呈现"三足鼎立"态势:MidJourney坚守艺术品质王座,Flux专注写实突破,Reve则以性价比和文字处理能力切入市场。随着GPT-4o的入局,行业竞争已从单点技术比拼升级为生态体系对抗。下一阶段,用户体验和伦理规范将成为关键胜负手。
3/27/2025 9:57:03 AM
故渊

Ideogram 正式发布 3.0 版本模型:真实感与创意表现再突破

Ideogram 官方宣布推出其最新图像生成模型——Ideogram3.0。 这一版本在真实感、创意表现力和风格一致性上实现了显著突破,被认为是图像生成领域的一次重要里程碑。 新模型不仅对标 GPT-4o 等顶级 AI 系统,还以其高效性能和创新功能吸引了广泛关注。
3/27/2025 9:53:00 AM
AI在线

清华稀疏Attention,无需训练加速一切模型!

在当今各类大语言模型以及视频模型中,长序列场景越来越普遍,而 Attention 的计算复杂度随着序列长度呈平方增长,成为长序列任务下的主要计算瓶颈。 此前,清华大学陈键飞团队提出的即插即用量化的 SageAttention 系列工作已实现 3 倍加速于 FlashAttention,且在各类大模型上均保持了端到端的精度,已被业界和社区广泛使用。 为了进一步加速 Attention,清华大学陈键飞团队进一步提出了无需训练可直接使用的稀疏 Attention(SpargeAttn)可用来加速任意模型。
3/27/2025 9:47:23 AM
机器之心

阿里深夜开源Qwen2.5-Omni,7B参数完成看、听、说、写

3 月 27 日凌晨,阿里通义千问团队发布 Qwen2.5-Omni。 这是 Qwen 系列中全新的旗舰级多模态大模型,专为全面的多模式感知设计,可以无缝处理包括文本、图像、音频和视频的各种输入,同时支持流式的文本生成和自然语音合成输出。 从此以后,你可以像打电话或进行视频通话一样与 Qwen 聊天!
3/27/2025 9:40:59 AM
机器之心

Spring AI + Ollama 实现 deepseek-r1 的API服务和调用

兄弟们,今天咱来聊聊一个超有意思的技术组合 ——Spring AI Ollama 实现 deepseek - r1 的 API 服务和调用。 咱都知道,人工智能这几年那可是火得一塌糊涂,各种大模型你方唱罢我登场。 deepseek - r1 就是其中一个挺厉害的模型,那怎么把它用起来,让它为咱们的项目服务呢?
3/27/2025 9:34:42 AM
儒猿团队

OpenAI收入暴增预测:未来几年或实现翻倍增长

根据最新消息,OpenAI正在迎来一波前所未有的需求增长,预计到2025年,其收入将达到127亿美元,较去年的37亿美元实现两倍增长。 该公司的乐观预期并不仅限于此,明年预计收入还将继续飙升,可能达到294亿美元。 自从 OpenAI 推出 ChatGPT 聊天机器人以来,其产品受到了广泛关注和热烈追捧。
3/27/2025 9:28:00 AM
AI在线

Stable Diffusion变身3D神器!一个LoRA将2D图像转3D模型

在Stable Diffusion当中,只需加入一个LoRA就能根据图像创建3D模型了? 港科大(广州)与趣丸科技合作推出了全新三维生成大模型——Kiss3DGen,创新性地将3D生成与成熟的图像生成模型进行了对齐。 并且与主流2D扩散模型技术(如ControlNet、Flux-Redux)兼容协同,无需额外训练即可即插即用。
3/27/2025 9:26:30 AM
量子位

轨迹可控视频生成新范式,复旦微软破解视频生成难题,精准控制任意物体运动

轨迹可控的视频生成来了,支持三种不同级别的轨迹控制条件——分别为掩码、边界框和稀疏框。 近年来,视频生成技术快速发展,显著提升了视频的视觉质量与时间连贯性。 在此基础上,(trajectory-controllable video generation)涌现了许多工作,使得通过明确定义的路径精确控制生成视频中的物体运动轨迹成为可能。
3/27/2025 9:24:16 AM
量子位

人形机器人优雅漫步,强化学习新成果!独角兽Figure创始人:之前大家吐槽太猛

注意看,机器人像人一样从容地走出大门了! 甚至,还有一整支机器人队伍迎面走来。 人形机器人独角兽Figure,再次带来他们的新成果——利用强化学习实现自然人形行走。
3/27/2025 9:19:57 AM
量子位

突发!英伟达收购贾扬清新创业的Lepton AI

出品 | 51CTO技术栈(微信号:blog51cto)刚刚,有外媒曝出英伟达即将收购成立两年的 AI 创业公司 Lepton AI。 Lepton AI 的创始人是AI圈内知名人士贾扬清。 据悉这笔收购交易的金额是数亿美元。
3/27/2025 8:50:38 AM

网络犯罪分子利用11种方式使网络钓鱼比以往更有危害力

网络犯罪分子正在改变其社交攻击的欺诈手段,以提高真实性,更好地绕过过滤器,并更有针对性地瞄准潜在受害者。 网络钓鱼一直是安全漏洞的主要来源——这一重大问题,尽管经过了多年的安全意识培训,但至今仍是网络安全方面的首要关注点。 不过,由于战术的改进和AI技术的恶意再利用,这种长期存在的社交攻击手段不断演变,网络犯罪分子正在寻找新的方法来诱骗用户点击恶意链接。
3/27/2025 8:00:00 AM
John Leyden

随着AI大模型和MCP生态发展,传统低代码平台和RPA类产品还有无出路?

今天准备跟大家聊一下随着AI大模型和MCP协议生态的发展,对传统的低代码产品和RPA机器人产品所带来的一些影响。 因为在一年多前我其实就聊过这个话题,但是最近一年的时间AI大模型、AI编程、AI智能体,包括最近的MCP协议生态的发展太快了,导致原来我们对这两个产品的影响分析会出现一些变化。 低代码平台影响分析首先我们先讲一下低代码,大家都知道其实低代码平台的产品,它的本质仍然是辅助我们编程,仍然是可能会生成源代码或者是生成低代码产品模板引擎能够解析的元数据。
3/27/2025 5:00:00 AM
何明璐

重磅发布!ChatGPT ImageGen “Shiba” 震撼来袭:你从未见过的强大AI图像生成模型!

引言期待已久的ChatGPT ImageGen终于迎来重大更新! 代号为“Shiba”的全新模型正式发布,而我可以毫不犹豫地说,这绝对是我目前为止使用过的最强大的AI图像生成工具! 无论是在Prompt理解、生成质量,还是在文字排版、编辑能力和角色一致性等方面,“Shiba”都展现出了前所未有的卓越性能,可以说是全面碾压!
3/27/2025 12:04:33 AM
深海幽光

Anthropic 取得 AI 版权官司初步胜利,出版商被指要求过于宽泛

Anthropic在与音乐出版商的版权纠纷中取得初步胜利,美国法官裁定出版商请求过于宽泛,未能证明Anthropic使用歌词对其造成不可弥补的损害。此案涉及AI训练中版权材料的合理使用问题,Anthropic对此裁决表示欢迎。#AI版权# #Anthropic#
3/26/2025 11:22:23 PM
远洋

以一敌五、屠榜登顶的谷歌Gemini 2.5,居然栽在小学数学题上

编辑 | 杨文今天凌晨,大洋彼岸可真够热闹的。 OpenAI 推出了 GPT-4o 动嘴生图、P 图的功能,而谷歌则直接祭出了号称「最智能的模型」Gemini 2.5。 据谷歌首席科学家 Jeff Dean 介绍,首个版本 Gemini 2.5 Pro  Experimental 已集成「思考能力」,是迄今为止性能最强大的 Gemini 模型,尤其擅长高级推理和编码,并在 @lmarena_ai 排行榜上拿下第一。
3/26/2025 8:54:00 PM
AI好好用

雷鸟AR眼镜与通义深度定制大模型联手,交互体验提升显著

在增强现实(AR)眼镜领域,雷鸟创新正在引领一场革命。 随着 AI 技术的飞速发展,AR 眼镜正逐渐被认为是未来消费电子的重要载体。 而雷鸟创新与阿里云的深度合作,致力于将 AI 与 AR 进行无缝融合,为用户带来更流畅的交互体验。
3/26/2025 5:59:00 PM
AI在线

你的“AI 同事”上线:微软 Copilot 新增研究员和分析师两大智能体

微软最新推出了 Researcher(研究员)和 Analyst(分析师)两款 AI Copilot 智能体,基于 OpenAI 的 o3 推理模型开发,能独立分析实时数据,并完成多步骤研究任务。
3/26/2025 2:00:00 PM
故渊

为避免内耗:谷歌 AI 助手 Pixie 项目遭拆分,部分能力并入 Gemini

科技媒体 The Information 今天(3 月 26 日)发布博文,报道称谷歌公司为避免和 Gemini 竞争,拆分 Pixie 项目,一部分转化为 Pixel 手机的“截图应用”,另一部分融入 Gemini 功能。
3/26/2025 11:48:15 AM
故渊