理论
Seedream 3.0 文生图模型技术报告发布
字节跳动 Seed 团队正式发布 Seedream 3.0 技术报告。 Seedream 3.0 是一个原生高分辨率、支持中英双语的图像生成基础模型,对比 Seedream 2.0,这一版本的整体性能表现有较大提升,尤其在分辨率、生图结构准确性、数量准确性、多物体属性关系、小字生成与排版、美感效果、真实度等方面有所突破。 具体亮点如下:原生 2K 直出,适配多比例场景:无需后处理可直接输出 2K 分辨率图像,从手机端到巨幅海报场景的视觉需求均可满足;3 秒出图,大幅提升创作效率:面向海报设计、视觉创意等需求,可实现 3 秒左右快速生成高品质图像,实现“所想即所得”的实时创意交互;小字更准,文本排版效果增强:优化小字体高保真生成、多行文本语义排版等业界难题,让 AI 具备商业级图文设计能力;美感&结构提升,生成富有感染力:指令遵循进一步增强,人体和物体结构崩坏改善,且进一步弱化了出图的 AI 感,实现从“看得清”到“有感染力”的审美提升。
4/24/2025 6:02:45 AM
豆包大模型团队
理解 RAG 第二部分:经典 RAG 的工作原理
在本系列的第一篇文章中,我们介绍了检索增强生成 (RAG) ,并解释了扩展传统大型语言模型 (LLM)功能的必要性。 我们还简要概述了 RAG 的核心思想:从外部知识库中检索上下文相关的信息,以确保 LLM 生成准确且最新的信息,而不会产生幻觉,也无需不断地重新训练模型。 本系列的第二篇文章将揭秘传统 RAG 系统运行的机制。
4/24/2025 1:10:00 AM
晓晓
你的数据有多好,你的模型就有多强
在AI大战烽火连天的今天,所有人都在追逐参数规模的增长和架构的优化。 然而,行业内的一个秘密正在悄然成形:拥有独特数据资产的企业正在构筑起难以逾越的竞争壁垒。 数据,而非算法,正成为区分强弱的决定性要素。
4/24/2025 12:40:00 AM
大数据AI智能圈
理解 RAG 第一部分:为什么需要它
自然语言处理(NLP) 是人工智能(AI)的一个领域,旨在教会计算机理解人类的书面和口头语言,并运用这些语言与人类互动。 虽然传统的 NLP 方法已研究数十年,但近年来出现的大型语言模型(LLM) 几乎主导了该领域的所有发展。 LLM 通过将复杂的深度学习架构与能够分析语言中复杂模式和相互依赖关系的自注意力机制相结合,彻底改变了 NLP 和整个人工智能领域。
4/24/2025 12:10:00 AM
晓晓
聊聊SpringAI流式输出的底层实现?
在 Spring AI 中,流式输出(Streaming Output)是一种逐步返回 AI 模型生成结果的技术,允许服务器将响应内容分批次实时传输给客户端,而不是等待全部内容生成完毕后再一次性返回。 这种机制能显著提升用户体验,尤其适用于大模型响应较慢的场景(如生成长文本或复杂推理结果)。 技术实现在 Spring AI 中流式输出的实现有以下两种方式:通过 ChatModel 实现流式输出。
4/24/2025 12:00:00 AM
磊哥
Mobileye首秀上海车展,按下辅助驾驶平权“加速键”
中国上海,2025年4月23日. ——Mobileye于今日亮相上海车展,通过展示其基于复合人工智能系统(CAIS)的全面驾驶自动化解决方案,以及开展高速和城区领航辅助驾驶(NOA)体验活动,充分彰显了其技术路线规划的前瞻思维和商业化量产落地的出色成果。 在本届上海车展上,Mobileye带来了涵盖其从基础驾驶辅助至面向未来“出行即服务”的全系列驾驶自动化系统,包括:ADAS(辅助驾驶系统):包括基础ADAS方案和云增强ADAS方案;Mobileye环绕式ADAS™:一套能够在其设计运行范围(ODD)内提升安全和舒适性体验,同时也充分契合组合辅助驾驶功能全面普及趋势的全新中阶方案;Mobileye SuperVision™:在特定ODD内的“驾驶员运动脱离/需注视”的驾驶辅助平台;Mobileye Chauffeur™:面向消费级车辆,在特定ODD内的有条件“驾驶员视觉脱离”的驾驶自动化系统;Mobileye Drive™:应用于未来“出行即服务”的驾驶自动化系统。
4/23/2025 8:29:59 PM
仅用3周时间,就打造出Manus开源平替!贡献源代码,免费用
可以对标 Manus 的智能体 Suna 来了! (有没有发现它是 manus 倒过来写)这款智能体由 Kortix AI 团队打造,开源并且完全免费。 具体而言,Suna 是一个完全开源的 AI 助手,旨在帮助用户轻松完成现实世界中的各种任务。
4/23/2025 5:22:59 PM
机器之心
业内首次! 全面复现DeepSeek-R1-Zero数学代码能力,训练步数仅需其1/10
OpenAI 的 o1 系列和 DeepSeek-R1 的成功充分证明,大规模强化学习已成为一种极为有效的方法,能够激发大型语言模型(LLM) 的复杂推理行为并显著提升其能力。 然而,这些推理模型的核心训练方法在其技术报告中仍然鲜有披露。 近期社区的主要工作也仅局限于数学推理领域,使得跨领域泛化这一挑战依然未得到充分探索。
4/23/2025 3:23:25 PM
机器之心
百度心响App悄然上线,30天极速开发,开启AI“现货”革命
在人工智能领域,一场关于未来交互模式的革命正悄然酝酿。 近日,百度心响APP在各大安卓市场上线,这款定位为“通用超级智能体”的产品,凭借通用化定位与开放生态设计引发关注,并计划于4月25日百度Create 2025开发者大会正式亮相。 令人意外的是,这一产品由几十人组成的95后年轻团队在短短30天内开发完成,以“现货”姿态打破行业“期货”惯例,展现出百度在AI应用落地方面高效务实的推进能力。
4/23/2025 3:10:24 PM
鸢玮
微软发布全球首个1-bit大模型:内存缩至0.4 GB,参数只有0和±1,性能追平全精度
微软的BitNet b1.58 2B4T 的技术报告悄然上线。 其实在开源社区里,关于极致低比特量化的大模型早就有各种传闻,这次微软研究院终于亮出底牌。 ——全球首个原生1-bit、规模高达20亿参数的开源大模型。
4/23/2025 12:11:40 PM
文摘菌
突发!OpenAI或将收购谷歌浏览器Chrome
今天凌晨4点,路透社消息,OpenAI一位高管在谷歌垄断案庭审中作证,将收购其浏览器Chrome。 目前,谷歌在美国正遭遇反垄断审判,如果上诉失败不仅Chrome会被拆分,其数字广告业务也会被剥离,会对谷歌进行大重组。 今天凌晨1点左右,华盛顿邮报最早报道了谷歌被起诉的消息。
4/23/2025 11:52:05 AM
AIGC开放社区
五个开源 MCP 服务器,让你的AI代理势如破竹
来源 | Code Pulse出品 | 51CTO技术栈(微信号:blog51cto)我最近一直在研究Claude,我对它只是回答问题感到有点厌烦。 我希望它能做一些事情,比如从网站拉取数据,或者浏览我的 GitHub。 当我第一次让一个MCP服务器运行起来的时候,我非常兴奋——感觉就像解锁了一个外挂。
4/23/2025 11:50:04 AM
突发!OpenAI法庭自曝收购Chrome计划,被谷歌律师回怼!OpenAI曾求谷歌合作惨遭拒绝,如今想成为大厂的野心藏不住了!
编辑 | 李美涵在美国司法部对谷歌的反垄断审判中,OpenAI 的 ChatGPT 产品负责人 Nick Turley 在法庭上表示:“如果 Chrome 浏览器真的要被出售,我们 OpenAI 有兴趣出价购买! ”图片这场审判的背景是,美国司法部希望通过一系列措施,打破谷歌在在线搜索领域的垄断地位。 此前,我们曾报道过司法部要求谷歌出售 Chrome 浏览器的消息:谷歌再度被要求出售Chrome!
4/23/2025 11:40:25 AM
李美涵
中杯o3成OpenAI“性价比之王”?ARC-AGI测试结果出炉:得分翻倍、成本仅1/20
得分比第二名翻倍,成本却仅为1/20? o3中杯在超难推理任务ARC-AGI上的新成绩,属实又给众人带来了亿点点震撼。 根据ARC Prize官方介绍,本轮测试得出的关键结论如下:o3 (Medium) 在ARC-AGI-1上得分为57%,成本为1.5美元/任务,优于目前所有已知COT推理模型;o4-mini(Medium)在ARC-AGI-1上得分为42%,成本为0.23美元/任务,准确率不足但成本优势明显;在难度升级的ARC-AGI-2上,两种型号模型的准确率均未超过3%。
4/23/2025 11:19:31 AM
量子位
惊到了!Cursor、Manus等多款爆品提示词遭黑客泄露,Github上疯涨2万星,VSCode也中招了!
近日,Github上有一个项目猛涨2万星,内容竟然是Cursor、Manus、Windsurf、Devin、VSCode Agent、Codex等知名爆款产品或智能体功能的核心秘密:系统提示词。 项目中并没有详细介绍获得系统提示词的方法。 这个项目的作者自称lucknitelol,X账号:NotLucknite这个项目是由这些AI编码工具的系统提示词的json文件集锦组成,超过6,500 行关于其结构和功能的见解分析。
4/23/2025 10:56:52 AM
突发!谷歌被逼卖身,OpenAI趁机收购Chrome?十亿搜索市场大洗牌
OpenAI竟觊觎上了谷歌浏览器? 周二法庭听证会上,ChatGPT负责人Nick Turley掷地有声地宣告:若联邦法庭强制谷歌剥离Chrome,OpenAI将毫不犹豫出手收购。 图片他在法庭上作证,去年7月,OpenAI曾请求获取谷歌搜索数据开发SearchGPT,但遭到了谷歌断然拒绝。
4/23/2025 9:55:37 AM
新智元
清华&英伟达揭露ICML最佳论文隐藏数值问题,简单掩码模型是等价更好选择 | ICLR25
掩码离散扩散模型,可能并没有看上去那么厉害。 这是清华及英伟达研究人员最新提出的观点。 他们发现,作为离散扩散模型中性能最强的类别,掩码扩散模型可能有点“被包装过度”了。
4/23/2025 9:44:54 AM
“史上最快闪存技术”登Nature!复旦新成果突破闪存速度理论极限,每秒执行操作2500000000次
史上最快的闪存器件,复旦团队造! 其研发的皮秒闪存器件“破晓(PoX)”登上了Nature,擦写速度达到了亚纳秒级,比现有速度快1万倍。 并且数据不易丢失,按照实验外推结果,保存年限可达十年以上。
4/23/2025 9:41:27 AM
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind