理论

揭秘大模型的魔法：训练你的tokenizer

揭秘大模型的魔法：训练你的tokenizer

大家好，我是写代码的中年人。在这个人人谈论“Token量”、“百万上下文”、“按Token计费”的AI时代，“Tokenizer（分词器）”这个词频频出现在开发者和研究者的视野中。它是连接自然语言与神经网络之间的一座桥梁，是大模型运行逻辑中至关重要的一环。

4/25/2025 12:20:00 AM 写代码的中年人

Windsurf全面降价！编程赛道的价格战要来了；被OpenAI收购尚未证实

Windsurf全面降价！编程赛道的价格战要来了；被OpenAI收购尚未证实

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）刚刚得到消息，AI编码助手初创公司 Windsurf周一宣布“全面”降价，称随着与竞争对手 Cursor 的竞争加剧，用户可以“大幅节省成本”。 Windsurf 表示，它将放弃其复杂的“流程操作积分”系统，该系统会向开发者收取其 AI 在后台执行的操作的费用。此外，该公司还将team plans的价格从每位用户每月 35 美元降至 30 美元，同时其企业计划的价格也将“大幅降低”。

4/24/2025 6:40:17 PM 云昭

谷歌“Wi-Fi密码”式的最瘦大模型

谷歌“Wi-Fi密码”式的最瘦大模型

Gemma 3 的“低门槛 AI”计划露面了，谷歌这次直接把 Gemma 3 做成了“跑得动的”AI。 —Gemma-3-27b-it-qat-q4_0-gguf 听上去像个 Wi-Fi 密码，其实却是谷歌迄今为止最精简的大模型是的，不再只属于高端服务器和土豪显卡，普通玩家的游戏卡，甚至手机，都能一试身手。这波操作的核心是三个字：量化训练（Quantization-Aware Training, QAT）。

4/24/2025 2:13:00 PM 文摘菌

大模型向量去重的N种解决方案！

大模型向量去重的N种解决方案！

简单来说，“向量”Vector 是大模型（LLM）在搜索时使用的一种“技术手段”，通过向量比对，大模型能找出问题的相关答案，并且进行智能回答。向量简介Vector 是向量或矢量的意思，向量是数学里的概念，而矢量是物理里的概念，但二者描述的是同一件事。 “定义：向量是用于表示具有大小和方向的量。

4/24/2025 11:09:13 AM 磊哥

刚刚，OpenAI最强图像生成API上线，一张图1毛5！

刚刚，OpenAI最强图像生成API上线，一张图1毛5！

昨夜，OpenAI发布全新图像生成模型gpt-image-1，API向所有开发者开放。这一次，他们直接把每张图的成本打到几美分。图片对于低、中、高质量的方形图像，生成大约花费0.02美元、0.07美元、0.19美元。

4/24/2025 10:31:54 AM

LLM 推理引擎之争：Ollama or vLLM ?

LLM 推理引擎之争：Ollama or vLLM ?

Hello folks，我是 Luga，今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的模型推理框架。在人工智能领域，模型的推理能力是衡量其性能的核心指标之一，直接影响其在复杂任务中的表现。随着自然语言处理（NLP）和大规模语言模型（LLM）技术的迅猛发展，众多创新模型不断涌现，为开发者提供了多样化的选择。

4/24/2025 10:26:40 AM Luga Lee

SLAM3R：北大陈宝权团队等只用单目长视频就能实时重建高质量的三维稠密点云

SLAM3R：北大陈宝权团队等只用单目长视频就能实时重建高质量的三维稠密点云

北京大学陈宝权团队和香港大学等高校及业界机构联合推出实时三维重建系统 SLAM3R，首次实现从长视频（单目 RGB 序列）中实时且高质量地重建场景的稠密点云。 SLAM3R 使用消费级显卡（如 4090D）即可达到 20 FPS 的性能，重建点云的准确度和完整度达到当前最先进水平，同时兼顾了运行效率和重建质量。该研究成果被 CVPR 2025 接收为 Highlight 论文，并在第四届中国三维视觉大会（China3DV 2025）上被评选为年度最佳论文，合作者为董思言博士（共同一作）、王书哲博士、尹英达博士、杨言超助理教授和樊庆楠博士，第一作者为北京大学本科生刘宇政。

4/24/2025 9:44:05 AM 机器之心

刚刚，OpenAI图像生成模型API发布，Token计价，一张图花掉1.4元

刚刚，OpenAI图像生成模型API发布，Token计价，一张图花掉1.4元

上个月，OpenAI 在 ChatGPT 中引入了图像生成功能，广受欢迎：仅在第一周，全球就有超过 1.3 亿用户创建了超过 7 亿张图片。就在刚刚，OpenAI 又宣布了一个好消息：他们正式在 API 中推出驱动 ChatGPT 多模态体验的原生模型 ——gpt-image-1，让开发者和企业能够轻松将高质量、专业级的图像生成功能直接集成到自己的工具和平台中。这也意味着，从今天开始，全世界的开发人员都可以使用 ChatGPT 强大的图像生成功能了。

4/24/2025 9:38:56 AM 机器之心

扩散模型还原被遮挡物体，几张稀疏照片也能"脑补"完整重建交互式3D场景｜CVPR'25

扩散模型还原被遮挡物体，几张稀疏照片也能"脑补"完整重建交互式3D场景｜CVPR'25

你是否设想过，仅凭几张随手拍摄的照片，就能重建出一个完整、细节丰富且可自由交互的3D场景？在传统方法中，这几乎是不可能完成的任务，稀少的拍摄视角往往导致模型无法还原被遮挡的区域，生成的场景要么残缺不全，要么细节模糊。更令人困扰的是，传统的重建算法无法解耦场景中的独立物体，重建结果无法交互，严重限制了在具身智能、元宇宙和影视游戏等领域的应用前景。

4/24/2025 9:38:00 AM

可媲美GPT-4o的开源图像生成框架来了！腾讯联手InstantX解决角色一致性难题

可媲美GPT-4o的开源图像生成框架来了！腾讯联手InstantX解决角色一致性难题

GPT-4o带火的漫画风角色生成，现在有了开源版啦！腾讯混元携手InstantX团队合作打破次元壁，开源定制化角色生成插件——InstantCharacter。以往针对角色驱动的图像生成方法，都存在一定的缺陷。

4/24/2025 9:35:00 AM

告别“AI失忆症”！新型SD-LoRA算法实现终身学习｜ICLR 2025

告别“AI失忆症”！新型SD-LoRA算法实现终身学习｜ICLR 2025

彻底摆脱传统方法对旧数据存储的依赖！哈佛团队联手香港城大、西安交大最新发布的SD-LoRA技术，通过固定已学习任务的方向参数，仅调整幅度权重，完全避免了历史数据的存储需求。能够在减少50%以上参数存储的同时保持最高准确率，并且在不增加推理开销的前提下显著缓解了灾难性遗忘问题。

4/24/2025 9:30:00 AM 量子位

挤爆字节服务器的Agent到底啥水平？一手实测来了

挤爆字节服务器的Agent到底啥水平？一手实测来了

“字节版Manus”有多能打？量子位实测在此。 △扣子智能体生成的活动介绍网页我们用光了一天的对话额度，考验了扣子空间（Coze Space）的信息整理、任务执行、工具调用等多项技能。

4/24/2025 9:27:00 AM 量子位

大模型数据味蕾论

大模型数据味蕾论

AI大模型就像一位厨师，预训练数据就是这位厨师的味蕾。没有经过训练的味蕾，再好的食材也无法变成美味佳肴。没有优质的预训练数据，再强大的计算资源也打造不出卓越大模型。

4/24/2025 9:26:13 AM 大数据AI智能圈

ICLR 2025 Oral | 训练LLM，不只是多喂数据，PDS框架给出最优控制理论选择

ICLR 2025 Oral | 训练LLM，不只是多喂数据，PDS框架给出最优控制理论选择

本文第一作者顾煜贤（）为清华大学计算机系四年级直博生，师从黄民烈教授，研究方向为语言模型的高效训练与推理方法。他曾在 ACL，EMNLP，ICLR 等会议和期刊上发表近 20 篇论文，多次进行口头报告，Google Scholar 引用数 2600 ，曾获 2025 年苹果学者奖学金。本篇论文为他在微软亚洲研究院实习期间所完成。

4/24/2025 9:25:00 AM 机器之心

特斯拉 Optimus 人形机器人试生产线亮相，马斯克称年底数千台将入驻工厂

特斯拉 Optimus 人形机器人试生产线亮相，马斯克称年底数千台将入驻工厂

4 月 24 日消息，在特斯拉 2025 年第一季度更新报告中，公司首次向外界展示了 Optimus 人形机器人试生产线。特斯拉表示，Optimus 的生产时间表保持不变，公司正朝着尽快生产出能够完成有用工作的首批人形机器人的目标迈进。据IT之家了解，特斯拉的 Optimus 试生产线位于弗里蒙特工厂，这里是特斯拉众多项目的起点。

4/24/2025 9:21:15 AM 远洋

一天拿下3.4k star，这个1.6B开源模型火了，合成对话超逼真

一天拿下3.4k star，这个1.6B开源模型火了，合成对话超逼真

如果不提前告诉你，你可能很难相信这段视频里的语音全部是 AI 生成的：这些声音来自 Dia-1.6B——一个刚刚在 𝕏、GitHub 等平台上走红的开源语音模型。它不仅能生成说话的声音、对话，同时也能合成真实感非常强的笑声、喷嚏声和吸鼻子声等表达情绪的声音。由于效果过于逼真，它在 GitHub 上线后不到 24 小时就收获了超过 3.4k star，现在的 star 数更是已经达到了 5.4k。

4/24/2025 9:21:00 AM 机器之心

Adam获时间检验奖！清华揭示保辛动力学本质，提出全新RAD优化器

Adam获时间检验奖！清华揭示保辛动力学本质，提出全新RAD优化器

ICLR（国际学习表征会议）是机器学习领域三大顶会之一，以推动深度学习基础理论和技术创新著称。每年，ICLR时间检验奖都会授予近十年对深度学习领域产生深远影响的里程碑式论文。今年这一殊荣花落Adam优化器（Adaptive Moment Estimation），该算法于2014年由OpenAI工程师Diederik Kingma和University of Toronto研究生Jimmy Ba提出。

4/24/2025 9:16:00 AM 新智元

大学文凭成废纸？AI暴击美国00后！他哥大退学成千万富翁，我却还要还学贷

大学文凭成废纸？AI暴击美国00后！他哥大退学成千万富翁，我却还要还学贷

摊牌了，不装了，美国的Z时代已经对上大学彻底不耐烦了。现在，他们喊出这样的宣言：有了ChatGPT，大学文凭已经彻底成了一张废纸！纯粹就是浪费时间和金钱。

4/24/2025 9:14:00 AM 新智元

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉