大模型

52页PPT，谷歌Gemini预训练负责人首次揭秘！扩展定律最优解

谷歌凭借Gemini 2.5 Pro在激烈的大模型竞争中一举翻盘。近日，Geimini Flash预训练负责人Vlad Feinberg在普林斯顿大学分享了相关内容。他深入分析了Gemini预训练的方法、挑战以及方向，如何在模型大小、算力、数据和推理成本间取得平衡。

4/29/2025 9:16:00 AM 新智元

深夜突袭，阿里Qwen3登顶全球开源王座！暴击DeepSeek-R1，2小时狂揽17k星

就在今天凌晨，备受全球期待的阿里新一代通义千问模型Qwen3开源！一经问世，它立刻登顶全球最强开源模型王座。它的参数量仅为DeepSeek-R1的1/3，但成本大幅下降，性能全面超越R1、OpenAI-o1等全球顶尖模型。

4/29/2025 8:14:14 AM 新智元

“大模型失联”的凌晨，我靠这四个配置救了全组！LangChain4j API 进阶指南

1.引言大家好，我是小米，一个31岁、依然热爱编码的程序员大哥哥～今天给大家分享一个我最近在项目里踩坑无数、最后“高光时刻”拯救全组的进阶配置经验——LangChain4j 的 API 进阶配置四大件：日志、监控、重试、超时。你以为 LangChain4j 就只是个 Java 包装器？配置对了，它能稳定、健壮、可观测，能用得安心、跑得漂亮！

4/29/2025 3:40:00 AM 软件求生

阿里 AI 工程师余亮荣获 “全国劳动模范” 称号

在 “庆祝中华全国总工会成立100周年暨全国劳动模范和先进工作者表彰大会” 上，阿里巴巴的员工余亮荣获 “全国劳动模范” 荣誉称号，这也是阿里 AI 工程师首次获得这一殊荣。余亮是一位专注于大数据和智慧城市领域的杰出工程师，他的贡献在行业内得到了广泛认可。余亮毕业于武汉大学，曾在浙江大学及海外顶尖高校和研究机构进行博士后研究，并担任研究员和科学家等职务。

4/28/2025 3:00:50 PM AI在线

字节跳动启动 “Top Seed” 计划，面向 2026 届博士生招募 AI 人才

字节跳动近日宣布正式启动2026届 “Top Seed” 大模型顶尖人才校招计划，计划招募约30位优秀博士生。这一项目专注于前沿的人工智能领域，涵盖大语言模型、机器学习算法与系统、多模态生成与理解、语音处理等研究方向。字节跳动希望通过此举，吸引那些在大模型研究领域具备极强潜力和热情的年轻才俊。

4/28/2025 12:00:40 PM AI在线

ICLR 2025：顶尖科学家最关心的 AI 趋势有哪些？丨GAIR Live

自 GPT-4 发布至今已有两年，但对大语言模型的研究并没有放缓，我们仍处在一个技术进步涌现的时代。 Anthropic 于 2024 年11月发布 MCP，成为接通 AI 生态的桥梁，自主的 Agent 工作流距我们更进一步。 GPT-4o、GPT-4.1时隔仅一个月先后发布，实现上下文处理能力八倍提升。

4/28/2025 11:19:00 AM 郑佳美||梁丙鉴

大模型重复生成内容：根因剖析与优化策略

前言最近在调试大模型应用过程中，遇到了如下问题：复制大模型首次生成内容与「重新生成」两次返回的内容近乎完全相同，几乎没有体现出任何差异性。面对这种情况，造成大模型输出高度相似的原因是什么呢？我们又该采取怎样的调整策略，才能使重新生成的内容与前次存在明显差异，提升输出的多样性呢？

4/28/2025 2:22:00 AM 张张

Encoder-free无编码器多模态大模型EVEv2模型架构、训练方法浅尝

基于视觉编码器的MLLM的基本构成：MLLM通常由预训练的模态编码器、预训练的LLM和一个连接它们的模态接口三个模块组成。模态编码器(如：CLIP-ViT视觉编码器、Whisper音频编码器等)将原始信息（如图像或音频）压缩成更紧凑的表示。预训练的LLM则负责理解和推理处理过的信号。

4/28/2025 2:03:00 AM 余俊晖

字节跳动启动 Top Seed 大模型顶尖人才计划 2026 届校招，计划招募 30 位顶尖博士

字节跳动正式启动2026届Top Seed校招，计划招募30位顶尖博士，研究方向涵盖大语言模型、多模态生成等前沿领域。不限专业背景，更看重研究潜力与热情。#字节跳动校招# #大模型人才#

4/27/2025 5:56:06 PM 远洋

答对有资格入职特斯拉？马斯克这道数学题，我们用七大 AI 模型测了一遍

此前，马斯克在社交平台 X 上贴出了一道数学题，并表示如果有人解开这个问题，就有资格在特斯拉公司工作，引起了很多网友的讨论

4/27/2025 2:57:01 PM 汐元

一日一技：如何快速生成大模型工具调用的JSON Schema

在使用大模型的工具调用时，我们需要编写JSON Schema，例如下图的tools字段的值：图片这个Schema写起来非常麻烦，括号太多了，看着眼花。不信你肉眼看看，你需要几秒钟才能分清楚type: "object"跟哪个字段在同一层级？这个Schema有没有什么办法自动生成呢？

4/27/2025 7:57:50 AM kingname

大模型应用系列：两万字解读MCP

MCP通过建立统一的工具连接规范，为Agent开发提供了标准化接入框架。该协议不仅简化了Agent与多样化系统的集成过程，还显著扩展了Agent的任务处理能力，使开发者能够更高效地构建具备复杂功能的智能体，实现从基础查询到业务决策的多层次应用。那么，如何进一步理解MCP呢？

4/27/2025 2:22:00 AM 曹洪伟

太争气了！百度的底气，李彦宏的决心：3万卡国产自研集群；一口气九个重磅发布，全方位支持MCP，百度在大模型应用时代的出招与押注

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）4月25日，一年一度的百度开发者大会会场如约到来，这是中国国内首家AI巨头在后DeepSeek时代的全新产品的公开亮相。进入2025以后，李彦宏带领下的百度正在如何思考新的AI应用形态？百度在AI应用爆发时代都做了哪些准备？

4/25/2025 1:51:49 PM 云昭

机械臂+大模型+多模态：打造人机协作具身智能体

在人工智能快速发展的浪潮中，多模态大模型已成为技术前沿，使AI能够同时理解文本、图像、音频等多种信息。这一突破为具身智能体开辟了新天地。最近我在github中就找到了一个这样好玩的项目vlm_arm，其将机械臂与多模态大模型结合，打造一个能听人话、看图像、执行精准操作的人机协作智能体系统。

4/25/2025 2:30:00 AM 贝塔街的万事屋

揭秘大模型的魔法：训练你的tokenizer

大家好，我是写代码的中年人。在这个人人谈论“Token量”、“百万上下文”、“按Token计费”的AI时代，“Tokenizer（分词器）”这个词频频出现在开发者和研究者的视野中。它是连接自然语言与神经网络之间的一座桥梁，是大模型运行逻辑中至关重要的一环。

4/25/2025 12:20:00 AM 写代码的中年人

谷歌“Wi-Fi密码”式的最瘦大模型

Gemma 3 的“低门槛 AI”计划露面了，谷歌这次直接把 Gemma 3 做成了“跑得动的”AI。 —Gemma-3-27b-it-qat-q4_0-gguf 听上去像个 Wi-Fi 密码，其实却是谷歌迄今为止最精简的大模型是的，不再只属于高端服务器和土豪显卡，普通玩家的游戏卡，甚至手机，都能一试身手。这波操作的核心是三个字：量化训练（Quantization-Aware Training, QAT）。

4/24/2025 2:13:00 PM 文摘菌

大模型向量去重的N种解决方案！

简单来说，“向量”Vector 是大模型（LLM）在搜索时使用的一种“技术手段”，通过向量比对，大模型能找出问题的相关答案，并且进行智能回答。向量简介Vector 是向量或矢量的意思，向量是数学里的概念，而矢量是物理里的概念，但二者描述的是同一件事。 “定义：向量是用于表示具有大小和方向的量。

4/24/2025 11:09:13 AM 磊哥

大模型数据味蕾论

AI大模型就像一位厨师，预训练数据就是这位厨师的味蕾。没有经过训练的味蕾，再好的食材也无法变成美味佳肴。没有优质的预训练数据，再强大的计算资源也打造不出卓越大模型。

4/24/2025 9:26:13 AM 大数据AI智能圈

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

大模型

52页PPT，谷歌Gemini预训练负责人首次揭秘！扩展定律最优解

深夜突袭，阿里Qwen3登顶全球开源王座！暴击DeepSeek-R1，2小时狂揽17k星

“大模型失联”的凌晨，我靠这四个配置救了全组！LangChain4j API 进阶指南

​阿里 AI 工程师余亮荣获 “全国劳动模范” 称号

字节跳动启动 “Top Seed” 计划，面向 2026 届博士生招募 AI 人才

ICLR 2025：顶尖科学家最关心的 AI 趋势有哪些？丨GAIR Live

大模型重复生成内容：根因剖析与优化策略

Encoder-free无编码器多模态大模型EVEv2模型架构、训练方法浅尝

字节跳动启动 Top Seed 大模型顶尖人才计划 2026 届校招，计划招募 30 位顶尖博士

答对有资格入职特斯拉？马斯克这道数学题，我们用七大 AI 模型测了一遍

一日一技：如何快速生成大模型工具调用的JSON Schema

大模型应用系列：两万字解读MCP

太争气了！百度的底气，李彦宏的决心：3万卡国产自研集群；一口气九个重磅发布，全方位支持MCP，百度在大模型应用时代的出招与押注

机械臂+大模型+多模态：打造人机协作具身智能体

揭秘大模型的魔法：训练你的tokenizer

谷歌“Wi-Fi密码”式的最瘦大模型

大模型向量去重的N种解决方案！

大模型数据味蕾论

阿里 AI 工程师余亮荣获 “全国劳动模范” 称号