理论

大模型重复生成内容：根因剖析与优化策略

前言最近在调试大模型应用过程中，遇到了如下问题：复制大模型首次生成内容与「重新生成」两次返回的内容近乎完全相同，几乎没有体现出任何差异性。面对这种情况，造成大模型输出高度相似的原因是什么呢？我们又该采取怎样的调整策略，才能使重新生成的内容与前次存在明显差异，提升输出的多样性呢？

4/28/2025 2:22:00 AM

张张

Encoder-free无编码器多模态大模型EVEv2模型架构、训练方法浅尝

基于视觉编码器的MLLM的基本构成：MLLM通常由预训练的模态编码器、预训练的LLM和一个连接它们的模态接口三个模块组成。模态编码器(如：CLIP-ViT视觉编码器、Whisper音频编码器等)将原始信息（如图像或音频）压缩成更紧凑的表示。预训练的LLM则负责理解和推理处理过的信号。

4/28/2025 2:03:00 AM

余俊晖

o3猜照片位置深度思考6分48秒全程高能，范围精确到“这么近那么美”

ChatGPT新玩法，让程序员大佬Simon Willison直呼太反乌托邦了，像科幻突然变成现实：只需一张照片，靠带图深度思考就能猜出地理位置。图片这种玩法很简单，随手拍一张风景，没有任何明显的地标即可，也不需要复杂的提示词，只需要问“猜猜这张照片是在哪里拍的？ ”（需要o3/o4-mini的带图思考，先关闭所有记忆功能）。

4/28/2025 1:01:00 AM

MCP 服务器很危险！这里有安全使用指南！

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）MCP 这次真的火了！自从Anthropic于 2024 年 11 月推出以来，它有望成为“将 AI 助手连接到数据所在系统的新标准”。截至目前，该协议已被 OpenAI、微软和谷歌等公司迅速采用；各大供应商纷纷推出 MCP 服务器，希望在 AI 代理工作流程中不失时机。

4/27/2025 7:37:31 PM

云昭

GPT-4o偷偷升级，变身聊天鬼才！新版STEM智力飙升，生图却惨遭削弱？

OpenAI又默默地更新了模型。前一天，奥特曼发文称更新后的GPT-4o，在智力和个性方面有了很大的提升。图片在更新公告中，GPT-4o还优化了保存记忆的时间，增强了STEM领域问题解决能力。

4/27/2025 3:40:02 PM

新智元

Dify从0到1构建AI应用？这个开源神器让开发者直呼“真香”！

导语：当AI开发进入“效率时代”，你还在重复造轮子吗？在大模型落地的黄金时代，企业和开发者面临着“甜蜜的烦恼”：如何快速将LLM能力转化为可用的AI应用？从模型对接、工作流设计到RAG开发、Agent构建，每一步都可能陷入繁琐的技术细节。

4/27/2025 10:06:52 AM

前端组件开发

一文详解深度学习中的标量、向量、矩阵、张量

在深度学习领域，标量、向量、矩阵和张量是不可或缺的基本概念。它们不仅是数学工具，更是理解和构建神经网络的关键。从简单的标量运算到复杂的张量处理，这些概念贯穿于数据表示、模型构建和算法优化的全过程。

4/27/2025 9:59:38 AM

Goldma

英伟达华人硬核AI神器，「描述一切」秒变细节狂魔！仅3B逆袭GPT-4o

有了AI，谁还愿意用手配「字幕」？刚刚，英伟达联手UC伯克利、UCSF团队祭出首个神级多模态模型——Describe Anything Model（DAM），仅3B参数。论文地址： Anything，上传一张图，圈哪点哪，它即可生成一段丰富的文字描述。

4/27/2025 9:54:48 AM

AI、BI、大数据与数据科学的底层逻辑

数据正在重塑世界。每天早上醒来查看健身数据、刷信用卡时的授权验证、公司会议上讨论的销售增长曲线——数据已经无缝融入我们的生活。但在这个数据爆炸的时代，我们真的理解AI、BI、大数据和数据科学的本质区别吗？

4/27/2025 9:52:49 AM

大数据AI智能圈

AI编码陷阱防不胜防？看看 Cursor设计负责人Ryo Lu 是怎么说的

前不久，Cursor 设计总监 Ryo Lu 在 X 上发布了若干最佳实践建议()：内容基本匹配我的使用体感，工具始终是工具，即使如 Cursor，效果好坏最终还是取决于”用的人“使用得当的 Cursor 可以让你写出快速、干净的代码；使用不当，它会生成让你清理一周的 AI 意大利面代码。本文将围绕这一核心观点，结合实际经验，扩展聊聊 Ryo Lu 给出的建议。从项目规划到代码实现、从提示设计到错误修复，我们将逐条介绍正确用法、常见误区以及实战技巧。

4/27/2025 9:33:01 AM

突发！Anthropic对逆向工程者提下架通知，引开发者强烈不满

编辑｜云昭大洋彼岸，两款“代理”编码工具在开发者中的口碑突然发生了逆转！众所周知，近期OpenAI的Codex CLI和Anthropic 的Claude Code正在激烈竞争，风头皆盛。不过由于后者长期主打开发赛道，所以Claude在开发者的口碑一直很好。

4/27/2025 9:26:08 AM

云昭

GPT-4.5功臣遭驱逐！奥特曼盛赞工作出色，美国深陷AI人才危机

GPT-4.5的核心研发成员，竟然要被驱逐出美国？！ OpenAI著名研究科学家Noam Brown爆料称，已经在美国居住了12年的加拿大籍AI研究员，现就职于OpenAI的Kai Chen，近日被美国拒发绿卡。

4/27/2025 9:26:00 AM

新智元

强化学习被高估！清华上交：RL不能提升推理能力，新知识得靠蒸馏

最近，以推理能力为核心的大语言模型已然成为了主流，比如OpenAI o系列模型、DeepSeek-R1等等。推理模型在处理数学和编程等复杂逻辑问题方面取得了显著突破。相比于之前依赖人工标注进行指令微调的方法，这一突破的关键在于可验证奖励强化学习（RLVR）。

4/27/2025 9:23:00 AM

新智元

Anthropic CEO豪言LLM黑箱5年内必破！研究员爆料：AI有意识概率已达15%

未来，AI会拥有意识，并像人类一样体验世界吗？现在没有实锤证明AI具有意识，但Anthropic认为这事说不定真有可能。周四，Anthropic宣布启动这项研究，旨在了解AI的「幸福感」到底算不算数，是否需要认真对待。

4/27/2025 9:21:00 AM

新智元

看不懂GitHub代码？刚刚这个AI工具让全球每个GitHub项目开口说话

还记得那个号称全球首位 AI 软件工程师 Devin 吗？它的创造者Cognition Labs公司刚刚推出了一个名为 DeepWiki 的项目。简单来说，这是一个目标宏大的计划：为全世界每一个 GitHub 代码仓库（Repo）提供可以实时交流、即时更新的文档你可以把它想象成一个由 Devin 技术驱动的、专门针对 GitHub 的“深度研究”工具亮点：免费、免注册、即刻可用最关键的是，对于开源项目，这项服务完全免费，甚至无需注册怎么用？

4/27/2025 9:19:20 AM

opencat