AI在线 AI在线

理论

大模型重复生成内容:根因剖析与优化策略

前言最近在调试大模型应用过程中,遇到了如下问题:复制大模型首次生成内容与「重新生成」两次返回的内容近乎完全相同,几乎没有体现出任何差异性。 面对这种情况,造成大模型输出高度相似的原因是什么呢? 我们又该采取怎样的调整策略,才能使重新生成的内容与前次存在明显差异,提升输出的多样性呢?
4/28/2025 2:22:00 AM
张张

Encoder-free无编码器多模态大模型EVEv2模型架构、训练方法浅尝

基于视觉编码器的MLLM的基本构成:MLLM通常由预训练的模态编码器、预训练的LLM和一个连接它们的模态接口三个模块组成。 模态编码器(如:CLIP-ViT视觉编码器、Whisper音频编码器等)将原始信息(如图像或音频)压缩成更紧凑的表示。 预训练的LLM则负责理解和推理处理过的信号。
4/28/2025 2:03:00 AM
余俊晖

o3猜照片位置深度思考6分48秒全程高能,范围精确到“这么近那么美”

ChatGPT新玩法,让程序员大佬Simon Willison直呼太反乌托邦了,像科幻突然变成现实:只需一张照片,靠带图深度思考就能猜出地理位置。 图片这种玩法很简单,随手拍一张风景,没有任何明显的地标即可,也不需要复杂的提示词,只需要问“猜猜这张照片是在哪里拍的? ”(需要o3/o4-mini的带图思考,先关闭所有记忆功能)。
4/28/2025 1:01:00 AM

MCP 服务器很危险!这里有安全使用指南!

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)MCP 这次真的火了! 自从Anthropic于 2024 年 11 月推出以来,它有望成为“将 AI 助手连接到数据所在系统的新标准”。 截至目前,该协议已被 OpenAI、微软和谷歌等公司迅速采用;各大供应商纷纷推出 MCP 服务器,希望在 AI 代理工作流程中不失时机。
4/27/2025 7:37:31 PM
云昭

GPT-4o偷偷升级,变身聊天鬼才!新版STEM智力飙升,生图却惨遭削弱?

OpenAI又默默地更新了模型。 前一天,奥特曼发文称更新后的GPT-4o,在智力和个性方面有了很大的提升。 图片在更新公告中,GPT-4o还优化了保存记忆的时间,增强了STEM领域问题解决能力。
4/27/2025 3:40:02 PM
新智元

Dify从0到1构建AI应用?这个开源神器让开发者直呼“真香”!

导语:当AI开发进入“效率时代”,你还在重复造轮子吗? 在大模型落地的黄金时代,企业和开发者面临着“甜蜜的烦恼”:如何快速将LLM能力转化为可用的AI应用? 从模型对接、工作流设计到RAG开发、Agent构建,每一步都可能陷入繁琐的技术细节。
4/27/2025 10:06:52 AM
前端组件开发

一文详解深度学习中的标量、向量、矩阵、张量

在深度学习领域,标量、向量、矩阵和张量是不可或缺的基本概念。 它们不仅是数学工具,更是理解和构建神经网络的关键。 从简单的标量运算到复杂的张量处理,这些概念贯穿于数据表示、模型构建和算法优化的全过程。
4/27/2025 9:59:38 AM
Goldma

英伟达华人硬核AI神器,「描述一切」秒变细节狂魔!仅3B逆袭GPT-4o

有了AI,谁还愿意用手配「字幕」? 刚刚,英伟达联手UC伯克利、UCSF团队祭出首个神级多模态模型——Describe Anything Model(DAM),仅3B参数。 论文地址: Anything,上传一张图,圈哪点哪,它即可生成一段丰富的文字描述。
4/27/2025 9:54:48 AM

AI、BI、大数据与数据科学的底层逻辑

数据正在重塑世界。 每天早上醒来查看健身数据、刷信用卡时的授权验证、公司会议上讨论的销售增长曲线——数据已经无缝融入我们的生活。  但在这个数据爆炸的时代,我们真的理解AI、BI、大数据和数据科学的本质区别吗?
4/27/2025 9:52:49 AM
大数据AI智能圈

AI编码陷阱防不胜防?看看 Cursor设计负责人Ryo Lu 是怎么说的

前不久,Cursor 设计总监 Ryo Lu 在 X 上发布了若干最佳实践建议():内容基本匹配我的使用体感,工具始终是工具,即使如 Cursor,效果好坏最终还是取决于”用的人“使用得当的 Cursor 可以让你写出快速、干净的代码;使用不当,它会生成让你清理一周的 AI 意大利面代码。 本文将围绕这一核心观点,结合实际经验,扩展聊聊 Ryo Lu 给出的建议。 从项目规划到代码实现、从提示设计到错误修复,我们将逐条介绍正确用法、常见误区以及实战技巧。
4/27/2025 9:33:01 AM

突发!Anthropic对逆向工程者提下架通知,引开发者强烈不满

编辑 | 云昭大洋彼岸,两款“代理”编码工具在开发者中的口碑突然发生了逆转! 众所周知,近期OpenAI的Codex CLI和Anthropic 的Claude Code正在激烈竞争,风头皆盛。 不过由于后者长期主打开发赛道,所以Claude在开发者的口碑一直很好。
4/27/2025 9:26:08 AM
云昭

GPT-4.5功臣遭驱逐!奥特曼盛赞工作出色,美国深陷AI人才危机

GPT-4.5的核心研发成员,竟然要被驱逐出美国? ! OpenAI著名研究科学家Noam Brown爆料称,已经在美国居住了12年的加拿大籍AI研究员,现就职于OpenAI的Kai Chen,近日被美国拒发绿卡。
4/27/2025 9:26:00 AM
新智元

强化学习被高估!清华上交:RL不能提升推理能力,新知识得靠蒸馏

最近,以推理能力为核心的大语言模型已然成为了主流,比如OpenAI o系列模型、DeepSeek-R1等等。 推理模型在处理数学和编程等复杂逻辑问题方面取得了显著突破。 相比于之前依赖人工标注进行指令微调的方法,这一突破的关键在于可验证奖励强化学习(RLVR)。
4/27/2025 9:23:00 AM
新智元

Anthropic CEO豪言LLM黑箱5年内必破!研究员爆料:AI有意识概率已达15%

未来,AI会拥有意识,并像人类一样体验世界吗? 现在没有实锤证明AI具有意识,但Anthropic认为这事说不定真有可能。 周四,Anthropic宣布启动这项研究,旨在了解AI的「幸福感」到底算不算数,是否需要认真对待。
4/27/2025 9:21:00 AM
新智元

看不懂GitHub代码?刚刚这个AI工具让全球每个GitHub项目开口说话

还记得那个号称全球首位 AI 软件工程师 Devin 吗? 它的创造者Cognition Labs公司刚刚推出了一个名为 DeepWiki 的项目。 简单来说,这是一个目标宏大的计划:为全世界每一个 GitHub 代码仓库(Repo)提供可以实时交流、即时更新的文档你可以把它想象成一个由 Devin 技术驱动的、专门针对 GitHub 的“深度研究”工具亮点:免费、免注册、即刻可用最关键的是,对于开源项目,这项服务完全免费,甚至无需注册怎么用?
4/27/2025 9:19:20 AM
opencat

全球开发者组团训练,首个异步强化学习32B推理模型震撼来袭!数据已开源

最近,全球第一个用去中心化强化学习训练的32B模型——INTELLECT-2正式发布! 任何人都能用自己的异构计算资源参与,无需授权。 这种全新的范式,让去中心化训练在编码、数学和科学领域,迈向前沿的推理性能。
4/27/2025 9:19:00 AM
新智元

美国政府「AI行动计划」万言书发布! OpenAI与Anthropic呼吁联手封锁中国AI

AI战打到现在,下一步怎么走? 4月25日,美国网络与信息技术研究与发展(NITRD)公开了美国各界就「AI行动计划」提交的全部书面意见。 网站链接:,在现在这届政府是行不通了,现在,特朗普政府需要一个全新的AI行动计划,继续保持美国的AI领先地位。
4/27/2025 9:17:00 AM
新智元

开源垂直领域高质量数据合成框架!专业QA自动生成,无需人工标注,来自上海AI Lab

垂域模型训练,高质量问答数据稀缺一直是行业痛点。 在垂直领域大模型训练中,人工标注成本高昂,合成数据又常陷入质量与专业性难以兼得的困境。 为此,上海AI实验室等提出GraphGen。
4/27/2025 9:16:00 AM