理论
击败思维链(CoT),草稿链(CoD)称王!推理成本降低近94%,低时延,准确率更高!
编辑 | 言征作者 | Ashish Bamania出品 | 51CTO技术栈(微信号:blog51cto)推理 LLM 是当今 AI 研究中的热门话题。 我们从 GPT-1 开始,一直到像 Grok-3 这样的高级推理器。 这段旅程非常了不起,一路上发现了一些非常重要的推理方法。
Perplexity CEO泼冷水:Agent 2025落地不靠谱!下月将推出自研浏览器——目前构建通用智能体的唯一方法!
整理 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)刚刚,AI搜索独角兽Perplexity的CEO在采访中给Agent浇了盆冷水! 不同于奥特曼等人的乐观论调。 Aravind直言不讳:任何说Agents今年可用的言论都很可疑。
三种RAG部署方案:自购GPU硬件 vs 大模型一体机 vs 云端GPU
春节以后这一个半月,算了下我前后也做了 20 的企业知识库落地咨询,其中无论是线上还是线下,被问到最多的一个问题是:要快速落地本地部署的知识库,应该购买什么硬件? 要回答这个问题,其实需要明确很多前置定语,自购 GPU 硬件、大模型一体机、以及选择云端 GPU 都有各自适用的情形。 这篇试图说清楚三种部署方式的主要特点对比,并在文末给些选择建议参考。
AI 写代码=安全危机?第一声“警哨”已吹响
作者 | 腾讯AI编程安全-啄木鸟团队团队介绍:专注AI编程场景下的安全研究与解决方案,让AI输出的每一行代码,都经得起安全考验。 一、AI时代带来编程新变革因为AI编程工具的诞生,代码的诞生方式正在经历一场看不见的变革。 Anthropic 公司(产品:Claude )的 CEO —— Dario Amodei 近日发表看法:一年内,所有代码都将由AI生成。
为什么批判性思维是应对即将到来的Deepfake海啸的最佳武器
这些内容并不全是“深度伪造”(deepfake),后者特指设计得极具误导性的内容。 近年来,我们看到深度伪造被用于操纵选举、实施欺诈和盗窃,以及未经他人同意制作色情图片。 随着AI工具变得更加强大和易获取,这些问题只可能会愈演愈烈。
AI将使勒索软件更加危险
相比之下,在安全专家中,只有29%的人表示他们对勒索软件攻击做了非常充分的准备——这表明在准备程度上存在显著差距(29%),凸显了采取更强大安全措施的必要性。 安全领导者对暴露管理的深刻理解网络安全需要采取一种更先进、更灵活的方法,这种方法要考虑到业务风险与回报之间的权衡,而不仅仅是单纯关注绝对保护。 在复杂的环境中,暴露管理为管理和减轻风险提供了更有效的解决方案。
关于LLMs 复读机问题
今天来看一个关于LLMs复读机问题的详细介绍,主要从定义、出现复读机问题的原因和怎么解决三个方面来介绍:1、什么是 LLMs 复读机问题? LLMs 复读机问题:字符级别重复:指大模型针对一个字或一个词重复不断生成。 例如在电商翻译场景上,会出现“steckdose steckdose steckdose steckdose steckdose steckdose steckdose steckdose...”;语句级别重复:大模型针对一句话重复不断生成。
来了!十个构建Agent的大模型应用框架
随着生成式人工智能(GenAI)的蓬勃发展,基于大型模型的应用已经悄然融入我们的日常工作和生活,它们在诸多领域中显著提升了生产力和工作效率。 为了更便捷地构建这些基于大模型的应用程序,开源社区和产品开发者们正以前所未有的速度进行创新。 在这些创新中,面向智能体(Agent)的应用,即所谓的Agentic AI,已经崭露头角,成为近年来生成式AI系统中最具潜力的明星。
让 AI 听懂你的语言:DeepSeek 提示词技巧介绍
在生成式AI技术飞速发展的今天,提示词(prompt)已成为人机交互的核心接口。 DeepSeek作为领先的智能对话系统,其输出质量直接取决于提示词的编写水平。 数据显示,专业优化的提示词可将回答准确率提升60%以上。
AI自我纠错,Diffusion超越自回归!质量提升55%,已达理论证据下界
如果大语言模型(LLMs)能够发现并纠正自己的错误,那岂不是很好? 而且,如果能够直接从预训练中实现这一点,而无需任何监督微调(SFT)或强化学习(RL),那会怎样呢? 最新提出的离散扩散模型,称为GIDD,它能够做到这一点。
2030年,AGI概率至少10%!AI范式转变快,谁能预测GenAI下一代?
AGI已经来了? 还是快来了? 还是说AGI也是一种「技术乌托邦」?
奥特曼豪言:OpenAI第一个发布AGI!下一代人不可能比AI聪明,却没人在意
奥特曼再谈AGI信念! 最近,奥特曼在一期采访中坚定地表示,「OpenAI将第一个发布AGI,并没有人多少人在意」。 他承认,当AI变得更加自主,能够完成通常需要整个组织,才能实现的任务时,自己并不知道那一刻会发生什么。
每天2小时成绩逆袭全美前2%!AI助教让学生不再内卷
每天只用2小时就能搞定繁重的学习任务,剩下时间开发自己的兴趣项目,考试成绩还提高了。 这样的学校你愿意尝试吗? 据福克斯新闻报道,德克萨斯州一家名为Alpha School的私立学校在引入AI「助教」后,学生的考试成绩蹭蹭上涨,提高到了全美国的前2%。
Idea撞车何恺明「分形生成模型」!速度领先10倍,性能更强
前不久,大神何恺明刚刚放出新作「分形生成模型」,递归调用原子生成模块,构建了新型的生成模型,形成了自相似的分形架构,将GenAI模型的模块化层次提升到全新的高度。 论文地址: 地址:,澳大利亚国立大学的研究人员提出了一个全新的图像生成模型ARINAR,在思想上与分形生成模型不谋而合,但是在性能和速度上都显著提升,base模型的FID从11.8提升到2.75,生成时间从2分钟降低到12秒! ARINAR不仅超越了之前的扩散模型,与目前表现最好的自回归模型MAR相比,ARINAR生成质量相当,速度是MAR的5倍。
硅谷投资人爆料:AI爆炸率先发生在中国!芯片扩大1万倍,AI逼近物理极限
如果AI系统能自己设计出更强大的AI,智能爆炸可能很快就要到来了! 而人类,会被AI迅速甩在后面。 最近,硅谷投资人、EverFi CEO兼创始人Tom Davidson等人发表了一篇长文硬核博客,详细讨论了智能爆炸(Intelligence explosion, IE)的类型以及对应的发生概率。
AI PS卷起来了!谷歌Gemini动嘴P图火出圈,马斯克Grok连夜上线图像编辑
Grok连夜上线图片编辑功能。 昨晚,Grok上线图片编辑功能,可以通过文字描述直接修改图片。 比如你可以上传一张个人证件照,「动动嘴」让Grok给你PS一套全新的西服。
基于代理知识蒸馏技术克服文档提取和RAG策略失败问题
译者 | 朱先忠审校 | 重楼简介当下,许多生成式AI应用场景仍然围绕检索增强生成(RAG)展开,但始终未能满足用户的期望。 尽管对RAG改进的研究越来越多,甚至在流程中添加了代理技术,但许多解决方案仍然无法返回详尽的结果,遗漏了文档中很少提及的关键信息,需要多次搜索迭代,并且通常难以协调多个文档中的关键主题。 最糟糕的是,许多实现方案仍然依赖于将尽可能多的“相关”信息与详细的系统和用户提示一起塞入模型的上下文窗口。
数据越多越好?错了!关键在于如何“喂”给模型
咱们今天聊聊机器学习里的一个重点概念——特征工程。 我们人看东西、做判断,是不是得先抓住事物的关键特点? 比如说,你要判断一个苹果好不好吃,你会看它颜色、闻它香味、摸它硬度,甚至尝一口。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉