理论
用 OpenCV 实现图像识别的十个基础算法
一、OpenCV简介与图像读写基础1. OpenCV是什么? OpenCV 是一个强大的计算机视觉库,广泛用于图像和视频处理。
3/25/2025 8:30:00 AM
手把手PythonAI编程
Vibe Coding 来了——但你准备好应对 Vibe 故障处理了吗?
译者 | 刘汪洋审校 | 重楼想象一下,完全沉浸在编程氛围中,甚至忘记了代码的存在。 不用敲键盘,只需让 Cursor 和 Sonnet 帮你搞定一切。 遇到 bug 时,你不去排查问题,而是把错误信息丢给大语言模型(LLM )然后复制粘贴修复方案。
3/25/2025 12:08:00 AM
刘汪洋
击败思维链(CoT),草稿链(CoD)称王!推理成本降低近94%,低时延,准确率更高!
编辑 | 言征作者 | Ashish Bamania出品 | 51CTO技术栈(微信号:blog51cto)推理 LLM 是当今 AI 研究中的热门话题。 我们从 GPT-1 开始,一直到像 Grok-3 这样的高级推理器。 这段旅程非常了不起,一路上发现了一些非常重要的推理方法。
3/24/2025 1:45:56 PM
言征
Perplexity CEO泼冷水:Agent 2025落地不靠谱!下月将推出自研浏览器——目前构建通用智能体的唯一方法!
整理 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)刚刚,AI搜索独角兽Perplexity的CEO在采访中给Agent浇了盆冷水! 不同于奥特曼等人的乐观论调。 Aravind直言不讳:任何说Agents今年可用的言论都很可疑。
3/24/2025 1:33:47 PM
伊风
三种RAG部署方案:自购GPU硬件 vs 大模型一体机 vs 云端GPU
春节以后这一个半月,算了下我前后也做了 20 的企业知识库落地咨询,其中无论是线上还是线下,被问到最多的一个问题是:要快速落地本地部署的知识库,应该购买什么硬件? 要回答这个问题,其实需要明确很多前置定语,自购 GPU 硬件、大模型一体机、以及选择云端 GPU 都有各自适用的情形。 这篇试图说清楚三种部署方式的主要特点对比,并在文末给些选择建议参考。
3/24/2025 1:17:11 PM
韦东东
AI 写代码=安全危机?第一声“警哨”已吹响
作者 | 腾讯AI编程安全-啄木鸟团队团队介绍:专注AI编程场景下的安全研究与解决方案,让AI输出的每一行代码,都经得起安全考验。 一、AI时代带来编程新变革因为AI编程工具的诞生,代码的诞生方式正在经历一场看不见的变革。 Anthropic 公司(产品:Claude )的 CEO —— Dario Amodei 近日发表看法:一年内,所有代码都将由AI生成。
3/24/2025 1:00:00 PM
腾讯技术工程
为什么批判性思维是应对即将到来的Deepfake海啸的最佳武器
这些内容并不全是“深度伪造”(deepfake),后者特指设计得极具误导性的内容。 近年来,我们看到深度伪造被用于操纵选举、实施欺诈和盗窃,以及未经他人同意制作色情图片。 随着AI工具变得更加强大和易获取,这些问题只可能会愈演愈烈。
3/24/2025 11:07:50 AM
Bernard Marr
AI将使勒索软件更加危险
相比之下,在安全专家中,只有29%的人表示他们对勒索软件攻击做了非常充分的准备——这表明在准备程度上存在显著差距(29%),凸显了采取更强大安全措施的必要性。 安全领导者对暴露管理的深刻理解网络安全需要采取一种更先进、更灵活的方法,这种方法要考虑到业务风险与回报之间的权衡,而不仅仅是单纯关注绝对保护。 在复杂的环境中,暴露管理为管理和减轻风险提供了更有效的解决方案。
3/24/2025 11:04:01 AM
D1net编译
关于LLMs 复读机问题
今天来看一个关于LLMs复读机问题的详细介绍,主要从定义、出现复读机问题的原因和怎么解决三个方面来介绍:1、什么是 LLMs 复读机问题? LLMs 复读机问题:字符级别重复:指大模型针对一个字或一个词重复不断生成。 例如在电商翻译场景上,会出现“steckdose steckdose steckdose steckdose steckdose steckdose steckdose steckdose...”;语句级别重复:大模型针对一句话重复不断生成。
3/24/2025 11:01:41 AM
Goldma
来了!十个构建Agent的大模型应用框架
随着生成式人工智能(GenAI)的蓬勃发展,基于大型模型的应用已经悄然融入我们的日常工作和生活,它们在诸多领域中显著提升了生产力和工作效率。 为了更便捷地构建这些基于大模型的应用程序,开源社区和产品开发者们正以前所未有的速度进行创新。 在这些创新中,面向智能体(Agent)的应用,即所谓的Agentic AI,已经崭露头角,成为近年来生成式AI系统中最具潜力的明星。
3/24/2025 10:55:18 AM
曹洪伟
让 AI 听懂你的语言:DeepSeek 提示词技巧介绍
在生成式AI技术飞速发展的今天,提示词(prompt)已成为人机交互的核心接口。 DeepSeek作为领先的智能对话系统,其输出质量直接取决于提示词的编写水平。 数据显示,专业优化的提示词可将回答准确率提升60%以上。
3/24/2025 10:37:15 AM
Python数智工坊
AI自我纠错,Diffusion超越自回归!质量提升55%,已达理论证据下界
如果大语言模型(LLMs)能够发现并纠正自己的错误,那岂不是很好? 而且,如果能够直接从预训练中实现这一点,而无需任何监督微调(SFT)或强化学习(RL),那会怎样呢? 最新提出的离散扩散模型,称为GIDD,它能够做到这一点。
3/24/2025 9:35:00 AM
新智元
奥特曼豪言:OpenAI第一个发布AGI!下一代人不可能比AI聪明,却没人在意
奥特曼再谈AGI信念! 最近,奥特曼在一期采访中坚定地表示,「OpenAI将第一个发布AGI,并没有人多少人在意」。 他承认,当AI变得更加自主,能够完成通常需要整个组织,才能实现的任务时,自己并不知道那一刻会发生什么。
3/24/2025 9:22:00 AM
新智元
每天2小时成绩逆袭全美前2%!AI助教让学生不再内卷
每天只用2小时就能搞定繁重的学习任务,剩下时间开发自己的兴趣项目,考试成绩还提高了。 这样的学校你愿意尝试吗? 据福克斯新闻报道,德克萨斯州一家名为Alpha School的私立学校在引入AI「助教」后,学生的考试成绩蹭蹭上涨,提高到了全美国的前2%。
3/24/2025 9:12:00 AM
新智元
Idea撞车何恺明「分形生成模型」!速度领先10倍,性能更强
前不久,大神何恺明刚刚放出新作「分形生成模型」,递归调用原子生成模块,构建了新型的生成模型,形成了自相似的分形架构,将GenAI模型的模块化层次提升到全新的高度。 论文地址: 地址:,澳大利亚国立大学的研究人员提出了一个全新的图像生成模型ARINAR,在思想上与分形生成模型不谋而合,但是在性能和速度上都显著提升,base模型的FID从11.8提升到2.75,生成时间从2分钟降低到12秒! ARINAR不仅超越了之前的扩散模型,与目前表现最好的自回归模型MAR相比,ARINAR生成质量相当,速度是MAR的5倍。
3/24/2025 9:08:00 AM
新智元
硅谷投资人爆料:AI爆炸率先发生在中国!芯片扩大1万倍,AI逼近物理极限
如果AI系统能自己设计出更强大的AI,智能爆炸可能很快就要到来了! 而人类,会被AI迅速甩在后面。 最近,硅谷投资人、EverFi CEO兼创始人Tom Davidson等人发表了一篇长文硬核博客,详细讨论了智能爆炸(Intelligence explosion, IE)的类型以及对应的发生概率。
3/24/2025 8:55:00 AM
新智元
AI PS卷起来了!谷歌Gemini动嘴P图火出圈,马斯克Grok连夜上线图像编辑
Grok连夜上线图片编辑功能。 昨晚,Grok上线图片编辑功能,可以通过文字描述直接修改图片。 比如你可以上传一张个人证件照,「动动嘴」让Grok给你PS一套全新的西服。
3/24/2025 8:43:00 AM
新智元
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
AI新词
智能体
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
华为
大语言模型
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
编程
DeepMind
亚马逊
特斯拉
AI模型