AI在线 AI在线

理论

32B本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强

就在DeepSeek-V3更新的同一夜,阿里通义千问Qwen又双叒叕一次梦幻联动了——发布Qwen2.5-VL-32B-Instruct。 此前开源家族视觉语言模型Qwen2.5-VL包括3B、7B和72B三种尺寸。 这一次的32B版本进一步兼顾尺寸和性能,可在本地运行。
3/25/2025 9:24:05 AM
量子位

AI引爆全美失业潮,12个月内接管所有代码!3亿岗位被取代,70%职业大换血

AI,正在改变生活。 LinkedIn的新研究显示,很大程度上因为AI,到2030年,大多数职业的70%技能将发生变化。 然而,更大的AI的冲击或许就要到来:AI永久性地改变就业市场,并带来大规模失业。
3/25/2025 9:12:53 AM
新智元

美国恐惧:冷战2.0将至,中国开源模型大爆炸临近!LeCun:DeepSeek只是卷王副产品

如今,美国已经开始陷入「冷战2.0焦虑」——我们的AI技术,恐怕已经落后于中国了? 甚至AI社区的不少人已经押注:接下来几个月,将有一大波中国开源AI模型的浪潮! 某AI大V如是说:一年前,没有人会预料到,在AI竞赛中,美国竟会被更强大的中国超越。
3/25/2025 9:08:41 AM
新智元

一文看懂多模态思维链

多模态思维链(MCoT)系统综述来了! 不仅阐释了与该领域相关的基本概念和定义,还包括详细的分类法、对不同应用中现有方法的分析、对当前挑战的洞察以及促进多模态推理发展的未来研究方向。 图片当下,传统思维链(CoT)已经让AI在文字推理上变得更聪明,比如一步步推导数学题的答案。
3/25/2025 9:06:11 AM
量子位

Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?

几乎每周都有新的、令人影响深刻的AI工具发布,研究人员纷纷踊跃尝试。 从复杂的数学问题求解,到医学诊断中的精准分析,再到代码编写与论文创作,AI工具展现了巨大的潜力。 但市面上令人眼花缭乱的AI模型,究竟哪一款才是让科研工作者效率起飞的「梦中情模」,能助力科研突破,带来事半功倍的效果呢?
3/25/2025 9:04:55 AM
新智元

爆火Block Diffusion引发LLM架构变革?自回归+扩散模型完美结合

扩散模型被广泛应用于生成图像和视频,并且在生成离散数据(如文本或生物序列)任务上的效果也越来越好,与自回归模型相比,扩散模型有望加速「生成过程」并提高模型输出的「可控性」。 然而,离散扩散模型目前仍然有三个局限性:在聊天系统等应用中,模型需要生成任意长度的输出序列(例如,对用户问题的回答),但大多数现有的扩散架构只能生成固定长度的向量;离散扩散在生成过程中使用双向上下文,因此无法利用键值缓存(KV caching)复用之前的计算,使得推理效率较低。 从困惑度等标准指标来看,离散扩散模型的质量仍落后于自回归方法,也进一步限制了其应用范围。
3/25/2025 9:04:12 AM
新智元

DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑

昨晚,DeepSeek-V3悄然升级! 新模型版本为DeepSeek-V3-0324,参数量为6850亿,相较上个版本参数增幅不大(6710亿)。 从发布时间和技术特点来看,DeepSeek-V3-0324,很可能是DeepSeek-R2的基础架构。
3/25/2025 9:03:00 AM
新智元

用 OpenCV 实现图像识别的十个基础算法

一、OpenCV简介与图像读写基础1. OpenCV是什么? OpenCV 是一个强大的计算机视觉库,广泛用于图像和视频处理。
3/25/2025 8:30:00 AM
手把手PythonAI编程

Vibe Coding 来了——但你准备好应对 Vibe 故障处理了吗?

译者 | 刘汪洋审校 | 重楼想象一下,完全沉浸在编程氛围中,甚至忘记了代码的存在。 不用敲键盘,只需让 Cursor 和 Sonnet 帮你搞定一切。 遇到 bug 时,你不去排查问题,而是把错误信息丢给大语言模型(LLM )然后复制粘贴修复方案。
3/25/2025 12:08:00 AM
刘汪洋

击败思维链(CoT),草稿链(CoD)称王!推理成本降低近94%,低时延,准确率更高!

编辑 | 言征作者 | Ashish Bamania出品 | 51CTO技术栈(微信号:blog51cto)推理 LLM 是当今 AI 研究中的热门话题。 我们从 GPT-1 开始,一直到像 Grok-3 这样的高级推理器。 这段旅程非常了不起,一路上发现了一些非常重要的推理方法。
3/24/2025 1:45:56 PM
言征

Perplexity CEO泼冷水:Agent 2025落地不靠谱!下月将推出自研浏览器——目前构建通用智能体的唯一方法!

整理 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)刚刚,AI搜索独角兽Perplexity的CEO在采访中给Agent浇了盆冷水! 不同于奥特曼等人的乐观论调。 Aravind直言不讳:任何说Agents今年可用的言论都很可疑。
3/24/2025 1:33:47 PM
伊风

三种RAG部署方案:自购GPU硬件 vs 大模型一体机 vs 云端GPU

春节以后这一个半月,算了下我前后也做了 20 的企业知识库落地咨询,其中无论是线上还是线下,被问到最多的一个问题是:要快速落地本地部署的知识库,应该购买什么硬件? 要回答这个问题,其实需要明确很多前置定语,自购 GPU 硬件、大模型一体机、以及选择云端 GPU 都有各自适用的情形。 这篇试图说清楚三种部署方式的主要特点对比,并在文末给些选择建议参考。
3/24/2025 1:17:11 PM
韦东东

AI 写代码=安全危机?第一声“警哨”已吹响

作者 | 腾讯AI编程安全-啄木鸟团队团队介绍:专注AI编程场景下的安全研究与解决方案,让AI输出的每一行代码,都经得起安全考验。 一、AI时代带来编程新变革因为AI编程工具的诞生,代码的诞生方式正在经历一场看不见的变革。 Anthropic 公司(产品:Claude )的 CEO —— Dario Amodei 近日发表看法:一年内,所有代码都将由AI生成。
3/24/2025 1:00:00 PM
腾讯技术工程

为什么批判性思维是应对即将到来的Deepfake海啸的最佳武器

这些内容并不全是“深度伪造”(deepfake),后者特指设计得极具误导性的内容。 近年来,我们看到深度伪造被用于操纵选举、实施欺诈和盗窃,以及未经他人同意制作色情图片。 随着AI工具变得更加强大和易获取,这些问题只可能会愈演愈烈。
3/24/2025 11:07:50 AM
Bernard Marr

AI将使勒索软件更加危险

相比之下,在安全专家中,只有29%的人表示他们对勒索软件攻击做了非常充分的准备——这表明在准备程度上存在显著差距(29%),凸显了采取更强大安全措施的必要性。 安全领导者对暴露管理的深刻理解网络安全需要采取一种更先进、更灵活的方法,这种方法要考虑到业务风险与回报之间的权衡,而不仅仅是单纯关注绝对保护。 在复杂的环境中,暴露管理为管理和减轻风险提供了更有效的解决方案。
3/24/2025 11:04:01 AM
D1net编译

关于LLMs 复读机问题

今天来看一个关于LLMs复读机问题的详细介绍,主要从定义、出现复读机问题的原因和怎么解决三个方面来介绍:1、什么是 LLMs 复读机问题? LLMs 复读机问题:字符级别重复:指大模型针对一个字或一个词重复不断生成。 例如在电商翻译场景上,会出现“steckdose steckdose steckdose steckdose steckdose steckdose steckdose steckdose...”;语句级别重复:大模型针对一句话重复不断生成。
3/24/2025 11:01:41 AM
Goldma

来了!十个构建Agent的大模型应用框架

随着生成式人工智能(GenAI)的蓬勃发展,基于大型模型的应用已经悄然融入我们的日常工作和生活,它们在诸多领域中显著提升了生产力和工作效率。 为了更便捷地构建这些基于大模型的应用程序,开源社区和产品开发者们正以前所未有的速度进行创新。 在这些创新中,面向智能体(Agent)的应用,即所谓的Agentic AI,已经崭露头角,成为近年来生成式AI系统中最具潜力的明星。
3/24/2025 10:55:18 AM
曹洪伟

让 AI 听懂你的语言:DeepSeek 提示词技巧介绍

在生成式AI技术飞速发展的今天,提示词(prompt)已成为人机交互的核心接口。 DeepSeek作为领先的智能对话系统,其输出质量直接取决于提示词的编写水平。 数据显示,专业优化的提示词可将回答准确率提升60%以上。
3/24/2025 10:37:15 AM
Python数智工坊