理论
32B本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强
就在DeepSeek-V3更新的同一夜,阿里通义千问Qwen又双叒叕一次梦幻联动了——发布Qwen2.5-VL-32B-Instruct。 此前开源家族视觉语言模型Qwen2.5-VL包括3B、7B和72B三种尺寸。 这一次的32B版本进一步兼顾尺寸和性能,可在本地运行。
3/25/2025 9:24:05 AM
量子位
AI引爆全美失业潮,12个月内接管所有代码!3亿岗位被取代,70%职业大换血
AI,正在改变生活。 LinkedIn的新研究显示,很大程度上因为AI,到2030年,大多数职业的70%技能将发生变化。 然而,更大的AI的冲击或许就要到来:AI永久性地改变就业市场,并带来大规模失业。
3/25/2025 9:12:53 AM
新智元
美国恐惧:冷战2.0将至,中国开源模型大爆炸临近!LeCun:DeepSeek只是卷王副产品
如今,美国已经开始陷入「冷战2.0焦虑」——我们的AI技术,恐怕已经落后于中国了? 甚至AI社区的不少人已经押注:接下来几个月,将有一大波中国开源AI模型的浪潮! 某AI大V如是说:一年前,没有人会预料到,在AI竞赛中,美国竟会被更强大的中国超越。
3/25/2025 9:08:41 AM
新智元
一文看懂多模态思维链
多模态思维链(MCoT)系统综述来了! 不仅阐释了与该领域相关的基本概念和定义,还包括详细的分类法、对不同应用中现有方法的分析、对当前挑战的洞察以及促进多模态推理发展的未来研究方向。 图片当下,传统思维链(CoT)已经让AI在文字推理上变得更聪明,比如一步步推导数学题的答案。
3/25/2025 9:06:11 AM
量子位
Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?
几乎每周都有新的、令人影响深刻的AI工具发布,研究人员纷纷踊跃尝试。 从复杂的数学问题求解,到医学诊断中的精准分析,再到代码编写与论文创作,AI工具展现了巨大的潜力。 但市面上令人眼花缭乱的AI模型,究竟哪一款才是让科研工作者效率起飞的「梦中情模」,能助力科研突破,带来事半功倍的效果呢?
3/25/2025 9:04:55 AM
新智元
爆火Block Diffusion引发LLM架构变革?自回归+扩散模型完美结合
扩散模型被广泛应用于生成图像和视频,并且在生成离散数据(如文本或生物序列)任务上的效果也越来越好,与自回归模型相比,扩散模型有望加速「生成过程」并提高模型输出的「可控性」。 然而,离散扩散模型目前仍然有三个局限性:在聊天系统等应用中,模型需要生成任意长度的输出序列(例如,对用户问题的回答),但大多数现有的扩散架构只能生成固定长度的向量;离散扩散在生成过程中使用双向上下文,因此无法利用键值缓存(KV caching)复用之前的计算,使得推理效率较低。 从困惑度等标准指标来看,离散扩散模型的质量仍落后于自回归方法,也进一步限制了其应用范围。
3/25/2025 9:04:12 AM
新智元
DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑
昨晚,DeepSeek-V3悄然升级! 新模型版本为DeepSeek-V3-0324,参数量为6850亿,相较上个版本参数增幅不大(6710亿)。 从发布时间和技术特点来看,DeepSeek-V3-0324,很可能是DeepSeek-R2的基础架构。
3/25/2025 9:03:00 AM
新智元
用 OpenCV 实现图像识别的十个基础算法
一、OpenCV简介与图像读写基础1. OpenCV是什么? OpenCV 是一个强大的计算机视觉库,广泛用于图像和视频处理。
3/25/2025 8:30:00 AM
手把手PythonAI编程
Vibe Coding 来了——但你准备好应对 Vibe 故障处理了吗?
译者 | 刘汪洋审校 | 重楼想象一下,完全沉浸在编程氛围中,甚至忘记了代码的存在。 不用敲键盘,只需让 Cursor 和 Sonnet 帮你搞定一切。 遇到 bug 时,你不去排查问题,而是把错误信息丢给大语言模型(LLM )然后复制粘贴修复方案。
3/25/2025 12:08:00 AM
刘汪洋
击败思维链(CoT),草稿链(CoD)称王!推理成本降低近94%,低时延,准确率更高!
编辑 | 言征作者 | Ashish Bamania出品 | 51CTO技术栈(微信号:blog51cto)推理 LLM 是当今 AI 研究中的热门话题。 我们从 GPT-1 开始,一直到像 Grok-3 这样的高级推理器。 这段旅程非常了不起,一路上发现了一些非常重要的推理方法。
3/24/2025 1:45:56 PM
言征
Perplexity CEO泼冷水:Agent 2025落地不靠谱!下月将推出自研浏览器——目前构建通用智能体的唯一方法!
整理 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)刚刚,AI搜索独角兽Perplexity的CEO在采访中给Agent浇了盆冷水! 不同于奥特曼等人的乐观论调。 Aravind直言不讳:任何说Agents今年可用的言论都很可疑。
3/24/2025 1:33:47 PM
伊风
三种RAG部署方案:自购GPU硬件 vs 大模型一体机 vs 云端GPU
春节以后这一个半月,算了下我前后也做了 20 的企业知识库落地咨询,其中无论是线上还是线下,被问到最多的一个问题是:要快速落地本地部署的知识库,应该购买什么硬件? 要回答这个问题,其实需要明确很多前置定语,自购 GPU 硬件、大模型一体机、以及选择云端 GPU 都有各自适用的情形。 这篇试图说清楚三种部署方式的主要特点对比,并在文末给些选择建议参考。
3/24/2025 1:17:11 PM
韦东东
AI 写代码=安全危机?第一声“警哨”已吹响
作者 | 腾讯AI编程安全-啄木鸟团队团队介绍:专注AI编程场景下的安全研究与解决方案,让AI输出的每一行代码,都经得起安全考验。 一、AI时代带来编程新变革因为AI编程工具的诞生,代码的诞生方式正在经历一场看不见的变革。 Anthropic 公司(产品:Claude )的 CEO —— Dario Amodei 近日发表看法:一年内,所有代码都将由AI生成。
3/24/2025 1:00:00 PM
腾讯技术工程
为什么批判性思维是应对即将到来的Deepfake海啸的最佳武器
这些内容并不全是“深度伪造”(deepfake),后者特指设计得极具误导性的内容。 近年来,我们看到深度伪造被用于操纵选举、实施欺诈和盗窃,以及未经他人同意制作色情图片。 随着AI工具变得更加强大和易获取,这些问题只可能会愈演愈烈。
3/24/2025 11:07:50 AM
Bernard Marr
AI将使勒索软件更加危险
相比之下,在安全专家中,只有29%的人表示他们对勒索软件攻击做了非常充分的准备——这表明在准备程度上存在显著差距(29%),凸显了采取更强大安全措施的必要性。 安全领导者对暴露管理的深刻理解网络安全需要采取一种更先进、更灵活的方法,这种方法要考虑到业务风险与回报之间的权衡,而不仅仅是单纯关注绝对保护。 在复杂的环境中,暴露管理为管理和减轻风险提供了更有效的解决方案。
3/24/2025 11:04:01 AM
D1net编译
关于LLMs 复读机问题
今天来看一个关于LLMs复读机问题的详细介绍,主要从定义、出现复读机问题的原因和怎么解决三个方面来介绍:1、什么是 LLMs 复读机问题? LLMs 复读机问题:字符级别重复:指大模型针对一个字或一个词重复不断生成。 例如在电商翻译场景上,会出现“steckdose steckdose steckdose steckdose steckdose steckdose steckdose steckdose...”;语句级别重复:大模型针对一句话重复不断生成。
3/24/2025 11:01:41 AM
Goldma
来了!十个构建Agent的大模型应用框架
随着生成式人工智能(GenAI)的蓬勃发展,基于大型模型的应用已经悄然融入我们的日常工作和生活,它们在诸多领域中显著提升了生产力和工作效率。 为了更便捷地构建这些基于大模型的应用程序,开源社区和产品开发者们正以前所未有的速度进行创新。 在这些创新中,面向智能体(Agent)的应用,即所谓的Agentic AI,已经崭露头角,成为近年来生成式AI系统中最具潜力的明星。
3/24/2025 10:55:18 AM
曹洪伟
让 AI 听懂你的语言:DeepSeek 提示词技巧介绍
在生成式AI技术飞速发展的今天,提示词(prompt)已成为人机交互的核心接口。 DeepSeek作为领先的智能对话系统,其输出质量直接取决于提示词的编写水平。 数据显示,专业优化的提示词可将回答准确率提升60%以上。
3/24/2025 10:37:15 AM
Python数智工坊
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用