AI在线 AI在线

理论

清华稀疏Attention,无需训练加速一切模型!

在当今各类大语言模型以及视频模型中,长序列场景越来越普遍,而 Attention 的计算复杂度随着序列长度呈平方增长,成为长序列任务下的主要计算瓶颈。 此前,清华大学陈键飞团队提出的即插即用量化的 SageAttention 系列工作已实现 3 倍加速于 FlashAttention,且在各类大模型上均保持了端到端的精度,已被业界和社区广泛使用。 为了进一步加速 Attention,清华大学陈键飞团队进一步提出了无需训练可直接使用的稀疏 Attention(SpargeAttn)可用来加速任意模型。
3/27/2025 9:47:23 AM
机器之心

阿里深夜开源Qwen2.5-Omni,7B参数完成看、听、说、写

3 月 27 日凌晨,阿里通义千问团队发布 Qwen2.5-Omni。 这是 Qwen 系列中全新的旗舰级多模态大模型,专为全面的多模式感知设计,可以无缝处理包括文本、图像、音频和视频的各种输入,同时支持流式的文本生成和自然语音合成输出。 从此以后,你可以像打电话或进行视频通话一样与 Qwen 聊天!
3/27/2025 9:40:59 AM
机器之心

Spring AI + Ollama 实现 deepseek-r1 的API服务和调用

兄弟们,今天咱来聊聊一个超有意思的技术组合 ——Spring AI Ollama 实现 deepseek - r1 的 API 服务和调用。 咱都知道,人工智能这几年那可是火得一塌糊涂,各种大模型你方唱罢我登场。 deepseek - r1 就是其中一个挺厉害的模型,那怎么把它用起来,让它为咱们的项目服务呢?
3/27/2025 9:34:42 AM
儒猿团队

Stable Diffusion变身3D神器!一个LoRA将2D图像转3D模型

在Stable Diffusion当中,只需加入一个LoRA就能根据图像创建3D模型了? 港科大(广州)与趣丸科技合作推出了全新三维生成大模型——Kiss3DGen,创新性地将3D生成与成熟的图像生成模型进行了对齐。 并且与主流2D扩散模型技术(如ControlNet、Flux-Redux)兼容协同,无需额外训练即可即插即用。
3/27/2025 9:26:30 AM
量子位

轨迹可控视频生成新范式,复旦微软破解视频生成难题,精准控制任意物体运动

轨迹可控的视频生成来了,支持三种不同级别的轨迹控制条件——分别为掩码、边界框和稀疏框。 近年来,视频生成技术快速发展,显著提升了视频的视觉质量与时间连贯性。 在此基础上,(trajectory-controllable video generation)涌现了许多工作,使得通过明确定义的路径精确控制生成视频中的物体运动轨迹成为可能。
3/27/2025 9:24:16 AM
量子位

人形机器人优雅漫步,强化学习新成果!独角兽Figure创始人:之前大家吐槽太猛

注意看,机器人像人一样从容地走出大门了! 甚至,还有一整支机器人队伍迎面走来。 人形机器人独角兽Figure,再次带来他们的新成果——利用强化学习实现自然人形行走。
3/27/2025 9:19:57 AM
量子位

突发!英伟达收购贾扬清新创业的Lepton AI

出品 | 51CTO技术栈(微信号:blog51cto)刚刚,有外媒曝出英伟达即将收购成立两年的 AI 创业公司 Lepton AI。 Lepton AI 的创始人是AI圈内知名人士贾扬清。 据悉这笔收购交易的金额是数亿美元。
3/27/2025 8:50:38 AM

关于智能体 Agent 的实现技术之思维链和函数调用 (function call) 的思考

Agent技术也被业界称为智能体技术,本质上是使得大模型具备独立思考和解决问题的能力;被广泛应用于各种应用场景,而且也被称为是实现通用人工智能的一种技术手段。 但在此之前对于智能体的理解比较肤浅,而今天突然发现原来智能体没我们想象中的那么简单,也没想象中的那么复杂。 今天我们就从Agent的两个实现技术之思维链和函数调用来重新理解智能体。
3/27/2025 8:10:00 AM
AI探索时代

网络犯罪分子利用11种方式使网络钓鱼比以往更有危害力

网络犯罪分子正在改变其社交攻击的欺诈手段,以提高真实性,更好地绕过过滤器,并更有针对性地瞄准潜在受害者。 网络钓鱼一直是安全漏洞的主要来源——这一重大问题,尽管经过了多年的安全意识培训,但至今仍是网络安全方面的首要关注点。 不过,由于战术的改进和AI技术的恶意再利用,这种长期存在的社交攻击手段不断演变,网络犯罪分子正在寻找新的方法来诱骗用户点击恶意链接。
3/27/2025 8:00:00 AM
John Leyden

随着AI大模型和MCP生态发展,传统低代码平台和RPA类产品还有无出路?

今天准备跟大家聊一下随着AI大模型和MCP协议生态的发展,对传统的低代码产品和RPA机器人产品所带来的一些影响。 因为在一年多前我其实就聊过这个话题,但是最近一年的时间AI大模型、AI编程、AI智能体,包括最近的MCP协议生态的发展太快了,导致原来我们对这两个产品的影响分析会出现一些变化。 低代码平台影响分析首先我们先讲一下低代码,大家都知道其实低代码平台的产品,它的本质仍然是辅助我们编程,仍然是可能会生成源代码或者是生成低代码产品模板引擎能够解析的元数据。
3/27/2025 5:00:00 AM
何明璐

星辰与代码:DeepSeek的发展历程

技术突破阶段2024 年,DeepSeek 强势开启生态扩张与技术爆发的新纪元,成为全球 AI 领域瞩目的焦点。 年初 1 月,DeepSeek 便以 DeepSeek-MoE 震撼登场,创新性架构设计以仅 60% 的计算量损耗,成功超越 Llama 2-7B 性能,为后续技术突破奠定坚实基础,在模型效率优化上迈出关键一步。 紧接着 2 月,DeepSeekMath 在 MATH 基准测试中表现惊艳,成绩飙升至 51.7%,无限逼近 GPT-4 水平,数学推理能力实现质的飞跃,极大提升了模型在复杂数学问题求解上的可靠性与精准度。
3/27/2025 3:50:00 AM
小牛呼噜噜

LLM中的分块技术:原理、应用与展望

在大语言模型(LLM)飞速发展的当下,分块技术(Chunking)(RAG 中的分块策略:从基础到前沿的全面剖析)作为提升模型性能的关键手段,受到了广泛关注。 它在优化信息处理、提高检索效率、增强模型理解能力等方面发挥着不可或缺的作用。 深入探究 LLMs 中的分块技术,对于推动自然语言处理(NLP)领域的发展具有重要意义。
3/27/2025 2:50:00 AM
大模型之路

一文详尽大型语言模型的四种量化技术

大型语言模型(比如ChatGPT背后的技术)确实非常"庞大"——这不仅指它们的能力,更直接体现在它们的体积上。 一个中等规模的模型就可能占用几十GB的内存,相当于几百部高清电影的大小。 对于普通开发者、个人研究者或初创公司来说,这样的资源需求无疑是一道难以跨越的门槛。
3/27/2025 2:44:00 AM
云朵君

重磅发布!ChatGPT ImageGen “Shiba” 震撼来袭:你从未见过的强大AI图像生成模型!

引言期待已久的ChatGPT ImageGen终于迎来重大更新! 代号为“Shiba”的全新模型正式发布,而我可以毫不犹豫地说,这绝对是我目前为止使用过的最强大的AI图像生成工具! 无论是在Prompt理解、生成质量,还是在文字排版、编辑能力和角色一致性等方面,“Shiba”都展现出了前所未有的卓越性能,可以说是全面碾压!
3/27/2025 12:04:33 AM
深海幽光

解码衰老时钟:深度学习揭示大脑衰老速度与认知功能衰退的关联

编辑 | 2049人脑的衰老速度与认知衰退、神经退行性疾病风险密切相关。 然而,传统脑龄(Brain Age,BA)模型仅能反映从出生到检测时间点的累积衰老效应,无法捕捉近期或动态的衰老速率。 这一问题在阿尔茨海默病(AD)等神经退行性病变的早期预警中尤为突出。
3/26/2025 2:11:00 PM
ScienceAI

活性提升65倍,山大新AI工具定向进化高活性酶,外部数据集验证成功率达80%

编辑丨&准确预测酶动力学参数对于酶的探索和修饰至关重要,但现有模型面临过拟合导致准确率低或泛化能力差的问题。 以山东大学为主导的团队提出了一种基于预训练模型和分子指纹的深度学习模型 CataPro ,并用它来预测转换数(k(cat))、米歇尔常数(K(m))和催化效率(k(cat)/K(m))。 与以前的基线模型相比,CataPro 在无偏数据集上表现出明显增强的准确性和泛化能力。
3/26/2025 2:10:00 PM
ScienceAI

88%的AI试点未能投入生产,究竟为何?

许多AI的概念验证(POC)项目因目标不明确、数据准备不足以及缺乏内部专业知识而失败。 同样,过于激进的概念验证批准以及来自高层的误导性压力也是导致失败的原因。 概念验证已成为CIO的AI战略的关键组成部分,它提供了一种低风险的方式来测试AI用例,而无需全面投入。
3/26/2025 11:40:28 AM
Evan Schuman

AI巨头画饼被戳穿!研究员警告:比起专注开发诺奖级AI,取代白领工作更有利可图!智能体搞定搜索和办公软件,人类面临数十年漫长过渡

许多AI大佬都给我们画过同样的饼——AI可以成为科学家。 不仅如此,根据他们的说法:诺奖级AI近在眼前,届时所有的研发工作将被自动化,世界也会因为各种科学突破变得愈发繁荣和美好。 OpenAI奥特曼曾表示,AI 可能会像晶体管一样,成为一种可广泛扩展并渗透到经济各个角落的重大突破。
3/26/2025 11:27:37 AM