资讯列表

分类

标签

开源模型逆袭：Databricks TAO 技术微调 Llama 超越 GPT-4o

近日，数据智能公司 Databricks 推出了一种全新的大语言模型微调方法 ——TAO（Test-time Adaptive Optimization），这一技术的出现为开源模型的发展带来了新的希望。通过运用无标注数据和强化学习，TAO 不仅在降低企业成本方面表现出色，更是在一系列基准测试中取得了令人瞩目的成绩。根据科技媒体 NeoWin 的报道，TAO 微调后的 Llama3.370B 模型在金融文档问答和 SQL 生成等任务中，展现出了优于传统标注微调方法的性能，甚至逼近了 OpenAI 的顶级闭源模型。

3/27/2025 2:39:00 PM AI在线

淘宝全平台启动AI假图治理严厉打击利用AI假图欺骗消费者等行为

近日，淘宝宣布自即日起正式在全平台范围内启动AI假图治理行动，旨在严厉打击利用AI技术生成的欺骗性图片误导消费者、侵害原创品牌商家合法权益的违规行为。随着电商行业的快速发展，AI生成的欺骗性图片逐渐成为行业面临的新挑战。这些看似精美却与实际商品严重不符的AI假图，在各平台上泛滥成灾，不仅误导了消费者的购物决策，降低了购物体验，还进一步助长了不良商家山寨、跨平台抄款、盗图等违法行为，严重侵害了原创品牌和商家的合法权益，对整个行业环境造成了恶劣影响。

3/27/2025 2:02:00 PM AI在线

法院允许《纽约时报》对 OpenAI 的版权诉讼继续进行

在近日的一场法律争斗中，OpenAI 公司的请求被驳回，法院决定允许《纽约时报》对其提起的版权诉讼继续进行。此案的核心是《纽约时报》指控 OpenAI 在未获得许可和支付的情况下，使用了其内容。美国纽约南区法院的法官西德尼・斯坦（Sidney Stein）在一份命令中，尽管缩小了诉讼的范围，但仍然允许主要的版权侵权指控继续进行。

3/27/2025 1:58:00 PM AI在线

Claude 3.7 Sonnet AI 被曝将祭出上下文窗口 50 万 tokens 杀手锏

科技媒体 testingcatalog 昨日（3 月 26 日）发布博文，报道称 AI 公司 Anthropic 正计划“扩容”Claude 3.7 Sonnet 模型，将其上下文窗口将从 20 万 token 跃升至 50 万 token，将刷新行业新纪录。

3/27/2025 1:43:39 PM 故渊

Agent太火！看这一篇综述，知识就不会学杂了丨华东师大&东华大学出品

火，Agent可太火了！关于Agent的进展俯拾皆是，根本看不过来……看过来——这篇综述可能能帮你厘清很多问题：来自华东师大和东华大学的研究团队发表了“A Survey on the Optimization of Large Language Model-based Agents（大模型智能体的优化方法综述）”，首次从系统化视角对LLM智能体优化策略进行了全面梳理与分析。论文将将现有方法划分为两大类：参数驱动的优化与参数无关的优化。

3/27/2025 1:30:57 PM 量子位

造手机的vivo，进军机器人了

下一场科技浪潮已经开始了。刚过去不久的「AI 超级碗」英伟达 GTC 大会上，黄仁勋把「物理 AI」放在了 AI 发展的最高点上，引发了人们的又一轮讨论。老黄说，AI 的下一个发展方向就是机器人。

3/27/2025 1:29:00 PM 机器之心

OpenAI最新官宣：Agent SDK支持MCP协议

OpenAI 也开始支持 MCP 了。这条消息由奥特曼亲自官宣：「人们非常喜欢 MCP，我们也很高兴在我们的产品中增加对它的支持。今天我们已经在 Agent SDK 中支持 MCP，对 ChatGPT 桌面应用以及 Responses API 的支持也即将到来！

3/27/2025 1:26:00 PM 机器之心

这AI绝对偷了格莱美奖杯！直接把LLaMA喂成乐坛顶流：开源版Suno来了！

家人们震惊了！现在 AI 成精啦，不仅能写能画，现在连唱功都是格莱美级的了！魅惑空灵电音女声，也太好听了吧！

3/27/2025 1:24:00 PM 机器之心

7B模型搞定AI视频通话，阿里最新开源炸场，看听说写全模态打通，开发者企业免费商用

深夜重磅！阿里发布并开源首个端到端全模态大模型——通义千问Qwen2.5-Omni-7B，来了。仅靠一个一体式模型，就能搞定文本、音频、图像、视频全模态，并实时生成文本和自然语音。

3/27/2025 1:23:39 PM 量子位

2025苹果AI学者名单公布，黄子琪、孔令东、北大吉嘉铭、清华顾煜贤等12位年轻华人入选

刚刚，苹果机器学习研究中心（Apple Machine Learning Research）正式公布了 2025 年 AI（人工智能）、ML（机器学习）领域获得博士生奖学金的「苹果学者」名单。今年共有 21 位年轻学者获得了苹果学者计划的资助，华人占了一半多。苹果博士奖学金旨在奖励和支持计算机科学与工程领域极具潜力的博士研究生开展研究，每年颁发一次，今年已是第六年。

3/27/2025 1:02:21 PM 机器之心

阿里版“Her”上线即开源！7B模型太全能了，全面击败Gemini-1.5-pro！所有用户都能试玩！

出品 | 51CTO技术栈（微信号：blog51cto）Qwen Chat上新实时语音聊天视频聊天了！可以像打电话或视频通话一样与AI进行聊天，Qwen也有自己的Her了。更更重要的是，一向大方开源的千问，直接开源了背后的模型 Qwen2.5-Omni-7B（ Apache 2.0 许可），并发布了详细的技术报告！

3/27/2025 12:30:36 PM

DeepSeek上线次月月活用户达1.8亿，AI大模型应用增长迅猛

在当今数智化时代，人工智能（AI）技术的飞速发展正深刻改变着我们的生活和工作方式。尤其是AI大模型的应用，正成为互联网行业增长的新引擎。根据QuestMobile发布的最新数据，AI大模型的应用呈现出迅猛的增长态势，其中DeepSeek APP的表现尤为引人注目，其上线次月的活跃用户规模就突破了1.8亿大关。

3/27/2025 12:27:13 PM

长视频理解新突破！Mamba混合架构让显存消耗腰斩，处理10万视频token不费力

Mamba混合架构视频模型来了，不再对视频token进行压缩——而是通过改进模型架构设计的方式提升模型在训练及推理预填充阶段处理视频token的效率。图片滑铁卢大学陈文虎团队与多伦多大学、零一万物、向量学院以及M-A-P的研究人员提出了一种新的Mamba-Transformer混合模型Vamba。图片通过大量实验验证，研究团队发现Vamba在同等硬件条件下可处理的视频帧数较传统Transformer架构提升4倍，训练内存消耗降低50%以上，并且可实现单步训练速度的翻倍。

3/27/2025 12:20:25 PM

AI Infra的起飞前夜，跟两位创业者聊了两小时，从DeepSeek的中国朋友圈，到AI基建演进的价值铁律：流量重赏下的勇夫

作者 | 云昭嘉宾 | 黄新平、谭中意出品 | 51CTO技术栈（微信号：blog51cto）“人生不无聊，有太多变化，太多好玩的事情发生。 ”的确，近期围绕DeepSeek的新发布实在太多了，乱花渐欲迷人眼。从春节期间企业抢先宣布接入DeepSeekR1、继而接入满血版R1，到DeepSeek一体机的出圈，再到国民应用微信的接入，潮潮迭起。

3/27/2025 12:15:44 PM 云昭

神经形态计算：从实验室原型到产业变革的前夜

编辑 | matrix数十年来，科研人员一直致力于构建类脑计算机硬件，但这一领域尚未迎来真正的突破性进展。如今，领先的研究者认为，构建首个能解决实际问题的规模化神经形态设备的时机已然成熟。从仿生启发的潜力到技术深层的差异近年来推动人工智能进步的神经网络技术，虽从大脑中获得灵感，但其算法和硬件与生物神经元存在本质差异。

3/27/2025 12:01:00 PM ScienceAI

外媒：英伟达将收购贾扬清创业公司Lepton AI，交易价值数亿美元

又一家 AI 大佬的创业公司被巨头收购了。据外媒 The Information 报道，英伟达即将达成收购知名 AI 创业公司 Lepton AI 的交易。 Lepton AI 是一家为 AI 时代构建新型基础设施的公司，由贾扬清（Yangqing Jia）等人创立。

3/27/2025 12:01:00 PM 机器之心

参数仅需12万分之一，训练只需2块GPU，MIT、哈佛推出生物序列建模新方法Lyra

编辑 | 白菜叶卷积神经网络（CNN）和 Transformer 等深度学习架构通过捕捉局部和长距离依赖关系，显著推进了生物序列建模。然而，它们在生物学环境中的应用受到高计算需求和对大数据集的需求的限制。麻省理工学院、哈佛大学和卡内基梅隆大学等机构的研究人员提出了 Lyra，这是一种用于序列建模的次二次架构，它基于上位性的生物学框架，用于理解序列与功能之间的关系。

3/27/2025 12:00:00 PM ScienceAI

把MLA和稀疏激活带到端侧！港科大广州和伦敦大学学院团队联合发布软硬协同设计的边缘语言模型PLM

本文由 PLM 团队撰写，PLM 团队是由香港科技大学（广州）的校长倪明选教授，伦敦大学学院（UCL）AI 中心汪军教授，香港科技大学（广州）信息枢纽院长陈雷教授联合指导。第一作者邓程是香港科技大学（广州）的研究助理，研究方向为端侧大模型和高效模型推理；参与成员包括中科院自动化所的孙罗洋博士，曾勇程博士，姜纪文硕士，UCL 吴昕键，港科大广州的博士生肖庆发和赵文欣，港科大的博士后王嘉川以及香港理工的助理教授（研究）李昊洋。通讯作者为邓程博士，陈雷教授和汪军教授。

3/27/2025 11:59:00 AM 机器之心

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

资讯列表

开源模型逆袭：Databricks TAO 技术微调 Llama 超越 GPT-4o

淘宝全平台启动AI假图治理 严厉打击利用AI假图欺骗消费者等行为

​法院允许《纽约时报》对 OpenAI 的版权诉讼继续进行

Claude 3.7 Sonnet AI 被曝将祭出上下文窗口 50 万 tokens 杀手锏

Agent太火！看这一篇综述，知识就不会学杂了丨华东师大&东华大学出品

造手机的vivo，进军机器人了

OpenAI最新官宣：Agent SDK支持MCP协议

这AI绝对偷了格莱美奖杯！直接把LLaMA喂成乐坛顶流：开源版Suno来了！

7B模型搞定AI视频通话，阿里最新开源炸场，看听说写全模态打通，开发者企业免费商用

2025苹果AI学者名单公布，黄子琪、孔令东、北大吉嘉铭、清华顾煜贤等12位年轻华人入选

阿里版“Her”上线即开源！7B模型太全能了，全面击败Gemini-1.5-pro！所有用户都能试玩！

DeepSeek上线次月月活用户达1.8亿，AI大模型应用增长迅猛

长视频理解新突破！Mamba混合架构让显存消耗腰斩，处理10万视频token不费力

AI Infra的起飞前夜，跟两位创业者聊了两小时，从DeepSeek的中国朋友圈，到AI基建演进的价值铁律：流量重赏下的勇夫

神经形态计算：从实验室原型到产业变革的前夜

外媒：英伟达将收购贾扬清创业公司Lepton AI，交易价值数亿美元

参数仅需12万分之一，训练只需2块GPU，MIT、哈佛推出生物序列建模新方法Lyra

把MLA和稀疏激活带到端侧！港科大广州和伦敦大学学院团队联合发布软硬协同设计的边缘语言模型PLM

淘宝全平台启动AI假图治理严厉打击利用AI假图欺骗消费者等行为

法院允许《纽约时报》对 OpenAI 的版权诉讼继续进行