理论
模态编码器 | 超强开源CLIP模型OpenCLIP
来自LAION、UC伯克利、HuggingFace等的工作,这篇工作的研究动机也很简单,CLIP 模型在多模态领域展现出了巨大潜力,但原始 CLIP 模型未完全开源,限制了其更广泛的应用和深入研究。 OpenCLIP 旨在通过开源的方式,让更多开发者能够无门槛地利用这一先进模型,推动多模态技术在各个领域的应用和发展。 模型架构和原始CLIP无异,下面简单介绍这篇工作中的一些研究规律和实验结果。
4/8/2025 4:20:00 AM
Goldma
AI问答的核心!知识图谱:突破传统 RAG 的天花板
看似简单的 AI 问答系统,背后却隐藏着无数技术难题。 当我们询问"组件 A 与组件 B 有什么区别"这样的问题时,传统检索增强生成(RAG)系统往往会犯难。 它们就像只会做加法的计算器,遇到了需要乘除法的复杂方程...传统 RAG 的三大痛点传统 RAG 技术已成为 AI 应用的标配,但它面临三个根本性挑战:信息孤岛:文档被切分成互不相关的小块,丢失了上下文联系视野局限:只能基于文本相似度检索,无法理解概念间的逻辑关系推理能力缺失:无法像人类那样进行跨文档的综合分析例如,你问系统:"A组件和B组件有什么区别?
4/8/2025 3:45:00 AM
大数据AI智能圈
Llama 4发布36小时差评如潮!匿名员工爆料拒绝署名技术报告
Meta最新基础模型Llama 4发布36小时后,评论区居然是这个画风:失望,非常失望不知道他们后训练怎么搞的,总之不太行在[各种测试]2中失败……还被做成表情包调侃,总结起来就是一个“差评如潮”。 具体来看,大家的抱怨主要集中在代码能力。 最直观的要数经典“氛围编程”小球反弹测试,小球直接穿过墙壁掉下去了。
4/8/2025 3:44:00 AM
大模型部署工具 Ollama 使用指南:技巧与问题解决全攻略
一、Ollama 是什么? Ollama 是一个开源的本地大模型部署工具,旨在简化大型语言模型(LLM)的运行和管理。 通过简单命令,用户可以在消费级设备上快速启动和运行开源模型(如 Llama、DeepSeek 等),无需复杂配置。
4/8/2025 3:22:00 AM
wayn
模态编码器 | 最强CLIP模型EVA-CLIP-18B
来自智源王鑫龙团队的工作,将EVA-CLIP模型参数扩展至18B,简单看下结果,EVA-CLIP-18B性能远超其他模型。 项目地址:。 首先,随着大型语言模型(LLMs)参数量的增长至千亿级别,与其配套的视觉基础模型却未能同步扩展,这种不对等限制了多模态应用的整体效能。
4/8/2025 3:00:00 AM
Goldma
Meta LLaMA 4:对抗 GPT-4o 与 Claude 的开源王牌
2025 年 4 月,Meta 正式发布了 LLaMA 4 系列的首批两款模型。 这两款模型模型分别是:LLaMA 4 Scout 与 LLaMA 4 Maverick,均采用了 专家混合架构(Mixture-of-Experts, MoE)。 据 Meta 表示,这是首次有 LLaMA 模型实现 文字与图像的统一处理能力,具备真正意义上的多模态理解。
4/8/2025 2:26:00 AM
LLM幻觉,竟因知识「以大欺小」!华人团队祭出对数线性定律与CoDA策略
大语言模型(LLMs)已经彻底改变了AI,但「幻觉」问题如影随从,堪称LLM癌症。 LLM会一本正经、义正辞严的捏造事实,「脸不红,心不跳」地说谎。 「幻觉」被普遍认为与训练数据相关。
4/8/2025 2:22:00 AM
新智元
比DeepSeek更惊艳,生成式决策如何让机器人拥有创造力?
当传统机器人遇见生成式AI,会擦出什么样的火花? 技术的演进从不停滞。 如今,我们正处在具身智能发展的关键节点,生成式决策技术正悄然改变着这个领域的游戏规则。
4/8/2025 2:00:00 AM
大数据AI智能圈
改变世界的十大算法
在当今这个数字化时代,算法已经成为推动世界运转的核心力量。 它们如同隐藏在幕后的魔术师,用精密的逻辑和数学原理塑造了现代生活的方方面面。 从我们每天使用的智能手机,到支撑全球金融体系的复杂网络,算法无处不在。
4/8/2025 1:11:00 AM
大道至简
五年复合增长率达35.2%!2028年中国AI总投资规模将超千亿美元
IDC发布的《全球人工智能和生成式人工智能支出指南》(IDC Worldwide AI and Generative AI Spending Guide)显示,2024年全球人工智能(AI) IT总投资规模为3158亿美元,预计2028年增至8159亿美元,五年复合增长率为32.9%。 其中,生成式AI市场五年复合增长率或达63.8%,到2028年其市场规模将达2842亿美元,占AI市场投资总规模的35%。 聚焦中国,IDC数据显示,中国将继续引领亚太地区人工智能市场发展,占亚太地区人工智能总支出超五成。
4/8/2025 1:00:00 AM
谷歌研究:合成数据使大模型数学推理能力提升八倍
最近,来自谷歌、卡内基梅隆大学和 MultiOn 的联合研究团队发表了一项关于合成数据在大型模型训练中应用的新研究。 据专注于人工智能发展的研究机构 Epoch AI 报告显示,目前全球约有 300 万亿个公开可用的高质量文本训练标记。 然而,随着类似 ChatGPT 这样的大模型的迅猛发展,对训练数据的需求呈指数级增长,预计到 2026 年之前,这些数据将被耗尽。
4/8/2025 12:40:00 AM
远洋
OpenAI宣布GPT-5推迟数月发布 技术整合难度成倍上升
OpenAI 首席执行官萨姆·奥特曼(Sam Altman)近日通过社交媒体宣布,GPT-5 的发布计划将推迟,预计在未来几个月内正式推出。 此前,OpenAI 计划在 2025 年初发布 GPT-5,但最终决定延后,以便将该模型做得比预期更好。 奥特曼表示,推迟发布的原因是 GPT-5 的能力远超预期,整合所需资源和生态准备超出了当前可控范围。
4/8/2025 12:20:00 AM
三年内拿下10%的赛道份额,用AI撬动技术人才招聘的百亿缺口,万码优才做对了什么
“我想我们是在红海里找到了蓝海”。 在众多涌入AI赛道逐梦的创客中,周媛绝对是非常特别的一位——创业之前,她在HRBP架构中担任COE,创业后,作为CEO的她,在一片红海的招聘领域中闯出了另一番洞天。 三年前,ChatGPT引爆的AI变革山雨欲来,周媛想要做一款AI驱动的招聘产品的念头愈发强烈:“我意识到再不转型可能要被AI替代掉了”。
4/7/2025 1:30:34 PM
李美涵
Llama 4训练作弊爆出惊天丑闻!AI大佬愤而辞职,代码实测崩盘全网炸锅
Meta前脚刚发Llama 4,后脚就有大佬请辞了! 一亩三分地的爆料贴称,经过反复训练后,Llama 4未能取得SOTA,甚至与顶尖大模型实力悬殊。 为了蒙混过关,高层甚至建议:在后训练阶段中,将多个benchmark测试集混入训练数据。
4/7/2025 1:24:52 PM
新智元
反向传播、前向传播都不要,这种无梯度学习方法是Hinton想要的吗?
「我们应该抛弃反向传播并重新开始。 」早在几年前,使反向传播成为深度学习核心技术之一的 Geoffrey Hinton 就发表过这样一个观点。 而一直对反向传播持怀疑态度的也是 Hinton。
4/7/2025 1:22:00 PM
机器之心
Agent不会在2025爆发
作者 | 云昭大模型已经在聚光灯下狂奔了28个月,时至今日,Agent已经被成为了包括黄仁勋、奥特曼、李彦宏、周鸿祎、吴泳铭等一众科技大佬在内备受期待的2025爆发品。 可正如不久前“朱啸虎不太看好机器人赛道”一般,Agent赛道同样也存在着一场泡沫之下的非共识。 1.巨头争相较量,市场异常冷谈我们先从企业内部的Agent来看下。
4/7/2025 1:17:49 PM
云昭
自我修复数据管道:数据工程的下一件大事?
译者 | 李睿审校 | 重楼梅西百货公司首席数据工程师Naresh Erukulla是一位勇于迎接挑战的数据工程师,他擅长用简洁明了的概念验证(POC)解决各种问题。 最近,Naresh关注到了数据工程师日常工作中普遍遭遇的一个难题,并为此采取行动,为所有批处理和流数据管道设置了警报系统。 当错误超过阈值或数据管道出现故障时,可以迅速通过电子邮件向数据工程师发送故障通知,确保问题能够得到及时处理。
4/7/2025 11:55:58 AM
李睿
CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo
本文介绍了 FoundationStereo,一种用于立体深度估计的基础模型,旨在实现强大的零样本泛化能力。 通过构建大规模(100 万立体图像对)合成训练数据集,结合自动自筛选流程去除模糊样本,并设计了网络架构组件(如侧调谐特征主干和远程上下文推理)来增强可扩展性和准确性。 这些创新显著提升了模型在不同领域的鲁棒性和精度,为零样本立体深度估计设立了新标准。
4/7/2025 9:45:00 AM
机器之心
资讯热榜
量大管饱!我整理了10个好用到爆的即梦4.0进阶玩法
AI 数据版权新纪元:Real Simple Licensing 协议引发行业关注
ChatGPT能随便连MCP了!对话就能开发票、帮退款…奥特曼的野心毕露:将OpenAI打造成全能型平台!开发者:太危险了不敢用
姚顺雨离职OpenAI,「亿元入职腾讯」传闻引爆AI圈,鹅厂辟谣了
狠人研究公开!ChatGPT底层记忆系统终于被逆向了!没有RAG!用户设备信息、使用习惯统统存下来,用户知识记忆是新的研究热点!
加州州议会通过AI伴侣聊天机器人监管法案,旨在保护未成年人
聚焦结构化注意力,探索提升多模态大模型文档问答性能
支付宝推出全国第一个智能体支付服务“AI付”
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
智能体
Gemini
AI新词
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
工具
计算
Sora
GPU
华为
大语言模型
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
编程
神器推荐
DeepMind
亚马逊
特斯拉
AI模型