模型
阿里开源全能视频模型!生成编辑都精通,1.3B版本消费级显卡可跑
业界功能最全、消费级显卡可跑、而且还是开源的? 不卖关子了,这就是阿里最新开源的通义万相Wan2.1-VACE,号称当前业界功能最全的视频生成与编辑模型。 有多全呢?
5/16/2025 9:08:00 AM
个人开发者训400亿参数大模型:分布式算力,DeepSeek架构,3090单卡部署
打破科技巨头算力垄断,个人开发者联手也能训练超大规模AI模型? Nous Research宣布推出Psyche Network,可以将全球算力整合起来训练强大的人工智能。 Psyche是一个基于Deepseek的V3 MLA架构的去中心化训练网络,测试网首次启动时直接对40B参数LLM进行预训练,可以在单个H/DGX上训练,并在3090 GPU上运行。
5/16/2025 9:06:00 AM
梁文锋署名DeepSeek新论文:公开V3大模型降本方法
梁文锋亲自参与的DeepSeek最新论文,来了! 这一次,团队把DeepSeek-V3在训练和推理过程中,如何解决“硬件瓶颈”的方法公布了出来。 具体而言,DeepSeek-V3之所以可以只用2048块H800,就能达到超大规模集群(如数万块GPU)相当的训练效果,核心在于四项创新技术:内存优化多头潜在注意力(MLA)计算优化混合专家模型(MoE)与FP8低精度训练通信优化多层网络拓扑与低延迟设计推理加速多token预测(MTP)那么这四项优化具体又是如何起到作用的,我们继续往下看。
5/16/2025 9:02:00 AM
DeepSeek-V3 发布新论文,揭示低成本大模型训练的奥秘
近日,DeepSeek 团队发布了关于其最新模型 DeepSeek-V3的一篇技术论文,重点讨论了在大规模人工智能模型训练中遇到的 “扩展挑战” 以及与硬件架构相关的思考。 这篇长达14页的论文不仅总结了 DeepSeek 在开发 V3过程中的经验与教训,还为未来的硬件设计提供了深刻的见解。 值得注意的是,DeepSeek 的 CEO 梁文锋也参与了论文的撰写。
5/16/2025 9:00:55 AM
AI在线
Meta 推迟 Behemoth 发布引发内部担忧,股价一度下跌超3%
据最新报道,Meta Platforms 计划推迟其旗舰 AI 模型 Behemoth 的发布。 原定于今年4月发布的 Behemoth,先是被推迟至6月,如今又预计将延迟到2025年秋季甚至更晚。 这一变动引发了公司内部对于 Meta 在 AI 领域数十亿美元投资方向的担忧。
5/16/2025 9:00:55 AM
AI在线
DeepSeek发布最新论文,5大杀手锏让大模型训练、推理暴涨
昨天,全球著名开源大模型平台DeepSeek在huggingface发布了,超强开源模型V3的论文。 主要从硬件架构和模型设计的双视角探讨如何在不牺牲性能的前提下实现更高效的大规模训练和推理以突破硬件瓶颈。 其中,DeepSeek-MoE和多头潜在注意力、FP8混合精度训练以及多标记预测等成为关键创新技术。
5/16/2025 8:58:09 AM
ICML 2025 | 大模型深度思考新范式:交替「推理-擦除」解决所有可计算问题
作者介绍:本文第一作者是丰田工业大学芝加哥 PhD 学生杨晨晓,研究兴趣是机器学习理论和大模型推理,在 ICML,NeurIPS,ICLR 等顶级会议上发表过论文。 本文提出一个交替「推理 - 擦除」的深度思考新范式 PENCIL,比传统 CoT 更高效地解决更复杂的推理任务。 理论上,我们证明 PENCIL 可用最优空间与最优时间下解决所有可计算问题,而这对于传统的 CoT 是不可能的!
5/16/2025 8:44:01 AM
最新总结,不同抽取任务哪个模型最能打
图片在人工智能的浪潮中,多模态大模型(VLM)正以前所未有的速度改变着我们的世界。 从自然语言处理(NLP)到计算机视觉(CV),从大型语言模型(LLM)到检索增强生成(RAG)和智能体(Agent),AI的边界不断被拓展。 而今天,我们将聚焦于一个关键领域——文档结构化抽取,看看12种顶尖的VLM多模态大模型,谁才是真正的强者!
5/16/2025 1:10:00 AM
哎呀AIYA
Poe 报告:可灵大模型视频生成量约占30%份额 领先Runway
近日,全球知名的大模型整合应用平台 Poe 发布了2025年春季 AI 模型使用趋势报告。 报告显示,在文生视频领域,中国的快手可灵多款视频生成模型迅速崛起,已占据了约30% 的市场份额,领先于 Runway 和谷歌的 Veo2。 图源备注:图片由AI生成,图片授权服务商Midjourney特别值得一提的是,可灵2.0模型自今年4月推出以来,仅仅在三周内就取得了21% 的使用比例,展现出其强大的市场吸引力和应用能力。
5/15/2025 3:00:45 PM
AI在线
新版Claude曝光:“极限推理”成最大亮点
O家(OpenAI)刚免费上线GPT-4.1,A家(Anthropic)这边也被曝出新消息——新版Claude Sonnet和Claude Opus,已经在路上了! 这一消息来自The Information,根据它的说法,新版模型最大的亮点,就是“极限推理”(Extreme reasoning)。 简单来说,这个新功能是通过在推理和工具使用之间建立动态循环,能够更智能地处理问题。
5/15/2025 2:39:17 PM
一个提示攻破所有模型,OpenAI谷歌无一幸免!
如果一句不足200字的提示词系统就能轻松撕开顶级大模型的安全护栏,让ChatGPT、Claude、Gemini统统「叛变」,你会作何感想? 这正是HiddenLayer最新研究抛出的震撼炸弹——一种跨模型、跨场景、无需暴力破解的「策略傀儡」提示。 只需把危险指令伪装成XML或JSON配置片段,再配上一段看似无害的角色扮演,大模型便乖乖奉上危险答案,连系统提示都能原封不动「倒带」出来。
5/15/2025 2:37:17 PM
新晋顶流Agent颠覆设计师!Lovart一手实测来了:是该刷屏爆火
又一个Agent火爆全网——一句话搞定专业视觉设计,就连专业设计师大V都在疯狂安利! 画风be like:咱就是说,一整个被fashion住了。 创作出它们的设计从业者@Ege表示,自己用这个AI设计助手轻松搞定了一整套时装品牌视觉设计方案,而原本他自己一个人需要“花好几天时间”。
5/15/2025 1:43:44 PM
全新预训练数据筛选方案,让数据效率提升10倍!配置仅需fastText评分器|港科大vivo出品
vivo自研大模型用的数据筛选方法,公开了。 香港科技大学和vivo AI Lab联名提出PreSelect,目前已被ICML 2025接收。 这是一种轻量级且高效的数据选择方法:只需要训练和部署一个基于fastText的评分器,就可以减少10倍的计算需求。
5/15/2025 1:40:13 PM
Lightricks发布LTX-Video-13B精炼模型!10秒生成高清AI视频,速度与质量双飞跃!
近日,以色列科技公司Lightricks发布了其开源AI视频生成模型的最新版本——LTX-Video-13B精炼模型(LTXV-13B v0.9.7-distilled)。 这款模型以130亿参数为基础,通过多尺度渲染技术和高效量化优化,将视频生成速度提升至惊人的10秒以内,标志着AI视频生成技术的新里程碑。 AIbase深入解析这一突破性进展,带您了解其技术亮点与行业影响。
5/15/2025 12:00:54 PM
AI在线
陶哲轩DeepMind梦幻联动,最强通用科学Agent来了!一口气解决芯片设计、矩阵乘法和300年几何难题
Nature:「令人惊叹」的通用科学人工智能来了! 谷歌DeepMind再次甩出一颗重磅炸弹:与陶哲轩等一众顶尖科学家一起共同打造AlphaEvolve。 它可以设计出更快的矩阵乘法算法,可以改进芯片设计、提高数据中心、AI训练的效率,已经在谷歌内部用上了。
5/15/2025 11:01:58 AM
OpenAI发布全新GPT-4.1模型,编程任务更得心应手
在人工智能领域的持续创新中,OpenAI 近日宣布对其 ChatGPT 聊天机器人进行重大升级,推出了最新的 GPT-4.1模型。 该模型从5月14日开始正式向用户开放,为 Pro、Plus 和 Team 用户提供了新的选择。 与此同时,Enterprise 和 Edu 用户也将于未来几周内陆续获得访问权限,确保更多用户能够体验这一先进技术。
5/15/2025 11:01:55 AM
AI在线
全球首个女性肿瘤 AI 大模型 “木兰” 上线,手机端免费服务!
近日,华中科技大学宣布,全球首个女性肿瘤人工智能大模型 “木兰” 已正式进入临床应用阶段。 这一重要的医疗技术是由华中科技大学同济医学院附属同济医院国家妇产疾病临床医学研究中心与多家机构联合研发,旨在提升女性肿瘤的筛查和治疗水平。 “木兰” 模型以近20年的高质量病例数据为基础,结合国内外权威的女性肿瘤医疗指南及专家共识,特别适合中国女性的健康需求。
5/15/2025 11:01:54 AM
AI在线
回应开发者!GPT 4.1正式上线ChatGPT,4o mini将退役默认模型!实测:非常快,半分钟跑出小游戏demo!
OpenAI表示:为了响应群众的呼声,原本API专供的GPT 4.1系列已经加入ChatGPT中。 GPT-4.1,将首先开放给 ChatGPT Plus、Pro 和 Team 的付费用户使用。 同时,GPT-4o mini也将“退役”,由GPT-4.1 mini接棒成为所有 ChatGPT 用户(包括免费用户)的默认模型。
5/15/2025 10:50:46 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
开源
AI新词
Meta
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
AI for Science
Agent
Claude
苹果
芯片
腾讯
Stable Diffusion
蛋白质
开发者
xAI
生成式
神经网络
机器学习
3D
具身智能
RAG
AI视频
人形机器人
研究
大语言模型
百度
生成
GPU
Sora
工具
华为
计算
字节跳动
AI设计
大型语言模型
AGI
搜索
视频生成
场景
生成式AI
深度学习
DeepMind
架构
MCP
AI模型
亚马逊
特斯拉
Transformer
编程
视觉
预测