资讯列表
微软Phi-4家族新增两位成员,5.6B多模态单任务超GPT-4o,3.8B小模型媲美千问7B
动辄百亿、千亿参数的大模型正在一路狂奔,但「小而美」的模型也在闪闪发光。 2024 年底,微软正式发布了 Phi-4—— 在同类产品中表现卓越的小型语言模型(SLM)。 仅用了 40% 合成数据,140 亿参数的 Phi-4 就在数学性能上击败了 GPT-4o。
2/27/2025 1:45:00 PM
机器之心
字节跳动AI智能助手豆包APP推出“照片动起来”功能
近日,字节跳动旗下的AI智能助手豆包APP宣布了一项创新功能——“照片动起来”。 这一功能的推出,旨在满足用户对于老照片动态化的需求,让那些曾经定格的瞬间重新焕发生机。 据悉,“照片动起来”功能操作简便,用户只需打开豆包APP,选择该功能并上传一张老照片,随后描述照片中人物或物体的动作。
2/27/2025 1:45:00 PM
AI在线
研究多模态?快来申报这个基金
2025 年 2 月 27 日,CCF 联合阿里妈妈正式发布 “CCF - 阿里妈妈科技袋基金” 第二期,共十个课题,聚焦多模态智能方向,申报截止时间:2025 年 3 月 26 日 24:00(北京时间),欢迎 CCF 会员积极申报。 2025 年 2 月 27 日,CCF 联合阿里妈妈正式发布「CCF - 阿里妈妈科技袋基金」第二期,聚焦在「多模态智能方向」展开研究,涵盖多模态推荐系统的递进式算法创新研究、基于多模态信息的用户意图识别、多模态中文广告海报制作、多模态视频创意制作等四个子方向,共十个课题。 申报截止时间:2025 年 3 月 26 日 24:00(北京时间),欢迎 CCF 会员积极申报。
2/27/2025 1:37:00 PM
机器之心
DeepSeek今日连开3源!针对优化的并行策略,梁文锋本人参与开发
按时整活! DeepSeek开源周第四天,直接痛快「1日3连发」,且全都围绕一个主题:优化并行策略。 DualPipe:一种创新的双向流水线并行算法,能够完全重叠前向和后向计算-通信阶段,并减少“流水线气泡”。
2/27/2025 1:10:00 PM
量子位
摆脱编码器依赖!Encoder-free 3D多模态大模型,性能超越13B现有SOTA | 上海AI Lab港中文等团队新作
无编码器多模态大模型被拓展到3D领域——3D编码器的功能被融入LLM本身,无编码器3D LMM适应不同的点云分辨率,摆脱预训练编码器的依赖。 来自上海AI Lab、西北工业大学、香港中文大学、清华大学等提出ENEL,在预训练阶段探索了如何使用自监督损失将3D编码器的功能整合到LLM本身,在指令调优阶段提出了一种层次几何聚合策略,基于PointLLM首次全面研究了无编码器架构在3D多模态大模型中的潜力。 在Objaverse基准测试中,ENEL表现突出,性能上超越目前SOTA ShapeLLM-13B。
2/27/2025 1:00:00 PM
量子位
超越Sora!阿里正式完全开源最新、最强大的视频生成模型 Wan2.1
阿里巴巴通义实验室正式开源了他们最新、最强大的视频生成模型 Wan2.1 系列! Wan2.1 亮点速览✨ 复杂运动: 视频动作更流畅自然,复杂场景也能轻松驾驭🧲 物理模拟: 物体交互更真实,视频更具沉浸感🎬 电影质感: 视觉效果更上一层楼,细节更丰富,更具艺术性✏️ 可控编辑: 编辑能力更强大,创作空间更广阔✍️ 视觉文字: 中英文动态文字生成,应用场景更丰富🎶 音效音乐: 视听体验一体化,视频极具感染力Wan2.1 系列模型家族,为不同需求的用户提供了多样化的选择:Wan2.1-I2V-14B: 图像到视频 (I2V) 领域的天花板! 140亿参数,720P高清画质,I2V 性能 SOTA!
2/27/2025 12:44:41 PM
AI寒武纪
榨干每一分算力:Distillation Scaling Laws带你走进高效模型新时代
初次阅读这篇文章,感到非常震撼。 在DeepSeek将知识蒸馏方法带入大众视野后,Apple与牛津大学的研究人员迅速提出了蒸馏缩放定律,并已于2月28日完成了所有实验及一篇长达67页的论文上传至arXiv。 这种效率和深度,无疑展示了大公司的研究实力。
2/27/2025 12:42:54 PM
Gloadma
外网夸爆DeepSeek开源周!今天一口气开源3个重磅!压轴戏期待拉满,R2、V4、被提名
出品 | 51CTO技术栈(微信号:blog51cto)好家伙! DeepSeek是真的OpenAI啊! 在第四天的开源日中,竟然一口气放出三个重磅的优化并行策略代码库,而且又是V3/R1模型中的干货:DualPipe:一种优化的双向流水线并行算法,旨在优化V3/R1模型训练中的计算和通信重叠。
2/27/2025 12:31:40 PM
CVPR 2025录用率22.1%,LeCun中奖!大模型参评,审稿人19篇论文被拒
刚刚,CVPR 2025录用结果出炉! 今年,共有13008份有效投稿并进入评审流程,其中2878篇被录用,最终录用率为22.1%。 近两年来,CVPR录用结果逐年递减。
2/27/2025 12:30:00 PM
新智元
Figure机器人进厂打工,8小时速成物流分拣大师!自研VLA模型全面升级
踹掉OpenAI之后,Figure的迭代堪称神速! 几天前才发布了第一款自研视觉-语言-动作(VLA)模型Helix,统一了感知、语言理解和学习控制。 就在刚刚,他们又在一个全新场景中实现了机器人应用的落地——物流包裹操作和分拣。
2/27/2025 12:12:28 PM
新智元
如何将智能体与营销自动化技术相结合
在数字化营销日益盛行的今天,智能体与营销自动化的结合已成为推动营销效率与客户体验升级的关键。 本文将深入探讨两者如何协同工作,以及这一组合如何为企业带来诸多益处。 要点概述:• AI提高效率。
2/27/2025 12:07:46 PM
Tom Ryan
DeepSeek开源三箭齐发,梁文峰亲自上阵!双向并行LLM训练飙升
开源周第4天,DeepSeek放出的是——优化并行策略,一共三个项目。 DualPipe:一种用于V3/R1模型训练中实现计算与通信重叠的双向流水线并行算法EPLB:一个针对V3/R1的专家并行负载均衡工具深入分析V3/R1模型中的计算与通信重叠机制值得一提的是,DualPipe是由三个人——Jiashi Li、Chengqi Deng和梁文峰共同研发。 有网友对此表示,这是一个颠覆性的突破。
2/27/2025 12:06:45 PM
新智元
DeepSeek一口气开源3个项目,还有梁文锋亲自参与,昨晚API大降价
实现顶级 AI 性能的秘诀,就在这里了。 DeepSeek 的开源周已经进行到了第四天(前三天报道见文末「相关阅读」)。 今天这家公司一口气发布了两个工具和一个数据集:DualPipe、EPLB 以及来自训练和推理框架的分析数据。
2/27/2025 11:45:00 AM
机器之心
MLSys’25 | 极低内存消耗:用SGD的内存成本实现AdamW的优化性能
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
2/27/2025 11:41:00 AM
机器之心
夏威夷大学与谷歌联手推出免费人工智能培训计划
近日,夏威夷大学宣布与谷歌合作,为其全州10个校区的学生和员工提供免费的人工智能培训课程。 这一计划将为参与者打开通向职业发展的新大门,特别是在网络安全、数据分析和信息技术支持等热门领域。 通过这一合作,夏威夷大学的学生可以免费获得谷歌职业证书项目的入场券。
2/27/2025 11:38:00 AM
AI在线
Anthropic 全面开放 Claude AI 的 GitHub 集成,赋能所有开发者
Anthropic 的 Claude 宣布面向所有用户开放 GitHub 集成,此前该功能仅限企业版用户。集成后,Claude 能理解代码库上下文,帮助测试、调试代码。免费用户需注意配额消耗,Pro 用户则更易控制。这是继 Google Drive 集成后,Claude 为开发者提供的又一重要功能。 #Claude #GitHub集成 #开发者工具
2/27/2025 11:37:20 AM
故渊
亚马逊推出全新智能助手 Alexa+,语音指令执行餐馆预订等任务
亚马逊宣布推出全新的智能助手 Alexa ,这一升级版的数字助理引入了生成式人工智能技术,提升了对话的自然流畅度和智能化水平。 Alexa 不仅能记住用户的偏好,还具备强大的多平台操作能力,让用户的日常任务更加轻松便捷。 Alexa 将于下个月在美国进行早期访问,亚马逊 Prime 会员可以免费使用,而非会员则需支付19.99美元。
2/27/2025 11:28:00 AM
AI在线
调查显示超八成美国职场人士尚未应用人工智能
根据最新调查显示,大多数美国上班族仍未在工作中使用 AI。 皮尤研究中心于本周二发布的调查结果显示,只有约16% 的美国上班族表示会利用 AI 来完成至少一部分工作。 相较之下,约81% 的受访者被视为 “非 AI 用户”。
2/27/2025 11:22:00 AM
AI在线