AI
Meta AI部门大裁员600人:重塑架构,提升效率,扎克伯格力挺新战略
Meta公司正在对其人工智能(AI)部门进行重大调整,计划从核心AI研究团队(FAIR)、产品AI和基础设施团队裁员约600人。 根据Axios获得的一份来自AI主管Alexandr Wang的内部备忘录,此次裁员旨在减少官僚作风、加快决策速度,并赋予团队更多责任。 尽管进行了裁员,但Meta仍将保留数千个AI工作岗位。
SIGGRAPH Asia 2025|电影级运镜一键克隆!港中文&快手可灵团队发布CamCloneMaster
本文第一作者罗亚文,香港中文大学 MMLab 博士一年级在读,研究方向为视频生成,导师为薛天帆教授。 个人主页:,你是否曾梦想复刻《盗梦空间》里颠覆物理的旋转镜头,或是重现《泰坦尼克号》船头经典的追踪运镜? 在 AI 视频生成中,这些依赖精确相机运动的创意,实现起来却往往异常困难。
阿里云GPU用量削减82%的技术突破:Aegaeon计算池化方案深度解析
1192个GPU削减到213个,82%的用量削减——当我看到阿里云Aegaeon系统在三个月测试中的这个数据时,第一反应是这怎么可能? 要知道,这可是在服务数十个720亿参数大模型的情况下实现的。 按照现在H20 GPU的价格,这意味着硬件成本直接砍掉了80%以上。
R-HORIZON:长程推理时代来临,复旦NLP&美团LongCat重磅发布LRMs能力边界探测新范式
陆毅,复旦大学自然语言处理实验室硕士生,在 ACL、EMNLP、COLM、NeurIPS 等顶会发表论文十余篇,LongCat Team 核心成员,研究方向为大模型的复杂推理和长序列建模,指导老师为桂韬老师。 郭林森,硕士毕业于东南大学,在 NAACL、EMNLP、Recsys 等会议发表论文多篇,目前就职于美团,LongCat Team 核心成员,研究方向为大模型评测与数据价值挖掘。 王嘉宁,获得华东师范大学博士学位,曾前往 UCSD 访问学习,在 ACL、EMNLP、AAAI、ICLR 等顶会发表论文数十篇,目前就职于美团,LongCat Team 核心成员,研究方向为大模型训练与复杂推理。
清华联手英伟达打造扩散模型新蒸馏范式!视频生成提速50倍,四步出片不穿模
让视频生成提速50倍,不穿模还不糊字。 新蒸馏范式让Wan2.1 14B仅需4步就生成吃火锅视频:这是清华大学朱军教授团队, NVIDIA Deep Imagination研究组联合提出的一种全新的大规模扩散模型蒸馏范式——分数正则化连续时间一致性模型 (Score-Regularized Continuous-Time Consistency Model, rCM)。 该方法首次将连续时间一致性蒸馏成功扩展至百亿参数级别的文生图和文生视频模型,解决了现有方法在真实应用场景中的瓶颈。
让LLM扔块石头,它居然造了个投石机
让LLM扔块石头,结果它发明了投石机? 大模型接到任务:“造一个能把石头扔远的结构。 ”谁成想,它真的开始动手造了,在一个真实的物理仿真世界里,一边搭零件,一边看效果,一边修改。
智谱运气是差一点点,视觉Token研究又和DeepSeek撞车了
这不巧了吗……智谱和DeepSeek,又双叒撞车了。 太卷了,DeepSeek-OCR刚发布不到一天,智谱就开源了自家的视觉Token方案——Glyph。 既然是同台对垒,那自然得请这两天疯狂点赞DeepSeek的卡帕西来鉴赏一下:或许你也会对我们的工作感兴趣。
不改模型也能提升推理性能?ICLR投稿提出测试时扩展新范式OTV
近年来,大语言模型在各类任务上表现出色,但幻觉、逻辑错误、推理漏洞等问题仍屡见不鲜。 这促使研究者持续探索提升模型输出可靠性的新路径。 现有主流范式各有优势,也存在局限。
利用AI全方位优化数据分析工作流的实战技巧
我们正畅游在数据的海洋之中,每一次点击、每一笔交易、每一次传感器读数,都在为数字数据库添砖加瓦,这些数据蕴含着无数的洞察与商机,然而,对许多企业而言,这些潜力尚未得到充分挖掘。 尽管如今企业收集的数据量比以往任何时候都要多,但其中高达73%的数据并未用于分析。 数据孤岛,以及数据量之大、流动速度之快、种类之多,让许多传统分析流程不堪重负,导致宝贵的信息被束之高阁。
隐性危机:AI的成本节约为何正在埋下未来隐患
今年的财报电话会议遵循了一个熟悉的模式。 领导团队站在投资者和分析师面前,自豪地宣布AI如何提升了效率、减少了员工数量。 截至6月,平均每天有491人因AI而失业,新闻稿称之为“优化”,董事会称之为“进步”,股价随之飙升。
中国首个AI开源后端平台,让前端开发彻底“自给自足”了!
AI 只写一半应用这几年,AI Coding 工具的发展实在是太快了,你随便丢给它一个复杂的需求,它就能迅速拆分成一个个任务,生成漂亮的界面,着实是让人震惊不已。 但是深入观察一下就会发现,那只是“一半的应用”:只有前端代码,没有后端,界面漂亮,数据却是假的。 原因很简单,后端要涉及数据库、API、服务器等复杂环境,要想让AI完全自动生成、集成、部署,难度极高。
诺贝尔奖得主称:AI正削弱“名校毕业生”的竞争力
据新浪财经消息,在日前于上海举行的 2025年可持续全球领导者大会上,诺贝尔化学奖得主、斯坦福大学教授 **迈克尔·莱维特(Michael Levitt)**在接受新浪财经独家对话时,对 AI 与教育的未来提出了一个颠覆性的观点:学历将变得越来越不重要。 莱维特教授认为,人工智能正在彻底改变知识的获取方式。 他指出:“过去,教育是知识的入口;现在,AI 让任何人都能获取知识。
准备好将你的人工智能愿景转变为市场现实了吗?
当今,就企业服务的AI赋能而言,AI Agent已成为科技领域最受关注的前沿方向。 网络上充斥着对自治Agent的设想——它们能自主编写代码、运行业务系统,甚至完成复杂决策任务,而人类只需在一旁品咖啡。 这种充满未来感的愿景确实令人振奋,但现实往往更为复杂:构建一个真正高效、可扩展且稳定的人工智能Agent远非简单地将语言模型接入工具接口并放任其运行那么简单。
OpenAI 招募逾百名前投行人士训练 AI,目标干掉初级银行从业者的重复活
10 月 22 日消息,据彭博社看到的文件显示,OpenAI 已聘请超过 100 名前投资银行家,协助训练其人工智能系统掌握财务建模技能,目标是取代整个行业初级银行从业者所承担的大量重复性工作。 这一团队成员包括来自摩根大通(JPMorganChase & Co.)、摩根士丹利(Morgan Stanley)和高盛集团(Goldman Sachs Group . Inc.)等机构的前员工,隶属于这家初创公司内部一个代号为“水星”(Mercury)的秘密项目。
特斯拉Karpathy对AI Agent的冷静判断:十年成熟论背后的技术理性
为什么一个曾经推动特斯拉自动驾驶技术突破的AI专家,会对当下最火热的AI Agent泼冷水? 最近在红杉资本的AI峰会上,OpenAI创始成员、前特斯拉AI总监安德烈·卡帕西(Andrej Karpathy)发表了一个让很多人意外的观点。 当所有人都在为AI Agent的"即将爆发"而兴奋时,这位技术大牛却给出了一个相当冷静的判断:真正实用的AI Agent,可能还需要十年左右的时间才能成熟。
墙体的AI革命!智能超表面如何让建筑「听懂」6G信号?
5G基站极高的功耗一直被业内诟病。 其主导原因是,基站只能部署在室外,但96%的流量需求却源于室内用户。 信号穿墙而过,强度下降了90%~99.9%。
一张照片,一个3D「你」:计算所等提出HumanLift,实现高保真数字人重建
创建具有高度真实感的三维数字人,在三维影视制作、游戏开发以及虚拟/增强现实(VR/AR)等多个领域均有着广泛且重要的应用。 尽管现有技术在从多视角图片重建高质量、可动画化的三维人体模型任务中展现出诸多优势,但从单张参考图像重建真实感三维数字人,依旧面临技术复杂、资源消耗大的挑战。 如何兼顾三维一致性与参考图像一致性,重建出高质量、高真实感的人物外观与姿势,以及如何生成高真实度且细节一致的服饰、人脸等,都是亟待解决的难题。
文本已死,视觉当立!Karpathy狂赞DeepSeek新模型,终结分词器时代
DeepSeek再次让全世界大吃一惊! 他们最新成果DeepSeek-OCR,从根本上改变了游戏规则——文本并非通用的输入。 反而,视觉将取而代之!
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
AI新词
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
算法
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
大型语言模型
AI设计
生成式AI
搜索
视频生成
亚马逊
AI模型
DeepMind
特斯拉
场景
深度学习
Transformer
架构
Copilot
MCP
编程
视觉