资讯列表
AI 复刻漫威《复仇者联盟 5:毁灭之日》第二支贴片预告:声音、画质全修复
AI在线 12 月 24 日消息,漫威 《复仇者联盟 5:毁灭之日》的第二支贴片预告已在互联网平台偷跑,由克里斯・海姆斯沃斯饰演的雷神托尔确认回归。 预告中的场景显示,海姆斯沃斯本人的女儿 India Rose 继续饰演 Love。 值得一提的是,由于偷跑版本的预告画质较为模糊,再次有网友借助 AI 技术对偷跑的预告片进行重置,实现了声音、画质全修复。
字节跳动发布新一代形式化数学推理专用模型 Seed Prover 1.5
AI在线 12 月 24 日消息,字节跳动 Seed 团队今日宣布推出新一代形式化数学推理专用模型 Seed Prover 1.5,通过大规模的 Agentic RL 训练,其推理能力和推理效率宣称取得显著进步。 相比上一代模型,Seed Prover 1.5 在 16.5 小时内,针对 IMO 2025 的前 5 道题目生成了完整可编译验证的 Lean 证明代码,换算成绩为 35/42,达到此前 IMO 评分标准的金牌分数线。 针对北美本科级别数学竞赛 Putnam,Seed Prover 1.5 用时 9 小时,对 12 道 Putnam 2025 赛题中的 11 道生成了可编译验证的 Lean 代码。
从「会表演」到「更会演」:KlingAvatar2.0让数字人拥有生动灵魂
还记得几个月前那个能随着音乐节拍自然舞动的 KlingAvatar 数字人吗? 现在,它迎来了史诗级进化! 近日,快手可灵团队正式发布了 KlingAvatar2.0 技术报告,这一次,数字人不仅能 "表演",更能 "生动表达"—— 它们将拥有更丰富的情感层次、更精准的多角色互动,对复杂文本指令的深度理解能力,以及支持长达 5 分钟的视频生成。
广电绝地反击!揭秘多彩新媒「不烧钱」的AI生存法则
目前,传统广电行业正面临一场深刻的生存危机。 外部竞争压力持续加剧,不断挤压行业原有的发展空间:家庭智能语音设备渗透率已经突破 68%,短视频平台日均占用用户时长已经高达 2.8 小时,用户注意力的结构性转移趋势已然形成。 而这种冲击更直接体现在行业的基本面上 —— 据国家广电总局数据,2024 年省级 IPTV 用户平均 ARPU 值已不足 15 元,较三年前下降 22%。
拒绝「盲修」:JarvisEvo 如何让 Agent 像人类一样拥有「视觉反思」能力?
在迈向通用人工智能的道路上,我们一直在思考一个问题:现有的 Image Editing Agent,真的「懂」修图吗? 大多数基于 LLM/VLM 的智能体,本质上更像是一个「盲目的指挥官」。 它们能流利地写出修图代码或调用 API,但在按下回车键之前,它们看不见画布上的变化,也无法像人类设计师那样,盯着屏幕皱眉说:「这张对比度拉太高了,得往回收到一点。
阿里巴巴推出新款 Qwen 模型,三秒音频即可克隆声音
近日,阿里巴巴云计算的 Qwen 团队发布了两款全新的人工智能模型,旨在通过文本指令生成或克隆声音。 其中,Qwen3-TTS-VD-Flash 模型允许用户根据详细描述生成声音,用户可以精确定义声音的特征,如情感和说话节奏。 例如,用户可以请求生成一个 “中年男性,洪亮的男中音 —— 充满活力的广告解说,快速的语速,夸张的音调变化,充满销售魅力的声音”。
MiniMax M2.1震撼开源!100亿激活参数编码模型登顶SOTA,多语言编程全面超越Gemini3Pro与Claude 4.5
国产大模型再攀高峰。 MiniMax今日正式开源其最新编码与智能体专用大模型——M2.1,以100亿激活参数的稀疏架构,在多语言编程、真实代码生成与工具调用等核心场景实现全面突破。 在权威基准SWE-Multilingual与VIBE-Bench上,M2.1不仅大幅领先同类开源模型,更超越谷歌Gemini3Pro、Anthropic Claude4.5Sonnet等闭源旗舰,标志着开源编码模型正式进入“性能碾压闭源”新阶段。
数字化头像新秀 Lemon Slice 获得 1050 万美元融资,推动 AI 聊天机器人的视频化
数字头像生成公司 Lemon Slice 近日宣布,已获得1050万美元的种子融资,投资方包括 Matrix Partners、Y Combinator,以及知名企业高管和音乐组合 The Chainsmokers。 该公司旨在为 AI 聊天机器人增加视频层,通过其最新的扩散模型 Lemon Slice-2,能够仅通过一张图片生成动态数字头像。 Lemon Slice-2是一款拥有200亿参数的模型,可以在单个 GPU 上以每秒20帧的速度直播视频。
面壁智能完成数亿元融资!端侧大模型加速落地,吉利、长安、大众已上车
端侧AI赛道再迎重磅加注。 面壁智能今日宣布已完成数亿元新一轮融资,由京国瑞、国科投资、中金保时捷基金、米聚资本与和基投资联合参投。 本轮融资将全力推进端侧高效大模型的研发与生态建设,进一步巩固其在国内边缘智能领域的先发优势。
阿里上线“千问智学”,字节推“AnyGen”:AI 应用正式接管你的书包与办公桌
随着人工智能技术的深度演进,大厂正加速将 AI 能力具象化为垂直场景的终端应用。 近日,阿里巴巴正式推出 AI 教育应用程序“千问智学”,而字节跳动则在海外市场低调上线了 AI 办公工具“AnyGen”,标志着两家巨头在 AI 个性化服务与轻量化生产力领域的竞争全面升级。 阿里巴巴推出的“千问智学”依托其最新的学习大模型,内置智能体“小千老师”,为从小学到研究生阶段的用户提供全学段免费辅导。
消息称阿里巴巴计划大规模采购 AMD MI308AI 芯片
近日,有消息透露,阿里巴巴正计划向 AMD 下单采购4万到5万颗 MI308AI 芯片。 这一举动显示了阿里巴巴在人工智能领域的强烈需求和对技术发展的重视。 AMD MI308是一款专为中国市场定制的合规 AI 芯片,其设计目标在于满足不断增长的 AI 计算需求。
OpenAI 启用 AI 模拟黑客攻击,只为修补代理式浏览器的致命漏洞
OpenAI 正采取一种“以毒攻毒”的新策略,来提升其代理式网页浏览器 ChatGPT Atlas 的安全性。 为了应对日益复杂的网络威胁,OpenAI 开发了一套“自动化攻击者”系统,通过模拟真实黑客的攻击手段,对 ChatGPT Atlas 进行全天候的压力测试。 这套系统的核心在于对抗提示注入(Prompt Injection)攻击。
长跑型 AI 登场:Jan 团队发布 Jan-v2-VL,深度优化多步任务执行力
开源 AI 项目 Jan 团队近日正式推出了全新的多模态大模型 Jan-v2-VL-Max。 这款拥有30B 参数的模型并非盲目追求通用性,而是精准锁定在“长周期执行任务”这一核心痛点上,旨在解决 AI 在复杂自动化流程中容易“断片”的问题。 该模型的技术底座源自 Qwen3-VL-30B-A3B-Thinking。
知乎2025 AI 榜单出炉:豆包登顶、DeepSeek 领跑,谁才是你心里的 AI 届“钢铁侠”?
近日,知乎正式发布“年度 AI 产品榜单”,全方位复盘了2025年 AI 行业的演进坐标。 在全球开发者与用户的共同筛选下,豆包、DeepSeek、Gemini、Nano-banana 等海内外明星产品悉数入选。 在最受关注的“知友年度爱用”榜单中,字节跳动旗下的豆包力压群雄荣登榜首,DeepSeek 与通义千问紧随其后。
自己年初造的新词火了,OpenAI 联合创始人卡帕西谈“氛围编程”
AI在线 12 月 24 日消息,今年年初,安德烈・卡帕西(Andrej Karpathy)创造了“氛围编程(vibe coding)”一词。 如今,他对此有话要说。 据AI在线了解,卡帕西曾在特斯拉主导人工智能业务五年,负责公司的自动驾驶项目,还短暂参与过人形机器人“擎天柱”的研发工作。
MiniMax 更新 M2.1 模型,重点聚焦于更多编程语言和办公场景的可用性
AI在线 12 月 24 日消息,MiniMax 昨日宣布为其 MiniMax M2 开源模型推出 M2.1 版本更新。 此次更新致力于提升真实世界复杂任务中的表现:重点聚焦于更多编程语言和办公场景的可用性。 MiniMax-M2.1 的具体亮点如下:系统性提升了 Rust / Java / Golang / C / Kotlin / Objective-C / TypeScript / JavaScript 等非 Python 语言的能力;显著加强了原生 Android / iOS 开发能力,系统性提升了模型在 Web 与 App 场景中的设计理解与美学表达能力;系统性问题解决能力再次升级,关注对“复合指令约束”的整合执行能力,在真实办公场景具备更高的可用性;模型回复以及思维链更加简洁,在实际编程与交互体验中响应速度显著提升、Token 消耗明显下降;在各类编程工具与 Agent(智能体 / 代理)框架中均有出色表现;在日常对话、技术说明与写作场景中,也能提供更具细节与结构性的回答。
普利策得主领衔起诉六大AI巨头!集体诉讼直指“盗版书训练模型”,索赔或达百亿级
AI训练数据的“原罪”问题迎来最强法律挑战。 由两届普利策奖得主约翰·卡雷鲁(John Carreyrou)领衔,数十位知名作家近日向美国加州北区地方法院提起集体诉讼,将OpenAI、谷歌、Meta、Anthropic、xAI与Perplexity AI六大AI公司列为共同被告,指控其系统性地使用盗版书籍训练大模型,构成“故意版权侵权”。 若罪名成立,每部作品最高可索赔15万美元,总赔偿或达数十亿乃至上百亿美元。
百度文心 5.0 登顶 LMArena:超越 GPT-5.2引领中国AI迈入全球第一梯队
百度文心大模型 ERNIE-5.0-Preview-1203 在国际权威评测平台 LMArena 最新榜单中以 1451 分的成绩夺得文本能力全球第一,不仅成为中国首个登顶该榜单的模型,也在创意写作、复杂指令理解等关键能力上超越多款国际主流模型。作为一款参数规模达 2.4 万亿的全模态统一大模型,文心 5.0 在文本、多模态理解与实际应用场景中展现出卓越性能。此次突破不仅彰显了百度在大模型领域的深厚技术积累,也标志着中国人工智能技术正加速迈向全球前沿,为未来 AI 产业发展注入新的动能