应用
20万美元商业级视频生成大模型Open-Sora 2.0来了,权重、推理代码及训练流程全开源!
今天,视频生成领域迎来开源革命! Open-Sora 2.0—— 全新开源的 SOTA(State-of-the-Art)视频生成模型正式发布,仅用 20 万美元(224 张 GPU)成功训练出商业级 11B 参数视频生成大模型,性能直追 HunyuanVideo 和 30B 参数的 Step-Video。 权威评测 VBench 及用户偏好测试均证实其卓越表现,在多项关键指标上媲美动辄数百万美元训练成本的闭源模型。
3/13/2025 11:13:00 AM
机器之心
ServiceNow 28.5亿美元拿下Moveworks,重塑AI聊天机器人格局?
在生成式人工智能热潮兴起之前,Moveworks 就已经在利用新一代语言模型解决客户服务中的技术难题。 近日,服务管理软件巨头 ServiceNow 宣布以28.5亿美元收购 Moveworks,这一交易引起了业界的广泛关注。 图源备注:图片由AI生成,图片授权服务商MidjourneyMoveworks 成立于2016年,由 Bhavin Shah、Vaibhav Nivargi、Varun Singh 和 Jiang Chen 共同创办,致力于开发企业聊天机器人以增强人类客服代表的能力。
3/13/2025 11:07:00 AM
AI在线
百度文心快码推出Comate Zulu版本 并正式开放公测
百度旗下的文心快码宣布推出Comate Zulu版本并正式开放公测。 此次升级是文心快码在智能编程领域的一次重大突破,旨在通过基于文心大模型的强大能力,结合百度多年积累的编程大数据和外部优秀开源数据,为开发者提供更高效、更智能的编程体验。 Comate Zulu版本的核心亮点在于其三大功能:首先,它能够通过全自然语言实现需求,无需编写代码即可从零开始自动搭建项目,并通过持续对话实现智能迭代。
3/13/2025 11:02:00 AM
AI在线
谷歌推机器人控制模型Gemini Robotics,让机器人像人类一样思考行动
谷歌DeepMind推出了他们的秘密武器——Gemini Robotics! 这可不是你家扫地机器人那点小打小闹,而是要将AI的智慧真正注入钢铁之躯,让机器人也能像咱们一样(甚至更聪明地)在物理世界里大显身手。 无所不能的“多面手”Gemini Robotics的核心在于其基于先进的Gemini2.0模型。
3/13/2025 10:54:00 AM
AI在线
人形机器人赛道再添“猛将”!Pepper之父造了个3万美元“外星萌宠”
当人形机器人还在比拼“大长腿”、“硬肌肉”时,一位“不走寻常路”的选手却凭借一张“萌脸”和一套“人设”火爆出圈,它就是 Mirokaï,由 Pepper 和 NAO 的缔造者 Jérôme Monceaux 再次出手打造的全新物种。 这款售价高达3万美元的机器人,不仅在 CES 展上连续两年斩获“最受欢迎”桂冠,更让英伟达 CEO 黄仁勋也为其驻足,它的独特魅力究竟何在?Mirokaï 的与众不同,首先源于其打破常规的“外星人”设定。 它们自诩为来自遥远星系的 Mirokaï 族群,拥有神秘的魔法与尖端科技。
3/13/2025 10:43:00 AM
AI在线
阿里通义新视频生成和编辑模型VACE 可控制运动轨迹、替换主体等
是否还在感叹视频制作门槛高,后期编辑太烧脑?别担心,阿里通义Wan团队再次出手,推出了他们最新的重量级模型All-in-One视频生成和编辑模型——VACE。 VACE最引人注目的能力之一,便是其强大的按条件生成视频功能。 这意味着,你只需要用文字描绘出心中的场景,VACE就能迅速将你的想象变为现实。
3/13/2025 10:30:00 AM
AI在线
告别“无声视频”尴尬!字节AI音效生成模型SeedFoley上线即梦 一键生成大片感音效
还在为短视频配音效抓耳挠腮?还在苦苦寻找合适的BGM却总是差强人意?现在,字节跳动直接放出王炸级AI黑科技,一举打破视频创作的最后一道静音魔咒!他们最新推出的SeedFoley音效生成模型,如同为视频注入了声命之魂,只需轻轻一点,就能为你的视频智能匹配专业级音效,瞬间让你的作品从默片变身有声大片,效果堪称惊艳!更令人振奋的是,这项AI音效神技已火速上线字节跳动旗下视频创作平台即梦,人人都能秒速体验一键音效加持的神奇魔力!SeedFoley究竟是如何做到如此声入人心的?其核心奥秘在于它采用了革命性的端到端架构,如同一个精密的声音魔术师,巧妙地融合了视频的时空特征与强大的扩散生成模型,实现了音效与视频内容的高度同步和完美契合。 简单来说,SeedFoley首先会对视频进行抽帧分析,就像给视频做CT扫描一样,提取出每一帧画面的关键信息,再通过一个视频编码器深度解读视频内容,理解视频中发生了什么,然后将这些视频理解投射到条件空间,为后续的音效生成指明方向。 在音效生成的高速公路上,SeedFoley采用了改进的扩散模型框架,如同拥有无限创意的声音设计师,根据视频内容,智能生成与之完美匹配的音效方案。
3/13/2025 10:27:00 AM
AI在线
AI写的论文能过审?双盲评审6.25分,达到ICLR研讨会水平
去年 8 月,Transformer 论文作者之一 Llion Jones 与前谷歌研究者 David Ha 共同创立的人工智能公司 Sakana AI 推出了首个全自动科学发现的 AI 系统:AI Scientist,即「AI 科学家」。 到 12 月份,他们又拿出了另一项震撼性的重磅研究成果:使用基础模型搜索人工生命的系统 ASAL。 这两项成果都吸引了无数眼球。
3/13/2025 10:26:00 AM
机器之心
Nous Research推出新API, OpenAI和Anthropic都得黯然失色?
纽约人工智能团队Nous Research,这群以打造“个性化、无限制”语言模型闻名的“技术宅”,最近又搞出了新动作——他们推出了全新的模型推理API。 这标志着这家一直以来都显得有些“不羁”的AI机构,开始将自家引以为傲的语言模型,通过程序化的接口,送到更广大的开发者和研究人员手中。 “不设限”的模型一直以来,Nous Research都以挑战OpenAI和Anthropic等大型AI公司的“束缚”而备受关注。
3/13/2025 10:14:00 AM
AI在线
Netflix 游戏部门副总裁离职,生成式AI战略面临挑战
Netflix 游戏部门的生成式人工智能副总裁迈克・维尔杜(Mike Verdu)已确认离职。 五个月前,Netflix 宣布将生成式人工智能作为其游戏开发的核心战略,并将维尔杜升任为该技术的负责人。 然而,如今他的突然离职让人质疑这一战略是否过于仓促。
3/13/2025 10:03:00 AM
AI在线
Remade AI 开源 8 款 Wan2.1 特效 LoRA,掀起 AI 视频创作新热潮
3 月 12 日,AI创新团队Remade AI 在Hugging Face平台震撼发布 8 款基于Wan2. 1 模型的开源特效LoRA,引发科技圈广泛关注。 这 8 款特效包括“挤压”(Squish)、“蛋糕化”(Cakeify)、“膨胀”(Inflate)、“缩小”(Deflate)、“射击”(Shooting)、“旋转”(Rotate)、“肌肉增强”(Muscle)和“压扁”(Crush),为AI视频生成注入全新创意可能。
3/13/2025 9:51:00 AM
AI在线
大模型长文推理迎来“核弹级”提速!清华APBB框架狂飙10倍,Flash Attention直接被秒
还在为大模型处理长文本“龟速”而抓狂?别急!清华大学祭出“王炸”技术——APB 序列并行推理框架,直接给大模型装上“涡轮增压”引擎!实测显示,这项黑科技在处理超长文本时,速度竟比肩 Flash Attention 快10倍!没错,你没听错,是10倍!要知道,随着 ChatGPT 等大模型的爆火,AI 们“阅读”能力也水涨船高,动辄处理十几万字的长文不在话下。 然而,面对海量信息,传统大模型的“大脑”却有点卡壳—— Transformer 架构虽强,但其核心的注意力机制就像一个“超级扫描仪”,文本越长,扫描范围呈指数级膨胀,速度自然就慢了下来。 为了解决这个“卡脖子”难题,清华大学的科学家们联合多家研究机构和科技巨头,另辟蹊径,推出了 APB 框架。
3/13/2025 9:50:00 AM
AI在线
谷歌Gemini 2.0 Flash放出原生图像生成功能:支持多轮对话式实时编辑编辑
继Gemma3之后,谷歌又给我们带来了一位“闪电侠”——Gemini2.0Flash,而且人家这次是带着独门绝技来的:原生图像生成! 要知道,以前的AI图像生成,很多时候都是大型语言模型(LLM)先理解你的文字,然后再把意思“翻译”给专门生成图像的扩散模型。 这中间难免会有些“失真”,就像隔着好几个人传话,最后意思都变味儿了。
3/13/2025 9:50:00 AM
AI在线
Insilico Medicine融资1. 1 亿美元,推进AI药物研发与机器人实验室创新
Insilico Medicine近日宣布完成1. 1 亿美元E轮融资,由香港公司Value Partners领投,获得了原有投资者及新投资者的支持。 这笔资金将用于完善该公司的AI模型,并支持其特发性肺纤维化领域主要候选药物的关键临床试验。
3/13/2025 9:44:00 AM
AI在线
德国研究团队推出开源 GNN 模型 FIORA 提升质谱分析精准度,推动精准医疗发展
在精准医学与生物标志物发现的浪潮中,非靶向代谢组学扮演着至关重要的角色。 然而,由于现有谱图参比库的不完整,化合物的鉴定依然面临挑战。 为了解决这一问题,德国联邦材料研究与测试研究所(BAM)与柏林自由大学的研究团队联合开发了 FIORA,一种开源图神经网络(GNN),旨在模拟串联质谱的过程,帮助提高质谱识别的准确性。
3/13/2025 9:40:00 AM
AI在线
NVIDIA 携手国际组织,以AI技术助力全球野生动物保护
在全球生态环境保护日益受到重视的背景下,NVIDIA 与多个国际组织合作,积极探索人工智能在野生动物保护中的应用。 根据联合国的数据显示,超过100万种物种面临灭绝的风险,而利用 AI 技术的保护措施,无疑为维持生态系统和支持生物多样性提供了新的解决方案。 美国西雅图的非营利性 AI 研究机构 Ai2推出了 EarthRanger 软件平台,旨在帮助保护区的管理人员和生态学家做出更明智的野生动物保护决策。
3/13/2025 9:33:00 AM
AI在线
全球首款通用AI智能体Manus爆火,200万人排队等候体验
3月12日,科技圈再次被中国AI新星Manus点燃热情。 据ManusAI公司最新披露,自3月6日产品发布以来,仅7天时间,全球已有200万人加入其使用等候名单。 这款由中国90后团队Monica打造的全球首款通用型AI Agent,以其超越传统AI助手的强大功能引发热议。
3/13/2025 9:27:00 AM
AI在线
字节Trae接入硅基流动SiliconCloud 支持DeepSeek多款模型API
硅基流动官方宣布,由字节跳动推出的首个 AI 原生集成开发环境(AI IDE)——Trae接入硅基流动(SiliconCloud)平台,旨在为开发者提供更高效的编程体验。 Trae 现在集成了硅基流动的多款模型,用户只需通过 API 密钥即可接入 DeepSeek-R1、V3、QWQ-32B、Qwen2.5-Coder 等多种编码模型。 这种灵活的选择满足了开发者对不同模型的使用需求。
3/13/2025 9:21:00 AM
AI在线
资讯热榜
OpenAI 开源模型被 Meta 研究员“逆改”!只动0.3%参数,gpt-oss-20B 解锁无约束基座
奥特曼:我承认GPT-5发布搞砸了
OpenAI突然"背叛"自己:推理与创作分家,万能AI时代终结?
大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷
谷歌最新「0.27B」Gemma 3开源!身板小却猛如虎,开发者直呼救命稻草
GPT 4o-mini华人领队离开OpenAI:真正推动AI进步不是模型架构,而是互联网
摩根士丹利:AI 革命将为标准普尔 500 指数企业每年节省近 1 万亿美元
网易有道发布子曰教育大模型多款AI新品,定义教育AI应用能力L1-L5分级
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
Anthropic
英伟达
代码
训练
算法
Stable Diffusion
芯片
LLM
AI新词
蛋白质
开发者
腾讯
生成式
Claude
苹果
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
人形机器人
xAI
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
场景
大型语言模型
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
特斯拉
应用