AI在线 AI在线

资讯列表

LynxAI获数百万人民币天使轮投资

近日,杭州斗兽场数字智能技术公司(LynxAI)获跨境电商大卖数百万人民币天使轮投资,华君出海资本跟投并担任独家财务顾问。 本轮融资资金将主要用于产品创新模型的训练、研发团队扩张以及标准化产品打造。 据介绍,LynxAI是一家为跨境电商企业提供Agentic AI产品平台的企业,成立于 2023 年。
3/13/2025 11:14:00 AM
AI在线

20万美元商业级视频生成大模型Open-Sora 2.0来了,权重、推理代码及训练流程全开源!

今天,视频生成领域迎来开源革命! Open-Sora 2.0—— 全新开源的 SOTA(State-of-the-Art)视频生成模型正式发布,仅用 20 万美元(224 张 GPU)成功训练出商业级 11B 参数视频生成大模型,性能直追 HunyuanVideo 和 30B 参数的 Step-Video。 权威评测 VBench 及用户偏好测试均证实其卓越表现,在多项关键指标上媲美动辄数百万美元训练成本的闭源模型。
3/13/2025 11:13:00 AM
机器之心

YOLOe问世,实时观察一切,统一开放物体检测和分割

它能像人眼一样,在文本、视觉输入和无提示范式等不同机制下进行检测和分割。 自 2015 年由华盛顿大学的 Joseph Redmon 研究团队提出 YOLO(You Only Look Once)以来,这项突破性的目标检测技术就像为机器装上了「闪电之眼」,凭借单次推理的实时性能刷新了计算机视觉的认知边界。 传统的 YOLO 系列如同我们人工效准的精密仪器,其识别能力被严格框定在预定义的类别目录之中,每个检测框的背后,都需要工程师手动输入认知词典。
3/13/2025 11:11:04 AM
机器之心

超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场

大语言模型(LLM)在推理领域的最新成果表明了通过扩展测试时计算来提高推理能力的潜力,比如 OpenAI 的 o1 系列。 通常来说,这些方法在训练模型时可以产生比典型正确解决方案更长的轨迹,并包含了试图实现某些「算法」的 token:例如反思前一个答案、规划或实现某种形式的线性搜索。 这些方法包括显式地微调预训练 LLM 以适应算法行为,例如对搜索数据进行监督微调(SFT)或针对 0/1 正确性奖励运行结果奖励(outcome-reward,OR)RL。
3/13/2025 11:07:30 AM
机器之心

ServiceNow 28.5亿美元拿下Moveworks,重塑AI聊天机器人格局?

在生成式人工智能热潮兴起之前,Moveworks 就已经在利用新一代语言模型解决客户服务中的技术难题。 近日,服务管理软件巨头 ServiceNow 宣布以28.5亿美元收购 Moveworks,这一交易引起了业界的广泛关注。 图源备注:图片由AI生成,图片授权服务商MidjourneyMoveworks 成立于2016年,由 Bhavin Shah、Vaibhav Nivargi、Varun Singh 和 Jiang Chen 共同创办,致力于开发企业聊天机器人以增强人类客服代表的能力。
3/13/2025 11:07:00 AM
AI在线

百度文心快码推出Comate Zulu版本 并正式开放公测

百度旗下的文心快码宣布推出Comate Zulu版本并正式开放公测。 此次升级是文心快码在智能编程领域的一次重大突破,旨在通过基于文心大模型的强大能力,结合百度多年积累的编程大数据和外部优秀开源数据,为开发者提供更高效、更智能的编程体验。 Comate Zulu版本的核心亮点在于其三大功能:首先,它能够通过全自然语言实现需求,无需编写代码即可从零开始自动搭建项目,并通过持续对话实现智能迭代。
3/13/2025 11:02:00 AM
AI在线

谷歌推机器人控制模型Gemini Robotics,让机器人像人类一样思考行动

谷歌DeepMind推出了他们的秘密武器——Gemini Robotics! 这可不是你家扫地机器人那点小打小闹,而是要将AI的智慧真正注入钢铁之躯,让机器人也能像咱们一样(甚至更聪明地)在物理世界里大显身手。 无所不能的“多面手”Gemini Robotics的核心在于其基于先进的Gemini2.0模型。
3/13/2025 10:54:00 AM
AI在线

阿里妈妈搜索广告2024大模型思考与实践

作者:石士阿里妈妈技术团队一、概览随着大模型时代的到来,搜推广模型是否具备新的进化空间? 能否延续像深度学习时期那样迸发旺盛的迭代生命? 带着这样的过去,阿里妈妈搜索广告在两年的持续探索中,逐步成功清理了一些关键问题,落地了多个优化方向。
3/13/2025 10:51:00 AM
机器之心

担心成为「AI界奥本海默」!DeepMind、Anthropic CEO同框,26年AGI降临?

当今世界,谁最有可能成为「AI时代的奥本海默」? DeepMind的创始人Hassabis与Anthropic的创始人Dario无疑是热门人选。 近日,这两位AI巨头罕见地坐到了一起,在《经济学人》的访谈中,直面AGI(通用人工智能)带来的种种争议与挑战。
3/13/2025 10:50:00 AM
新智元

人形机器人赛道再添“猛将”!Pepper之父造了个3万美元“外星萌宠”

当人形机器人还在比拼“大长腿”、“硬肌肉”时,一位“不走寻常路”的选手却凭借一张“萌脸”和一套“人设”火爆出圈,它就是 Mirokaï,由 Pepper 和 NAO 的缔造者 Jérôme Monceaux 再次出手打造的全新物种。 这款售价高达3万美元的机器人,不仅在 CES 展上连续两年斩获“最受欢迎”桂冠,更让英伟达 CEO 黄仁勋也为其驻足,它的独特魅力究竟何在?Mirokaï 的与众不同,首先源于其打破常规的“外星人”设定。 它们自诩为来自遥远星系的 Mirokaï 族群,拥有神秘的魔法与尖端科技。
3/13/2025 10:43:00 AM
AI在线

只需7.6% token,性能还更强!华人团队提全新「草稿链」CoD,成本延迟大降

当下,企业正处于部署AI的关键节点。 随着AI系统在企业运营中的深度融合,计算成本与响应时间成为阻碍AI广泛应用的主要瓶颈。 来自Zoom的华人研究团队取得了一项突破性成果,他们开发的「草稿链」(Chain of Draft,CoD)技术,有望从根本上改变企业大规模部署AI的模式。
3/13/2025 10:40:00 AM
新智元

DeepSeek 开源 EPLB,世界上从来没有什么腾空出世!

deepseek开源DualPipe的同一天,还开源了EPLB。 今天来简单聊聊EPLB,包懂。 EPLB是干嘛的?
3/13/2025 10:31:20 AM
架构师之路

阿里通义新视频生成和编辑模型VACE 可控制运动轨迹、替换主体等

是否还在感叹视频制作门槛高,后期编辑太烧脑?别担心,阿里通义Wan团队再次出手,推出了他们最新的重量级模型All-in-One视频生成和编辑模型——VACE。 VACE最引人注目的能力之一,便是其强大的按条件生成视频功能。 这意味着,你只需要用文字描绘出心中的场景,VACE就能迅速将你的想象变为现实。
3/13/2025 10:30:00 AM
AI在线

告别“无声视频”尴尬!字节AI音效生成模型SeedFoley上线即梦 一键生成大片感音效

还在为短视频配音效抓耳挠腮?还在苦苦寻找合适的BGM却总是差强人意?现在,字节跳动直接放出王炸级AI黑科技,一举打破视频创作的最后一道静音魔咒!他们最新推出的SeedFoley音效生成模型,如同为视频注入了声命之魂,只需轻轻一点,就能为你的视频智能匹配专业级音效,瞬间让你的作品从默片变身有声大片,效果堪称惊艳!更令人振奋的是,这项AI音效神技已火速上线字节跳动旗下视频创作平台即梦,人人都能秒速体验一键音效加持的神奇魔力!SeedFoley究竟是如何做到如此声入人心的?其核心奥秘在于它采用了革命性的端到端架构,如同一个精密的声音魔术师,巧妙地融合了视频的时空特征与强大的扩散生成模型,实现了音效与视频内容的高度同步和完美契合。 简单来说,SeedFoley首先会对视频进行抽帧分析,就像给视频做CT扫描一样,提取出每一帧画面的关键信息,再通过一个视频编码器深度解读视频内容,理解视频中发生了什么,然后将这些视频理解投射到条件空间,为后续的音效生成指明方向。 在音效生成的高速公路上,SeedFoley采用了改进的扩散模型框架,如同拥有无限创意的声音设计师,根据视频内容,智能生成与之完美匹配的音效方案。
3/13/2025 10:27:00 AM
AI在线

Open-Sora 2.0全面开源,20万复刻百万级大片!11B媲美闭源巨头,224张GPU创奇迹

今天,视频生成领域迎来开源革命! Open-Sora 2.0——全新开源的SOTA(State-of-the-Art)视频生成模型正式发布,仅用20万美元(224张GPU)成功训练出商业级11B参数视频生成大模型,性能直追HunyuanVideo和30B参数的Step-Video。 权威评测VBench及用户偏好测试均证实其卓越表现,在多项关键指标上媲美动辄数百万美元训练成本的闭源模型。
3/13/2025 10:26:45 AM
新智元

AI写的论文能过审?双盲评审6.25分,达到ICLR研讨会水平

去年 8 月,Transformer 论文作者之一 Llion Jones 与前谷歌研究者 David Ha 共同创立的人工智能公司 Sakana AI 推出了首个全自动科学发现的 AI 系统:AI Scientist,即「AI 科学家」。 到 12 月份,他们又拿出了另一项震撼性的重磅研究成果:使用基础模型搜索人工生命的系统 ASAL。 这两项成果都吸引了无数眼球。
3/13/2025 10:26:00 AM
机器之心

迈向视觉大一统:UnifiedReward,多模态生成与理解的通用奖励模型

本篇文章来自公众号粉丝投稿,论文提出了一个视觉领域通用的奖励模型UnifiedReward,能够对图像/视频的生成与理解进行pairwise(成对比较)或 pointwise(单样本打分)评估,可用于视觉各领域的直接偏好优化 (DPO),提升各类视觉模型的表现。 论文介绍近年来,大模型时代的多模态生成与理解技术取得了飞跃式发展。 然而,如何让AI真正“看懂”世界,并更好地对齐人类偏好,仍是一个核心挑战。
3/13/2025 10:18:42 AM
Yibin Wang

Nous Research推出新API, OpenAI和Anthropic都得黯然失色?

纽约人工智能团队Nous Research,这群以打造“个性化、无限制”语言模型闻名的“技术宅”,最近又搞出了新动作——他们推出了全新的模型推理API。 这标志着这家一直以来都显得有些“不羁”的AI机构,开始将自家引以为傲的语言模型,通过程序化的接口,送到更广大的开发者和研究人员手中。 “不设限”的模型一直以来,Nous Research都以挑战OpenAI和Anthropic等大型AI公司的“束缚”而备受关注。
3/13/2025 10:14:00 AM
AI在线