AI在线 AI在线

资讯列表

国内首个自研通用具身智能大模型 “自变量机器人” 完成数亿元融资

近日,具身智能公司 “自变量机器人” 宣布成功完成了 Pre-A 轮和 A 轮两轮融资,融资总额达到数亿元。 这一融资活动由华映资本和美团领投,标志着该公司在推动通用具身智能技术的道路上迈出了重要一步。 自变量机器人自2023年成立以来,已完成七轮融资,累计融资金额超过10亿元。
5/12/2025 3:00:52 PM
AI在线

​NVIDIA AI推出Audio-SDS,革新音效生成与多任务音频处理

NVIDIA AI研究团队发布了一项突破性技术——Audio-SDS,将Score Distillation Sampling(SDS)技术扩展至文本条件音频扩散模型,显著提升了音效生成、音源分离及多任务音频处理的能力。 这一创新成果已在学术界和工业界引发热议。 技术核心:SDS赋能音频扩散模型Audio-SDS基于NVIDIA此前在图像生成领域广泛应用的SDS技术,通过将其适配到预训练的音频扩散模型,实现了从单一模型到多任务音频处理的跨越。
5/12/2025 3:00:52 PM
AI在线

阿里通义千问成为日本AI发展的新基石

近日,日本经济新闻(NIKKEI)发表了一篇引人注目的报道,指出阿里巴巴的通义千问大模型正迅速成为日本人工智能开发的重要基础。 随着全球 AI 技术的飞速发展,通义千问的表现已在国际舞台上崭露头角,尤其是在日经新闻对各大 AI 模型进行的综合评测中,通义千问 Qwen2.5-Max 一举夺得第六名,超越了许多国内外知名模型,包括 DeepSeek-V3和 OpenAI 的 o3-mini 等。 日本的众多新兴企业正纷纷借助通义千问的强大能力,开发适用于自身的企业级 AI 模型。
5/12/2025 3:00:52 PM
AI在线

国内首个光子芯片专用大模型问世,南智光电引领智能研发新潮流

在光子芯片技术领域,中国又迎来了一个重要的里程碑。 5月12日,南智光电正式发布了国内首个光子芯片专用大模型 ——OptoChat AI。 这一创新成果将显著推动我国光子芯片的研发进程,标志着研发方式的重大转变。
5/12/2025 3:00:52 PM
AI在线

苹果放大招!FastVLM 让视觉语言模型在 iPhone 上飞速 “狂飙”

苹果最近又搞了个大新闻,偷偷摸摸地发布了一个叫 FastVLM 的模型。 听名字可能有点懵,但简单来说,这玩意儿就是让你的 iPhone 瞬间拥有了“火眼金睛”,不仅能看懂图片里的各种复杂信息,还能像个段子手一样跟你“贫嘴”!而且最厉害的是,它速度快到飞起,苹果官方宣称,首次给你“贫嘴”的速度比之前的一些模型快了足足85倍!这简直是要逆天啊!视觉语言模型的 “成长烦恼”现在的视觉语言模型,就像个不断进化的小天才,能同时理解图像和文本信息。 它的应用可广了,从帮咱们理解图片里的内容,到辅助创作图文并茂的作品,都不在话下。
5/12/2025 3:00:52 PM
AI在线

Kimi入驻小红书,AI大模型从“投流大战”转向内容深耕

近日,月之暗面旗下大模型产品 Kimi 宣布与小红书达成最新合作,在“小红书·Kimi智能助手”账号中上线对话入口,用户可通过跳转进入对话界面,并一键生成笔记。 然而,“硅基研究室”实测发现,该入口目前仅作为轻量化的访问渠道存在,与小红书平台其他入口尚未形成深入整合。 早在2024年,小红书就已参与Kimi母公司10亿美元A轮融资,双方曾联合推出“AI新手村”活动。
5/12/2025 3:00:52 PM
AI在线

苹果发布FastVLM模型,可在iPhone上运行的极速视觉语言模型

苹果正式发布FastVLM,一款专为高分辨率图像处理优化的视觉语言模型(VLM),以其在iPhone等移动设备上的高效运行能力和卓越性能引发行业热议。 FastVLM通过创新的FastViTHD视觉编码器,实现了高达85倍的编码速度提升,为实时多模态AI应用铺平了道路。 技术核心:FastViTHD编码器与高效设计FastVLM的核心在于其全新设计的FastViTHD混合视觉编码器,针对高分辨率图像处理进行了深度优化。
5/12/2025 3:00:52 PM
AI在线

微博开展“AI 起号”违规行为专项整治,重点打击虚假内容 / 引流带货等内容

微博宣布开展“AI起号”违规行为专项整治,重点打击虚假内容、引流带货等行为。已清理违规内容560余条,关闭11个违规账号。平台将持续升级AI内容治理规则,呼吁用户合规创作。#微博AI治理# #虚假内容整治#
5/12/2025 2:45:44 PM
漾仔

南智光电发布国内首个光子芯片领域专用大模型 OptoChat AI

综合南京自由贸易试验区、南京大学等消息,2025 年 5 月 8 日,以“AI 赋能,光启未来”为主题的光子产业生态大会在宁举行。会上,由“南大系”新研机构 —— 南智先进光电集成平台牵头研发、凝聚校企联合力量打造的国内首款光子专用大模型 OptoChat AI 正式发布。
5/12/2025 2:36:00 PM
归泷

陶哲轩油管首秀:33分钟,AI速证「人类需要写满一页纸」的证明

快来围观,陶哲轩当视频博主了。 第一个产出就很炸裂:人类需要写满一页纸的证明,结果借助AI 33分钟就搞定了? 整个过程看起来一气呵成,还是全程“盲证”不用过脑子那种。
5/12/2025 2:26:43 PM

八秒极速生成!复杂场景图像定制低成本轻松驾驭,已开源丨字节北大联合发布

可控图片生成,如今已经不是什么新鲜事。 甚至也不需要复杂的提示词,用户通过简单的文本描述,就能快速生成符合个人需求的创意图像。 不过仍然有一些局限:比如说,虽然可以实现单一任务(如身份、主体、风格、背景等)的定制化设计,可是一旦条件增多,就会出现“鱼和熊掌不可兼得”的问题。
5/12/2025 2:24:56 PM

强迫模型自我争论,递归思考版CoT热度飙升!网友:这不就是大多数推理模型的套路吗?

CoT(Chain-of-thought)大家都很熟悉了,通过模仿「人类解题思路」,进而大幅提升语言模型的推理能力。 这几天,一个名为 CoRT(Chain-of-Recursive-Thoughts)的概念火了! 从名称上来看,它在 CoT 中加入了「递归思考」这一步骤。
5/12/2025 2:24:07 PM

RL训练总崩溃?R1-Reward稳定解锁奖励模型Long-Cot推理能力

多模态奖励模型(MRMs)在提升多模态大语言模型(MLLMs)的表现中起着至关重要的作用,在训练阶段可以提供稳定的 reward,评估阶段可以选择更好的 sample 结果,甚至单独作为 evaluator。 尽管近期强化学习(RL)在传统视觉任务和多模态推理任务中取得了显著进展,但其在奖励建模中的应用仍然受到挑战,尤其是如何通过强化学习对奖励模型引入长期推理能力。 来自快手、中科院、清华、南大的研究团队发现,直接把现有的 RL 算法(比如 Reinforce )用到训练 MRM 上,会遇到很多问题,比如训练过程很不稳定,甚至直接崩掉。
5/12/2025 2:23:42 PM

CVPR2025|MCA-Ctrl:多方协同注意力控制助力AIGC时代图像精准定制化

本文由中国科学院计算技术研究所研究团队完成,第一作者为硕士生杨晗,通讯作者为副研究员安竹林,助理研究员杨传广。 论文标题:Multi-party Collaborative Attention Control for Image Customization论文地址::,生成式人工智能(Generative AI)技术的突破性进展,特别是文本到图像 T2I 生成模型的快速发展,已经使 AI 系统能够根据用户输入的文本提示(prompt)生成高度逼真的图像。 从早期的 DALL・E 到 Stable Diffusion、Midjourney 等模型,这一领域的技术迭代呈现出加速发展的态势。
5/12/2025 2:16:52 PM

两项指南发布,教育部助推中小学人工智能教育发展

近日,教育部基础教育教学指导委员会发布《中小学人工智能通识教育指南(2025 年版)》和《中小学生成式人工智能使用指南(2025 年版)》。据介绍,此次发布的两项指南是科学规范推进人工智能全学段教育,进一步落实培养具有人工智能素养的创新人才的重要举措,为全球教育领域应对技术变革贡献中国方案。
5/12/2025 2:03:17 PM
浩渺

OpenAI 聘请前 Facebook 应用主管 Simo 为新任应用业务负责人

OpenAI 近日宣布,已经聘请 Instacart 首席执行官以及前 Facebook 应用主管 Fidji Simo 担任公司新设立的应用业务负责人。 OpenAI 首席执行官山姆・阿尔特曼(Sam Altman)在社交媒体平台 X 上发表声明,表示这一新角色的引入将使他能够将更多的时间和精力投入到研究、计算和安全等重要领域。 Fidji Simo 在2011年加入 Facebook,并于2019年被任命为 Facebook 应用的负责人。
5/12/2025 11:00:52 AM
AI在线

字节跳动发布开源代码模型Seed-Coder,8B参数引领编程新风潮

字节跳动Seed团队正式推出全新开源代码模型Seed-Coder,以其卓越的代码生成、补全、编辑及推理能力引发业界广泛关注。 作为一款8B参数规模的模型,Seed-Coder在多个基准测试中超越同级别竞品,展现出强大的编程潜力和高效的数据处理设计。 模型概览:8B参数,32K上下文,MIT协议开源Seed-Coder是一个专注于代码生成、编程和软件工程任务的模型系列,包含三个主要变体:Seed-Coder-8B-Base:基于模型为中心的代码数据预训练,奠定坚实基础。
5/12/2025 11:00:52 AM
AI在线

清华系创业团队“灵御智能”融资千万,聚焦人机混合智能

近日,国内具身智能初创企业“灵御智能”宣布完成千万级种子轮融资,由英诺天使基金领投,水木校友种子基金和远镜创投跟投。 公司由清华大学自动化系校友金戈与团队联合创立,致力于打造具身智能实用化标杆,加速机器人在工业、家庭等场景的真实落地。 灵御智能依托在机器人运动控制领域的技术积累,构建了从人侧数据采集、机侧执行器到智能操作平台的通用解决方案,打通了从L0到L4的智能演化路径。
5/12/2025 11:00:52 AM
AI在线