AI在线 AI在线

资讯列表

苹果放大招!FastVLM 让视觉语言模型在 iPhone 上飞速 “狂飙”

苹果最近又搞了个大新闻,偷偷摸摸地发布了一个叫 FastVLM 的模型。 听名字可能有点懵,但简单来说,这玩意儿就是让你的 iPhone 瞬间拥有了“火眼金睛”,不仅能看懂图片里的各种复杂信息,还能像个段子手一样跟你“贫嘴”!而且最厉害的是,它速度快到飞起,苹果官方宣称,首次给你“贫嘴”的速度比之前的一些模型快了足足85倍!这简直是要逆天啊!视觉语言模型的 “成长烦恼”现在的视觉语言模型,就像个不断进化的小天才,能同时理解图像和文本信息。 它的应用可广了,从帮咱们理解图片里的内容,到辅助创作图文并茂的作品,都不在话下。
5/12/2025 3:00:52 PM
AI在线

Kimi入驻小红书,AI大模型从“投流大战”转向内容深耕

近日,月之暗面旗下大模型产品 Kimi 宣布与小红书达成最新合作,在“小红书·Kimi智能助手”账号中上线对话入口,用户可通过跳转进入对话界面,并一键生成笔记。 然而,“硅基研究室”实测发现,该入口目前仅作为轻量化的访问渠道存在,与小红书平台其他入口尚未形成深入整合。 早在2024年,小红书就已参与Kimi母公司10亿美元A轮融资,双方曾联合推出“AI新手村”活动。
5/12/2025 3:00:52 PM
AI在线

苹果发布FastVLM模型,可在iPhone上运行的极速视觉语言模型

苹果正式发布FastVLM,一款专为高分辨率图像处理优化的视觉语言模型(VLM),以其在iPhone等移动设备上的高效运行能力和卓越性能引发行业热议。 FastVLM通过创新的FastViTHD视觉编码器,实现了高达85倍的编码速度提升,为实时多模态AI应用铺平了道路。 技术核心:FastViTHD编码器与高效设计FastVLM的核心在于其全新设计的FastViTHD混合视觉编码器,针对高分辨率图像处理进行了深度优化。
5/12/2025 3:00:52 PM
AI在线

微博开展“AI 起号”违规行为专项整治,重点打击虚假内容 / 引流带货等内容

微博宣布开展“AI起号”违规行为专项整治,重点打击虚假内容、引流带货等行为。已清理违规内容560余条,关闭11个违规账号。平台将持续升级AI内容治理规则,呼吁用户合规创作。#微博AI治理# #虚假内容整治#
5/12/2025 2:45:44 PM
漾仔

南智光电发布国内首个光子芯片领域专用大模型 OptoChat AI

综合南京自由贸易试验区、南京大学等消息,2025 年 5 月 8 日,以“AI 赋能,光启未来”为主题的光子产业生态大会在宁举行。会上,由“南大系”新研机构 —— 南智先进光电集成平台牵头研发、凝聚校企联合力量打造的国内首款光子专用大模型 OptoChat AI 正式发布。
5/12/2025 2:36:00 PM
归泷

陶哲轩油管首秀:33分钟,AI速证「人类需要写满一页纸」的证明

快来围观,陶哲轩当视频博主了。 第一个产出就很炸裂:人类需要写满一页纸的证明,结果借助AI 33分钟就搞定了? 整个过程看起来一气呵成,还是全程“盲证”不用过脑子那种。
5/12/2025 2:26:43 PM

八秒极速生成!复杂场景图像定制低成本轻松驾驭,已开源丨字节北大联合发布

可控图片生成,如今已经不是什么新鲜事。 甚至也不需要复杂的提示词,用户通过简单的文本描述,就能快速生成符合个人需求的创意图像。 不过仍然有一些局限:比如说,虽然可以实现单一任务(如身份、主体、风格、背景等)的定制化设计,可是一旦条件增多,就会出现“鱼和熊掌不可兼得”的问题。
5/12/2025 2:24:56 PM

强迫模型自我争论,递归思考版CoT热度飙升!网友:这不就是大多数推理模型的套路吗?

CoT(Chain-of-thought)大家都很熟悉了,通过模仿「人类解题思路」,进而大幅提升语言模型的推理能力。 这几天,一个名为 CoRT(Chain-of-Recursive-Thoughts)的概念火了! 从名称上来看,它在 CoT 中加入了「递归思考」这一步骤。
5/12/2025 2:24:07 PM

RL训练总崩溃?R1-Reward稳定解锁奖励模型Long-Cot推理能力

多模态奖励模型(MRMs)在提升多模态大语言模型(MLLMs)的表现中起着至关重要的作用,在训练阶段可以提供稳定的 reward,评估阶段可以选择更好的 sample 结果,甚至单独作为 evaluator。 尽管近期强化学习(RL)在传统视觉任务和多模态推理任务中取得了显著进展,但其在奖励建模中的应用仍然受到挑战,尤其是如何通过强化学习对奖励模型引入长期推理能力。 来自快手、中科院、清华、南大的研究团队发现,直接把现有的 RL 算法(比如 Reinforce )用到训练 MRM 上,会遇到很多问题,比如训练过程很不稳定,甚至直接崩掉。
5/12/2025 2:23:42 PM

CVPR2025|MCA-Ctrl:多方协同注意力控制助力AIGC时代图像精准定制化

本文由中国科学院计算技术研究所研究团队完成,第一作者为硕士生杨晗,通讯作者为副研究员安竹林,助理研究员杨传广。 论文标题:Multi-party Collaborative Attention Control for Image Customization论文地址::,生成式人工智能(Generative AI)技术的突破性进展,特别是文本到图像 T2I 生成模型的快速发展,已经使 AI 系统能够根据用户输入的文本提示(prompt)生成高度逼真的图像。 从早期的 DALL・E 到 Stable Diffusion、Midjourney 等模型,这一领域的技术迭代呈现出加速发展的态势。
5/12/2025 2:16:52 PM

两项指南发布,教育部助推中小学人工智能教育发展

近日,教育部基础教育教学指导委员会发布《中小学人工智能通识教育指南(2025 年版)》和《中小学生成式人工智能使用指南(2025 年版)》。据介绍,此次发布的两项指南是科学规范推进人工智能全学段教育,进一步落实培养具有人工智能素养的创新人才的重要举措,为全球教育领域应对技术变革贡献中国方案。
5/12/2025 2:03:17 PM
浩渺

OpenAI 聘请前 Facebook 应用主管 Simo 为新任应用业务负责人

OpenAI 近日宣布,已经聘请 Instacart 首席执行官以及前 Facebook 应用主管 Fidji Simo 担任公司新设立的应用业务负责人。 OpenAI 首席执行官山姆・阿尔特曼(Sam Altman)在社交媒体平台 X 上发表声明,表示这一新角色的引入将使他能够将更多的时间和精力投入到研究、计算和安全等重要领域。 Fidji Simo 在2011年加入 Facebook,并于2019年被任命为 Facebook 应用的负责人。
5/12/2025 11:00:52 AM
AI在线

字节跳动发布开源代码模型Seed-Coder,8B参数引领编程新风潮

字节跳动Seed团队正式推出全新开源代码模型Seed-Coder,以其卓越的代码生成、补全、编辑及推理能力引发业界广泛关注。 作为一款8B参数规模的模型,Seed-Coder在多个基准测试中超越同级别竞品,展现出强大的编程潜力和高效的数据处理设计。 模型概览:8B参数,32K上下文,MIT协议开源Seed-Coder是一个专注于代码生成、编程和软件工程任务的模型系列,包含三个主要变体:Seed-Coder-8B-Base:基于模型为中心的代码数据预训练,奠定坚实基础。
5/12/2025 11:00:52 AM
AI在线

清华系创业团队“灵御智能”融资千万,聚焦人机混合智能

近日,国内具身智能初创企业“灵御智能”宣布完成千万级种子轮融资,由英诺天使基金领投,水木校友种子基金和远镜创投跟投。 公司由清华大学自动化系校友金戈与团队联合创立,致力于打造具身智能实用化标杆,加速机器人在工业、家庭等场景的真实落地。 灵御智能依托在机器人运动控制领域的技术积累,构建了从人侧数据采集、机侧执行器到智能操作平台的通用解决方案,打通了从L0到L4的智能演化路径。
5/12/2025 11:00:52 AM
AI在线

宇树科技王兴兴:我们所有岗位都缺人,欢迎年轻人加入AI浪潮

“如果上海的年轻人愿意来我们公司发展,我们非常欢迎。 ”在近日举行的第六届上海创新创业青年50人论坛上,宇树科技创始人、首席执行官王兴兴公开发出“招聘令”,直言公司目前各类岗位极度紧缺,包括文职、采购、销售、技术、研发、市场等多个方向,真诚期待更多年轻人才加入。 数据显示,2024年宇树机器狗年销量高达2.37万台,约占全球市场的69.75%;与此同时,公司人形机器人年交付量突破1500台,同样刷新全球纪录,技术能力与产业化进程均走在前列。
5/12/2025 11:00:29 AM
AI在线

一年半融资七轮超10亿!自变量机器人再获美团数亿元A轮加码

据《智能涌现》消息,成立不到一年半的具身智能公司「自变量机器人」(X Square Robot)近日完成数亿元A轮融资,由美团战投领投,美团龙珠跟投。 本轮资金将主要用于加速其全自研端到端通用具身智能大模型与机器人本体的同步迭代,并推动未来在多个应用场景的智慧化方案合作与落地。 值得注意的是,在本次A轮融资前,自变量机器人还完成了由光速光合、君联资本领投的数亿元Pre-A 轮融资(今年2月披露),以及由华映资本、云启资本、广发信德投资的数亿元Pre-A 轮融资。
5/12/2025 10:01:17 AM
AI在线

MCP 与创新悖论:开放标准为何能拯救 AI

模型上下文协议(MCP)的出现,预示着人工智能应用生态系统即将发生根本性变革。 由 Anthropic 于2024年11月推出的 MCP,旨在规范 AI 应用程序与其训练数据之外的世界进行交互的方式。 正如 HTTP 和 REST 为 Web 应用和服务间的连接奠定了基础,MCP 正在为 AI 模型与各种工具的连接建立统一的标准。
5/12/2025 10:01:16 AM
AI在线

腾讯发布全新 AI 框架 PrimitiveAnything:颠覆 3D 形状生成方式!

在计算机视觉和图形学中,3D 形状的抽象是一个基础且关键的研究领域。 通过将复杂的3D 形状分解为简单的几何单位,研究者能够更好地理解人类视觉感知的机制。 然而,现有的3D 生成方法通常无法满足机器人操作或场景理解等任务对语义深度和可解释性的要求。
5/12/2025 10:01:16 AM
AI在线