资讯列表
亚马逊展示机器人时代下人类新角色的前景
在当今科技行业,关于人类在日益自动化的世界中所扮演的角色,出现了两种截然不同的观点:一种认为除了他们自己,其他所有工作都将被机器人取代;另一种则认为机器人会承担那些乏味和重复的工作,而人类将负责新的工作类型。 根据世界经济论坛的预测,虽然当前的技术趋势将导致9200万个职位消失,但也将创造1.7亿个新工作岗位。 图源备注:图片由AI生成,图片授权服务商Midjourney然而,对于那些没有经济实力或对人工智能和机器学习不感兴趣的人,比如如今的仓库工人,未来的工作场景将会如何?亚马逊在本周宣布其新款 Vulcan 机器人取得了重大进展,这为未来的工作提供了一丝启示。
5/12/2025 4:00:42 PM
AI在线
陶哲轩油管首秀:33 分钟,AI 速证「人类需要写满一页纸」的证明
第一个产出就很炸裂:人类需要写满一页纸的证明,结果借助 AI 33 分钟就搞定了?!
5/12/2025 3:08:26 PM
清源
痛斥!现在的MCP,就像尿裤子!创业CTO试用后怒气值飙升,开怼整个大模型圈怪象:开发文档用大模型写的!网友:召唤MCP适配器
作者 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)现在的MCP乃至大模型开发圈,就像尿了裤子! 一开始热乎乎的,然后就开始难受了! 近日,一篇有关MCP深度批判的博客文章《A Critical Look at MCP》在网络上走红。
5/12/2025 3:07:01 PM
云昭
毕马威:中国职场 AI 应用率高达 93%,半数使用者达到常态化应用水平
毕马威 5 月 9 日发布《全球人工智能信任、态度与应用调查报告(2025)》。该研究于 2024 年 11 月至 2025 年 1 月共同开展,覆盖 47 个国家(含中国)的 4.8 万名受访者,创下同类研究最大规模纪录。
5/12/2025 3:04:57 PM
浩渺
国内首个自研通用具身智能大模型 “自变量机器人” 完成数亿元融资
近日,具身智能公司 “自变量机器人” 宣布成功完成了 Pre-A 轮和 A 轮两轮融资,融资总额达到数亿元。 这一融资活动由华映资本和美团领投,标志着该公司在推动通用具身智能技术的道路上迈出了重要一步。 自变量机器人自2023年成立以来,已完成七轮融资,累计融资金额超过10亿元。
5/12/2025 3:00:52 PM
AI在线
NVIDIA AI推出Audio-SDS,革新音效生成与多任务音频处理
NVIDIA AI研究团队发布了一项突破性技术——Audio-SDS,将Score Distillation Sampling(SDS)技术扩展至文本条件音频扩散模型,显著提升了音效生成、音源分离及多任务音频处理的能力。 这一创新成果已在学术界和工业界引发热议。 技术核心:SDS赋能音频扩散模型Audio-SDS基于NVIDIA此前在图像生成领域广泛应用的SDS技术,通过将其适配到预训练的音频扩散模型,实现了从单一模型到多任务音频处理的跨越。
5/12/2025 3:00:52 PM
AI在线
阿里通义千问成为日本AI发展的新基石
近日,日本经济新闻(NIKKEI)发表了一篇引人注目的报道,指出阿里巴巴的通义千问大模型正迅速成为日本人工智能开发的重要基础。 随着全球 AI 技术的飞速发展,通义千问的表现已在国际舞台上崭露头角,尤其是在日经新闻对各大 AI 模型进行的综合评测中,通义千问 Qwen2.5-Max 一举夺得第六名,超越了许多国内外知名模型,包括 DeepSeek-V3和 OpenAI 的 o3-mini 等。 日本的众多新兴企业正纷纷借助通义千问的强大能力,开发适用于自身的企业级 AI 模型。
5/12/2025 3:00:52 PM
AI在线
国内首个光子芯片专用大模型问世,南智光电引领智能研发新潮流
在光子芯片技术领域,中国又迎来了一个重要的里程碑。 5月12日,南智光电正式发布了国内首个光子芯片专用大模型 ——OptoChat AI。 这一创新成果将显著推动我国光子芯片的研发进程,标志着研发方式的重大转变。
5/12/2025 3:00:52 PM
AI在线
苹果放大招!FastVLM 让视觉语言模型在 iPhone 上飞速 “狂飙”
苹果最近又搞了个大新闻,偷偷摸摸地发布了一个叫 FastVLM 的模型。 听名字可能有点懵,但简单来说,这玩意儿就是让你的 iPhone 瞬间拥有了“火眼金睛”,不仅能看懂图片里的各种复杂信息,还能像个段子手一样跟你“贫嘴”!而且最厉害的是,它速度快到飞起,苹果官方宣称,首次给你“贫嘴”的速度比之前的一些模型快了足足85倍!这简直是要逆天啊!视觉语言模型的 “成长烦恼”现在的视觉语言模型,就像个不断进化的小天才,能同时理解图像和文本信息。 它的应用可广了,从帮咱们理解图片里的内容,到辅助创作图文并茂的作品,都不在话下。
5/12/2025 3:00:52 PM
AI在线
Kimi入驻小红书,AI大模型从“投流大战”转向内容深耕
近日,月之暗面旗下大模型产品 Kimi 宣布与小红书达成最新合作,在“小红书·Kimi智能助手”账号中上线对话入口,用户可通过跳转进入对话界面,并一键生成笔记。 然而,“硅基研究室”实测发现,该入口目前仅作为轻量化的访问渠道存在,与小红书平台其他入口尚未形成深入整合。 早在2024年,小红书就已参与Kimi母公司10亿美元A轮融资,双方曾联合推出“AI新手村”活动。
5/12/2025 3:00:52 PM
AI在线
苹果发布FastVLM模型,可在iPhone上运行的极速视觉语言模型
苹果正式发布FastVLM,一款专为高分辨率图像处理优化的视觉语言模型(VLM),以其在iPhone等移动设备上的高效运行能力和卓越性能引发行业热议。 FastVLM通过创新的FastViTHD视觉编码器,实现了高达85倍的编码速度提升,为实时多模态AI应用铺平了道路。 技术核心:FastViTHD编码器与高效设计FastVLM的核心在于其全新设计的FastViTHD混合视觉编码器,针对高分辨率图像处理进行了深度优化。
5/12/2025 3:00:52 PM
AI在线
微博开展“AI 起号”违规行为专项整治,重点打击虚假内容 / 引流带货等内容
微博宣布开展“AI起号”违规行为专项整治,重点打击虚假内容、引流带货等行为。已清理违规内容560余条,关闭11个违规账号。平台将持续升级AI内容治理规则,呼吁用户合规创作。#微博AI治理# #虚假内容整治#
5/12/2025 2:45:44 PM
漾仔
南智光电发布国内首个光子芯片领域专用大模型 OptoChat AI
综合南京自由贸易试验区、南京大学等消息,2025 年 5 月 8 日,以“AI 赋能,光启未来”为主题的光子产业生态大会在宁举行。会上,由“南大系”新研机构 —— 南智先进光电集成平台牵头研发、凝聚校企联合力量打造的国内首款光子专用大模型 OptoChat AI 正式发布。
5/12/2025 2:36:00 PM
归泷
陶哲轩油管首秀:33分钟,AI速证「人类需要写满一页纸」的证明
快来围观,陶哲轩当视频博主了。 第一个产出就很炸裂:人类需要写满一页纸的证明,结果借助AI 33分钟就搞定了? 整个过程看起来一气呵成,还是全程“盲证”不用过脑子那种。
5/12/2025 2:26:43 PM
八秒极速生成!复杂场景图像定制低成本轻松驾驭,已开源丨字节北大联合发布
可控图片生成,如今已经不是什么新鲜事。 甚至也不需要复杂的提示词,用户通过简单的文本描述,就能快速生成符合个人需求的创意图像。 不过仍然有一些局限:比如说,虽然可以实现单一任务(如身份、主体、风格、背景等)的定制化设计,可是一旦条件增多,就会出现“鱼和熊掌不可兼得”的问题。
5/12/2025 2:24:56 PM
强迫模型自我争论,递归思考版CoT热度飙升!网友:这不就是大多数推理模型的套路吗?
CoT(Chain-of-thought)大家都很熟悉了,通过模仿「人类解题思路」,进而大幅提升语言模型的推理能力。 这几天,一个名为 CoRT(Chain-of-Recursive-Thoughts)的概念火了! 从名称上来看,它在 CoT 中加入了「递归思考」这一步骤。
5/12/2025 2:24:07 PM
RL训练总崩溃?R1-Reward稳定解锁奖励模型Long-Cot推理能力
多模态奖励模型(MRMs)在提升多模态大语言模型(MLLMs)的表现中起着至关重要的作用,在训练阶段可以提供稳定的 reward,评估阶段可以选择更好的 sample 结果,甚至单独作为 evaluator。 尽管近期强化学习(RL)在传统视觉任务和多模态推理任务中取得了显著进展,但其在奖励建模中的应用仍然受到挑战,尤其是如何通过强化学习对奖励模型引入长期推理能力。 来自快手、中科院、清华、南大的研究团队发现,直接把现有的 RL 算法(比如 Reinforce )用到训练 MRM 上,会遇到很多问题,比如训练过程很不稳定,甚至直接崩掉。
5/12/2025 2:23:42 PM
CVPR2025|MCA-Ctrl:多方协同注意力控制助力AIGC时代图像精准定制化
本文由中国科学院计算技术研究所研究团队完成,第一作者为硕士生杨晗,通讯作者为副研究员安竹林,助理研究员杨传广。 论文标题:Multi-party Collaborative Attention Control for Image Customization论文地址::,生成式人工智能(Generative AI)技术的突破性进展,特别是文本到图像 T2I 生成模型的快速发展,已经使 AI 系统能够根据用户输入的文本提示(prompt)生成高度逼真的图像。 从早期的 DALL・E 到 Stable Diffusion、Midjourney 等模型,这一领域的技术迭代呈现出加速发展的态势。
5/12/2025 2:16:52 PM