资讯列表
内置“图片生成动图”,《逆水寒》手游与可灵 AI 合作开启全新游戏体验
网易《逆水寒》手游在 5 月底迎来周年庆前的重要版本更新,除推出大富翁玩法外,与可灵 AI 合作的“图片生成动图”功能也成为受到玩家欢迎的亮点。
6/5/2025 2:57:17 PM
汪淼
奥特曼:Codex 让我感到 AGI!最新谈话罕见透露下一代“完美模型”,大胆预测 Agent 明年突破边界!
编辑 |伊风、云昭出品 | 51CTO技术栈(微信号:blog51cto)不知道大家有没有发现:今年的奥特曼,突然安静了很多。 不像 24 年那样频繁出现在各种技术播客、大会、访谈里,甚至好多次OpenAI新发布也不见他的身影——这位 AI 圈最活跃的“CEO 网红”,仿佛一下子就开启带娃模式、退居幕后了。 可偏偏,在这个 AI产品、Agent、大模型都在飞速迭代的时间点,我们又特别想知道他最近在想什么。
6/5/2025 2:32:41 PM
伊风
英伟达推出 ProRL 方法:强化学习训练至 2000 步,打造全球最佳 1.5B 推理 AI 模型
英伟达推出 ProRL 强化学习方法,并开发出全球最佳的 1.5B 参数推理模型 Nemotron-Research-Reasoning-Qwen-1.5B。
6/5/2025 2:27:31 PM
故渊
语音AI的终极突破!Bland TTS一键克隆任意人声,真实到让人毛骨悚然!
人工智能语音合成技术迎来重大突破!AIbase从社交媒体平台获取最新信息,了解到Bland AI正式发布了其全新Bland TTS引擎,号称首个跨越“恐怖谷”的语音AI技术。 这一引擎利用大型语言模型(LLM)直接生成语音,仅需一个短音频即可实现任意人声克隆,并支持语调、节奏等风格的灵活“混搭”。 本文将为您深入解析Bland TTS的创新功能及其对AI语音应用的深远影响。
6/5/2025 2:00:55 PM
AI在线
微软开源发布 Athena 智能体:AI 重塑 Teams 工作流,代码 PR 审查最高提速 58%
微软公司昨日(6 月 4 日)发布博文,宣布 Teams 应用已整合名为 Athena 的 AI 智能体,目的是优化产品开发流程,相关源代码已开源托管在 GitHub 平台上,供组织和个人定制使用。
6/5/2025 1:52:36 PM
故渊
重视安全成金字招牌,报告称 Anthropic 持续成功挖角谷歌及 OpenAI 高层
风险投资公司SignalFire基于领英数据的最新报告显示,OpenAI工程师跳槽至Anthropic的人数远多于反向跳槽者,比例高达8:1;而谷歌DeepMind部门的情况更加突出,这一比例达到11:1。
6/5/2025 1:49:18 PM
清源
1步碾压250步!何恺明新作祭出MeanFlow,一行公式让 FID 狂降近 70%
2025 年 5 月的一篇论文中,何恺明与 CMU、MIT 联合团队提出了一种全新的一步生成框架 MeanFlow。 图片论文标题是:《Mean Flows for One-step Generative Modeling》。 从论文的实验曲线来看,只跑1 步,图像质量居然能甩开跑 250 步的老牌扩散模型(2021 年前后的经典扩散模型,如 ADM)。
6/5/2025 1:35:33 PM
文摘菌
被疯传的“恶趣味”:看Copilot这款“熊孩子”把微软工程师逼疯!Agent 刚上线就翻车?网友:微软工程师成了“人肉保姆”
作者 | Dylan Cooper编译 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)最近,GitHub Copilot 又“整活儿”了。 Reddit 上一位网友发帖调侃:“我最近迷上了一个新爱好:看 AI 一点点把微软员工逼疯。 ”这不是段子,而是对微软 .NET 仓库里一连串尴尬 PR(Pull Request,拉取请求)的讽刺。
6/5/2025 1:16:22 PM
云昭
AMD 收购软件优化创企 Brium,剑指英伟达 AI 硬件领域主导地位
这已是AMD两年内的第四笔AI相关收购,前几次分别为2023年8月的Mipsology、同年10月的Nod.AI,以及2024年7月的Silo AI。
6/5/2025 12:37:15 PM
清源
Suno 升级AI音乐编辑工具,允许上传和混音未完成的作品
近日,Suno 这一人工智能音乐创作平台宣布对其音乐编辑工具进行了重大升级。 Suno 的这次更新在其官方博客上发布,正值其面临来自主要唱片公司的版权诉讼之际。 这些唱片公司,包括索尼音乐、环球音乐和华纳音乐,正在与 Suno 及竞争对手 Udio 洽谈音乐录音的许可事宜。
6/5/2025 12:00:55 PM
AI在线
ChatGPT 升级新功能:连接外部服务,助力企业高效办公
随着人工智能技术的快速发展,ChatGPT 在企业用户中的影响力也日益增强。 OpenAI 最新宣布,ChatGPT 现已能够连接多个外部服务,进一步提升其在商业领域的应用效果。 这一举措旨在为用户提供更丰富、实时的上下文信息,使其响应更加精准和有用。
6/5/2025 12:00:55 PM
AI在线
CVPR2025|不改U-Net也能提升生成力!MaskUNet用掩码玩转扩散模型
一眼概览MaskUNet 提出了一种基于可学习掩码的参数筛选机制,在不更新预训练U-Net参数的前提下,有效提升了扩散模型的图像生成质量和下游泛化能力。 核心问题当前扩散模型在不同时间步使用相同U-Net参数生成结构和纹理信息,限制了模型的表达灵活性。 该研究聚焦于:如何在不更改预训练U-Net的参数下,提升其对不同时间步和样本的适应性,以生成更高质量的图像?
6/5/2025 11:52:27 AM
萍哥学AI
NVIDIA 新成果:ProRL 拓展 LLM 推理边界
大家好,我是肆〇柒。 本文想和大家分享一篇来自 NVIDIA 研究团队的前沿论文——《ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models》。 这篇论文挑战了强化学习在大型语言模型(LLM)中作用的传统认知,还提出了一种创新的训练方法 ProRL,通过长时间的强化学习训练,显著提升了模型的推理能力。
6/5/2025 11:51:14 AM
肆零柒
OpenAI久违发了篇「正经」论文:线性布局实现高效张量计算
OpenAI 发论文的频率是越来越低了。 如果你看到了一份来自 OpenAI 的新 PDF 文件,那多半也是新模型的系统卡或相关增补文件或基准测试,很少有新的研究论文。 至于原因嘛,让该公司自家的 ChatGPT 来说吧:「截至目前,OpenAI 在 2025 年在 arXiv 上公开发布的论文数量相对较少,可能反映了其对研究成果公开策略的谨慎态度,可能出于商业保密或安全考虑。
6/5/2025 11:49:59 AM
ACL 2025 | 基于Token预算感知的大模型高效推理技术
本位作者分别来自南京大学,罗格斯大学和马萨诸塞大学阿默斯特分校。 第一作者韩廷旭与共同第一作者王震霆是分别来自南京大学和罗格斯大学的博士生,研究方向聚焦于大模型推理以及安全负责任的生成式人工智能。 通讯作者为南京大学房春荣教授。
6/5/2025 11:49:21 AM
抢快递员饭碗?亚马逊将测试用人形机器人送快递
亚马逊正在测试人形机器人用于包裹投递服务,计划让机器人从Rivian电动送货车中走出,将包裹送至消费者家门口。目前亚马逊已投入2万辆Rivian电动送货车,预计到2030年将增至10万辆。未来人形机器人有望接手投递环节。#亚马逊机器人快递##Rivian电动车#
6/5/2025 11:29:29 AM
远洋
谷歌 CEO 皮查伊:公司在加大投入 AI 的同时将继续扩招工程师
皮查伊说,未来一段时间谷歌将在工程领域持续投资。“我预计我们当前的工程团队明年还会扩大,因为这让我们能够更充分把握各种机遇。我认为这将极大提升工程师的效率,帮助他们摆脱许多繁琐事务。”
6/5/2025 11:22:15 AM
清源
AI 编程神器 Cursor 1.0 发布:BugBot 代码审查、Memories 记忆、一键 MCP 安装等
Cursor 1.0版本正式发布,新增BugBot自动代码审查工具、Memories记忆功能及一键安装MCP服务器等多项实用功能,显著提升开发体验。#AI编程# #Cursor1.0#
6/5/2025 11:21:49 AM
故渊