资讯列表
仅50天!百度蒸汽机视频生成大模型升级2.0版本,价格低至行业70%
8月21日,百度蒸汽机(MuseSteamer)音视频一体化模型完成重大升级,Turbo版、Lite版、Pro版,及有声版全面开放,在行业内首次实现多人有声音视频一体化生成。 百度蒸汽机通过五大技术突破实现“需求即成片”,在生成电影级高清视频画面的同时,实现逼真环境音效、自然人物语音的同步输出。 即日起,用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验,企业用户可在千帆平台享受高性能视频生成服务。
仅50天!百度蒸汽机视频生成大模型升级2.0版本,价格低至行业70%,百万级特效降至“百元”
8月21日,百度蒸汽机(MuseSteamer)音视频一体化模型完成重大升级,Turbo版、Lite版、Pro版,及有声版全面开放,在行业内首次实现多人有声音视频一体化生成。 百度蒸汽机通过五大技术突破实现“需求即成片”,在生成电影级高清视频画面的同时,实现逼真环境音效、自然人物语音的同步输出。 即日起,用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验,企业用户可在千帆平台享受高性能视频生成服务。
Intel 发布全新机架级 AI 芯片 Jaguar Shores,搭载 HBM4 内存
Intel 近日首次曝光了其新一代 AI 芯片 Jaguar Shores。 这款芯片正在被 Intel 的热工程团队进行测试,目的是为寻找合适的冷却方案。 Jaguar Shores 被安装在一块开发板上,其封装尺寸达到 92.5mm×92.5mm,显示出它是为高性能计算(HPC)平台而设计。
企业已向生成式 AI投资大量资金,但95%的回报为零
尽管企业在生成式人工智能(AI)领域投入了高达300亿至400亿美元的资金,但最新的麻省理工学院(MIT)报告显示,95% 的组织并未从中获得任何回报。 这一数据引发了人们对 AI 投资效果的深刻思考。 图源备注:图片由AI生成,图片授权服务商Midjourney该报告指出,只有5% 的集成人工智能试点项目能够 “创造出数百万美元的价值”,而大多数企业在使用这些技术后,并未见到显著的利润增长。
GPT-5点赞!八大顶尖机构发布「自进化智能体」全面综述
LLM驱动的AI智能体已展现出惊人潜力:它们以LLM为核心,集成感知模块(处理文本/图像/音频/视频)、规划模块(如链式思考CoT或树式思考ToT)、记忆模块(短期上下文存储与长期知识检索)和工具模块(调用API如搜索引擎或代码执行器)。 在单智能体系统中,这些组件协同工作,处理从网页导航、代码生成、投资辅助到生物医学分析的任务。 而在多智能体系统(MAS)中,智能体间通过协作(如辩论或任务分解)攻克复杂问题,模拟人类团队的群体智能。
GPT-5空间智能大考:简单任务称王,复杂挑战平手,所有模型都输给了人类
大家好,我是肆〇柒。 今天我们要探讨一篇由 DeepMind 联合 Stanford HAI(斯坦福以人为本人工智能研究院)共同发布的重磅实证研究报告。 这份报告首次对GPT-5的空间智能能力进行了系统性、标准化的全面评估,其结论可能会更加清晰我们对当前AI能力边界的认知。
USENIX Security 25 | TEE+Legacy GPU混合算力下的模型隐私安全攻防
近日,字节跳动安全研究团队、北京大学和伊利诺伊大学香槟分校合作的研究论文《Game of Arrows: On the (In-)Security of Weight Obfuscation for On-Device TEE-Shielded LLM Partition Algorithms》被安全领域国际顶会USENIX Security收录。 USENIX Security 会议是网络与信息安全领域的四大顶级会议之一,也是中国计算机学会推荐的网络与信息安全领域A类国际学术会议。 该会议享有广泛的学术影响和深厚的学术底蕴,近五年平均录用率约为20%。
马斯克一觉醒来,Space X在京开卖了
西风 发自 凹非寺. 量子位 | 公众号 QbitAI马斯克一觉醒来,新品Space X在京被发布了(doge)! 只不过这次不是火箭,是支笔,专门用来辅导学习的那种。
应届生看过来!上海AI Lab校招通道已开,100+岗位,700+offer,让科研理想照进现实!
上海人工智能实验室,2026 届全球校园招聘正式启动, 100 职位等你 Pick。 欢迎加入上海人工智能实验室一起并肩,Think Bold, Contribute Big,共同定义AGI 未来! 寻找这样的同路人(期待你拥有):AGI 的坚定信仰者:深信伟大突破源于解决根本问题,顶会论文是水到渠成的“自然结果”,而非刻意追逐的终点。
击败Meta登榜首:推理增强的文档排序模型ReasonRank来了
本文的第一作者是刘文涵,就读于中国人民大学高瓴人工智能学院,博士三年级,导师为窦志成教授,目前在百度大搜部门进行实习。 他的研究方向聚焦于 AI 搜索,在顶级国际会议如 ACL、WWW 等发表了多篇论文。 推理大模型(Large Reasoning Model)极大的促进了自然语言处理领域的发展,而信息检索领域的核心问题之一是文档排序,如何利用强大的推理大模型通过主动推理来判断文档的相关性,进而再对文档进行排序是一个值得探索的方向。
速卖通“新品闪电推”亮相:AI Agent自动整合资源,新品7天破零率翻倍
阿里旗下跨境电商平台速卖通(AliExpress)近日推出了一款重磅新品营销AI Agent——“新品闪电推”。 这一创新工具旨在通过人工智能技术,帮助商家实现新品的快速出单,显著提升运营效率。 据悉,“新品闪电推”的核心优势在于其高度的自动化和智能化。
高性能计算群星闪耀时
“没有高性能计算,就没有大模型。 ”自 2023 年以来,伴随大模型崛起的除了芯片,还有芯片与模型之间的中间层——系统软件优化,其中高性能计算(HPC)背景出身的研究员参与占比大幅攀升。 但对大众来说,HPC 之于 LLM 的战略意义仍是晦涩艰深的,直到 DeepSeek 杀出重围,软硬协同的力量被具象化,他们才被更多关注。
写给小白的“具身智能”入门科普
最近具身智能这个概念很火。 那么,究竟什么是具身智能? 它包括哪些类别和关键技术?
CIO可能无意间阻碍AI战略落地的方式
奥斯卡·王尔德曾说:“以最美好的初衷,往往做出最糟糕的作品。 ”几乎所有目睹过精心策划的AI战略突然分崩离析的CIO都会证明,善意并非成功的保证。 没有哪位CIO希望破坏或延误重要的AI计划,但这种情况发生的频率远超许多领导愿意承认的程度,因此,对AI计划进行强有力的控制,现已成为CIO的首要任务。
智创飞跃|AI 社会公益,科技温暖人心
Google 谷歌坚持以科技力量为社会带来积极改变,一起走进 2025 Google 开发者大会,深入探索谷歌携手开发者、创作者及生态伙伴共同打造的一系列“AI 社会公益”创新实践,了解如何通过技术使人人受益。 谷歌始终关注如何将技术转化为人类福祉的推动力。 面对因身体挑战而产生的沟通或行动障碍,谷歌正努力通过 AI 提供更包容、更具人性化的解决方案,让每个人都能跨越障碍,与世界建立连接,从而获得更广阔、更自主的人生。
金山办公半年报:AI月活用户突破2900万,WPS365营收暴增62%
金山办公(688111)发布2025年半年报,展现出稳健的增长态势。 公司上半年实现营业收入26.57亿元,同比增长10.12%;归属于母公司所有者净利润7.47亿元,同比增长3.57%;扣非净利润7.27亿元,同比增长5.77%。 AI技术引领用户增长新高AI技术的深度应用为金山办公带来显著效果。
OpenAI首度实现月入10亿!但算力不足成最大难题
在人工智能领域的迅猛发展中,OpenAI 近日传出好消息,财务主管 Sarah Friar 在接受 CNBC 采访时透露,公司的月收入首次突破10亿美元。 这一里程碑的成就,标志着 OpenAI 自2022年底推出 ChatGPT 以来的快速增长,预计今年营收将增长至127亿美元。 尽管收入喜人,Friar 却表示,OpenAI 依然面临着巨大的算力需求压力。
ElevenLabs 发布 v3 Alpha API:支持超过 70 种语言和无限数量的虚拟角色
2025 年 8 月 20 日,全球领先的 AI 语音技术公司 ElevenLabs 正式宣布推出其最新的 Eleven v3 Alpha API,为开发者提供了一个突破性的文本转语音(Text-to-Speech, TTS)工具。 Eleven v3 Alpha API 被誉为“地球上最具表现力的文本转语音模型”,其核心优势在于支持超过 70 种语言,能够生成自然、流畅且富有情感的语音输出。 该 API 引入了全新的对话模式(Dialogue Mode),允许开发者创建多角色对话场景,支持无限数量的虚拟角色,并能处理语气变化、情感波动和对话中的自然中断。