资讯列表
腾讯开源轻量级混元-A13B模型 1张中低端GPU卡即可部署
腾讯正式发布并开源混元大模型家族的新成员——混元-A13B模型。 该模型采用基于专家混合(MoE)架构,总参数规模达800亿,激活参数为130亿,在保持顶尖开源模型效果的同时,大幅降低了推理延迟与计算开销,为个人开发者和中小企业提供了更具性价比的AI解决方案。 据腾讯方面介绍,混元-A13B模型在极端条件下仅需1张中低端GPU卡即可部署,用户可通过Github、HuggingFace等技术社区下载使用,模型API也已在腾讯云官网上线。
可灵AI推出“视频音效”功能,实现“所见即所听”沉浸体验
可灵AI近日宣布,其全系列视频模型已正式上线**“视频音效”功能**,为用户带来革命性的沉浸式体验。 现在,用户在生成视频的同时,可以同步生成立体声音效,真正实现“所见即所听”。 不仅如此,平台原有的“音效生成”功能也得到了升级,新增了**“视频生音效”模块**。
最低仅需2G显存,谷歌开源端侧模型刷新竞技场纪录,原生支持图像视频
谷歌开源模型,又上新了。 今天凌晨,谷歌正式官宣了Gemma 3n,原生支持文本、图像和音视频等多种模态。 在大模型竞技场中,Gemma 3n取得了1303分,成为了第一个超过1300分的10B以下模型。
快手可灵 AI 宣布上线“视频音效”功能,向用户限时免费开放
可灵 AI 平台原有的“音效生成”功能中也新增了“视频生音效”模块,支持用户上传视频或调用历史作品,支持一键匹配精准同步的音效。
OpenAI员工爆料:已抢先体验GPT-5!7月上线,疑似完全多模态
就在今天,关于GPT-5的讨论再度火了,X上的神秘爆料满天飞。 起因是这样的,Sam Altman在X上关注了了一个叫Yacine的人。 这个人说,自己刚刚试用了一个AI公司的大模型,体验非常震撼。
阿里发布信息检索Agent,可自主上网查资料,GAIA基准超越GPT-4o
Agent能“看懂网页”,像人类一样上网? 阿里发布WebDancer,就像它的名字一样,为“网络舞台”而生。 只要输入指令,它就可以帮你上网搜索、做攻略,实现自主信息检索代理和类似深度研究模型的推理。
苹果出手!改进GRPO,让dLLM也能高效强化学习
最近,扩散语言模型(dLLM)有点火。 现在,苹果也加入这片新兴的战场了。 不同于基于 Transformer 的自回归式语言模型,dLLM 基于掩码式扩散模型(masked diffusion model / MDM),此前我们已经报道过 LLaDA 和 Dream 等一些代表案例,最近首款实现商业化的 dLLM 聊天机器人 Mercury 也已经正式上线(此前已有 Mercury Coder)。
汽车“新物种”:CIO 揭秘AI如何让生产线“会思考”、驾驶舱“懂人心”
随着人工智能(AI)技术的飞速发展,汽车行业正迎来前所未有的变革。 AI技术在汽车制造、自动驾驶、智能座舱、车联网等领域的应用,不仅推动了汽车产业向更高效、更安全、更个性化的方向发展,也为汽车企业带来了新的增长机遇。 本文汇集了企业网D1net2025全国CIO大会上多位汽车行业企业CIO及IT高管在AI应用方面的前沿观察和实战经验,深入剖析了汽车行业AI应用的发展现状、挑战与机遇。
谷歌正式发布 Gemma 3n 小钢炮模型:2GB 内存本地玩转 AI 多模态
在 2025 年 I/O 开发者大会上预览发布后,谷歌已正式推出 Gemma 3n 端侧多模态模型,支持在手机、平板和笔记本电脑上本地运行,处理音频、文本、图片和视频多种数据类型。
巨人网络《太空杀》推出AI原生“残局对决”:三大国产大模型入局,打造多维智能竞技
巨人网络旗下的社交推理游戏**《太空杀》近日上线了全新的AI原生玩法——“残局对决”。 此次更新联合了阿里通义千问、腾讯混元、字节豆包这三大国产大模型,共同打造了游戏行业首个“多用户与AI智能体混合对抗”**的创新竞技机制。 这不仅是《太空杀》AI原生玩法的重要升级,也标志着国产大模型在游戏场景落地应用的前沿探索。
谷歌推出实验性AI试穿应用 Doppl:虚拟时尚新体验
谷歌于本周四在美国iOS和Android平台推出了一款名为 Doppl 的实验性新应用,旨在通过人工智能技术,让用户直观地看到不同服装穿在自己身上的效果。 这款应用利用AI生成用户穿着服装的虚拟形象,甚至能将静态图像转换为动态视频,为用户提供沉浸式的试穿体验。 Doppl 的核心功能在于允许用户上传自己的全身照片,然后通过导入服装照片或截图,在自己的数字版本上进行虚拟试穿。
ElevenLabs推出Voice Design v3 只需一句话,生成任何你想要的声音
近日,AI语音技术领域的领军企业ElevenLabs正式发布其最新语音设计工具Voice Design v3,为内容创作者和开发者带来了前所未有的语音生成体验。 据AIbase了解,这款工具通过简单的文本提示即可生成高度拟人化的语音,支持70多种语言和数百种本地化口音,极大地提升了语音的表达力和真实感。 Voice Design v3的发布标志着AI语音技术在个性化和情感表达方面的重大突破。
OpenAI宣布2025年开发者大会将在旧金山举办,预计吸引1500多名开发者参与
OpenAI 已正式公布了其下一届开发者大会(DevDay)的时间和地点,定于2025年10月6日在旧金山举行。 这次大会将吸引超过1500名开发者参加,预计将成为迄今为止规模最大的一次开发者活动。 此次 DevDay 的议程丰富多彩,包含多个重要环节。
硅基流动 SiliconFlow 品牌焕新:启用新品牌视觉标识,国际站正式上线
硅基流动表示“新 Logo 让扁平化的硅基芯片如水般流动,也恰似撑起 AI 生态的基石,更是对自我价值与使命的再次确认”。
Anthropic 报告:仅 3% 用户会向 AI 寻求“情感陪伴”
Anthropic 最新发布的报告显示,现实远非如此:用户向 Claude 寻求陪伴或情绪安慰的情况极为少见,仅占全部对话的 2.9%。
Salesforce 力压 AI Agent 赛道,称公司 30%-50% 日常工作已被人工智能接管
Salesforce 联合创始人称公司 30%-50% 日常工作已被 AI 接管,今年已裁撤 1000 岗位。该公司发力 AI 赛道,推多款产品。预计年底帮客户“部署 10 亿个 AI 智能体”,约 5000 家客户已在用。#Salesforce AI 变革#
让Agent审查代码,第一版天崩!AI原生Github创始人血泪:话痨、误判,别幻想万能代理,快让AI闭嘴!网友:有效,但没必要
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)“我们用 AI 来做代码审查,结果它比我老板还话多。 ”——这句话可能是很多开发者的真实写照。 最近,一篇名为《How we made our AI code reviewer stop being so noisy》的博客引发了热议。
去年出价被嫌太低,消息称 CoreWeave 再度谋求收购 Core Scientific 实现“AI 公司与矿商整合”
AI云基础设施公司CoreWeave正与数字基础设施企业Core Scientific洽谈收购事宜,这是去年收购提议遭拒后的再次尝试。Core Scientific股价应声大涨33.01%。两家公司已合作多年,去年签署了长达12年的合同。分析认为,类似收购案例将持续增多,因AI公司迫切需要更多运算基础设施。#AI收购潮# #高性能计算#