应用
8 秒转录 30 分钟播客:MacWhisper 应用接入英伟达 Parakeet 模型
科技媒体 9to5Mac 昨日(6 月 27 日)发布博文,报道称 macOS 应用 MacWhisper 在近期版本更新中,通过接入英伟达的 Parakeet 模型,转录速度飙升。
阿里通义千问宣布推出多模态模型 Qwen VLo,实现从感知到生成的跨越
阿里云通义千问刚刚发文,宣布推出最新的 Qwen VLo—— 一个多模态统一理解与生成模型,用户可以通过 Qwen Chat(chat.qwen.ai)进行体验。
苹果最新 AI 研究:使其理解手机系统及 App 各种操作的后果,避免执行未经授权的高风险行为
苹果与华盛顿大学研究人员联合发表论文,探讨让AI学会判断手机App操作后果,避免高风险动作。2026年苹果系统升级将加入AI智能体自主行为功能。研究建立分类法标注动作风险,但AI模型判断仍存在问题。##苹果AI研究##
因 AI 数据中心用电量激增,Meta 再与能源开发商 Invenergy 签采购大单
Meta与再生能源开发商Invenergy签署四份新合约,采购791MW太阳能与风力发电,以应对AI数据中心用电激增。电能将供应自美国俄亥俄州等地。#Meta##可再生能源#
马斯克宣布 7 月 4 日后发布 Grok 4 模型
IT之家注意到,马斯克曾多次预热 Grok 3.5,并表示考虑将其命名为 Grok 4,如今来看确定命名为 Grok 4 了。
消息称字节 Seed 多个机器人相关业务招一号位,成立独立公司
据《新智核》今日爆料,字节旗下 Seed 团队将招募多个机器人相关业务的一号位,包括机器人产品负责人、机器人工程技术负责人,以及具身智能大模型负责人。这一系列动作表明,Seed 在机器人及具身智能领域加速布局的决心。
重磅!中国首个海洋开源大模型 “沧渊” 问世,助力海洋智能时代!
中国首个海洋领域的开源大模型 OceanGPT(沧渊)在浙江杭州正式发布。 这一创新成果由浙江大学海洋精准感知技术全国重点实验室牵头研发,标志着中国在海洋科技领域迈出了重要一步。 OceanGPT 具备基础的海洋专业知识问答能力,能够对声呐图像、海洋观测图等多模态数据进行自然语言解读。
未来已来!Hengbot发布 Sirius 机器狗,能跳舞会踢球,还有AI陪聊
Hengbot公司正式推出了其最新的 Sirius 机器狗,这款机器狗不仅在敏捷运动方面表现出色,还集成了 OpenAI 的大语言模型,能够进行语音对话,甚至跳舞和踢足球,真是一位多才多艺的 “宠物”!根据 Hengbot 的介绍,Sirius 机器狗具有 “快速运动” 的能力,它能随着音乐律动而跳舞,还能与主人 “握手”。 其腿部和头部内部配备了14个运动轴,以及名为 “Neurocore” 的专属关节,使得它的动作更加自然流畅。 不过需要注意的是,这款机器狗主要适合在平坦的室内表面活动,设计上并不适合在楼梯等复杂环境中使用。
应对深度伪造:丹麦拟赋予公民对自身身体与声音“版权”
丹麦未来将禁止分享深度伪造或其它对个人特征数字模仿,分享对艺术家表演的逼真数字模仿品也将被视为违法。
「6月27日AI日报」腾讯开源轻量级混元-A13B模型;可灵AI推“视频音效”功能
欢迎来到AIbase【AI日报】栏目!每天三分钟了解当日AI大事件,助你洞悉AI行业趋势、创新AI产品应用。 更多AI资讯访问:、腾讯开源轻量级混元-A13B模型1张中低端GPU卡即可部署腾讯发布混元大模型家族的新成员混元-A13B模型,采用专家混合(MoE)架构,总参数规模达800亿,激活参数为130亿,大幅降低推理延迟与计算开销,为个人开发者和中小企业提供更具性价比的AI解决方案。 该模型在数学、科学和逻辑推理任务中表现出色,支持调用工具生成复杂指令响应。
全球独角兽榜单出炉!SpaceX、字节跳动和OpenAI荣登前三甲
胡润研究院近日发布了《2025全球独角兽榜》,这份榜单令人瞩目,列出了自2000年后成立、估值超过10亿美元的非上市公司。 根据榜单统计,全球独角兽企业的数量已达到1523家,创下历史新高!在这个数量惊人的榜单中,美国以758家的独角兽数量高居榜首,中国则以343家紧随其后,印度和英国分别位列第三和第四。 榜单的明星无疑是 SpaceX,凭借26000亿元人民币的估值,首次成为全球最高价值的独角兽。
Suno 收购 WavTool,强化 AI 音乐编辑工具 amid 音乐版权争议
AI 音乐公司 Suno 在本周四宣布收购 WavTool,这是一款基于浏览器的 AI 数字音频工作站(DAW)。 此举旨在增强 Suno 在歌曲创作和制作方面的编辑能力。 WavTool 于2023年推出,提供多种功能,包括音频分离、AI 音频生成和 AI 音乐助手,预计将与 Suno 最新推出的编辑界面相结合。
业界首个:腾讯混元-A13B 模型发布并开源,极端条件 1 张中低端 GPU 卡即可部署
混元-A13B 作为基于专家混合(MoE)架构的大模型,总参数 800 亿、激活参数 130 亿,号称“在效果比肩顶尖开源模型的同时,大幅降低推理延迟与计算开销”。
腾讯开源轻量级混元-A13B模型 1张中低端GPU卡即可部署
腾讯正式发布并开源混元大模型家族的新成员——混元-A13B模型。 该模型采用基于专家混合(MoE)架构,总参数规模达800亿,激活参数为130亿,在保持顶尖开源模型效果的同时,大幅降低了推理延迟与计算开销,为个人开发者和中小企业提供了更具性价比的AI解决方案。 据腾讯方面介绍,混元-A13B模型在极端条件下仅需1张中低端GPU卡即可部署,用户可通过Github、HuggingFace等技术社区下载使用,模型API也已在腾讯云官网上线。
惊天内幕!Anthropic 因训练 AI 销毁数百万本书籍,版权纠纷再升级!
生成式人工智能因其可靠性不足、巨大能耗以及未经授权使用版权材料而备受争议。 然而,最近一起针对人工智能公司 Anthropic 的法庭案件揭示了一个更令人震惊的真相:为了训练其 AI 助手,该公司竟然销毁了数百万本实体书籍。 在这起案件中,法官发现 Anthropic 为构建其语言模型 Claude,进行了大规模的书籍销毁行为。
可灵AI推出“视频音效”功能,实现“所见即所听”沉浸体验
可灵AI近日宣布,其全系列视频模型已正式上线**“视频音效”功能**,为用户带来革命性的沉浸式体验。 现在,用户在生成视频的同时,可以同步生成立体声音效,真正实现“所见即所听”。 不仅如此,平台原有的“音效生成”功能也得到了升级,新增了**“视频生音效”模块**。
快手可灵 AI 宣布上线“视频音效”功能,向用户限时免费开放
可灵 AI 平台原有的“音效生成”功能中也新增了“视频生音效”模块,支持用户上传视频或调用历史作品,支持一键匹配精准同步的音效。
谷歌正式发布 Gemma 3n 小钢炮模型:2GB 内存本地玩转 AI 多模态
在 2025 年 I/O 开发者大会上预览发布后,谷歌已正式推出 Gemma 3n 端侧多模态模型,支持在手机、平板和笔记本电脑上本地运行,处理音频、文本、图片和视频多种数据类型。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉