AI新词
xAI 推最快语音代理 API,支持中文实时搜索与情绪控制
据 AIbase 报道,xAI 正式发布了 Grok 语音代理 API,以每分钟仅 0.05美元的极具竞争力价格,在实时语音 AI 领域掀起了性能与性价比的双重风暴。 该模型在音频推理基准测试中高居榜首,凭借不足1秒的首音延迟,实现了比竞品快近5倍的响应速度。 技术上,Grok 语音代理不仅支持包括中文在内的数十种语言自动检测与自由切换,更深度集成了实时网页搜索与推理能力,使其回复能够紧跟全网最新资讯。
火山引擎发布 AI 节省计划,豆包大模型最高降价47%
在12月18日举办的火山引擎 FORCE 原动力大会上,火山引擎总裁谭待发布了多项重磅更新,旨在通过视觉模型进化、生态整合及极具竞争力的定价策略,加速 AI 在企业端的规模化普惠。 在多模态领域,豆包视觉模型迎来双重迭代。 图像创作模型 Seedream4.5 能力显著增强,已支持多图组合、创意写真、虚拟试穿及海报设计等多种商业化功能。
Gemini3Flash 正式面向 Perplexity Pro 与 Max 用户开放
12月18日,人工智能搜索平台 Perplexity 宣布,其集成的最新大模型 Gemini3Flash 已全面向 Pro 和 Max 订阅用户开放。 此次更新标志着 Perplexity 在提升响应速度与推理效率方面迈出关键一步。 Gemini3Flash 是谷歌近期推出的轻量级高性能模型,主打低延迟与高吞吐能力,在保持强大语言理解能力的同时,显著优化了推理成本与响应速度。
xAI重磅发布Grok Voice Agent API:每分钟仅0.05美元,音频推理基准登顶第一!
xAI正式推出Grok Voice Agent API,为开发者开放实时语音交互能力。 这一API基于Grok语音技术栈打造,已在移动应用和数百万Tesla车辆中服务海量用户,现向全球开发者全面开放。 极致性价比:每分钟仅0.05美元 Grok Voice Agent API以行业领先的成本效率脱颖而出,采用简单平价计费模式——每分钟连接时间仅0.05美元。
Mozilla新任CEO上任:AI功能将进Firefox,但“必须可关闭”
在AI重塑浏览器定义的关键时刻,Mozilla迎来新掌舵人——Anthony Enzor-DeMeo正式出任CEO,接替临时CEO劳拉·钱伯斯(Laura Chambers)。 这位前Firefox业务总经理的升任,标志着这家以隐私和开放网络为使命的组织,正试图在AI浪潮中走出一条“不妥协”的第三条路。 当前,浏览器市场正经历十年未有之变局。
豆包大模型日均使用量破 50 万亿,火山引擎发布两大新品引领AI原生架构升级
在12月18日举办的FORCE原动力大会上,火山引擎交出了一份惊人的成绩单:截至今年12月,豆包大模型日均Tokens使用量已突破50万亿,稳居中国第一、全球第三。 会上,火山引擎正式发布了豆包大模型1.8与视频生成模型Seedance1.5pro。 其中,豆包1.8版本针对多模态Agent场景进行了深度优化,不仅视觉理解能力大幅提升,支持超长视频分析,更在工具调用和复杂指令遵循上达到了全球第一梯队水平。
Adobe被诉用盗版书籍训练AI模型,SlimLM陷版权风波
近日,俄勒冈州作家伊丽莎白·莱昂(Elizabeth Lyon)对Adobe提起集体诉讼,指控其在训练名为 SlimLM 的小型语言模型时,使用了包含其盗版作品在内的非法数据集。 SlimLM是Adobe推出的一系列轻量化语言模型,专为移动设备上的文档辅助任务(如摘要、改写、问答)优化。 Adobe官方称,该模型基于 SlimPajama-627B 数据集进行预训练——这是由AI芯片公司Cerebras于 2023 年 6 月发布的开源、去重、多来源语料库。
Adobe 遭集体诉讼,被指使用盗版书籍训练 AI 模型
软件巨头 Adobe 近日面临一项拟议的集体诉讼,指控其在训练人工智能模型时非法使用了受版权保护的盗版书籍。 俄勒冈州作者伊丽莎白·里昂(Elizabeth Lyon)代表受影响群体提起诉讼,称 Adobe 在开发其名为 SlimLM 的轻量级语言模型时,使用了包含她作品在内的盗版书籍数据集。 诉讼指出,SlimLM是在开源数据集 SlimPajama-627B 上进行预训练的。
千问 App 全面接入高德地图,AI 赋能出行“顺路”体验
出行与生活服务的边界正在被 AI 进一步打破。 近日,阿里旗下通义千问(千问 App)正式宣布全面接入高德地图,将高德深厚的地理位置数据与 AI 的复杂任务处理能力深度融合,为用户打造“问答即服务”的全新出行模式。 在最新的版本中,千问 App 不仅是一个聊天伙伴,更成为了一个懂生活的智能导航员。
马斯克:xAI 欲在三年内登顶,AGI 时代最快明年开启
近日,埃隆·马斯克在其人工智能公司xAI旧金山总部召开的全员大会上,向员工展示了极为宏大的愿景。 马斯克明确表示,只要公司能在未来两到三年的关键窗口期内稳步发展,xAI 终将超越现有的所有竞争对手,成为全球人工智能领域的领军者。 在这场被内部人士形容为“气氛热烈”的会议中,马斯克不仅分享了对行业格局的判断,还给出了极具挑战性的时间表。
苹果开源 SHARP 模型:告别漫长等待,1秒让平面照片跃升3D 空间
在3D 内容创作领域,苹果公司近日投下了一枚“深水炸弹”。 据科技媒体9to5Mac 披露,苹果正式开源了一款名为SHARP的新型 AI 模型。 这项技术最令人惊叹之处在于,它打破了传统3D 重建动辄数小时的耗时瓶颈,仅需不到一秒钟,就能将一张普通的2D 照片转化为具有真实物理比例的3D 场景。
Google将“氛围编程”工具Opal深度集成至Gemini,零代码打造专属AI助手Gems
Google正将Gemini从通用聊天界面,转变为人人可用的AI应用创作平台。 近日,公司正式将“氛围编程”(vibe-coding)工具 Opal 整合进Gemini网页应用(gemini.google.com),用户现在可直接在浏览器中通过自然语言描述,零代码构建个性化迷你应用,并一键保存为专属AI助手——Gems。 Gems是Google于2024年推出的自定义AI助手体系,支持用户针对特定场景(如学习辅导、职业规划、编程协作、文案润色等)定制专属智能体。
追赶竞品压力大,亚马逊 AGI 部门换帅:Nova 模型生父普拉萨德离职
亚马逊内部近期迎来重大的人事余震。 据 IT之家 援引 Business Insider 消息,负责亚马逊尖端 AI 模型研发的关键人物——高级副总裁兼首席科学家罗希特・普拉萨德(Rohit Prasad)已确定将于年底离职。 作为直接向首席执行官安迪・贾西汇报的核心高管,普拉萨德在两年前受命组建通用人工智能(AGI)部门,被寄予了带领亚马逊重回 AI 巅峰的厚望。
Adobe 陷入 AI 侵权风暴,知名作家指控其非法使用 Books3训练
据 AIbase 报道,继 Meta、苹果及 Anthropic 等巨头之后,软件大厂 Adobe 如今也深陷人工智能版权纠纷。 近日,俄勒冈州作家伊丽莎白·里昂(Elizabeth Lyon)提起集体诉讼,指控 Adobe 在开发其小型语言模型系列 SlimLM 时,使用了包含大量盗版书籍的非法数据集进行预训练。 作为 Adobe AI 布局的重要组成部分,SlimLM 旨在优化移动设备上的文档辅助任务,但原告指出,该模型所依赖的开源数据集 SlimPajama-627B 实际上是 RedPajama 的衍生副本,而后者因收录了含有19.1万本侵权书籍的“Books3”数据库而广受诟病。
AI 开发新范式:谷歌发布 Gems 可视化编辑器,文字一秒变 App
据 AIbase 报道,谷歌于周三宣布将其“氛围编程”(Vibe-coding)工具 Opal 正式引入 Gemini 平台,标志着 AI 驱动的应用开发进入“零代码”时代。 此次集成允许用户直接在 Gemini 网页版的 Gems 管理器中,通过自然语言描述来构建名为“Gems”的自定义 AI 迷你应用。 Gems 自2024年发布以来,已涵盖学习教练、编程伙伴及编辑等多种预设场景,而 Opal 的加入则进一步强化了其灵活性,使用户能够通过调用不同的 Gemini 模型,将创意快速转化为可重复使用的独立应用。
Meta发布SAM Audio:全球首个支持“点击分离声音”的多模态音频模型,一键提取吉他声、人声或狗叫
Meta正式推出音频处理领域的重磅突破——SAM Audio,全球首个统一的多模态音频分离模型。 它能让用户像“用眼睛听声音”一样,从一段混杂的视频或音频中,一键提取出任意目标声音:点击视频中的吉他手,立刻分离出纯净吉他声;输入“狗吠”,自动过滤掉整段播客中的犬吠噪音;甚至只需圈定时间片段,即可精准剔除干扰音。 这项技术首次将人类自然感知声音的方式——看、说、指、选——完整复刻到AI系统中。
估值狂飙!OpenAI 传拟融资千亿美金,目标直指 7500 亿美元
据路透社援引《The Information》的最新消息,OpenAI目前正与投资者进行初步洽谈,计划筹集数百亿甚至高达 1000亿美元 的巨额资金。 如果这一融资计划达成,OpenAI 的估值将飙升至 7500亿美元 左右。 这一估值数字令人咋舌,意味着 OpenAI 在短短两个月内身价暴涨了50%——今年10月,在该公司员工出售约66亿美元股票时,其估值约为5000亿美元。
Gemini 3 Flash登场:免费、极速、智力反超Pro,谷歌AI全面进入“零延迟”时代
谷歌再次改写大模型性能与成本的边界。 今日,公司正式发布新一代轻量级模型 Gemini3Flash——不仅响应速度达到前代三倍、近乎“零延迟”,更在多项高难度基准测试中反超同代旗舰Gemini3Pro,成为史上首个在同期对比中“小弟干翻大哥”的Flash模型。 更令人意外的是,这一顶尖性能版本全球免费开放,默认集成于Gemini App、AI Studio、Google Antigravity及CLI工具中。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉