AI新词
字节跳动发布 Seedance 1.5 Pro:AI 音视频创作进入 100% 视听同步时代!
12月16日,字节跳动在北京正式发布了其新一代音视频创作模型 ——Seedance1.5pro。 这一全新的创作工具不仅在音视频生成领域实现了重大突破,还为用户带来了更为丰富的视听体验。 Seedance1.5pro 支持音视频的联合生成,用户可以通过文本输入生成音视频内容,或者利用图像引导生成音视频。
Meta AI 眼镜重磅升级:新增“对话聚焦”和 Spotify 视觉配乐功能
Meta 公司周二宣布对其 Ray-Ban Meta 和 Oakley Meta HSTN 智能眼镜进行软件更新(v21),推出了两项关键新功能:“对话聚焦”以增强嘈杂环境中的听力清晰度,以及与 Spotify 合作的“视觉配乐”功能。 实用功能上线:AI 增强嘈杂环境中的对话清晰度本次更新中最具实用性的功能是**“对话聚焦”(Conversation Focus)。 该功能利用 AI 眼镜的开放式扬声器和人工智能技术,能够放大对话者的声音**,从而帮助用户在嘈杂的环境,如繁忙的餐厅、酒吧或通勤列车中,更清晰地听到对方说话。
谷歌升级 Gemini2.5Flash Native Audio 提升语音助手表现
谷歌最近发布了 Gemini2.5Flash Native Audio 的更新,显著增强了其语音助手的功能。 这一版本旨在更好地处理复杂的工作流程,提高执行用户指令的准确性,同时使对话更加自然流畅。 根据谷歌的反馈,新版本在开发者指令的遵循率上从84% 提升至90%,这表明语音助手在理解和执行用户请求方面有了显著进步。
日本科学家发布“Sui”编程语言,宣称能让 LLM100% 准确编写代码
日本数据科学家 Takato Honda (本田崇人) 近日推出了一门全新的开源编程语言 “Sui”(粋),旨在革命性地解决大型语言模型(LLM)编写代码的准确性问题,并宣称能让 LLM 以100% 的准确率生成代码。 据悉,该语言的名称源于日本美学中的 “粋”,意为**“精炼”和“去除冗余”,其设计理念是只保留必需品。 Sui 的核心设计原则包括:结构上保证零语法错误率**;通过使用数字作为变量而非名称,实现零拼写错误;保证行级独立性,即每一行代码都是完全独立的;它被设计为一门纯逻辑语言,仅用于计算,用户界面可以自由搭配任何现有框架(如 React、Vue 等)来实现。
OpenAI深夜放大招:GPT Image 1. 5 免费开放,生成速度提升 4 倍,奥特曼晒“男模照”引爆网络
OpenAI再次搅动AI图像生成赛道。 今日凌晨,公司正式发布全新图像模型 GPT Image 1.5,并宣布向所有免费ChatGPT用户开放使用——无需付费订阅,即可体验目前最先进的文生图能力。 新模型相较上一代GPT Image1 实现四大关键升级: - 指令遵循更精准:能准确理解复杂、多条件的提示词; - 编辑控制更精细:局部修改不再破坏整体构图; - 细节保留更完整:人物五官、纹理、光影一致性显著提升; - 生成速度提升 4 倍:大幅缩短用户等待时间。
阿布扎比 G42推出87亿参数的开源印英语言模型 NANDA87B
阿布扎比的人工智能集团 G42于周二正式发布了 NANDA87B,这是一款拥有87亿参数的开源印英大型语言模型,标志着其早期版本 NANDA 的升级。 NANDA87B 现已在 MBZUAI 的 Hugging Face 页面上以开放权重的形式提供,开发者、创作者和企业可以自由使用并扩展其功能。 这款模型由穆罕默德・本・扎耶德人工智能大学(MBZUAI)与 G42旗下的 Inception 公司及芯片制造商 Cerebras 合作开发。
OpenAI 推出全新图像生成模型 GPT Image 1.5,性能显著提升!
OpenAI 于正式发布了其最新的图像生成模型 GPT Image1.5,标志着 ChatGPT 在视觉创作能力上的重大突破。 这一新模型不仅能够生成高保真的图像,还在理解用户指令方面表现优异,具备极强的提示词遵循能力。 新版本的 GPT Image1.5能够从零开始创作图像,或者在用户上传的照片基础上进行编辑,同时保留原图的核心要素,准确执行用户的各种指令。
AI硬件神器!Stickerbox一键把孩子脑洞“打印”成贴纸,家长直呼太会玩了
AIbase报道 2025年,AI硬件再次迎来新奇爆款:一款专为儿童设计的创意神器——Stickerbox。 它将孩子的口头想象力直接转化为实体贴纸,真正实现了“说出来的故事,打印成现实”。 这款产品一经曝光,迅速成为家长圈和科技圈的热议焦点。
中国信通院建设的人工智能产品安全漏洞专业库(CAIVD)正式上线运行
中国信息通信研究院(简称 “中国信通院”)在工业和信息化部网络安全管理局的指导下,正式推出了人工智能产品安全漏洞专业库(简称 CAIVD)。 这一全新的专业库现已上线,网址为 ai.nvdb.org.cn,旨在加强人工智能产品的安全管理,提升网络产品的安全性。 CAIVD 的建立是为了贯彻《网络产品安全漏洞管理规定》的要求,并加强对网络产品安全漏洞的管理。
OpenAI与迪士尼达成“股权换IP”重磅合作:Sora获米老鼠等200+角色授权,押注AI视频未来
一场颠覆传统授权模式的战略联姻,正在重塑AI与娱乐产业的边界。 据知情人士透露,OpenAI与迪士尼达成一项极具创新性的合作:OpenAI以**认股权证**(warrants)而非现金,获得了迪士尼旗下超过 200 个经典角色的使用权——包括米老鼠、灰姑娘、小美人鱼Ariel、狮子王辛巴等标志性IP。 此举不仅让Sora文生视频模型一举坐拥全球最具价值的动画角色库,更将两家巨头的未来深度绑定。
ChatGPT 新增分支聊天功能:多线程对话轻松实现
OpenAI 正式宣布,ChatGPT 在 iOS 和 Android 平台上推出了备受期待的分支聊天功能。 这项新功能使用户在与 AI 对话时,可以创建多个并行的对话分支,轻松探索不同的话题和思路。 分支聊天功能的引入,旨在帮助用户在聊天过程中实现更灵活的对话方式。
Canva 可画向中国市场推出对话式 AI 助手,简化设计流程
在近日的年度分享会上,视觉设计平台 Canva 可画正式在中国市场推出了其全新的对话式 AI 助手 ——Canva AI。 该产品旨在通过自然对话来简化设计流程,让用户的创作体验更加轻松和高效。 Canva AI 的核心理念是 “对话启动、边聊边改”。
蚂蚁数科开源数据智能体技术,助力企业轻松实现数据分析!
在近日举办的第二届 CCF 中国数据大会上,蚂蚁数科重磅宣布将开源其先进的数据智能体技术 ——Agentar SQL。 这一技术的推出,让普通用户也能通过简单的日常语言来进行复杂的商业数据查询和分析,为企业的数字化转型提供了强有力的支持。 此次开源的首个产品是实时文本转结构化查询语言(Text-to-SQL)框架,旨在帮助开发者快速搭建数据查询方案,显著提升文本与数据库的交互效率。
AI 初创公司Resemble筹集 1300 万美元以应对深度伪造技术威胁
最近,总部位于多伦多和旧金山的初创公司 Resemble AI 成功完成了最新一轮融资,筹集了1300万美元。 该公司的投资者包括谷歌的 AI 未来基金、Okta Ventures、台湾资本、Gentree Fund、IAG 资本伙伴、伯克利前沿基金以及 KDDI。 这次融资使 Resemble AI 迄今为止的总融资额达到了2500万美元。
Lightspeed 创下 90 亿美元融资纪录,专注投资 AI 初创企业
硅谷的风险投资公司 Lightspeed Venture Partners 近日宣布成功融资90亿美元,创下该公司的历史最高纪录。 这笔巨额资金将使 Lightspeed 能够继续在资本需求较大的人工智能(AI)初创企业中进行投资。 在2021年风险投资市场经历了一轮繁荣后,许多投资公司未能获得预期的回报。
菜鸟与蜜雪冰城达成战略合作:AI 与物流供应链科技赋能“万店扩张”
国内最大的数字化供应链管理系统提供商菜鸟,近日宣布与高速增长的茶饮巨头蜜雪冰城达成合作。 此次合作涉及人工智能(AI)和物流供应链科技领域。 蜜雪冰城集团的业务扩张速度惊人。
微软 Copilot “入侵” LG 电视:用户投诉 AI 应用无法卸载,隐私设置成关键
微软正积极将其 Copilot 人工智能助手整合到其特制笔记本电脑系列之外的其他科技产品中。 现在,一些 LG 智能电视用户发现,Copilot 应用已悄然出现在他们的设备上,并且无法卸载。 据 Engadget 报道,过去几天 Reddit 上出现了大量用户投诉,称其 LG 智能电视上突然出现 Copilot 应用。
OpenAI 支持的生物技术新星 Chai Discovery 完成1.3亿美元 B 轮融资,估值达13亿美元
致力于将人工智能应用于药物研发的生物技术初创公司 Chai Discovery 于周一宣布,已成功完成 1.3亿美元的 B 轮融资,公司估值飙升至 13亿美元。 此次融资由 General Catalyst 和 Oak HC/FT 共同领投,巩固了 Chai Discovery 在蓬勃发展的 AI 驱动药物发现领域中的领先地位。 其他知名投资者也积极参与,包括 Menlo Ventures、OpenAI、Dimension、Thrive Capital、Neo、Yosemite Venture Fund、Lachy Groom、SV Angel,以及新加入的 Glade Brook 和 Emerson Collective。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
AI新词
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
腾讯
算法
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
AI设计
生成式AI
大型语言模型
搜索
视频生成
亚马逊
AI模型
特斯拉
DeepMind
场景
深度学习
Copilot
Transformer
架构
MCP
编程
视觉