资讯列表
面壁智能发布端侧大模型“前进四”MiniCPM 4.0,号称性能大小王
该公司称新模型通过自研 CPM.cu 推理框架,在极限场景下实现最高 220 倍提速,常规 5 倍提速,支持在 vLLM、SGLang、LlamaFactory 等框架部署。
谷歌 Gemini 上线“计划操作”功能:动动手就能让“AI 秘书”帮你完成任务
“计划操作”目前仅向订阅 Gemini 付费服务的用户开放,包括 Google AI Pro、Ultra,以及 Google Workspace 的商业和教育版用户。
2025 世界人形机器人运动会开启报名,8 月 15 日北京开幕
2025世界人形机器人运动会将于8月15日-17日在北京鸟巢和冰丝带举行,今日开启报名。赛事设置竞技、表演和场景赛三类,涵盖田径、舞蹈、清洁服务等项目。国内外企业、高校等均可组队参赛。#机器人##科技体育#
博世携手阿里云推出智能座舱新体验:3D 数字人助力 AI 交互
近日,德国科技巨头博世与阿里云达成合作,双方共同推动通义大模型在智能座舱领域的应用。 这一创新方案不仅提升了汽车内部环境的智能感知能力,还实现了与 3D 数字人的交互,给用户带来了前所未有的体验。 在现代汽车的智能座舱中,乘客和驾驶员可以通过语音和视觉与车辆进行更自然的沟通。
具身智能最权威的一场圆桌!王兴兴回应质疑:当AI和具身智能到达某一阶段,机器人一定能打格斗!机器人届的格斗冠军和马拉松冠军都来了
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)宇树、银河通用、穹彻智能……当国内顶尖的机器人玩家同框,能碰撞出什么样的火花? 在今天智源做的AI春晚上,搞了一个很炸裂的“具身智能会客厅”,请来了王兴兴、熊友军、王鹤等顶尖大佬,分享最新进展和自己对行业的判断和洞察。 会上,王兴兴首次回应了机器人格斗“秀肌肉”的质疑,他表示格斗的关键在于动作的演示:因为我们公司终极目标还是希望机器人是干活的,无论是家里还是工厂。
Figma 推出新工具,助力 AI 更精准地转换设计为代码
Figma 近日宣布推出一款全新的开发者工具,旨在帮助人工智能(AI)模型更有效地将设计转化为完整的编码应用。 这一工具被称为开发模式模型上下文协议(MCP)服务器,目前正在面向拥有开发者或完整席位权限的用户进行 beta 测试。 MCP 服务器的主要功能是使 AI 模型能够直接访问 Figma 中的数据。
Perplexity AI 推出 SEC 数据集成,助力投资者轻松获取财务信息
AI 搜索引擎初创公司 Perplexity AI 本周四宣布推出 SEC(证券交易)文件访问功能,旨在使复杂的财务数据变得更易于理解,适合从学生到顾问、再到日间交易者等各类投资者。 此次 SEC/EDGAR 集成使用户能够直接在 Perplexity 的平台上查询财务文档,涵盖搜索、研究和实验室等多个界面。 用户所获得的答案均附有引用和参考资料,帮助他们追溯到原始文档。
Aibidia 获 2800 万美元 B 轮融资,携 AI 税务科技进军美国市场
芬兰金融科技公司 Aibidia 近日成功获得2800万美元的 B 轮融资,这一资金将用于扩大其面向美国市场的 AI 驱动税务技术平台。 此次融资由 Activant 领投,DN Capital、FPV 及 Icebreaker.vc 等现有投资者参与,标志着 Aibidia 在为全球企业提供先进税务合规与转让定价解决方案方面迈出了重要一步。 图源备注:图片由AI生成,图片授权服务商Midjourney自2018年成立以来,Aibidia 已经成为大型企业税务科技生态系统的重要组成部分。
Snap 推出 Lens Studio iOS 和网页应用,简化 AR 镜头创作流程
Snap 公司近日宣布推出全新的 Lens Studio iOS 应用和网页工具,这一举措旨在让更多人轻松创建增强现实(AR)镜头。 通过这些新工具,用户可以使用文本提示和简单的编辑工具,快速生成自己的 AR 效果,增添个人化的元素。 新推出的 Lens Studio 应用程序允许用户生成 AI 效果、添加个人的 Bitmoji 形象,并浏览流行模板,以便自定义自己的 AR 镜头。
字节跳动发布图像编辑模型 SeedEdit 3.0,处理更加丝滑高效
它能够处理并生成 4K 图像,在精细且自然地处理编辑区域的同时,还能高保真地维持其他信息。
阿里开源千问3向量模型,性能大幅提升,挑战谷歌和OpenAI
在人工智能技术快速发展的今天,阿里巴巴于6月6日正式开源了其全新的千问3向量模型系列 ——Qwen3-Embedding。 该模型是基于千问3底座,为文本表征、检索和排序等任务进行优化,标志着阿里在 AI 领域的又一重大突破。 相较于前一版本,Qwen3-Embedding 在文本检索、聚类和分类等核心任务上的性能提升了超过40%。
智源研究院推出Emu3等“悟界”系列大模型
在刚刚闭幕的第七届 “北京智源大会” 上,智源研究院重磅推出了一系列名为 “悟界” 的大模型。 这些模型的发布标志着人工智能领域又一次技术的飞跃,吸引了众多科技爱好者的目光。 此次发布的模型包括原生多模态世界模型 Emu3、脑科学多模态通用基础模型见微 Brainμ、以及跨本体的具身大小脑协作框架 RoboOS2.0和具身大脑 RoboBrain2.0。
AI驱动本地视频编辑工具Diffusion Studio Pro,号称“CapCut + Cursor”结合
AI 驱动的视频编辑工具 Diffusion Studio Pro 正式亮相,引发行业广泛关注。 这款号称“CapCut Cursor”结合的创新产品,以本地优先、浏览器为基础的非线性编辑体验,集成超过16种生成式 AI 模型,为专业视频创作者和开发者提供强大支持。 核心亮点:多模态 AI 赋能非线性编辑Diffusion Studio Pro 是一款完全基于 AI 的本地视频编辑工具,运行于浏览器,支持非线性编辑流程。
字节跳动发布图像编辑模型SeedEdit 3.0 细节保持能力进一步提升
6月6日,字节跳动Seed团队正式发布了图像编辑模型SeedEdit3.0。 这一全新版本的图像编辑模型在图像主体保持、背景细节处理以及指令遵循等方面取得了显著进步,极大地提升了图像编辑的可用率和效率。 SeedEdit3.0是基于文生图模型Seedream3.0开发的,通过引入多样化的数据融合方法和特定奖励模型,解决了以往图像编辑模型在主体与背景保持、指令遵循等方面的不足。
Trae 集成 Gemini 2.5 Pro Preview,Web 应用开发迎来新突破
根据最新消息,Trae 平台已完成更新,正式支持 Google 最新发布的 Gemini2.5Pro Preview(I/O 版)模型。 这一升级使 Trae 在前端开发和用户界面(UI)设计领域迈出重要一步,为开发者提供更强大的工具支持。 据悉,Gemini2.5Pro Preview 在 WebDev Arena 排行榜上荣登榜首,Elo 分数较前一版本提升35点,达到1443分,超越了 Claude3.7Sonnet 和 GPT-4.1等竞争对手。
OpenAudio 发布开源 TTS 模型 S1-Mini:0.5B 参数打造超自然 AI 语音
AI 语音技术领域迎来重要进展,Fish Audio 宣布开源其全新文本转语音(TTS)模型 OpenAudio S1-Mini。 作为广受好评的 S1模型的精简版,S1-Mini 以其轻量化设计、高表现力和多语言支持引发行业热议。 技术亮点:轻量化与高性能兼得OpenAudio S1-Mini 是从4B 参数的 S1模型蒸馏而来的轻量化版本,仅包含0.5B 参数,大幅降低计算需求,适合在资源受限的环境中部署,如边缘设备或本地化应用。
PixVerse国内版“拍我AI”正式发布,解锁AI视频创作新玩法
备受海外市场追捧的AI视频生成平台PixVerse正式推出其国内版本 “拍我AI”,并同步上线移动端App和网页版。 这一产品的发布标志着PixVerse正式进军中国市场,为国内内容创作者和企业提供了高效、便捷的AI视频生成工具。 AIbase深入解析“拍我AI”的核心功能与市场潜力,带您一探这一席卷全球的AI视频平台的国内新篇章。
OpenAI与印度政府启动AI教育合作,OpenAI学院首次国际落地
OpenAI与印度电子和信息技术部下属的人工智能任务组(IndiaAI)于本周四正式宣布启动“OpenAI学院印度分院”,标志着OpenAI教育平台首次在国际落地。 这项合作旨在扩大人工智能在印度的普及和技能培训,覆盖学生、开发者、教育者、政府官员、非营利组织负责人及小企业主等多类群体。 根据双方签署的谅解备忘录(MoU),OpenAI学院将作为IndiaAI未来技能战略的重要组成部分,提供线上线下混合教学,初期支持英语和印地语,后续计划扩展至更多地区语言。