应用
商汤「日日新V6.5」登顶OpenCompass全球多模态大模型榜单
根据权威评测平台OpenCompass多模态大模型学术榜单(Multi-modal Academic Leaderboard)最新数据显示,商汤「日日新 V6.5」(SenseNova-V6.5 Pro)多模态大模型以82.2的综合成绩登顶榜首,领先Gemini 2.5 Pro以及GPT-5等国际顶尖模型。 这一佳绩不仅意味着商汤「日日新 V6.5」成为全球最强多模态大模型之一,同时也是商汤在“多模态通用智能”技术战略下的成果印证。 商汤科技联合创始人、执行董事、首席科学家林达华在《迈向多模态通用智能:商汤的思考》中指出,智能的核心是与外界进行自主交互的能力,多模态信息感知与处理的能力是AGI的核心要求,使AI能像人类一样,通过视觉、听觉等多种感官接收并融合信息,实现更深层次的理解与推理,是迈向AGI的必由之路。
腾讯混元发布并开源图像模型2.1,支持原生2K生图
9月9日深夜,腾讯发布并开源混元最新的生图模型“混元图像2.1(HunyuanImage 2.1)” 。 该模型综合能力业界领先,支持原生2K高清生图。 混元图像2.1模型在开源后,在Hugging Face模型热度榜热度迅速攀升,一跃而成全球第三热门模型。
爱诗科技完成6000万美元B轮融资,阿里巴巴领投,达晨财智、深创投、北京市AI基金、巨人网络、Antler等跟投
9月10日,AI视频生成领军企业爱诗科技宣布完成超过6000万美元B轮融资,由阿里巴巴领投,达晨财智、深创投、北京市人工智能产业投资基金、湖南电广、巨人网络和Antler等投资方跟投。 目前公司全球用户规模突破1亿,自研视频生成大模型PixVerse V5位居Artificial Analysis 图生视频榜首,产品PixVerse(拍我AI)入选a16z“全球Top 50生成式AI消费移动应用”榜单第25位,公司持续推动AI视频生成走向更广泛的日常应用。 爱诗科技创立于2023年4月,致力于打造全球领先的AI视频生成大模型及应用,旨在满足AI时代下视频消费的全新需求,帮助每一个人成为生活的导演。
Sarvam 推出 Samvaad 语音与聊天 AI 代理,WhatsApp 支持 11 种印度语言
Sarvam 公司近日在 WhatsApp 平台推出了其最新的 Samvaad 语音和聊天 AI 代理。 这项服务使企业能够在 WhatsApp 上直接部署 AI 代理,为用户提供更便捷的沟通体验。 用户可以在同一对话中无缝切换语音通话和聊天,这一功能得益于 Meta 推出的全新商业通话 API。
沃尔玛推出超级智能平台 WIBEY,重塑开发者工作流程
2025年8月,在其旗舰零售科技活动 “Converge” 前夕,沃尔玛正式推出了名为 WIBEY 的超级智能平台。 该平台是沃尔玛新推出的智能框架的一部分,旨在简化开发者在构建、部署和操作技术过程中的工作流程。 WIBEY 的核心功能是为开发者提供一个简单直观的入口,使他们能够快速指定需求,例如创建新的微服务、开发用户界面组件或修复无障碍性问题。
AI应用元年,这场标杆赛事见证了中国创新速度与野心
一场关于未来金融智能的集体预演,见证了创业者们的冲刺,也折射出一个行业的进化。 2025 年的 AI ,正在上演「双线长跑」。 一端是大模型底层的持续进化,远未触顶;另一端是场景应用集中爆发。
一致性对标Nano Banana,国产Vidu Q1同时支持7张参考 | 实测
最近AI生图赛道简直卷疯了! 从Nano Banana的爆火,到即梦AI 4.0,豆包4.0接连上线,一直专注于视频大模型的Vidu也按捺不住了:. Vidu Q1参考生图堂堂登场!
知乎发起“进击的具身智能”线上圆桌,共探人形机器人发展未来
从WAIC2025到世界机器人大会,机器人成为最受瞩目的主角。 在AI时代,它们也多了一个新名字——具身智能。 这一概念也迅速成为2025年最热议的赛道之一:具身智能何时真正融入人类的生活和工作?
甲骨文公司股价飙升 27%,人工智能未来收入大幅增长
甲骨文公司(Oracle)日前公布了其云基础设施部门未来人工智能业务的订单量大幅增长,这一消息推动该公司股票在盘后交易中上涨了27%,创下历史新高。 该公司报告称,未完成的业绩承诺 —— 即已签订但尚未实现的收入 —— 激增至4550亿美元,远高于三个月前的1380亿美元。 图源备注:图片由AI生成,图片授权服务商Midjourney甲骨文的首席执行官萨夫拉・卡茨(Safra Catz)形容这是一个 “惊人的季度”,并表示公司在最新的三个月内与三家不同客户签署了四份数十亿美元的合同。
AI人才服务平台Mercor寻求100亿美元估值C轮融资,年收入逼近5亿美元
据TechCrunch获得的营销文件和两名知情人士透露,专注于为OpenAI、Meta等科技公司提供AI模型训练专家的初创公司Mercor正在与投资者就C轮融资进行谈判。 该公司目前寻求 100 亿美元或更高的估值,较几个月前讨论的 80 亿美元目标估值有所上升。 据两名消息人士透露,此前投资过Mercor的风投公司Felicis正在考虑在C轮融资中继续加码投资。
Nvidia 发布全新 Rubin CPX GPU,助力 “海量上下文” 人工智能应用
Nvidia 近日宣布,其全新的 Vera Rubin 微架构正处于研发阶段,计划于2026年正式推出。 该架构下的 Rubin CPX 变体将专注于满足那些需要处理海量上下文窗口的人工智能工作负载。 Nvidia 首席执行官黄仁勋在新闻发布会上表示:“Vera Rubin 平台将标志着人工智能计算的新飞跃,推出下一代 Rubin GPU 和名为 CPX 的新类别处理器。
AI赋能核电运营:Nuclearn完成1050万美元A轮融资,服务全球65座核反应堆
随着Meta、谷歌和微软等科技巨头纷纷与核电企业达成合作协议,人工智能与核电行业的融合正在加速。 在这一趋势下,专注于核电运营AI解决方案的初创公司Nuclearn近日宣布完成1050万美元A轮融资,由Blue Bear Capital领投,AZ-VC、Nucleation Capital和SJF Ventures参投。 据该公司透露,其AI工具目前已在全球超过65座核反应堆中投入使用,主要用于优化核电站的业务运营流程。
AI 训练初创公司 Mercor 欲争取超 100 亿美元估值
Mercor 是一家成立仅两年的初创公司,专注于为像 OpenAI 和 Meta 这样的企业提供所需的领域专家,以帮助训练和优化其基础 AI 模型。 根据 TechCrunch 获取的一份市场文件和知情人士的说法,Mercor 目前正在与投资者讨论进行第三轮融资(Series C)。 该公司目前的目标是将估值提升至100亿美元或以上,较几个月前讨论的80亿美元估值有所上升。
爱诗科技完成6000万美元B轮融资
国内视频生成领域单次最大融资额 以技术普惠驱动全球视频创作浪潮9月10日,AI视频生成领军企业爱诗科技宣布完成超过6000万美元B轮融资,由阿里巴巴领投,达晨财智、深创投、北京市人工智能产业投资基金、湖南电广、巨人网络和Antler等投资方跟投。 目前公司全球用户规模突破1亿,自研视频生成大模型PixVerse V5位居Artificial Analysis 图生视频榜首,产品PixVerse(拍我AI)入选a16z“全球Top 50生成式AI消费移动应用”榜单第25位,公司持续推动AI视频生成走向更广泛的日常应用。 爱诗科技创立于2023年4月,致力于打造全球领先的AI视频生成大模型及应用,旨在满足AI时代下视频消费的全新需求,帮助每一个人成为生活的导演。
Gemini加密交易所IPO价格大幅上调,目标估值超30亿美元!
近日,由著名加密货币大亨文克莱沃斯兄弟创办的加密交易所 Gemini 宣布,计划大幅提高其美国首次公开募股(IPO)的拟议价格区间。 这一举动不仅反映了投资者对加密行业日益增长的兴趣,也显示出 Gemini 在市场中的信心。 根据最新的消息,Gemini 现计划通过出售 1667 万股股票,筹集约 4.333 亿美元。
微软启动AI供应商多元化策略,将在Office 365中集成Anthropic技术
据The Information报道,微软公司将付费使用Anthropic的AI技术为Office365应用提供支持,这标志着微软结束了此前在办公套件中完全依赖OpenAI技术的策略。 根据两名知情人士透露的消息,Anthropic的AI技术将与OpenAI的技术共同为Word、Excel、Outlook和PowerPoint等应用的新功能提供支持。 这一合作决定反映了微软与OpenAI关系的微妙变化。
看完这篇就够了!我总结了Nano Banana的 21 种隐藏进阶用法
之前大家用生图模型最大的痛点就是不好控制,每次都得抽卡,所以大家会去用 comfyUI,就是因为它的可控性更好,但当 AI 大模型有了很好的可控性后,comfyUI 几乎就可以不用再学了,AI 的发展趋势就是化繁为简。 当可控性足够好后,可以做的事情可太多了。 我周末尝试了各种有意思的玩法,让我大开眼界,原来还能这样玩?
9.16-9.17来腾讯全球数字生态大会,解锁AI技术应用落地场景与产品实践
9.16来腾讯全球数字生态大会,与行业大咖「智者见智」共话AI增益新机. 广汽集团、阿斯利康、华住集团、美的集团等企业领袖齐聚,分享AI赋能行业发展的前沿洞察与实战路径! 扫描下方海报预约报名!
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉