AI
放世界任务成功率82%!美的攻克机器人泛化控制难题
还在担心机器人只能机械执行、不会灵活应变? 美的AI研究院和华东师范大学联合提出ChatVLA-2——一个具有开放世界具身推理能力的视觉-语言-动作模型(VLA)模型。 它引入动态混合专家架构,并结合双阶段训练流程,不仅最大程度保留了视觉-语言模型(VLM)的多模态认知和推理能力,还能将推理结果真正转化为可执行的动作。
7/15/2025 4:28:05 PM
Switch的救世主是老黄!?
Switch2发售后,内置图形API——NVN2首次公开亮相。 相较前代Switch发热、卡顿、续航短、画质缩水等问题,搭载英伟达NVN2的Switch2显然从容得多,面对各类3A大作也毫不吃力。 《赛博朋克2077》的联合开发者Eoin O'Grady表示,只要是Xbox上能跑满60帧的游戏,移植到Switch2几乎都不在话下。
7/15/2025 4:26:44 PM
卡帕西预言成真!华人团队开源全AI操作系统:神经网络模拟Windows,预测下一帧屏幕图像
疯狂,太疯狂了~大神卡帕西预测的「下一代GUI系统」这就水灵灵地实现了? 玩法相当easy,当你移动鼠标、点击图标或敲键盘时,这个完全由神经网络驱动的操作系统就和咱们平时的电脑一样,能在屏幕上实时显示对应的图形界面。 就是说,AI现在能完全模拟Windows,直接预测下一帧屏幕图像。
7/15/2025 4:26:16 PM
AI重塑游戏未来:79%开发者拥抱,8大环节迎革新|AI+游戏产业变革研究报告发布
分析师 卡洛琳 量子位智库 | 公众号 AI123All. 在文生图、文生3D等技术被更多人理解后,我们想要系统、全面地了解AI从哪些方面影响了游戏。 量子位智库对此做了深入的研究,发现在游戏领域:1)有利用AI的强烈需求和开放的态度;.
7/15/2025 3:40:23 PM
智库
消息称 Meta 正讨论放弃开源 AI 模型 Behemoth,转向闭源战略
AI在线 7 月 15 日消息,《纽约时报》报道称,Meta 新成立的超级智能实验室(Superintelligence Lab)正在讨论放弃其强大的开源人工智能模型“Behemoth”,转而开发闭源模型。 据消息人士透露,Meta 已完成对“Behemoth”模型的训练,但由于其内部测试表现未达预期,该模型的发布被推迟。 随着超级智能实验室的启动,对“Behemoth”模型的测试也已暂停。
7/15/2025 2:46:48 PM
远洋
元科学可以改进科学——但它也必须对社会有用
编辑丨&7 月 2 日,一项科学倡议在伦敦的一间演讲厅诞生,元科学联盟由此成立。 该联盟由 25 个以上的资助机构、学术团体、企业及其他机构组成,其核心使命是推动元科学的发展 —— 即运用科学方法来理解并改进科学研究本身。 该联盟选择在此时成立,是因为相关领域的社群已形成足够规模,并且元科学也获得了更广泛的认可。
7/15/2025 2:19:00 PM
ScienceAI
AGENTGROUPCHAT-V2:大型语言模型多智能体协作的创新思考
大家好,我是肆〇柒。 LLM 多智能体系统在社会模拟和复杂任务解决这两大领域大显身手。 在社会模拟里,它们精准地复刻人类社交互动模式,助力我们洞察群体行为背后的社会学;在复杂任务解决场景下,智能体们协同合作,先是制定详尽规划,再按部就班执行,轻松应对复杂局面。
7/15/2025 12:14:44 PM
肆零柒
终于把 LSTM 算法搞懂了!!
大家好,我是小寒今天给大家分享一个超强的算法模型,LSTM。 LSTM(长短期记忆网络,Long Short-Term Memory)是一种特殊的循环神经网络(RNN)算法,专门设计用来解决传统RNN在处理长序列数据时存在的梯度消失和梯度爆炸问题。 它通过引入细胞状态和门控机制,使得模型能够捕捉和保存长期依赖信息,从而有效地处理序列数据中的长期依赖关系。
7/15/2025 10:41:44 AM
程序员小寒
硅谷大戏!Scale AI刚卖身就被集体拉黑,谷歌OpenAI无情断供
听说了吗? 不久前,Meta花费143亿美元收购了28岁少年Alexandr Wang创办的数据标注公司Scale AI近一半的股份。 别小看这个数据标注公司,这一笔交易让Meta在AI竞赛中直接提升了实力,瞬间成为焦点。
7/15/2025 9:47:22 AM
AI 为何能查天气、订机票?揭秘大模型背后的“神秘工具箱”
你有没有想过,为什么 AI 能回答“今天上海天气怎么样? ”这种实时问题,甚至帮你预订机票? 明明它的训练数据截止到去年,怎么会对现在的事情了如指掌?
7/15/2025 9:44:16 AM
红绿灯灯灯灯
比Adam更有效,POET从谱不变原理出发,让LLM训练又稳又快
Zeju Qiu和Tim Z. Xiao是德国马普所博士生,Simon Buchholz和Maximilian Dax担任德国马普所博士后研究员,Bernhard Schölkopf是德国马普所所长,Weiyang Liu是香港中文大学计算机系助理教授。 随着大型语言模型(LLM)推动人工智能领域取得突破性进展,如何实现高效、稳定的超大规模模型训练,始终是该领域最富挑战性的核心议题之一。
7/15/2025 9:27:29 AM
谷歌发布首个嵌入模型:MTEB排行榜第一,超过OpenAI
今天凌晨1点,谷歌发布了首个Gemini嵌入模型刷新了MTEB榜单记录成为第一,并且价格很便宜每100万token只要0.15美元,已经开放API。 根据谷歌在多文本嵌入基准测试平台MTEB上的测试结果显示,Gemini嵌入模型平均分达到了68.37,大幅度超过了OpenAI文本嵌入模型的58.93分。 在双语挖掘、分类、聚类、指令检索、多标签分类、配对分类、重排、检索、语义文本相似性等测试中,全部都非常出色成为目前最强嵌入模型。
7/15/2025 9:07:00 AM
Windsurf打工人被谷歌做局24小时后获收购!华人AI编程明星出手,接收250名员工
AI编程赛道,局势突变。 距离谷歌以24亿美元挖走Windsurf创始团队仅仅72小时,AI编程智能体Devin开发商宣布,已经火速收购Windsurf剩余的全部资产和团队。 临时接任CEO的Windsurf前商务主管Jeff Wang感慨“过去72小时就像我职业生涯中最惊险刺激的过山车之旅。
7/15/2025 9:06:00 AM
ICCV 2025 | 清华&腾讯混元X发现「视觉头」机制:仅5%注意力头负责多模态视觉理解
本文的主要作者来自清华大学智能视觉实验室(i-Vision Group)、腾讯混元 X 组。 本文的共同第一作者为清华大学自动化系本科生王嘉辉和博士生刘祖炎,本文的通讯作者为清华大学自动化系鲁继文教授。 多模态大模型通常是在大型预训练语言模型(LLM)的基础上扩展而来。
7/15/2025 9:00:00 AM
MIT满分学霸掏空AI初创,谷歌24亿收购黑幕曝光!数百员工血本无归
OpenAI收购Windsurf在即,突然半路杀出个谷歌! 但这波可不是收购,而是釜底抽薪:谷歌直接挖走了整个Windsurf领导层 前30位核心AI工程师! 为了这次挖角,谷歌豪掷24亿美元!
7/15/2025 8:52:00 AM
具身智能大脑+首个SaaS开源框架,智源研究院刷新10项测评基准,加速群体智能新范式
具身智能大脑 全球首个具身智能SaaS开源框架,智源研究院在具身智能领域发力了——“通用具身大脑”RoboBrain 2.0,面向真实物理环境,集感知、推理与规划于一体。 全新32B版本凭借时空认知能力的突破,在多项权威具身智能基准上全面刷新纪录。 RoboOS 2.0,作为全球首个具身智能SaaS开源框架,创新性集成MCP协议与无服务器架构,实现轻量化部署,打通智能大脑与异构本体协同通路。
7/15/2025 8:45:00 AM
OpenAgentSafety 框架:AI 智能体安全评估的创新实践
大家好,我是肆〇柒,在 AI 智能体快速发展的当下,它们潜在的安全风险也日益凸显。 现有的 AI 智能体安全评估方法存在诸多局限:多数评估依赖于简化现实复杂性的模拟环境,难以准确反映智能体在真实场景下的表现;许多评估仅关注单一领域,如仅测试智能体的网页浏览或代码编写能力,缺乏对多领域综合任务的考察;此外,多轮多用户交互在评估中的缺失,使得难以洞察智能体在复杂人际互动和长期任务执行中的表现与潜在风险。 由卡耐基梅隆大学和艾伦人工智能研究所联合提出的 OpenAgentSafety(OA-SAFETY)框架,通过支持智能体与真实工具(如文件系统、终端、浏览器、消息平台等)的交互,并模拟多样化用户意图(包括良性、恶意和模糊意图)以及多轮交互场景,全面覆盖八大关键安全风险类别,系统地揭示了智能体在实际应用中可能存在的安全隐患。
7/15/2025 4:00:00 AM
肆零柒
员工AI助手应用指南:在应对挑战中实现效益最大化
“处于这一曲线顶端的公司——我们称之为未来构建型公司,那些最为成熟的公司——正在看到实质性的成果:收入增长达到1.5倍,股东价值提升1.8倍,”Kropp说道,“这里存在价值,但我们还处于早期阶段。 ”部署、重塑、创新为了利用AI和智能体创造价值,公司需要确定重点领域,采用部署、重塑、创新的框架。 AI已经在每个企业中部署,未来几年内将集成智能体,但如果你只是给员工一个聊天机器人,你并没有改变工作的方式。
7/15/2025 1:00:00 AM
D1net编译
资讯热榜
月之暗面 Kimi K2 发布并开源,擅长代码与 Agentic 任务
ChatGPT 商业推荐被曝引用不可靠信息来源,专家提醒用户勿盲目信任
谷歌 Gemini 待发布新技能曝光:AI 帮你生成插画故事书
OpenAI 筹划进军硬件市场,CEO 奥尔特曼曾称 AI 革命不一定需要新硬件
ChatGPT 又遇“奶奶漏洞”,网友成功让 GPT-4o 主动生成“Win7 密钥”
资讯/神器/素材全都有!2025年6月设计素材周刊第四波
微软发布 Phi-4-mini-flash-reasoning 端侧 AI 模型:10 倍吞吐量,推理能力升级
搭积木一样做视频!Vidu Q1「参考生视频」功能实测
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
Meta
微软
GPT
学习
图像
技术
Gemini
AI创作
马斯克
论文
Anthropic
代码
英伟达
算法
Stable Diffusion
智能体
训练
芯片
开发者
蛋白质
生成式
腾讯
苹果
AI新词
神经网络
3D
Claude
LLM
研究
生成
机器学习
计算
AI for Science
Sora
人形机器人
AI视频
xAI
AI设计
GPU
华为
百度
搜索
大语言模型
Agent
场景
字节跳动
预测
大型语言模型
深度学习
伟达
工具
Transformer
视觉
RAG
具身智能
神器推荐
亚马逊
Copilot
模态
AGI
LLaMA
文本
算力
驾驶