资讯列表
麻省理工学院研发乒乓球机器人系统:击球成功率高达 88%,剑指人类水平
研究人员计划在后续工作中进一步拓展平台能力,例如通过为机械臂加装龙门架结构以扩大其活动范围,让机器人能够完整参与人机乒乓球比赛。
6/2/2025 7:18:32 AM
清源
银河通用发布全球首个产品级端到端具身 FSD 大模型,联合宇树机器狗完成长程验证
银河通用推出TrackVLA导航大模型,具备纯视觉环境感知、语言指令驱动等能力,让机器人实现自主跟随。该模型已搭载于宇树机器狗,完成真实场景验证。#机器人##人工智能#
6/1/2025 10:35:02 AM
远洋
谷歌悄然推出“AI Edge Gallery”应用:可在手机本地运行 AI 模型
谷歌发布Google AI Edge Gallery应用,支持手机离线运行Hugging Face的AI模型,可生成图像、回答问题等。无需联网,直接利用手机处理器计算。目前为实验性Alpha版本,安卓可用,iOS即将推出。#AI应用# #谷歌黑科技#
6/1/2025 7:06:39 AM
远洋
消息称 Meta 计划让 AI 接管 90% 产品风险评估,取代人工审核
Meta计划将高达90%的风险评估工作交由AI完成,包括青少年风险和暴力内容等敏感领域。尽管AI审核能加快流程,但员工警告可能忽视人工能识别的严重风险。最新报告显示,政策调整后删除内容减少,但霸凌和暴力内容略有上升。#MetaAI审核# #社交媒体安全#
6/1/2025 6:43:01 AM
远洋
Claude 团队打开大模型“脑回路”,推出开源 LLM 思维可视化工具
Claude 团队来搞开源了 —— 推出“电路追踪”(circuit tracing)工具,可以帮大伙儿读懂大模型的“脑回路”,追踪其思维过程。
5/31/2025 10:36:22 PM
汪淼
谷歌野心藏不住!劈柴哥放话:AI比互联网更颠覆!智能体将打造新的中间平台生态;记者:Chrome被卖了咋办?
出品 | 51CTO技术栈(微信号:blog51cto)I/O大会,谷歌用Gmini 2.5 Pro、Veo 3证明了自己在AI领域的绝对实力。 刚刚,知名科技媒体Verge放出了谷歌CEO劈柴哥的采访,看完发现——谷歌的AI逆袭绝非偶然! 在24年,谷歌还在被OpenAI追着打的时候,劈柴哥就曾表示大厂的AI竞争并非一朝一夕之功,如果眼光放长远些,短期内谁领先、谁落后,其实并不重要。
5/31/2025 9:32:35 PM
伊风
Opera 介绍 Neon AI 浏览器技术细节,内嵌 Operator 模型分析网页 DOM 树 / 排版实现自动化操作
Opera 在 5 月 28 日宣布推出一款全新 Opera Neon 浏览器,主打 AI 功能,官方称该浏览器可以帮助用户撰写报告、玩在线游戏、完成各种任务。
5/31/2025 8:47:21 PM
漾仔
拼凑网络传言、利用 AI“洗稿”,8 人被抓
据公安部网安局今日援引新京报贝壳财经消息,上海警方侦破一起利用人工智能技术编造、传播网络谣言损害企业权益案,抓获姚某、陈某等 8 名犯罪嫌疑人。
5/31/2025 8:12:26 PM
汪淼
Perplexity AI 推出 Labs 功能,Pro 订阅用户可享“深度搜索”解读报告 / 创建代码图像
Perplexity AI推出Labs功能,Pro用户可享深度网络搜索、代码图表生成等AI工具整合,单次任务执行时间或超10分钟。#AI工具# #PerplexityAI#
5/31/2025 8:07:14 PM
漾仔
谷歌 Veo 视频生成模型走红后,国外网友开始上传“人扮 AI”内容博取关注
TikTok 等社交平台迅速被大量 AI 视频充斥。这款模型可在短短几秒内生成高度真实的八秒钟短片,配备音效与对口对白,内容涵盖挑战视频、虚构新闻,甚至是超现实短剧,引发用户广泛尝试与转发。
5/31/2025 7:57:19 PM
清源
百度 AI 搜索宣布全面接入 DeepSeek R1 最新版,推理能力更强
今日,百度AI搜索宣布全面接入深度思考模型DeepSeek R1-0528 ,用户可通过PC端、APP端免费使用。
5/31/2025 3:08:07 PM
问舟
谷歌 DeepMind 最强 AI 手语翻译模型:SignGemma 登场,打破手语沟通壁垒
谷歌 DeepMind 团队于 5 月 27 日宣布推出 SignGemma,是其迄今为止最强大的手语翻译模型,可将手语转化为口语文本,该开源模型将于今年晚些时候加入 Gemma 模型家族。
5/31/2025 11:24:22 AM
故渊
谷歌联合创始人 Sergey Brin 揭秘:AI 爱吃“罚酒”,受威胁后反而提升性能
在出席迈阿密举办的 All-In-Live 活动中,谷歌联合创始人谢尔盖・布林(Sergey Brin)抛出新观点,有时候恐吓人工智能(AI)模型,反而能刺激提升其表现。
5/31/2025 10:43:01 AM
故渊
美国白宫委员会编制儿童健康报告被指 AI 造假:引用“幽灵论文”,结论遭质疑
纽约时报于 5 月 29 日发布博文,报道称由美国白宫 Make America Healthy Again Commission 委员会编写的儿童健康报告,大量引用了不存在的科学研究,因此报告给出的数据和结论遭到质疑。
5/31/2025 10:27:05 AM
故渊
通义开源视觉感知多模态RAG推理框架VRAG-RL
近日,通义实验室自然语言智能团队正式发布并开源了VRAG-RL——一款视觉感知驱动的多模态RAG推理框架,旨在解决在真实业务场景中,AI如何从图像、表格、设计稿等视觉语言中检索关键信息并进行精细化推理的难题。 在复杂视觉文档知识库中检索并推理关键信息,一直是AI领域的一大挑战。 传统的检索增强型生成(RAG)方法在处理视觉丰富信息时显得力不从心,主要因为它们难以应对图像、图表等视觉内容,且现有视觉RAG方法受限于固定的检索-生成流程,难以充分挖掘视觉信息中的关键知识。
5/31/2025 10:00:54 AM
AI在线
BFL 推出 FLUX.1 Kontex 模型套件,AI 生图速度比主流竞争对手快一个数量级
科技媒体 WinBuzzer 昨日(5 月 30 日)发布博文,报道称 Black Forest Labs(BFL)推出全新 AI 模型套件 FLUX.1 Kontext,专注于生成与编辑上下文图像,号称速度比主流竞争对手快一个数量级。
5/31/2025 9:55:51 AM
故渊
英伟达 CEO 黄仁勋:中国的 Deepseek 和阿里通义千问是当前最佳开源模型
他表示,DeepSeek 和阿里巴巴的通义千问(Qwen)是“当前表现最优的开源 AI 模型之一”,已在美国、欧洲等多个市场获得广泛应用。
5/30/2025 9:07:30 PM
清源
谷歌 AI 概览被指无法正确回答“今年是哪一年”,官方紧急修复
谷歌发言人表示:“和所有搜索功能一样,我们会持续改进,并通过这类案例更新系统。绝大多数 AI 概览都能提供有用且准确的信息,我们正着手修复这一类问题。”
5/30/2025 7:54:20 PM
清源