应用
OpenAI o3 模型测试成绩遭质疑,实际表现远低于宣传
近日,OpenAI 推出的 o3人工智能模型在基准测试中的表现引发了广泛争议。 尽管 OpenAI 在去年12月首次发布 o3时自信地宣称该模型在极具挑战性的 FrontierMath 数学问题集上能够正确回答超过四分之一的问题,但这一声称与最近的独立测试结果形成鲜明对比。 Epoch 研究所对 o3模型进行了独立测试,结果显示该模型的实际得分仅为10%,远低于 OpenAI 之前所宣称的25%。
Netflix推全新 AI 搜索功能,用户可通过自然语言搜索
Netflix 近日开始测试一项全新的 AI 搜索功能,这一功能基于 OpenAI 的技术,旨在提升用户在流媒体平台上的内容发现体验。 用户将能够通过自然语言来搜索影片,不再局限于传统的按类型或演员进行搜索。 据彭博社的报道,这项新功能能够理解用户更具体的需求,包括他们的观影心情。
可信AI技术获中国电子学会科技进步一等奖,蚂蚁数科助力破解大模型应用“安全可信”难题
4月19日,2024年度中国电子学会科学技术奖在第十八届中国电子信息年会揭晓并颁奖,由清华大学、北京中关村实验室和蚂蚁集团等单位共同完成的联合项目《高效协作的互联网动态行为安全可信关键技术与应用》荣获科技进步奖一等奖。 近年来,网络环境日益复杂,恶意流量攻击和隐蔽未知应用风险在互联网中泛滥,如何构建一个更安全可信的互联网环境,成为学术界和产业界的共同追求。 由清华大学、北京中关村实验室及蚂蚁集团等联合提出的“高效协作的互联网动态行为安全可信关键技术”,创新提出了分层传递和高效求解的智能协作体系技术思路,通过模型表达、知识共享和应用支撑,在实现安全信息获取、传递和协作的同时,显著提升了互联网应对未知应用风险的能力。
全球首个:阿联酋尝试用 AI 制定和修改法律
阿联酋正尝试利用AI技术制定和修改法律,成立监管智能办公室推进相关工作。AI将定期提出立法更新建议,预计使立法速度加快70%。然而,专家警告AI可能存在偏见和可靠性问题。#AI立法# #阿联酋科技#
Reachy2机器人发布:互动自然,售价 7万美元
Hugging Face 宣布通过收购法国初创公司 Pollen Robotics,正式推出开源人形机器人 Reachy2。 这一消息在社交媒体和 AI 社区引发热烈讨论,被认为是人形机器人与生成式 AI 结合的重要里程碑。 作为专为 AI 研究和教育设计的“实验室伙伴”,Reachy2以其开源特性、先进功能和人性化设计,迅速成为全球顶尖实验室的关注焦点。
OpenAI 4o图像生成支持自定义GPTs,个性化AI创作再升级
近日,OpenAI宣布其最新4o模型的图像生成功能将支持自定义GPTs,为用户提供更灵活的个性化AI创作体验。 据AIbase了解,这一更新允许开发者与用户基于4o模型构建定制化的GPTs,生成符合特定需求的高质量图像内容。 消息一经发布,便引发了AI社区的广泛讨论,标志着OpenAI在个性化AI工具领域的又一重要进展。
Intel 开源 AI Playground,可用intel Arc 显卡使用各种AI模型
Intel 宣布将其生成式 AI 软件 AI Playground 正式开源,这一举措引发了 AI 社区的广泛关注。 作为一款专为 Intel Arc GPU 和集成显卡优化的 AI 工具,AI Playground 被描述为一个“AI 中心”,支持本地运行聊天式大语言模型(LLM)以及图像和视频生成功能。 此次开源标志着 Intel 在推动生成式 AI 技术普及和社区协作方面迈出了重要一步。
美国多所社区大学遭“机器人学生”渗透:一切行动都为了助学金
现如今线上教学已经蔚然成风,但一种被称为“机器人学生”的现象在美国社区大学日益普遍。这些“学生”并非真正为学习而来,而是为在领取助学金之前维持在籍身份而注册,且数量仍在持续增长。
天工机器人:人形机器人即将实现小批量量产,未来售价可与入门轿车相当
据中新经纬昨日报道,天工队、北京人形机器人创新中心CTO唐剑在接受采访时表示,随着人形机器人的大规模落地,其价格将与一台入门级的小轿车差不多。
OpenAI o3 模型基准测试成绩遭质疑,实测分数远不及宣称
OpenAI的o3模型在内部测试与第三方基准测试结果存在显著差异,Epoch研究所独立测试得分仅10%,远低于OpenAI宣称的25%。#AI争议##OpenAI#
研究:AI 医疗诊断平均准确率 52.1%,与非专家医生相当
大阪都会大学研究显示,生成式AI在医疗诊断中平均准确率达52.1%,与非专家医生相当,但专家医生仍领先15.8%。AI在皮肤科表现突出,泌尿科数据有限。研究认为AI可用于医学教育和资源有限地区。#AI医疗##医学诊断#
超全总结!15个AI视频镜头语言提示词+效果展示
在AI视频创作中,精准的镜头语言是提升作品质感的关键。 本文系统解析15种专业级拍摄技法,从经典50mm镜头到沉浸式FPV视角,结合视觉效果对比,为创作者提供直观的镜头语言应用指南。 超全总结!
宇树科技将推出人形机器人格斗大赛,预计 5 月至 6 月举行
据央视网报道,近一个月来,宇树科技技术团队一直在为参加格斗大赛的机器人进行技术研发调试与算法训练。赛事预计于今年 5 月至 6 月举行,期间将通过中央广播电视总台相关平台等进行全网直播。
合成数据也能通吃真实世界?首个融合重建-预测-规划的生成式世界模型AETHER开源
近日,上海人工智能实验室(上海 AI 实验室)开源了生成式世界模型 AETHER。 该模型全部由合成数据训练而成,不仅在传统重建与生成任务中表现领先,更首次赋予大模型在真实世界中的 3D 空间决策与规划能力,可助力机器人完成目标导向的视觉规划、4D 动态重建、动作条件的视频预测等复杂任务。 研究团队将几何重建与生成式建模深度融合,首创「重建 — 预测 — 规划」 一体化框架,通过 AETHER 使大模型能够感知周围环境,理解物体之间的位置、运动和因果关系,从而做出更智能的行动决策。
对 ChatGPT 说“谢谢”,竟给 OpenAI 带来“数千万美元”开销
OpenAI CEO透露,仅仅是用户与AI进行的日常寒暄和礼貌性交流,例如“谢谢”和“请”等,就给公司带来了“数千万美元”的开销。#AI成本# #人机互动#
英特尔®具身智能大小脑融合方案发布:构建具身智能落地新范式
在 4 月 18 日举办的 2025 英特尔具身智能解决方案推介会上,英特尔正式发布其具身智能大小脑融合方案(下称具身智能方案)。 该方案基于英特尔® 酷睿™ Ultra 处理器的强大算力,以及全新的具身智能软件开发套件和 AI 加速框架打造。 凭借创新性地模块化设计,其不仅能够兼顾操作精度和智能泛化能力,而且以卓越的性价比满足不同领域需求,为具身智能的规模化、场景化应用落地夯实基础。
一台3090就能跑Gemma 3 27B!谷歌发布Gemma 3全系QAT版模型
谷歌 Gemma 3 上线刚刚过去一个月,现在又出新版本了。 该版本经过量化感知训练(Quantization-Aware Training,QAT)优化,能在保持高质量的同时显著降低内存需求。 比如经过 QAT 优化后,Gemma 3 27B 的 VRAM 占用量可以从 54GB 大幅降至 14.1GB,使其完全可以在 NVIDIA RTX 3090 等消费级 GPU 上本地运行!
高德地图推出HumanRig技术 开源3D人形角色绑定设计数据集
高德地图宣布推出HumanRig技术,并开源了业界首个专门针对3D人形角色绑定设计的大规模数据集。 这项技术旨在降低角色动画制作成本,推动动画行业向更高效、更自动化的方向发展,成为高德打造沉浸式导航体验的关键基础设施。 HumanRig技术的核心是自动绑定算法,它通过先验引导的骨架估计器(Prior-guided Skeleton Estimator, PGSE)利用2D先验信息投射到3D空间,初始化粗略骨架,大幅降低绑定任务的复杂度。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉