AI
相机参数秒变图片!新模型打通理解生成壁垒,支持任意视角图像创作
能看懂相机参数,并且生成相应视角图片的多模态模型来了。 来自S-Lab、新加坡南洋理工大学、商汤科技、美国密歇根大学、德国马普所的研究员提出了Puffin统一多模态模型。 它能整合理解相机参数(如角度、视野)与按相机参数生成对应视角图片的能力。
AI“工作陷阱”:唯有培训能破解的新型生产力杀手
AI为工作者带来了提高效率和生产力的希望,使他们从重复性工作中解放出来,从而能够处理更复杂的任务,但是,随着企业向员工推出AI工具,许多人面临着不同的挑战:AI生成的工作成果适得其反。 AI生成内容的质量在很大程度上取决于与该工具协作人员的技能,而并非每个人都具备这方面的正确技能,这导致斯坦福社交媒体实验室和Betterup实验室创造了“AI工作烂稿(AI workslop)”一词——他们将其定义为“伪装成优秀成果的AI生成的工作内容,但缺乏实质性内容来有意义地推进既定任务”。 Pegasystems公司的CTO Don Schuerman表示:“当企业在错误的时间使用错误的AI时,就会出现AI工作烂稿,即将为创造性和推理而设计的大型语言模型部署到需要精确性、治理性和可靠性的情境中。
深刻理解Claude Skills-构建AI时代的组织和个体进化之路-加速从AI Agent到Agentic AI演进
Hello,大家好,我是人月聊IT。 今天接着AI和大模型方面的话题。 即大模型厂商Anthropic最近刚推出的Claude Skills。
LeCun怒揭机器人最大骗局,坦白Llama与我无瓜!
人形机器人,也成为了AI圈最大的骗局? 最近在MIT的一场讲座中,Meta首席AI科学家LeCun一语道破了机器人界最大的秘密——这些公司压根不知道,如何让机器人变得足够「聪明」,或是说达到通用智能的程度。 家用机器人的实现,还需要AI领域取得一系列突破。
马斯克「世界模拟器」首曝,1天蒸馏人类500年驾驶经验!擎天柱同脑进化
一个神经网络模型,统治了一切。 今天,特斯拉官宣神经网络「世界模型器」,AI可以直接模拟、合成自动驾驶的「孪生世界」。 如下九宫格演示中,特斯拉「世界模拟器」生成了汽车行驶过程中的不同视角。
美国大学排名出炉:哥大断崖式下滑,MIT稳居CS榜第一!
每年秋天,美国高等教育界都会迎来一场「期末大考」——U.S. News最佳大学排名。 它不仅牵动数百万学生和家长的择校决策,更在全球范围内左右着学校的声誉与资源。
从辅助驾驶到无人驾驶出租车,Mobileye展现技术与商业化双重实力
在全球五大车展之一的2025德国国际汽车及智慧出行博览会(IAA MOBILITY 2025,以下简称:慕尼黑车展)上,来自中国和海外的众多车企及方案商纷纷展示各自的前沿技术。 其中,驾驶自动化依然是最受关注的焦点。 在其中一家企业的展台上,我们得以一览从基础辅助驾驶到L2级组合辅助驾驶,乃至不久将至的L4级全自动驾驶的驾驶自动化发展全景图。
一行“隐形”的代码,就能让 Comet 泄露你的全部邮件!AI产品公司创始大佬:AI看不懂的网站早晚会消失!
编辑 | 听雨出品 | 51CTO技术栈(微信号:blog51cto)上周,OpenAI 发布了 ChatGPT Atlas 浏览器——一个由 AI 驱动、能主动理解意图并代你完成任务的新型浏览器。 它不仅能“看懂”网页,还能“替你上网”:搜索、总结、订票、发送邮件。 这标志着互联网的一次结构性转折:从以人为中心的“点击互联网”,迈向以机器意图为驱动的互联网。
硅谷AI研发精英,每周需工作100小时
在中美前仆后继筚路蓝缕,争夺AGI「圣杯」的过程中,顶尖AI研究员们头顶耀眼光环,拿着超越体育明星的亿级高薪,背后却是常人难以想象的高强度脑力劳动。 每一个频繁更迭的全新SOTA模型的背后,都有一大批AI研究员,每周需工作100小时。 而这已是长期普遍现象,并不局限于硅谷某一家公司。
知识图谱推理新sota,兼顾性能+效率!中科大新作 | NeurIPS'25
知识图谱推理(Knowledge Graph Reasoning)是人工智能的重要组成部分,在问答系统、推荐系统、语义检索和知识增强大模型等场景中具有广泛应用。 然而,随着知识图谱规模的爆炸式增长,现有推理方法在计算效率、模型表达能力和泛化能力方面面临巨大挑战。 现有知识图谱推理方法主要存在以下三类问题:推理效率低:随着知识图谱实体规模增长,候选实体空间极速膨胀,导致推理阶段计算成本急剧上升;表达能力不足:轻量级嵌入模型虽计算高效,但难以捕捉多跳关系和高阶语义结构;过平滑问题突出:基于全局注意力或深层GNN的方法容易在图上过度聚合信息,导致表示不具判别力(如图1所示)。
全美60万岗人类出局,三年暴省126亿!机器人大军入厂
这个时代最有戏剧性的两类新闻,竟在同一天出现:一则写着「亚马逊将在美国扩招25万人」;另一则写着「亚马逊计划让机器人取代60万个岗位」。 前者出现在新闻发布会上,后者藏在泄露文件里。 「招人」与「裁人」也只是计算出的结果。
AI黑化如恶魔附体!LARGO攻心三步,潜意识种子瞬间开花 | NeurIPS 2025
你的AI助手真的安全吗? 你敢信吗? 只要在AI的「脑子」里注入一段精心「调制」的「想法」,就能让它自己「黑化」,说出本不该说的秘密。
可攻可防,越狱成功率近90%!六大主流模型全中招 | EMNLP'25
大型语言模型(LLMs)在信息处理、内容生成等领域应用广泛(如LLaMA、DeepSeek、ChatGPT),但随着其与现实场景深度融合,安全问题愈发凸显:可能被用于传播网络犯罪指令、虚假信息等有害内容。 尽管开发者通过监督微调(SFT)、基于人类反馈的强化学习(RLHF)等技术优化模型安全性,但面对复杂的越狱攻击,现有防护机制仍存在不足。 现有越狱攻击主要分为两类,均存在明显缺陷:手动构造提示词攻击:如PAIR、PAP等,依赖黑箱模板操控,模型更新后模板易失效,可解释性差、泛化能力弱。
硅谷的「十万大裁员」:Meta按代码量裁员
一个阴郁的清晨,在旧金山Salesforce公园的亲子歌谣活动上,一位年轻的父亲——同时也是一名软件工程师——推着婴儿车若有所思。 几天前,他刚收到Salesforce的裁员通知,成为这家市值2400亿美元的软件巨头最新一轮裁员中的一员。 同一时间,Salesforce首席执行官马克·贝尼奥夫(Marc Benioff)正在公开赞美人工智能如何提高生产力。
超94%类别第一!3D点云异常检测与修复新SOTA | ICCV'25
在制造质检、机器人抓取与3D打印等场景中,3D点云的异常检测日益关键,但实际应用却常遭遇两大难题:一是物体姿态随机、形变细微,传统离散化表示(体素、点云、视角投影)容易丢失几何细节;二是检测之后如何修复缺陷,业界缺少能直接生成高保真「正常模板」的方法。 为突破这两道关卡,上海科技大学与密歇根大学联合团队提出Pose-Aware Signed Distance Function(PASDF)框架,通过显式姿态对齐与连续的SDF形状表示,实现「检测—定位—修复」的一体化闭环。 论文地址:: AUROC分别为80.2%与90.0%的最新成绩,并在点级定位、可视化修复方面表现突出。
AI人格分裂实锤!30万道送命题,撕开OpenAI、谷歌「遮羞布」
实锤! LLM也有自己的「价值观」? 想象一下,你让AI帮你做一个商业计划,既要「赚钱」,又要「有良心」。
奥特曼抢走小扎印钞机!Meta「占领」OpenAI,20%都是前同事
扎克伯格在硅谷「不讲武德」翘OpenAI的墙角。 但如果你扒开OpenAI的外衣往里一看,嘿,OpenAI里面竟然也藏着另一个Meta! 三年前,OpenAI还是一个让世界惊叹的研究实验室。
Atlas来了!ChatGPT嵌入浏览器,用谷歌的引擎,革谷歌的命
三十年前,一行代码引发了互联网的第一场战争。 Netscape Navigator打开了图形化网页的大门,微软的Internet Explorer紧随其后,用预装的方式夺走了它的灵魂。 而Google Chrome作为一匹黑马,杀出重围并在几十年位居榜首。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
AI新词
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
算法
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
大型语言模型
AI设计
生成式AI
搜索
视频生成
亚马逊
AI模型
DeepMind
特斯拉
场景
深度学习
Transformer
架构
Copilot
MCP
编程
视觉