AI
多模态大模型改造人脸防伪检测,厦大腾讯优图等研究入选CVPR 2025
近年来,人脸合成技术在快速发展,相关检测任务也逐渐从“看得出来”向“说明白为什么”演进。 除了判断一张脸是真还是假,更需要模型能“说出个所以然”。 在CVPR 2025的工作《Towards General Visual-Linguistic Face Forgery Detection》中,研究团队尝试从视觉 语言的多模态视角来改进伪造检测方法。
4/22/2025 9:22:00 AM
量子位
Sebastian Raschka长文:DeepSeek-R1、o3背后,RL推理训练正悄悄突破上限
著名 AI 研究者和博主 Sebastian Raschka 又双叒叕更新博客了。 这次的主题是《LLM 推理的强化学习现状》。 博客地址: AI 社区很热闹,尤其是 Llama 4 和 GPT-4.5 等新旗舰模型的发布。
4/22/2025 9:12:00 AM
机器之心
AI创造新物理学,暴力破解引力波!宇宙观测开挂50倍,三体人直呼内行
就在刚刚,AI又将物理学,推动到了全新的领域。 来自马克斯·普朗克光科学研究所(MPL)、加州理工等机构的科学家发现,AI已经设计出了人类尚未理解的引力波探测工具。 这一发现,直接将可观测的宇宙体积扩大了50倍!
4/22/2025 9:08:00 AM
新智元
UIUC联手谷歌发布Search-R1:大模型学会「边想边查」,推理、搜索无缝切换
本文的作者来自伊利诺伊大学香槟分校(UIUC)、马萨诸塞大学(UMass)和谷歌。 本文的第一作者为 UIUC 博士生金博文,主要研究方向为与大语言模型相关的智能体、推理和强化学习研究。 其余学生作者为 UMass 博士生曾翰偲和 UIUC 博士生岳真锐。
4/22/2025 9:06:00 AM
机器之心
更懂公务员的大模型:写作/意图理解/公文排版全拿捏,部署成本直降90%,来自金山
当政务大模型具备推理能力,部署成本直降90%,写作效率提升71.58%、意图理解提升34.87%、公文排版能力提升12%。 如上新进展,来自金山办公。 时隔四个月,金山自研政务大模型完成推理能力升级。
4/22/2025 9:05:36 AM
量子位
采样越多越聪明?隐式扩展颠覆认知,采样搜索如何挑出完美解
先让模型生成多个候选答案,再通过自我验证挑出「真金」。 基于采样的搜索在许多推理任务中表现优异,可关于它的扩展趋势,还有许多未解之谜。 随着采样数量的增加,模型的推理性能能否继续提升?
4/22/2025 8:50:00 AM
新智元
2025年全球GenAI手机出货量有望突破4亿部,渗透率约占三分之一
根据Counterpoint的最新预测,2025年全球智能手机市场将迎来一个重要的里程碑:三分之一的智能手机出货量将支持生成式人工智能(GenAI),预计全年出货量将超过4亿部。 这一趋势标志着智能手机行业在人工智能技术集成方面的快速进步,也预示着GenAI将成为未来智能手机的核心功能之一。 d3001.pngGenAI集成加速,技术与市场需求推动变革从2024年到2025年,全球智能手机支持GenAI的比例显著提升。
4/22/2025 6:58:02 AM
AI和现代工作空间推动全球视频会议设备市场增长
AI已成为推动市场发展的关键加速器,消除了以往阻碍视频广泛采用的许多障碍。 AI驱动的创新——从自动会议记录、实时翻译到智能摄像头取景和噪声抑制——正在彻底改变视频会议体验,使其更加无缝、引人入胜、个性化和高效。 市场正见证着前所未有的创新浪潮,其中AI和数据驱动的见解处于前沿地位。
4/22/2025 6:54:40 AM
D1net编译
被LangChain4j坑惨了!
最近在深度体验和使用 Spring AI 和 LangChain4j,从开始的满怀期待五五开,但最后极具痛苦的使用 LangChain4j,让我真正体验到了正规军和草台班子的区别。 Spring AI VS LangChain4jSpring AI:使用简单、写法优雅、但功能提供的较少、成熟度稍高;LangChain4j:作为移植大模型著名框架 LangChain 功能稍多、灵活度高、使用复杂、满是 BUG。 还有根本找不到关键内容的官方文档,该有的重要内容是一点都不介绍啊,使用和学习成本很高。
4/22/2025 3:00:00 AM
磊哥
你对ChatGPT多说一句谢谢,OpenAI就要多花一笔钱
在如今这个人工智能(AI)日益渗透生活的时代,AI 已经成为我们日常对话和问题解决的重要助手。 然而,您或许不知道,这些看似简单的日常互动实际上蕴含着巨大的成本。 OpenAI 的首席执行官山姆・奥尔特曼(Sam Altman)透露,仅仅是为了处理用户之间的寒暄与礼貌用语,公司每年就需支出数千万美元。
4/21/2025 5:00:37 PM
AI在线
o3被曝「无视」前成果?华人博士生实名指控,谢赛宁等大牛激烈争辩
在视觉感知方面,o3和o4-mini在思维链中进行图像推理, 代表了一个重要突破。 华盛顿大学计算机科学博士生施惟佳站出来表示,o3和o4-mini可能用到了她之前的研究Visual Sketchpad 。 论文链接:,曾提出通过可视化辅助增强模型推理。
4/21/2025 4:32:29 PM
新智元
选AI比选对象还难!起名黑洞OpenAI的新模型,到底怎么选?
如果你最近关注AI新闻,可能会被各种层出不穷的新模型搞的眼花缭乱。 尤其是堪称「起名黑洞」的OpenAI,命起名来可谓是是毫无章法。 即便是AI圈的资深团队,在面对同时发布的o3、o4-mini、GPT-4.1、GPT-4.1 mini和GPT-4.1 nano时,也是蒙圈的。
4/21/2025 4:27:18 PM
新智元
OpenAI CEO批评礼貌语言浪费:与AI对话不需要“请”和“谢谢”
OpenAI的首席执行官萨姆·奥特曼(Sam Altman)近日提出了一个具有挑战性的观点,称与ChatGPT这样的聊天机器人使用礼貌语言,如“请”和“谢谢”,实际上是一种浪费,耗费了大量的电力和计算资源。 奥特曼指出,尽管许多人认为与人工智能保持礼貌是一种文化上的必要行为,或者有助于提升交互质量,但这种做法却无形中增加了人工智能系统的负担。 每次使用礼貌语言时,聊天机器人不仅要识别和处理这些词汇,还需要生成长而复杂的回应,所有这些都需要大量的计算资源和电力支持。
4/21/2025 11:00:46 AM
AI在线
可信AI技术获中国电子学会科技进步一等奖,蚂蚁数科助力破解大模型应用“安全可信”难题
4月19日,2024年度中国电子学会科学技术奖在第十八届中国电子信息年会揭晓并颁奖,由清华大学、北京中关村实验室和蚂蚁集团等单位共同完成的联合项目《高效协作的互联网动态行为安全可信关键技术与应用》荣获科技进步奖一等奖。 近年来,网络环境日益复杂,恶意流量攻击和隐蔽未知应用风险在互联网中泛滥,如何构建一个更安全可信的互联网环境,成为学术界和产业界的共同追求。 由清华大学、北京中关村实验室及蚂蚁集团等联合提出的“高效协作的互联网动态行为安全可信关键技术”,创新提出了分层传递和高效求解的智能协作体系技术思路,通过模型表达、知识共享和应用支撑,在实现安全信息获取、传递和协作的同时,显著提升了互联网应对未知应用风险的能力。
4/21/2025 9:47:00 AM
新闻助手
清华张亚勤:10年后,机器人将可能比人都多
“10年后,机器人将可能比人都多,会陆续进入工厂、社会,最终形态是进入家庭。 未来每个人、每个家庭都有机器人。 ”这样的预言,来自清华大学智能产业研究院(AIR)院长张亚勤。
4/21/2025 9:30:00 AM
量子位
OpenAI爆出硬伤,强化学习是祸首!o3越强越「疯」,幻觉率狂飙
满血o3更强了,却也更爱「胡言乱语」了。 OpenAI技术报告称,o3和o4-mini「幻觉率」远高于此前的推理模型,甚至超过了传统模型GPT-4o。 根据PersonQA基准测试,o3在33%的问题回答中产生了幻觉,几乎是o1(16%)的2倍。
4/21/2025 9:27:00 AM
新智元
全球首个:阿联酋尝试用 AI 制定和修改法律
阿联酋正尝试利用AI技术制定和修改法律,成立监管智能办公室推进相关工作。AI将定期提出立法更新建议,预计使立法速度加快70%。然而,专家警告AI可能存在偏见和可靠性问题。#AI立法# #阿联酋科技#
4/21/2025 9:26:09 AM
远洋
杀疯了!Gemini 2.5狂飙「高尔顿板」测试,编码横扫所有OpenAI模型
编码能力一直是顶尖模型宣传的重点。 尤其是,AI大神Karpathy带火vibe coding(氛围编程)概念后,普通人也可以通过AI体验到编程的乐趣。 游戏、网页、3D建模,再加上最近爆火的MCP协议,大家玩得不亦乐乎。
4/21/2025 9:15:00 AM
新智元
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
马斯克
智能体
AI创作
AI新词
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
蛋白质
开发者
Claude
苹果
AI for Science
Agent
生成式
神经网络
机器学习
3D
研究
xAI
生成
人形机器人
AI视频
百度
计算
Sora
工具
GPU
华为
大语言模型
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
深度学习
视频生成
预测
AGI
视觉
伟达
架构
Transformer
神器推荐
亚马逊
特斯拉
编程
MCP
Copilot