AI
OpenAI o3 / o4-mini 模型 AI 生成文本含特殊符号,推测为隐形水印
AI 初创公司 Rumi 发现 OpenAI 公司在 o3 和 o4-mini 模型中,嵌入了窄不换行空格(Narrow No-Break Space, NNBSP, U+202F)等特殊 Unicode 字符。
AI 助手 Claude 的“内心世界”:Anthropic 新研究解密其价值观
Anthropic 公司于周一发布了一项名为“Values in the Wild”的研究,深入剖析了 AI 助手 Claude 在实际用户交互中的价值观表达。
韩国内阁通过 1.8 万亿韩元 AI 投资补充预算:一年内要买 10000 块 GPU
该预算的 80% 以上用于 GPU 购买,其它投资项目包括选拔先进 LLM 开发团队、扩大公私合作 AI 创新基金规模、支持韩国企业 NPU 商业化、招募和培养 AI 人才。
力压群雄:谷歌 Gemini 2.5 Pro 成首款完全理解 PDF 布局的 AI 模型,可精确引用
最新报告指出,谷歌旗下的 Gemini 2.5 Pro 模型能准确解析 PDF 文档的视觉结构,实现精准的视觉引用功能,成为首款能完全理解 PDF 布局的 AI 模型。
使用礼貌用语可能导致 OpenAI 每年损失数百万美元
最近,关于向人工智能聊天机器人如 ChatGPT 使用礼貌用语可能导致 OpenAI 每年损失数百万美元的新闻引发了广泛关注。 这一说法源自 OpenAI 首席执行官山姆・阿尔特曼(Sam Altman)的一条社交媒体评论,迅速引起了众多媒体的热议。 事情的起因是一位网友在社交平台上询问阿尔特曼:“用户对 AI 说‘请’和‘谢谢’到底让 OpenAI 在电费上损失了多少?” 对此,阿尔特曼幽默地回应:“数千万美元,花得值 —— 你永远不知道。
突破封锁!华为将发布大量AI芯片,平替英伟达H100
今天凌晨2点,路透社独家消息,华为最早将于5月份发布大量910C AI芯片,部分出货已完成。 华为此次发布产品主要是针对美国对国内AI芯片的封锁,帮助国内企业解决AI芯片短缺的难题。 因为美国政府本月要求英伟达销售H20需出口许可证。
用任务向量做模型编辑为何有效?这篇ICLR 2025 Oral论文给出了理论分析
本文作者李宏康,博士毕业于美国伦斯勒理工大学,本科毕业于中国科学技术大学,并即将前往宾夕法尼亚大学担任博士后研究员。 研究方向包括深度学习理论、大语言模型理论等等。 本文的通讯作者为伦斯勒理工大学的汪孟教授。
百页专业报告一次直出!Jürgen团队开源框架WriteHERE,重塑AI写作天花板
在 AI 长文写作领域,一项革命性突破正在改写行业规则 —— 由「人工智能之父」Jürgen Schmidhuber 领衔的团队,正式开源其长文写作框架 WriteHERE。 该框架凭借异质递归规划(Heterogeneous Recursive Planning)技术,实现单次生成超 4 万字、100 页专业报告的能力,在小说创作、报告生成场景中全面超越 Perplexity 付费版「深度研究」、DeepMind 的 Agent's Room 及斯坦福 STORM 等顶尖方案。 论文标题:Beyond Outlining: Heterogeneous Recursive Planning for Adaptive Long-form Writing with Language Models论文地址: & 在线 Demo: 仓库:「大纲先行」到「实时编织」现有 AI 长文生成系统(如 Agent's Room、STORM)多将写作简化为「规划 - 填充」的线性流程,而 WriteHERE 首次通过数学形式化揭示:长文写作本质上是检索(Retrieval)、推理(Reasoning)、写作(Composition)三类异构任务的动态编织。
RL很重要,但远非All You Need!微软副总裁:AI不靠单个技术撑起
「AI 领域确实存在苦涩的教训,但若当初全盘接受它,我们现在可能还在用线性回归搞强化学习。 」刚刚,微软副总裁 Nando de Freitas 一篇长推文表达了自己的观点:反对单一技术的过度宣传,如 RL,应该强调多领域合作的重要性;AI 进步不是靠单一天才撑起的,而是成千上万的参与者共同推动了这一领域的发展;过去的一些观点在当时看似合理,但随着技术的发展,这些观点显得过时;人工智能的发展需要不断突破传统观念,就像数学一样,通过不断的探索和试错来逐步推进。 推文中,Freitas 还透露 RL 固然重要,但还远未达到「RL is all you need」的程度。
多模态大模型改造人脸防伪检测,厦大腾讯优图等研究入选CVPR 2025
近年来,人脸合成技术在快速发展,相关检测任务也逐渐从“看得出来”向“说明白为什么”演进。 除了判断一张脸是真还是假,更需要模型能“说出个所以然”。 在CVPR 2025的工作《Towards General Visual-Linguistic Face Forgery Detection》中,研究团队尝试从视觉 语言的多模态视角来改进伪造检测方法。
Sebastian Raschka长文:DeepSeek-R1、o3背后,RL推理训练正悄悄突破上限
著名 AI 研究者和博主 Sebastian Raschka 又双叒叕更新博客了。 这次的主题是《LLM 推理的强化学习现状》。 博客地址: AI 社区很热闹,尤其是 Llama 4 和 GPT-4.5 等新旗舰模型的发布。
AI创造新物理学,暴力破解引力波!宇宙观测开挂50倍,三体人直呼内行
就在刚刚,AI又将物理学,推动到了全新的领域。 来自马克斯·普朗克光科学研究所(MPL)、加州理工等机构的科学家发现,AI已经设计出了人类尚未理解的引力波探测工具。 这一发现,直接将可观测的宇宙体积扩大了50倍!
UIUC联手谷歌发布Search-R1:大模型学会「边想边查」,推理、搜索无缝切换
本文的作者来自伊利诺伊大学香槟分校(UIUC)、马萨诸塞大学(UMass)和谷歌。 本文的第一作者为 UIUC 博士生金博文,主要研究方向为与大语言模型相关的智能体、推理和强化学习研究。 其余学生作者为 UMass 博士生曾翰偲和 UIUC 博士生岳真锐。
更懂公务员的大模型:写作/意图理解/公文排版全拿捏,部署成本直降90%,来自金山
当政务大模型具备推理能力,部署成本直降90%,写作效率提升71.58%、意图理解提升34.87%、公文排版能力提升12%。 如上新进展,来自金山办公。 时隔四个月,金山自研政务大模型完成推理能力升级。
采样越多越聪明?隐式扩展颠覆认知,采样搜索如何挑出完美解
先让模型生成多个候选答案,再通过自我验证挑出「真金」。 基于采样的搜索在许多推理任务中表现优异,可关于它的扩展趋势,还有许多未解之谜。 随着采样数量的增加,模型的推理性能能否继续提升?
2025年全球GenAI手机出货量有望突破4亿部,渗透率约占三分之一
根据Counterpoint的最新预测,2025年全球智能手机市场将迎来一个重要的里程碑:三分之一的智能手机出货量将支持生成式人工智能(GenAI),预计全年出货量将超过4亿部。 这一趋势标志着智能手机行业在人工智能技术集成方面的快速进步,也预示着GenAI将成为未来智能手机的核心功能之一。 d3001.pngGenAI集成加速,技术与市场需求推动变革从2024年到2025年,全球智能手机支持GenAI的比例显著提升。
AI和现代工作空间推动全球视频会议设备市场增长
AI已成为推动市场发展的关键加速器,消除了以往阻碍视频广泛采用的许多障碍。 AI驱动的创新——从自动会议记录、实时翻译到智能摄像头取景和噪声抑制——正在彻底改变视频会议体验,使其更加无缝、引人入胜、个性化和高效。 市场正见证着前所未有的创新浪潮,其中AI和数据驱动的见解处于前沿地位。
被LangChain4j坑惨了!
最近在深度体验和使用 Spring AI 和 LangChain4j,从开始的满怀期待五五开,但最后极具痛苦的使用 LangChain4j,让我真正体验到了正规军和草台班子的区别。 Spring AI VS LangChain4jSpring AI:使用简单、写法优雅、但功能提供的较少、成熟度稍高;LangChain4j:作为移植大模型著名框架 LangChain 功能稍多、灵活度高、使用复杂、满是 BUG。 还有根本找不到关键内容的官方文档,该有的重要内容是一点都不介绍啊,使用和学习成本很高。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉