AI在线 AI在线

理论

刚刚,OpenAI推出「轻量级」Deep Research,免费用户也能薅羊毛!

刚刚,OpenAI 宣布推出「轻量级」版本的 Deep Research,免费用户也可以使用! 轻量级版本由 OpenAI 的 o4-mini 模型提供支持,而之前的 Deep Research 使用的是更强大的 o3 模型(或其变体)。 OpenAI 表示,虽然响应通常会更简短,但仍能够维持您所期待的深度和质量。
4/25/2025 10:26:19 AM
机器之心

揭秘 RAG:为什么说它是让大语言模型(LLM)更聪明的秘密武器?

现在人工智能(AI)很火,尤其是像 ChatGPT 这样的大语言模型(LLM),它们能聊天、写文章、写代码,感觉无所不能。 但有时候,它们也会犯一些小错误,比如信息过时了,或者一本正经地胡说八道(这叫“幻觉”),或者你问它一些你们公司内部的事情,它就完全不知道了。 为了解决这些问题,科学家们想出了一个聪明的办法,叫做RAG。
4/25/2025 10:03:12 AM
用户007

再也不用愁画架构图了,AI帮你画

作为技术人,你一定有过这样的经历:项目文档需要一张专业的架构图,你打开draw.io或Visio,从一个空白画布开始,拖拽组件、调整布局、设置样式...一张像样的架构图往往需要耗费数小时。 画架构图一直是我最头疼的事情,不仅公司项目,我做的一些开源项目也需要画架构图,画的崩溃时我就想到,现在代码都可以通过AI从零生成,为什么还要手动绘制架构图? 通过我的实践发现,Claude在生成draw.io格式的XML架构图方面表现尤为出色——只需描述你的系统,它就能生成格式规范、结构合理的draw.io架构图,导入后即可直接使用或微调,将数小时的工作压缩至几分钟内完成。
4/25/2025 10:00:00 AM
贝塔街的万事屋

我的小网站被"薅秃"了,用 Trae 五 分钟给网站增加日志功能,揪出爬虫!

最近我发现自己用 Express 搭建的网站突然响应变慢,服务器负载莫名其妙地升高。 一开始我还以为是代码优化问题,但看了几天后隐约感觉不对劲——流量突然暴增,但 uv 并没有明显增长。 这种情况显然是遭遇了异常访问,要么是人为高频刷新,要么是爬虫抓取。
4/25/2025 9:54:26 AM
story

RL真让大模型更会推理?清华新研究:其能力边界或仍被基座「锁死」

近年来,RLVR(可验证奖励的强化学习)训练大模型在数学、代码等各项任务中表现惊艳,大模型的推理能力快速提升,强化学习因而被视为重要的推手。 然而,其中直指核心的重要问题却悬而未决:强化学习真的能让大模型获得超越基础模型的新推理能力吗? 清华大学LeapLab团队联合上海交通大学开展的最新实证研究,通过实验现象揭示了一个值得关注的问题:当前的 RLVR 方法似乎尚未突破基座模型的能力上限。
4/25/2025 9:22:44 AM
机器之心

无需数据标注!测试时强化学习,模型数学能力暴增 | 清华&上海AI Lab

无需数据标注,在测试时做强化学习,模型数学能力暴增159%! 清华和上海AI Lab周伯文团队用这样的方法,对模型进行了强化——结果模型在多个数据集上的成绩均大幅提升,尤其是Qwen-2.5-Math-7B,它做AIME 2024竞赛题的成绩直接提高了159%。 实验过程中,强化学习的数据均由被训练的模型自身生成。
4/25/2025 9:20:00 AM

机器人也会挤牙膏?ManipTrans:高效迁移人类双手操作技能至灵巧手

研究团队由来自北京通用人工智能研究院(BIGAI)、清华大学和北京大学的跨专业研究者组成,致力于具身智能领域的前沿研究。 团队成员在开发高效、智能的通用机器人技术,特别是机械灵巧手操作方面,拥有丰富的研究经验。 一作为北京通用人工智能研究院研究员李恺林,其它作者为清华大学博士生李浦豪、北京通用人工智能研究院研究员刘腾宇、北京大学博士生李宇飏;通讯作者为北京通用人工智能研究院研究员黄思远。
4/25/2025 9:17:00 AM
机器之心

北大团队引领3D生成与对齐革新:OctGPT打破扩散模型垄断

近年来,智能三维形状生成(3D AIGC)技术迅速崛起,正成为推动数字内容创作革新的关键力量,特别是在游戏、影视、虚拟现实和工业设计等领域表现出巨大的应用潜力。 随着技术的不断进步,三维内容的生成质量与效率持续提升,成为业界与学界广泛关注的焦点。 最近,北京大学陈宝权教授带领团队在三维形状生成和三维数据对齐方面取得新的突破。
4/25/2025 9:15:00 AM
量子位

TTS和TTT已过时?TTRL横空出世,推理模型摆脱「标注数据」依赖,性能暴涨

在大语言模型(LLMs)竞争日趋白热化的今天,「推理能力」已成为评判模型优劣的关键指标。 OpenAI 的 o 系列、Anthropic 的 Claude 和 DeepSeek-R1 等模型的惊艳表现背后,测试时缩放(TTS)技术功不可没。 测试时缩放(TTS,Test-Time Scaling)是一种提升大语言模型推理能力的新兴策略,通过在测试阶段优化推理过程(如多数投票、蒙特卡洛树搜索等)提升大型语言模型(LLMs)的性能,而无需修改模型参数。
4/25/2025 9:12:00 AM
机器之心

UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!

首次在统一框架内实现理解与生成的“双优表现”,打破了多模态统一建模的僵局! 复旦大学和美团的研究者们提出了UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾了图文理解与图像生成任务,并在多个权威评测中取得了领先的性能表现。 UniToken通过融合连续和离散视觉表征,有效缓解了以往方法中“任务干扰”和“表示割裂”的问题,为多模态统一建模提供了新的范式。
4/25/2025 9:10:00 AM

突发!OpenAI免费开放Deep research,超强AI Agent

今天凌晨4点30,OpenAI推出轻量级版本的Deep research功能提高当前的速率限制,以扩大Plus、Team和Pro用户的使用范围。 值得一提的是,从今天开始免费ChatGPT用户可以使用Deep research,并且支持最新的o4-mini模型。 下面「AIGC开放社区」就用免费版为大家展示一下Deep research的免费功能。
4/25/2025 9:09:00 AM
AIGC开放社区

从模型原理到代码实践,深入浅出上手 Transformer,叩开大模型世界的大门

作者 | Plus一、序言作为非算法同学,最近被Cursor、DeepSeek搞的有点焦虑,同时也非常好奇这里的原理,所以花了大量业余时间自学了Transformer并做了完整的工程实践。 希望自己心得和理解可以帮到大家~如有错漏,欢迎指出~本文都会以用Transformer做中英翻译的具体实例进行阐述。  二、从宏观逻辑看Transformer让我们先从宏观角度解释一下这个架构。
4/25/2025 9:00:00 AM
腾讯技术工程

微软重磅官宣:「AI智能体」同事连夜上线!预言25年人类同事成稀有物种

就在刚刚,微软宣布:AI同事真来了! CEO纳德拉亲自种草,激动表示:今天,对Microsoft 365 Copilot来说是个大日子。 Copilot的界面,已经完全AI化。
4/25/2025 8:55:00 AM
新智元

DeepResearch轻量版今日面向免费用户开放,实测一波,秒生成,太快了!

刚刚3个小时前,OpenAI推出轻量级版本的Deep research功能提高当前的速率限制,以扩大Plus、Team和Pro用户的使用范围。 值得一提的是,从今天开始免费ChatGPT用户可以使用DeepResearch,并且支持最新的o4-mini模型。 我这里实测了一下,中美两国人形机器人的市场现状和趋势分析,要求生成一份深度分析报告。
4/25/2025 8:44:04 AM

AI语音革命新纪元:Sesame模型让聊天AI“活”出表情包式情绪声线

译者 | 朱先忠审校 | 重楼Sesame使用一种名为残差向量量化的深度学习技术对语音进行编码最近,Sesame人工智能公司发布了他们最新的语音转语音(Speech-to-Speech)模型的演示。 这是一个非常擅长说话的对话式人工智能代理,它们能够提供相关的答案,并带有表情地说话,而且说实话,它们非常有趣,互动性很强。 请注意,有关这方面的系统的技术论文尚未发布,但他们确实发布了一篇简短的博客文章,并提供了有关他们使用的技术和他们所构建的先前算法的大量信息。
4/25/2025 8:19:05 AM
朱先忠

企业中最常用的十种GenAI工具

从AI聊天机器人和虚拟助手,到音频和视频生成器,这些都是当今最前沿的GenAI工具。 自OpenAI于2022年推出ChatGPT以来,GenAI已大规模进入企业领域。 根据Precedence Research的数据,2024年全球GenAI市场规模已超过250亿美元,并预计到2033年将达到惊人的8030亿美元。
4/25/2025 7:10:00 AM
Thor Olavsrud

CISO仍未遏制影子AI飙升的数据风险

GenAI带来了诸多益处,但同时也伴随着数据安全风险,这主要通过影子AI的使用和敏感信息的泄露来实现。 在企业中,这些风险正在加剧,因为员工经常使用私人GenAI账户来处理敏感数据。 根据Netskope的一项研究,尽管大多数企业(90%)都提供了官方批准的GenAI应用,甚至更多(98%)的企业为用户提供了包含AI功能的应用,但企业中未经授权的AI服务使用仍在激增。
4/25/2025 7:05:00 AM
John

机械臂+大模型+多模态:打造人机协作具身智能体

在人工智能快速发展的浪潮中,多模态大模型已成为技术前沿,使AI能够同时理解文本、图像、音频等多种信息。 这一突破为具身智能体开辟了新天地。 最近我在github中就找到了一个这样好玩的项目vlm_arm,其将机械臂与多模态大模型结合,打造一个能听人话、看图像、执行精准操作的人机协作智能体系统。
4/25/2025 2:30:00 AM
贝塔街的万事屋