AI在线 AI在线

资讯列表

准博士生把导师履历论文输入ChatGPT,制成「AI评委」!顺利通过资格考试

美国学生发现了ChatGPT的创意新用途! 2024年8月,渴望成为University of Colorado生物医学博士生的Adriana Ivich,面临着博士资格考试的挑战。 在这场考试中,她不仅要详细阐述自己的研究计划,还得接受评审委员会的闭门「拷问」。
3/10/2025 9:55:00 AM
新智元

推理版局部重绘方法LanPaint,零训练修复图片

近日,开发者 scraed 在 GitHub 上发布了 LanPaint,一个无需额外训练的图像修复工具。 该工具旨在帮助用户在任何稳定扩散模型(SD)上实现高质量的图像修复效果,甚至包括用户自己训练的自定义模型。 LanPaint 通过多次迭代让模型在去噪之前 “思考”,从而获得更为无缝和准确的修复结果。
3/10/2025 9:53:00 AM
AI在线

Firecrawl推出LLM.txt API:提供网址即可生成任意网站的LLM.txt

近日,Firecrawl 推出了一项全新的功能 ——LLMs.txt 生成器接口(Alpha 版),旨在帮助用户将任何网站的内容转化为清晰、适用于大语言模型(LLM)训练的文本文件。 用户只需提供一个网站的 URL,Firecrawl 便会对该网站及其链接页面进行抓取,生成两种格式的文本文件:llms.txt 和 llms-full.txt,便于后续的分析和训练。 该生成器的工作流程相对简单。
3/10/2025 9:48:00 AM
AI在线

开源版HeyGen来了!Heygem:精准克隆外貌和声音,支持对口型

Heygem 是一款为 Windows 系统设计的全新离线视频合成工具,它能精准克隆用户的外貌和声音,将个人形象数字化。 该工具支持用户通过文本和语音驱动虚拟形象进行视频创作,整个过程无需互联网连接,确保用户隐私安全。 Heygem 的核心功能包括精确的外貌和声音克隆。
3/10/2025 9:46:00 AM
AI在线

Manus官方X账号解封 将继续分享酷炫的使用案例

中国初创公司Monica开发的通用AI代理Manus AI在经历了短暂的社交媒体危机后重新恢复正常运营。 这款被定位为"世界首个自主AI代理"的产品能够处理创建网站、分析股票市场趋势和规划旅行行程等复杂现实任务,在2025年初的行业表现被媒体誉为"中国AI的骄傲",与DeepSeek等模型并列。 3月7日,Manus AI的官方X账号突然被暂停,原因初步指向与第三方提及的加密货币诈骗有关。
3/10/2025 9:42:00 AM
AI在线

10²⁶参数,AGI还需70年!清华人大预测届时GPU总价达4000万倍苹果市值

AGI,就在今年;诺奖级AI,将2026年-2027年诞生。 不论是奥特曼,还是Anthropic首席执行官Dario Amodei,AI界科技大佬纷纷认为「超级智能」近在眼前。 甚至,几天前,纽约时报的一篇文章称,美国政府知道AGI要来,并有了相应的想法和对策。
3/10/2025 9:42:00 AM
新智元

1.5B硬刚GPT-4o,CMU祭出LCPO提示可控思考!每token性能较S1暴涨2倍

一个只有15亿参数的小模型,竟然能在相同token预算下挑战GPT-4o的性能! 最近,CMU团队推出了「长度控制策略优化」(LCPO),它让AI的推理过程不再是「一刀切」,而是像个聪明管家,能根据任务需求灵活调整「思考」长度。 无论是啃下复杂的数学难题,还是快速解答简单问题,这个名叫L1的模型都游刃有余。
3/10/2025 9:38:00 AM
新智元

超越 Mistral 和 Qwen:谷歌 Gemini Embedding 登顶 MTEB,问鼎最强文本嵌入 AI 模型

Gemini Embedding的发布标志着谷歌在AI文本处理领域的又一次突破。其卓越的性能和广泛的应用潜力,不仅为谷歌搜索和云服务提供了强大支持,也为企业用户带来了更多可能性。
3/10/2025 9:30:27 AM
故渊

Ilya错了?Scaling另有他用,ViT大佬力挺谷歌1000亿数据新发现

预训练Scaling  Law到尽头了? ViT大佬翟晓华(Xiaohua Zhai)并不这样认为,至少在多模态模型上并非如此。 他公布了最新的关于多模态Scaling的最新见解,而训练数据达到了1000亿的规模!
3/10/2025 9:30:00 AM
新智元

精度效率双冠王!时序预测新范式TimeDistill:跨架构知识蒸馏,全面超越SOTA

如何在保证预测精度的同时降低计算成本,是时序预测应用面临的核心挑战。 传统的时序预测模型(如基于Transformer或CNN的复杂结构)虽在精度上表现卓越,但计算开销往往难以满足实际部署需求。 而轻量级MLP(多层感知器)虽然具备较高的推理速度,却常因建模能力不足,导致预测精度较低。
3/10/2025 9:22:00 AM
新智元

手搓RAG新增功能:递归检索与迭代查询+重回成熟框架API

在上那篇提到的我手搓的那个 RAG 项目新增功能中,漏掉了递归检索与迭代查询,这篇补上(源码见知识星球)。 经过初步调试对召回效果有明显提升,这种方法解决了传统 RAG 的几个关键问题:处理复杂多步骤问题:通过多次迭代,分解复杂问题信息不足的补充:当初始检索结果不足以回答问题时,自动生成补充查询多角度信息收集:能够从不同角度收集相关信息1、递归检索具体实现递归检索函数(recursive_retrieval)(支持最多三次迭代查询)每次迭代使用混合检索(向量检索 BM25)获取信息使用 LLM 分析当前检索结果,判断是否需要进一步查询如果需要,LLM 会生成新的查询问题,用于下一轮检索换句话说,递归检索的工作原理可以理解为"先检索-后思考-再检索"的过程,模拟了人解决问题的方式:先获取一些信息,思考下是否足够,如果不够则继续查找更多相关信息。 总之,好的结果不是一蹴而就的。
3/10/2025 9:20:00 AM
韦东东

AI玩手机越玩越6!西湖大学发布新智能体:会自我进化的AppAgentX

人工智能正迎来前所未有的变革,其中,大语言模型(LLM)的崛起推动了智能系统从信息处理向自主交互迈进。 以DeepSeek为代表的LLM,凭借强大的语言理解与推理能力,在文本创作、编程辅助、复杂任务规划等领域展现出卓越表现。 然而,LLM的潜力远不止于文本生成,它们正在塑造一种全新的智能体形态——GUI代理(GUI Agents)。
3/10/2025 9:15:00 AM
量子位

马斯克诉OpenAI案出现转机:法官对AI巨头营利化计划表示担忧

尽管埃隆·马斯克在OpenAI诉讼的初步禁令申请中败诉,一位联邦法官对该AI公司从非营利转为营利的计划表达了严重法律顾虑,为反对该转型的人士提供了希望。 美国地方法院法官Yvonne Gonzalez Rogers周二驳回了马斯克阻止OpenAI向营利性公司转型的禁令请求,但同时指出当公众资金用于此类转变时,将造成"重大且不可挽回的损害"。 法官还提到OpenAI联合创始人Sam Altman和Greg Brockman曾做出"基本承诺",不会将OpenAI"用作中饱私囊的工具"。
3/10/2025 9:13:00 AM
AI在线

在 AI 时代如何证明你是人类,OpenAI 奥尔特曼推聊天应用 World 尝试虹膜识别

奥尔特曼正在开发一款名为“World”的“全能应用”。这个创新平台旨在创建一个综合性的超级应用生态系统,整合支付、聊天和微贷款等功能,所有这些都通过一种独特的生物识别方法进行验证:用户必须凝视篮球大小的“球体”,这些球体会扫描他们的虹膜,来证明确实是人类。
3/10/2025 9:10:36 AM
汪淼

大模型本地部署的“隐形炸弹”,你的数据安全吗?

作者 | 朱雀实验室随着DeepSeek R1等开源大模型的火爆,越来越多的开发者、企业甚至开始尝试在本地部署大语言模型,享受AI带来的便利。 然而近期腾讯混元安全团队-朱雀实验室发现:这些广受欢迎的AI工具中有不少存在安全隐患。 如果使用不当,攻击者可能窃取用户数据、滥用算力资源,甚至控制用户设备。
3/10/2025 9:10:00 AM
腾讯技术工程

DeepSeek同款GRPO训练大提速!魔搭开源全流程方案,支持多模态训练、训练加速和评测全链路

GRPO训练又有新的工具链可以用,这次来自于ModelScope魔搭社区。 随着DeepSeek-R1的成功出圈,其使用的GRPO算法受到了业界的广泛关注。 GRPO训练是来自于PPO算法的一种改进,旨在利用采样原理对value model进行简化,以增大训练的稳定性和可维护性。
3/10/2025 9:10:00 AM
量子位

马斯克可能仍有机会阻止 OpenAI 的营利转型

近期,特斯拉 CEO 马斯克与 OpenAI 之间的法律争斗再次引发关注。 马斯克的诉讼指控 OpenAI 在转型为盈利公司时背离了其最初的非营利使命。 OpenAI 成立于 2015 年,最初是作为非营利机构,但在 2019 年改为 “有限利润” 结构,目前计划进一步转型为公共利益公司。
3/10/2025 9:00:41 AM
AI在线

视频训练LoRA来了!Ostris 用 20 张照片打造惊艳 Wan 2.1 LoRA

2025年3月9日,美国加利福尼亚州——开源模型正让文生视频技术变得越来越有趣。 AI 开发者 Ostris(@ostrisai)近日在 X 平台上分享了他使用自家照片训练的 Wan2.1LoRA 模型成果,仅凭约20张照片和一块家用 RTX4090显卡,便实现了令人惊叹的视频生成效果。 这一成果不仅展示了开源技术的潜力,也引发了 X 社区对视频 LoRA 训练工具的热烈讨论。
3/10/2025 9:00:39 AM
AI在线