资讯列表
精度效率双冠王!时序预测新范式TimeDistill:跨架构知识蒸馏,全面超越SOTA
如何在保证预测精度的同时降低计算成本,是时序预测应用面临的核心挑战。 传统的时序预测模型(如基于Transformer或CNN的复杂结构)虽在精度上表现卓越,但计算开销往往难以满足实际部署需求。 而轻量级MLP(多层感知器)虽然具备较高的推理速度,却常因建模能力不足,导致预测精度较低。
3/10/2025 9:22:00 AM
新智元
手搓RAG新增功能:递归检索与迭代查询+重回成熟框架API
在上那篇提到的我手搓的那个 RAG 项目新增功能中,漏掉了递归检索与迭代查询,这篇补上(源码见知识星球)。 经过初步调试对召回效果有明显提升,这种方法解决了传统 RAG 的几个关键问题:处理复杂多步骤问题:通过多次迭代,分解复杂问题信息不足的补充:当初始检索结果不足以回答问题时,自动生成补充查询多角度信息收集:能够从不同角度收集相关信息1、递归检索具体实现递归检索函数(recursive_retrieval)(支持最多三次迭代查询)每次迭代使用混合检索(向量检索 BM25)获取信息使用 LLM 分析当前检索结果,判断是否需要进一步查询如果需要,LLM 会生成新的查询问题,用于下一轮检索换句话说,递归检索的工作原理可以理解为"先检索-后思考-再检索"的过程,模拟了人解决问题的方式:先获取一些信息,思考下是否足够,如果不够则继续查找更多相关信息。 总之,好的结果不是一蹴而就的。
3/10/2025 9:20:00 AM
韦东东
AI玩手机越玩越6!西湖大学发布新智能体:会自我进化的AppAgentX
人工智能正迎来前所未有的变革,其中,大语言模型(LLM)的崛起推动了智能系统从信息处理向自主交互迈进。 以DeepSeek为代表的LLM,凭借强大的语言理解与推理能力,在文本创作、编程辅助、复杂任务规划等领域展现出卓越表现。 然而,LLM的潜力远不止于文本生成,它们正在塑造一种全新的智能体形态——GUI代理(GUI Agents)。
3/10/2025 9:15:00 AM
量子位
马斯克诉OpenAI案出现转机:法官对AI巨头营利化计划表示担忧
尽管埃隆·马斯克在OpenAI诉讼的初步禁令申请中败诉,一位联邦法官对该AI公司从非营利转为营利的计划表达了严重法律顾虑,为反对该转型的人士提供了希望。 美国地方法院法官Yvonne Gonzalez Rogers周二驳回了马斯克阻止OpenAI向营利性公司转型的禁令请求,但同时指出当公众资金用于此类转变时,将造成"重大且不可挽回的损害"。 法官还提到OpenAI联合创始人Sam Altman和Greg Brockman曾做出"基本承诺",不会将OpenAI"用作中饱私囊的工具"。
3/10/2025 9:13:00 AM
AI在线
在 AI 时代如何证明你是人类,OpenAI 奥尔特曼推聊天应用 World 尝试虹膜识别
奥尔特曼正在开发一款名为“World”的“全能应用”。这个创新平台旨在创建一个综合性的超级应用生态系统,整合支付、聊天和微贷款等功能,所有这些都通过一种独特的生物识别方法进行验证:用户必须凝视篮球大小的“球体”,这些球体会扫描他们的虹膜,来证明确实是人类。
3/10/2025 9:10:36 AM
汪淼
大模型本地部署的“隐形炸弹”,你的数据安全吗?
作者 | 朱雀实验室随着DeepSeek R1等开源大模型的火爆,越来越多的开发者、企业甚至开始尝试在本地部署大语言模型,享受AI带来的便利。 然而近期腾讯混元安全团队-朱雀实验室发现:这些广受欢迎的AI工具中有不少存在安全隐患。 如果使用不当,攻击者可能窃取用户数据、滥用算力资源,甚至控制用户设备。
3/10/2025 9:10:00 AM
腾讯技术工程
DeepSeek同款GRPO训练大提速!魔搭开源全流程方案,支持多模态训练、训练加速和评测全链路
GRPO训练又有新的工具链可以用,这次来自于ModelScope魔搭社区。 随着DeepSeek-R1的成功出圈,其使用的GRPO算法受到了业界的广泛关注。 GRPO训练是来自于PPO算法的一种改进,旨在利用采样原理对value model进行简化,以增大训练的稳定性和可维护性。
3/10/2025 9:10:00 AM
量子位
马斯克可能仍有机会阻止 OpenAI 的营利转型
近期,特斯拉 CEO 马斯克与 OpenAI 之间的法律争斗再次引发关注。 马斯克的诉讼指控 OpenAI 在转型为盈利公司时背离了其最初的非营利使命。 OpenAI 成立于 2015 年,最初是作为非营利机构,但在 2019 年改为 “有限利润” 结构,目前计划进一步转型为公共利益公司。
3/10/2025 9:00:41 AM
AI在线
视频训练LoRA来了!Ostris 用 20 张照片打造惊艳 Wan 2.1 LoRA
2025年3月9日,美国加利福尼亚州——开源模型正让文生视频技术变得越来越有趣。 AI 开发者 Ostris(@ostrisai)近日在 X 平台上分享了他使用自家照片训练的 Wan2.1LoRA 模型成果,仅凭约20张照片和一块家用 RTX4090显卡,便实现了令人惊叹的视频生成效果。 这一成果不仅展示了开源技术的潜力,也引发了 X 社区对视频 LoRA 训练工具的热烈讨论。
3/10/2025 9:00:39 AM
AI在线
让SFT重新伟大!CMU等华人学者提出全新「批判式微调」,媲美复刻版DeepSeek
模仿是传统语言模型训练的主要方式。 LLM在解决现实世界问题方面之所以表现出前所未有的性能,其中一项核心技术是监督微调(SFT)。 在SFT的过程中,模型被要求模仿人类标注或合成的高质量回复,以增强通用指令遵循能力。
3/10/2025 9:00:00 AM
新智元
Ollama的配置修改与接口调用
一、修改环境变量1.1 配置远程访问在我们本地部署好ollama之后,仅支持本机访问,我们可以通过修改环境变量让其他人可以远程访问。 在wins电脑上增加环境变量:复制1.2 配置本地模型路径1.2.1 本地模型默认路径wins本地模型默认路径:C:\Users\%username%\.ollama\models。 这里 %username% 是当前登录的用户名。
3/10/2025 9:00:00 AM
Python伊甸园
DeepSeek占比升至9.6%,稳居全球第二!「全球生成式AI行业趋势」发布
近日,SimilarWeb发布了最新的「全球生成式AI行业趋势」报告。 报告中详细分析了截至2月28日,全球生成式AI工具在各个领域的趋势和表现。 报告链接:,AI工具在过去12周的增速约为20%,其中代码自动补全与DevOps增长高达72%。
3/10/2025 8:55:00 AM
新智元
外媒:Manus 可能不是中国的第二个“DeepSeek 时刻”
最近,一款名为 Manus 的中国 AI 智能体平台在网络上引起了广泛关注。 该平台自上周预览推出以来,迅速吸引了大量用户,Hugging Face 的产品负责人称其为 “我见过的最令人印象深刻的 AI 工具”。 与此同时,AI 政策研究者 Dean Ball 也表示 Manus 是 “最复杂的计算机 AI”。
3/10/2025 8:53:00 AM
AI在线
世界首个人类脑细胞计算机诞生!能编程还能活体计算,售价3万5美金
就在刚刚,世界上第一台「合成生物智能」生物计算机诞生了! Cortical lab推出的这款计算机,是由人类神经元直接集成到硅芯片上,可以编程和自适应,甚至还能活体计算。 合成生物智能,再次创造奇迹。
3/10/2025 8:52:00 AM
新智元
QQ浏览器推出AI问答功能“元宝快答”:基于混元快思考模型Turbo S
3月7日,QQ浏览器宣布推出AI问答功能——“元宝快答”,旨在为用户提供更快速、更精炼的搜索答案体验。 该功能基于腾讯混元的“快思考”模型Turbo S,结合了搜索增强技术,能够快速检索全网实时信息,包括公众号等优质内容,并自动提炼重点,为用户提供简洁明了的回答。 用户在QQ浏览器的手机或电脑端,通过搜狗搜索或全网搜索模式提问时,元宝快答能够在瞬间给出答案,极大地提升了搜索效率。
3/10/2025 8:43:00 AM
AI在线
狂揽1.3亿美金!AlphaGo大神组队Gemini大牛,用RL打造超级智能,英伟达抢投
正如Ilya所说,AI的下一步,就是「超级智能」。 近日,由DeepMind近12年老将、做出AlphaGo/AlphaZero/MuZero等项目的超级天才Ioannis Antonoglou,和Gemini强化学习的核心负责人Misha Laskin,联合成立的初创Reflection AI终于浮出了水面。 Reflection AI的目标十分明确——构建超级智能自主系统!
3/10/2025 8:38:00 AM
新智元
Ollama的介绍与测试
一、Ollama介绍Ollama是一个开源工具,专为在本地机器上便捷部署和运行大型语言模型(LLM)而设计。 它提供了一个简洁高效的界面,让用户能够轻松地创建、执行和管理这些复杂的模型。 此外,Ollama还配备了一个丰富的预构建模型库,使得这些模型能够无缝集成到各种应用程序之中,大大提升了开发效率和用户体验。
3/10/2025 8:30:00 AM
Python伊甸园
ICLR 2025 Spotlight |「免费」多模态信息助力3D小样本分割
该文章的第一作者安照崇,目前在哥本哈根大学攻读博士学位,导师为 Serge Belongie。 他硕士毕业于苏黎世联邦理工学院(ETH Zurich),在硕士期间,他跟随导师 Luc Van Gool 进行了多个研究项目。 他的主要研究方向包括场景理解、小样本学习以及多模态学习。
3/10/2025 8:25:00 AM
机器之心