AI在线 AI在线

理论

Switch的救世主是老黄!?

Switch2发售后,内置图形API——NVN2首次公开亮相。 相较前代Switch发热、卡顿、续航短、画质缩水等问题,搭载英伟达NVN2的Switch2显然从容得多,面对各类3A大作也毫不吃力。 《赛博朋克2077》的联合开发者Eoin O'Grady表示,只要是Xbox上能跑满60帧的游戏,移植到Switch2几乎都不在话下。
7/15/2025 4:26:44 PM

卡帕西预言成真!华人团队开源全AI操作系统:神经网络模拟Windows,预测下一帧屏幕图像

疯狂,太疯狂了~大神卡帕西预测的「下一代GUI系统」这就水灵灵地实现了? 玩法相当easy,当你移动鼠标、点击图标或敲键盘时,这个完全由神经网络驱动的操作系统就和咱们平时的电脑一样,能在屏幕上实时显示对应的图形界面。 就是说,AI现在能完全模拟Windows,直接预测下一帧屏幕图像。
7/15/2025 4:26:16 PM

零售业加速布局GenAI投资

超过一半(56%)的零售企业今年相比去年增加了对GenAI的投资,这是凯捷另一份报告所指出的。 零售业是采用AI智能体或多智能体系统最先进的五大行业之一,有18%的零售企业已经实施了AI智能体或多智能体系统,该报告显示。 在所有行业中,大约40%追踪投资回报率的企业预计在一到三年内从AI中获得正回报。
7/15/2025 2:33:14 PM
Xanayra

Claude背后大厂终于出手!Kiro让氛围编码走出“造玩具”,开发流程结构化了!网友:氛围编程的游戏规则又要被改写!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)作为 Claude 背后的金主,亚马逊终于在 AI 编程领域终于出手了! 昨日,他们推出了自家的 Agentic IDE —— Kiro,一款由 Claude Sonnet 4 驱动的开发工具,目标明确:解决 vibe coding 应用难以上线的“最后一公里”问题。 乍看之下,Kiro 有些像 Cursor,但本质上,它走的是另一条路线。
7/15/2025 1:55:49 PM

OpenAI出手,Windsurf背刺数百员工?

Sam Altman最近在一次演讲中说:"我认为收购是糟糕的,我通常会不惜一切代价避免它们。 "但就在他说这话的时候,一个令人震惊的故事正在硅谷悄然展开。 这个故事涉及一家名为Windsurf的AI编程创业公司,一笔30亿美元的收购协议,以及一场被称为"虚假拥抱"的商业阴谋。
7/15/2025 1:35:11 PM
阿丸笔记

RAGFlow引用机制揭秘:LLM引导与后端验证如何协同工作?

昨天知识星球内有个提问:RAGFlow 显示引用为什么不通过提示词直接显示在回答中,而是通过分块后和检索片段比较向量相似度? 判断引用出处? 能不能直接通过提示词实现。
7/15/2025 12:24:16 PM
韦东东

AGENTGROUPCHAT-V2:大型语言模型多智能体协作的创新思考

大家好,我是肆〇柒。 LLM 多智能体系统在社会模拟和复杂任务解决这两大领域大显身手。 在社会模拟里,它们精准地复刻人类社交互动模式,助力我们洞察群体行为背后的社会学;在复杂任务解决场景下,智能体们协同合作,先是制定详尽规划,再按部就班执行,轻松应对复杂局面。
7/15/2025 12:14:44 PM
肆零柒

世界最大的招聘搜索引擎Indeed利用AI技术帮助求职者寻找新工作

Indeed的云原生和数据驱动的数字化转型,使其非常适合快速发展的AI时代,公司CIO兼CSO的Anthony Moisant如是说。 “我们不仅仅是在采用AI技术,我们正在构建一家智能体公司,在这里人类智慧与同理心能够与机器智能相结合。 ”Moisant表示。
7/15/2025 11:20:57 AM
Paula Rooney

终于把 LSTM 算法搞懂了!!

大家好,我是小寒今天给大家分享一个超强的算法模型,LSTM。 LSTM(长短期记忆网络,Long Short-Term Memory)是一种特殊的循环神经网络(RNN)算法,专门设计用来解决传统RNN在处理长序列数据时存在的梯度消失和梯度爆炸问题。 它通过引入细胞状态和门控机制,使得模型能够捕捉和保存长期依赖信息,从而有效地处理序列数据中的长期依赖关系。
7/15/2025 10:41:44 AM
程序员小寒

使用 SHAP 使机器学习模型变的可解释

大家好,我是小寒今天给大家分享机器学习中的一个关键概念,SHAPSHAP 是一种用于解释机器学习模型输出的统一框架。 它基于博弈论中的 Shapley 值,用来量化每个特征对模型预测结果的贡献度。 帮助我们理解模型为什么做出这样的预测。
7/15/2025 10:29:17 AM
程序员小寒

硅谷大戏!Scale AI刚卖身就被集体拉黑,谷歌OpenAI无情断供

听说了吗? 不久前,Meta花费143亿美元收购了28岁少年Alexandr Wang创办的数据标注公司Scale AI近一半的股份。 别小看这个数据标注公司,这一笔交易让Meta在AI竞赛中直接提升了实力,瞬间成为焦点。
7/15/2025 9:47:22 AM

AI 为何能查天气、订机票?揭秘大模型背后的“神秘工具箱”

你有没有想过,为什么 AI 能回答“今天上海天气怎么样? ”这种实时问题,甚至帮你预订机票? 明明它的训练数据截止到去年,怎么会对现在的事情了如指掌?
7/15/2025 9:44:16 AM
红绿灯灯灯灯

RAG系列:复杂文档解析不理想?使用 TextIn xParse 轻松解析多样性 PDF 文档

在RAG系统的建设中,文档预处理是一个非常关键的环节,因为只有将文档中的图表、表格、公式以及手写批注等信息按阅读顺序还原出来,并最终解析为Markdown格式,这样才能够构建高质量的知识库和高效的信息检索系统,让LLM更好的读懂文档,最终给到用户更准确更全面的回答。 目前的文档解析工具算是百花齐放了,有很多优秀的开源工具(MinerU、Docling、Unstructured等等),在我之前的文章也有讲过。 今天给大家测评一款优秀的文档解析工具 - TextIn xParse[1] ,看下它的文档解析能力到底如何,希望通过我的测评能够给大家带来更多更好的选择。
7/15/2025 9:31:31 AM
燃哥讲AI

比Adam更有效,POET从谱不变原理出发,让LLM训练又稳又快

Zeju Qiu和Tim Z. Xiao是德国马普所博士生,Simon Buchholz和Maximilian Dax担任德国马普所博士后研究员,Bernhard Schölkopf是德国马普所所长,Weiyang Liu是香港中文大学计算机系助理教授。 随着大型语言模型(LLM)推动人工智能领域取得突破性进展,如何实现高效、稳定的超大规模模型训练,始终是该领域最富挑战性的核心议题之一。
7/15/2025 9:27:29 AM

谷歌发布首个嵌入模型:MTEB排行榜第一,超过OpenAI

今天凌晨1点,谷歌发布了首个Gemini嵌入模型刷新了MTEB榜单记录成为第一,并且价格很便宜每100万token只要0.15美元,已经开放API。 根据谷歌在多文本嵌入基准测试平台MTEB上的测试结果显示,Gemini嵌入模型平均分达到了68.37,大幅度超过了OpenAI文本嵌入模型的58.93分。 在双语挖掘、分类、聚类、指令检索、多标签分类、配对分类、重排、检索、语义文本相似性等测试中,全部都非常出色成为目前最强嵌入模型。
7/15/2025 9:07:00 AM

Windsurf打工人被谷歌做局24小时后获收购!华人AI编程明星出手,接收250名员工

AI编程赛道,局势突变。 距离谷歌以24亿美元挖走Windsurf创始团队仅仅72小时,AI编程智能体Devin开发商宣布,已经火速收购Windsurf剩余的全部资产和团队。 临时接任CEO的Windsurf前商务主管Jeff Wang感慨“过去72小时就像我职业生涯中最惊险刺激的过山车之旅。
7/15/2025 9:06:00 AM

ICCV 2025 | 清华&腾讯混元X发现「视觉头」机制:仅5%注意力头负责多模态视觉理解

本文的主要作者来自清华大学智能视觉实验室(i-Vision Group)、腾讯混元 X 组。 本文的共同第一作者为清华大学自动化系本科生王嘉辉和博士生刘祖炎,本文的通讯作者为清华大学自动化系鲁继文教授。 多模态大模型通常是在大型预训练语言模型(LLM)的基础上扩展而来。
7/15/2025 9:00:00 AM

谷歌T5Gemma重燃架构之战!「套壳」反杀Gemma本尊,9B推理快得离谱

2023年以来,大模型的战场由decoder-only架构一统江湖。 从GPT家族到LLaMA、Gemma、Mistral,再到Claude、Command-R、Yi系列,能叫得出名字的主流LLM,几乎都是清一色的「纯解码器」(decoder-only)。 但今天,Google带着T5Gemma杀回来了——不仅重启了encoder-decoder的技术路线,还略施小技就让它原地起飞,暴打原版Gemma 2。
7/15/2025 8:58:00 AM