理论
RAG终极框架!港大开源RAG-Anything:统一多模态知识图谱
RAG-Anything的核心技术创新在于构建了统一的多模态知识图谱架构,能够同时处理并关联文档中的文字内容、图表信息、表格数据、数学公式等多种类型的异构内容,解决了传统RAG系统仅支持文本处理的技术限制,为多模态文档的智能理解提供了新的技术方案。 项目地址:: (RAG)系统,专注解决复杂场景下的智能问答与信息检索难题。 该系统提供完整的端到端多模态文档处理解决方案,能够统一处理文本、图像、表格、数学公式等多种异构内容,实现从文档解析、知识图谱构建到智能问答的全流程自动化,为下一代AI应用提供了可靠的技术基础。
6/30/2025 1:57:59 PM
百度文心大模型4.5系列正式开源,同步开放API服务
百度文心大模型开源,如期而至。 就在今天,百度官宣文心大模型4.5系列正式开源,还同步提供API服务。 此番,百度一次性推出10款开源模型,涵盖从47B参数的混合专家(MoE)模型到轻量级0.3B稠密型模型,覆盖文本、多模态等多种任务需求。
6/30/2025 1:54:34 PM
甭提静态AI了,MIT新框架让模型具备自学能力
作者 | Ben Dickson编译 | 沈建苗出品 | 51CTO技术栈(微信号:blog51cto)近日,麻省理工学院(MIT)的研究人员已开发出一种名为自适应语言模型(SEAL)的框架,使大语言模型(LLM)能够通过更新自身的内部参数来持续学习和适应。 SEAL可以教LLM生成自己的训练数据并更新指令,让LLM能够永久吸收新知识并学习新任务。 这种框架特别适用于企业应用环境,尤其适用于在动态环境中运行的AI智能体,它们必须不断处理新信息并调整其行为。
6/30/2025 1:10:37 PM
OpenAI 停工一周,紧急调薪!Meta灭霸式天价挖8名OpenAI大佬!紧急回应:我们被偷家了!与Meta冲突是支线任务!
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)又是震惊 AI 圈的一天。 进入 6 月,Meta 与 OpenAI 的主旋律变成了一场关于“研究人才”的攻防红蓝对决。 而让人没想到的是 Meta 的高调挖角 OpenAI,疯狂的阵势强度已经到堪比“黑五抢购天才大脑”一般。
6/30/2025 1:03:13 PM
云昭
首届魔搭开发者大会举办,已服务全球超1600万开发者
6月30日,首届魔搭开发者大会在北京举办。 自2022年11月初成立以来,历经两年多高速发展,社区已汇聚超500家贡献机构,托管的开源模型数量已超7万个,增长超200倍,用户数量从2023年4月的100万扩展至如今1600万,增长约16倍。 魔搭社区已形成全链路服务,支持开发者体验、下载、调优、训练、推理、部署模型,覆盖LLM、对话、语音、文生图、图生视频、AI作曲等多个领域,并提供4000 MCP服务和调试工具。
6/30/2025 11:53:53 AM
奥特曼慌了!OpenAI连夜加薪全员放假,小扎疯狂挖人高管震怒
小扎抢人大战,彻底把OpenAI整慌了。 OpenAI首席研究官Mark Chen直言,「现在,我感觉就像有人闯进我们的家,偷走了我们的东西一样」。 这份来自Wired的独家爆料,挖出了OpenAI七大高管向全员发布了一份强硬的备忘录。
6/30/2025 9:42:01 AM
新智元
当Gemini CLI遇见n8n:免费撸Google顶级模型的玩法
最近两天,GitHub 上最炙手可热的开源项目非 Gemini CLI[1] 莫属! 免费白嫖 Google 顶级大模型? 这简直是开发者的福音。
6/30/2025 9:37:39 AM
林月半子聊AI
马斯克生日惊喜!全球首例Model Y无人「自驾交付」,30分钟见证历史
就在昨天,一个足以载入史册的时刻悄然到来。 一辆特斯拉Model Y从得州超级工厂缓缓驶出,没有驾驶员,没有安全员,也没有远程操控员。 它独自穿越城市街道,上下高速公路,以最高约115公里/小时(72英里/小时)的速度,在30分钟内平稳地把自己交付给主人。
6/30/2025 9:12:00 AM
不会被AI替代?100年前的农民也这么想的,这些图表让你害怕!
「我的岗位太复杂不会被AI替代的」。 如果你还在抱着这种看法来看待如今的AI时代,那你99%要完蛋了。 SAFE.没有任何工作是安全的。
6/30/2025 9:07:00 AM
苹果一口咬死AI不会思考!OpenAI前高管直接开怼:AGI已来,别再酸了
最近,苹果发布了一篇论文,引发了关于AI是否真正在推理的激烈讨论。 它提出了一个尖锐问题:当前的推理模型,是否已经触及能力的天花板? 与此同时,OpenAI前研究主管Bob McGrew则持完全不同的态度。
6/30/2025 9:05:00 AM
媲美DeepSeek!腾讯开源新版混元模型:AI Agent强化,超30种智能体指令
腾讯开源了混元大模型的最新版本Hunyuan-A13B。 Hunyuan-A13B是一个专家混合模型,拥有800亿参数,其中130亿参数处于激活状态。 支持快、慢两种思考模式:快速思维模式,提供简洁高效的输出,适用于高效、简单的日常任务;慢速思维模式,支持更深层次的推理步骤包含反思和回溯,生成更长的思维链,提升复杂任务的准确性。
6/30/2025 9:04:00 AM
刚刚,马斯克切脑全场震撼!插脑只要1.5秒,26年治愈失明,28年全人类变AI
就在刚刚,马斯克又整大活了! 他带着脑机接口Neuralink团队,开了1小时发布会,整个过程亮点满满,全程高能。 首先,Neuralink宣布,目前全球已经有七人植入了设备。
6/30/2025 9:03:00 AM
史上最惨AI店长!被顾客耍到破产,「人格觉醒」却忘了自己是代码
AI当店长,靠谱吗? 想象一下:给一个AI完全控制一家小店的权力,不只是收银——而是一整个运营和管理。 定价、库存、客服、供应商谈判、包括和顾客讨价还价,所有这些工作都由它亲自完成。
6/30/2025 9:01:00 AM
小扎挖走四名顶尖华人震惊Sam Altman,OpenAI最新内部全员信:奉陪到底,薪资大调整
昨天爆出小扎挖走OpenAI四名华人顶尖研发领导,果然是挖到了OpenAI的大动脉,震惊了整个OpenAI,现在Sam Altman 已经焦头烂额了,正在全力应对。 OpenAI的首席研究官Mark Chen刚刚向全体员工发送了一封措辞强硬的全员信,承诺将在顶级研究人才的争夺战中与小扎正面交锋。 Mark Chen在信中写道:“我现在有一种发自肺腑的感觉,就好像有人闯进了我们的家,偷走了我们的东西。
6/30/2025 8:55:13 AM
AI一眼认出95万物种,还能分辨雄雌老幼,2亿生物图像炼成“生命视觉”大模型
让AI看懂95万物种,并自己悟出生态关系与个体差异!俄亥俄州立大学研究团队在2亿生物图像数据上训练了BioCLIP 2模型。 大规模的训练让BioCLIP 2取得了目前最优的物种识别性能。 而更令人惊喜的是,即使在训练过程中没有相应监督信号,BioCLIP 2还在栖息地识别、植物疾病识别等5个非物种任务中给出了远超DINOv2的准确率。
6/30/2025 8:52:00 AM
航空发动机用上大模型:解决复杂时序问题,性能超越ChatGPT-4o实现SOTA|上交创智复旦
时序数据分析在工业监控、医疗诊断等领域至关重要。 比如航空发动机监控这个复杂工业场景中,工程师需分析海量多通道传感器数据,以判断设备状态并制定维护决策。 然而,现有研究多聚焦于分类、预测等单一任务,与实际工业场景中专家通过自然语言进行复杂交互和决策的需求存在显著差异。
6/30/2025 8:51:00 AM
打破长视频理解瓶颈:HoPE混合位置编码提升VLM长度泛化能力
李浩然,CMU 机器学习系研究生,研究方向是基础模型的长上下文建模、对齐、以及检索增强生成。 如今的视觉语言模型 (VLM, Vision Language Models) 已经在视觉问答、图像描述等多模态任务上取得了卓越的表现。 然而,它们在长视频理解和检索等长上下文任务中仍表现不佳。
6/30/2025 8:50:00 AM
华为CloudMatrix重磅论文披露AI数据中心新范式,推理效率超NV H100
今年,AI大厂采购GPU的投入又双叒疯狂加码——马斯克xAI打算把自家的10万卡超算扩增10倍,Meta也计划投资100亿建设一个130万卡规模的数据中心……GPU的数量,已经成为了互联网企业AI实力的直接代表。 的确,建设AI算力,这种堆卡模式是最简单粗暴的,但实际上,AI集群却并非是卡越多就越好用。 GPU虽然计算性能好,但是在集群化的模式下依然有很多挑战,即便强如英伟达,也面临通信瓶颈、内存碎片化、资源利用率波动等问题。
6/30/2025 8:49:00 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
Copilot
视觉