资讯列表
英伟达让机器人「做梦学习」,靠梦境实现真·从0泛化
「仿生人会梦见电子羊吗? 」这是科幻界一个闻名遐迩的问题。 现在英伟达给出答案:Yes!
Mistral 重返开源阵营:发布超高效代码 AI 模型 Devstral 笔记本电脑也能跑
法国人工智能模型制造商 Mistral 在因其最新闭源模型 Medium3受到部分开源社区批评后,迅速回归开源路线。 该公司近日与开源初创公司 All Hands AI(OpenDevin 的创建者)合作,推出了全新的开源语言模型 Devstral。 这款拥有2400万参数的轻量级模型,专为代理 AI 软件开发而设计,其性能甚至在特定基准测试中超越了许多参数高达数十亿的竞争对手,包括一些闭源模型。
人工智能寒冬已至?明星初创公司 Builder.ai 破产敲响警钟
曾被誉为“像订披萨一样简单”开发应用程序的英国人工智能初创公司 Builder.ai 近日宣告破产,引发行业震动。 这家曾获得微软、软银等巨头超过4.5亿美元投资、估值一度超过10亿美元的明星企业,最终因资金链断裂而倒下,令人唏嘘。 据报道,一家投资公司从 Builder.ai 账户中扣押了3700万美元,导致其仅剩500万美元运营资金,触发优先贷款机构的违约决定。
微软 Win11 五月更新惊人增大,AI 文件占据大部分空间
近日,微软于5月13日发布了针对 Windows1124H2和 Windows Server2025(24H2)的累积安全更新 KB5058411。 令人惊讶的是,此次更新包的体积高达4368.9MB,远远超过了上个月的更新包 KB5059087的800MB。 根据科技媒体 borncity 的报道,有用户使用7-zip 工具解压了该更新包,结果显示其中常规安全更新的文件仅占约850MB,而其余约3GB 的文件则与微软的人工智能(AI)应用相关。
OpenAI 得州数据中心扩建计划获 116 亿美元投资
有媒体报道称,初创公司 Crusoe 为 OpenAI 在得克萨斯州建设的数据中心成功获得116亿美元的融资。 这一资金将用于将目前的两栋建筑扩展至八栋,以满足日益增长的计算需求。 图源备注:图片由AI生成,图片授权服务商Midjourney据悉,这座数据中心预计将成为 OpenAI 的最大算力基地,每栋建筑将配备多达五万块英伟达 Blackwell 芯片。
OpenAI以65亿美元收购Jony Ive创立的初创公司io,迈向AI硬件新纪元
近日,彭博社报道,OpenAI 宣布以接近65亿美元的全股票交易收购了由前苹果首席设计师 Jony Ive 联合创立的 AI 设备初创公司 io。 这项交易不仅是 OpenAI 历史上最大的一笔收购,也标志着其在 AI 硬件领域的一次重大布局。 io 公司是 Jony Ive 与几位苹果老同事共同创立的,旨在推动创新的消费电子产品。
昆仑万维面向全球发布天工超级智能体Skywork Super Agents
5月22日,昆仑万维集团面向全球市场正式发布了天工超级智能体(Skywork Super Agents)。 这款产品采用AI agent架构和deep research技术,能够一站式生成文档、PPT、表格、网页、播客和音视频等多种内容,标志着“AI版Office”时代的到来。 天工超级智能体的发布,代表了中国在AI技术领域的重大突破。
OpenAI放大招!核心API支持MCP,一夜改变智能体开发
今天凌晨,OpenAI全资收购io的消息占据了大部分头条。 同时OpenAI也“悄悄地”放出了另外一个重磅消息,用于开发智能体的核心API——Responses API支持MCP服务。 传统方法,我们在开发智能体需要通过函数调用与外部服务交互,每次操作都涉及从大模型到后端再到外部服务的网络传输,导致多次跳转、延迟会很高,并增加扩展和管理的复杂性。
如何基于自定义MCP服务器构建支持工具调用的Llama智能体(含code)
一、背景与目标:从知识隔离到本地化智能体在人工智能应用日益普及的今天,隐私保护与数据主权成为重要挑战。 传统的AI模型依赖外部服务,导致私有知识面临泄露风险。 本文将详细介绍如何构建一个完全本地化的AI智能体,通过自定义的Model Context Protocol(MCP)服务器实现知识隔离,并结合Llama 3.2轻量级模型实现工具调用能力。
MIT 新研究指出 AI 不懂“no”,逻辑推理缺陷导致否定词成“盲区”
研究表明,AI 已快速发展,具备诊断疾病、创作诗歌甚至驾驶汽车等多项实用技能,但对“no”和“not”等否定词,却束手无策。
Dia-1.6B TTS:优秀的文本到对话生成模型
译者 | 李睿审校 | 重楼Dia-1.6B TTS是由Nari Labs开发的一款拥有16亿个参数的文本转语音模型(TTS)。 本文将详细介绍该模型,以及其访问途径、使用方法,并展示实际应用结果以真正了解该模型的功能。 你是否正在寻求一种合适的文本转语音模型?
当心:AI 真的在抢你的工作!
译者 | 陈峻审校 | 重楼你也许是被本文的标题吸引进来,而且感觉不寒而栗。 这实际上是全球性的自由职业在线平台 Fiverr 的 CEO 在给其全体员工的一封电子邮件中,所描述的一个严酷事实。 而且这并非个案。
100行代码速通Agent开发
大家好,我卡颂自从23年初GPT爆火后,每年都会涌现一些爆火的AI概念。 今年最火的概念无疑是Agent。 伴随而来的,是各家都在争夺「Agent的解释权」:openAI发布a-practical-guide-to-building-agents[1]Antropic发布building-effective-agents[2]langchain作者发文how-to-think-about-agent-frameworks[3]反驳openAI的观点(目的是推销自家的langGraph)这些繁杂的信息无疑加深了开发者对Agent的理解成本。
摩尔线程算力专区正式上线 AutoDL 平台,首次将国产 GPU 算力开放至 AI 开发一线
摩尔线程昨日晚宣布:近日,摩尔线程与国内 AI 算力平台 AutoDL 宣布达成深度合作,双方联合推出面向个人开发者的“摩尔线程专区”,首次将国产 GPU 算力开放至 AI 开发一线。
如何防止智能体成为数据安全威胁
每家公司都存在信息缺口和瓶颈,归根结底,这正是AI为企业带来的真正价值:扩大信息获取渠道,帮助人们连接更多信息点。 但是,当你部署一个像智能体这样的系统,该系统连接着企业的每一个数据源,旨在回答问题、主动从数百个应用程序或部门中挖掘洞察,并采取行动(无论是否有人类提出要求),会发生什么呢?你会得到一个可能极大提升生产力的智能体,但同时也可能成为一个重大的安全风险。 好了,别急着渲染末日氛围——这个问题并非完全新鲜,毕竟,近六成的安全漏洞都是由人为造成的。
RAG系列:基于 DeepSeek + Chroma + LangChain 开发一个简单 RAG 系统
创建 Next 项目首先,使用 npx create-next-app@latest 根据提示完成 Next 项目的创建:复制创建好项目之后,在 src/app 目录下新建 rag 目录,本次 demo 的代码都将放在这里。 知识库构建接下来,我们将构建知识库,主要目标是将准备好的 pdf 通过向量化存到向量数据库中,以便后续的检索。 由于本次 RAG 系统的开发都要依赖 LangChain 框架,所以我们先在项目中安装 LangChain 框架和核心依赖:复制文档加载LangChain 的 DocumentLoaders[1] 提供了种类丰富的文档加载器,可加载文件系统的文件也可以加载线上文件,包括 csv、docx、pdf、pptx、html、github、youtube等等。
Qwen3:开源 LLM 的革新者与多语言先锋(万字)
“ Qwen3 模型以其卓越的性能、效率和多语言能力,为开源大语言模型领域树立了新的标杆,引领着技术发展的新潮流。 ”大家好,我是肆〇柒。 在 4 月底的时候 Qwen3 开源放出了权重,在热火朝天开炉炼丹后的不久,上周三千问团队又放出了 Qwen3 的技术报告,最近有点小忙,所以虽然第一时间阅读了技术报告,但是一直没有发文出来。
并行扩展(Parallel Scaling):一种新型语言模型扩展范式(万字)
“ PARSCALE 作为一种新型的语言模型扩展范式,通过增加并行计算次数 P,在保持参数规模几乎不变的情况下,能够显著提升模型的推理能力。 ”大家好,我是肆〇柒。 今天,我们来聊一项可以改变语言模型性能的技术——PARSCALE(Parallel Scaling)。