资讯列表
315 行代码构建编程助手,Go大佬揭开智能体的「神秘面纱」
知名 Go 大佬 Thorsten Ball 最近用 315 行代码构建了一个编程智能体,并表示「它运行得非常好」且「没有护城河」(指它并非难以复制)。 Thorsten Ball 在编程领域以其对系统编程和编程语言的深入研究而闻名,尤其擅长解释器、编译器和虚拟机等主题。 他撰写的《用 Go 语言自制编译器》和《用 Go 语言自制解释器》则被视为编译原理领域的「入门平替」。
5/6/2025 9:15:00 AM
机器之心
成熟的编程智能体,已经学会升级自己的系统了
编程智能体,几乎成为了 2025 年最热门的话题之一。 不管是学术机构还是工业界,都在寻找更高效的落地路径。 机器学习领域的历史经验表明,手工设计的解决方案最终会被学习到的解决方案所取代。
5/6/2025 9:10:00 AM
机器之心
谷歌DeepMind:大模型也很任性,知道最优路径偏要撞南墙
大语言模型(LLMs)的成功激发了人们对各种智能体的兴趣。 将 LLM 用于智能体的一个关键假设是,LLMs 利用常识和思维链(Chain-of-Thought, CoT)进行推理,从而智能体可以有效地探索并高效地解决复杂领域的问题。 然而,LLM 智能体存在次优探索和知 - 行差距(knowing-doing gap)的问题,即无法有效地将模型中的知识转化为行动。
5/6/2025 9:08:00 AM
机器之心
DeepSeek开源的文件系统,是如何提升大模型效率的?
在 AI 领域里,大模型通常具有百亿甚至数千亿参数,训练和推理过程对计算资源、存储系统和数据访问效率提出了极高要求。 2 月 28 日,DeepSeek 开源了一种高性能分布式文件系统 3FS,官方表示其目的是解决人工智能训练和推理工作负载的挑战。 作为一种并行文件系统,3FS 可以在 180 节点集群中实现 6.6 TiB/s 的聚合读取吞吐量,对于提高 DeepSeek V3、R1 大模型的训练数据预处理、数据集加载、检查点保存/重新加载、嵌入向量搜索和 KVCache 查找等工作的效率有重要帮助。
5/6/2025 9:03:00 AM
机器之心
苹果携手 Anthropic,于开发更新版编程平台Xcode
据彭博社报道,苹果公司正与人工智能公司 Anthropic 合作,致力于开发新版本的 Xcode,这一版本将整合 AI 功能以提升代码编写、编辑和测试的效率。 Anthropic 以其 “Claude” 大语言模型而闻名,Claude 在编程任务上表现出色,与 OpenAI 的 ChatGPT 展开竞争。 为了加速产品开发,越来越多的公司开始采用 AI 编程工具,苹果自然也不甘落后。
5/6/2025 9:00:41 AM
AI在线
如何选择Embedding Model?关于嵌入模型的十个思考
在大模型应用中,尤其基于RAG框架的大模型应用,嵌入模型(embedding Model)是不可或缺的关键组件。 这里总结了笔者在实践中关于潜入模型的10个思考,希望对大家有所帮助。 嵌入模型在RAG中的重要性嵌入模型能够将文本转换成数值形式的向量,这让计算机可以更高效地处理、对比和检索信息。
5/6/2025 8:51:37 AM
曹洪伟
细节直逼亚毫米级!港科广分层建模突破3D人体生成|CVPR 2025
从人体单图变身高保真3D模型,不知道伤害了多少程序猿头发的行业难题,竟然被港科广团队一招破解了! 团队最新提出的MultiGO创新方案,借助分层建模思路——将人体分解为不同精度层级,从基础体型到衣物褶皱逐级细化。 这有点像在搭乐高积木:先大模块构建整体轮廓,再用小零件补充细节,最后再处理材质纹理。
5/6/2025 8:50:00 AM
首个移动端 AI 组件库正式发布!并宣布开源啦!
前言大家好,我是林三心,用最通俗易懂的话讲最难的知识点是我的座右铭,基础是进阶的前提是我的初心~ChatUI 3.0 的发布引入了许多新的特性和组件,旨在提升智能对话机器人的设计和开发效率。 以下是一些关键点和功能亮点:图片核心优化图片自然: 致力于提升对话的自然流畅性,让用户的互动体验更加亲切高效: 通过新组件的引入,增强了开发效率,减少了开发时间沉浸: 提升了视觉与互动体验,使用户能更沉浸于对话中图片新增组件图片Typing 组件: 用于展示服务端处理中的状态,缓解用户等待时的焦虑感,提升用户体验。 TypingBubble 组件: 将气泡内容呈现为打字效果,模拟人类输入的过程,增加互动感。
5/6/2025 8:46:33 AM
林三心不学挖掘机
用多模态LLM超越YOLOv3!强化学习突破多模态感知极限|开源
超越YOLOv3、Faster-RCNN,首个在COCO2017 val set上突破30AP的纯多模态开源LLM来啦! 华中科技大学、北京邮电大学等多所高校研究团队共同推出的Perception-R1(PR1),在视觉推理中最基础的感知层面,探究rule-based RL能给模型感知pattern带来的增益。 PR1重点关注当下主流的纯视觉(计数,通用目标检测)以及视觉语言(grounding,OCR)任务,实验结果展现出在模型感知策略上的巨大潜力。
5/6/2025 8:40:00 AM
量子位
一文读懂到底什么是“模型蒸馏(Model Distillation)”技术?
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的模型优化技术——模型蒸馏(Model Distillation)。 随着人工智能技术的高速发展,模型规模的不断扩大(如 GPT-4 的万亿参数)带来了性能的显著提升,但也伴随着高昂的计算成本和部署挑战,尤其在资源受限的边缘设备和实时系统中。 如何在保持模型性能的同时降低资源消耗,成为 AI 领域亟待解决的关键问题。
5/6/2025 8:35:00 AM
Luga Lee
Anthropic 推出 AI for Science 计划:为生命科学等领域研究者提供免费 API 积分
Anthropic 认为其 AI 技术能减少科学发现所需的时间和资源,帮助解决人类面临的一些最紧迫的挑战
5/6/2025 8:26:51 AM
溯波(实习)
使用Llama 4和AutoGen构建一个AI智能体
译者 | 布加迪审校 | 重楼Meta的Llama 4 系列模型目前正主导不断发展的AI世界。 这些模型凭借原生的多模态功能,正在彻底改变我们构建智能系统的方式。 当Llama 4与AutoGen结合使用时,它将充分发掘构建动态、响应迅速且强大的AI智能体的潜力。
5/6/2025 8:23:56 AM
布加迪
尤雨溪:让 AI 更好的理解 Vue、Vite
尤雨溪今天宣布 Vue、Vite 和 Rolldown 项目都加上了 llms.txt 文件。 这是为了让大型语言模型 (LLM) 更方便地理解这些前端技术。 那这个 llms.txt 到底是什么?
5/6/2025 3:30:00 AM
前端充电宝
AI 正在改变前端开发:前端使用 AI 现状!
“State of JS”、“State of CSS”、“State of React”等开发者调查组织,近期推出了全新的 State of AI 调查,旨在全面了解 Web 开发领域对 AI 工具和技术的采用现状与痛点。 本文将围绕调查中的五大主题,简要呈现核心发现。 AI 大模型ChatGPT 以绝对优势领跑,使用率达 86%;紧随其后的是 Anthropic 的 Claude。
5/6/2025 2:40:00 AM
前端充电宝
68页论文再锤大模型竞技场!Llama4发布前私下测试27个版本,只取最佳成绩
大模型竞技场的可信度,再次被锤。 最近一篇名为《排行榜幻觉》(The Leaderboard Illusion)的论文在学术圈引发关注。 图片它指出,如今被视为LLM领域首选排行榜的Chatbot Arena,存在诸多系统问题。
5/6/2025 1:45:00 AM
安利五款超赞的开源 AI 前端组件库
前言在当今快速发展的前端技术领域中,开源项目一直扮演着举足轻重的角色。 它们不仅为开发者提供了丰富的工具和资源,还极大地促进了技术的创新和共享。 特别是在人工智能(AI)逐渐融入前端开发的今天,开源的AI前端组件库更是成为了提升开发效率、优化用户体验的重要利器。
5/6/2025 12:45:00 AM
大姚
DeepSeek还没登场,Qwen3 已经抢先引爆AI开源圈
AI 社区原本期盼 DeepSeek 发布重磅新品,却意外迎来了另一款令人瞩目的中国开源模型:Qwen3 正式登场。 此次发布的旗舰型号为 Qwen3-235B-A22B。 其中,235B 代表总参数量;而 A22B 指的是该模型采用了“专家混合”(Mixture of Experts,简称 MoE)架构,实际在每次查询中激活的参数量仅约为 220亿(22B)。
5/6/2025 12:35:33 AM
前端小智