AI在线 AI在线

理论

大型语言模型微调全攻略:从理论到实战的终极指南

译者|朱先忠审校|重楼微调是将预先在海量通用数据上训练好的大型语言模型,在更小、更具体的领域或任务数据集上进一步训练的过程。 其核心在于利用预训练模型获得的通用语言理解能力,通过特定数据进行针对性调整,使模型能深刻理解专业术语、领域规则和任务要求,从而生成更准确、更符合特定需求的输出。 引言想象你拥有一个像GPT-3或Llama 3这样强大的LLM,它已在互联网规模的文本上进行了预训练,能回答一般问题、创作文本、总结文章、翻译语言。
6/24/2025 8:52:54 AM
朱先忠

只训练数学,却在物理化学生物战胜o1!新强化学习算法带来显著性能提升,还缓解训练崩溃问题

只训练数学,却在物理化学生物战胜o1! 强化学习提升模型推理能力再添例证。 来自上海创智学院、上海AI Lab的MM-Eureka系列工作提出了新的强化学习算法CPGD(Clipped Policy Gradient Optimization with Policy Drift)——相比于传统GRPO、RLOO等算法显著缓解了训练不稳定(甚至崩溃)的问题,并带来显著性能提升。
6/24/2025 8:45:00 AM

CVPR 2025 Award Candidate | 英伟达等Difix3D+:用单步扩散模型修复 3D 重建伪影

在 3D 重建领域,无论是 NeRF 还是最新的 3D Gaussian Splatting(3DGS),在生成逼真新视角时仍面临一个核心难题:视角一旦偏离训练相机位置,图像就容易出现模糊、鬼影、几何错乱等伪影,严重影响实际应用。 为了解决这个问题,来自英伟达的研究团队联合提出了一种创新方案 —— Difix3D ,通过单步扩散模型对 3D 渲染结果进行 “图像修复”,显著提升新视角图像的质量和一致性。 该工作已被 CVPR 2025 接收,并入选 Best Paper Award 候选。
6/24/2025 8:40:00 AM

企业正在高薪招聘的11大热门AI岗位

各企业对工作场所中的AI持乐观态度,但AI的迅速普及也催生了对新人才的需求,以帮助设计、开发、实施和维护AI工具和服务。 AI的受欢迎程度不仅在科技行业迅速增长,而且在其他所有行业也同样如此,因为各企业正迅速采用这项技术以简化业务流程。 Foundry最近对高级IT专业人员进行的一项调查发现,预计到2025年底,AI支出将保持稳定,61%的企业表示他们计划增加支出,而只有1%的企业表示他们计划减少支出,总计有88%的企业表示,他们已经投资或计划投资于帮助内部构建AI能力的工具。
6/24/2025 7:00:00 AM
Sarah

模型合并 之 PMA 策略:大型语言模型预训练的 “加速引擎”

大家好,我是肆〇柒。 在 AI 领域,大型语言模型(LLM)在自然语言处理、智能问答系统和代码生成等众多任务中展现出卓越能力。 然而,这些模型的发展面临诸多挑战,包括预训练成本高昂、特定领域后训练效果有限、性能扩展预测不确定以及大规模训练不稳定等问题。
6/24/2025 3:00:00 AM
肆零柒

AI“黑科技”入侵医药行业,究竟藏着多少惊喜变革?

人工智能(AI)技术在医药行业的应用日益广泛且深入。 从特药药房的患者精细化管理到制药企业的数字化转型,AI技术正逐步改变着医药行业的运营模式和服务方式。 本文汇集了企业网D1net .
6/24/2025 1:30:00 AM
赵立京

超实用!SpringAI提示词的四种神级用法

提示词(Prompt)是输入给大模型(LLM)的文本指令,用于明确地告诉大模型你想要解决的问题或完成的任务,也是大语言模型理解用户需求并生成准确答案的基础。 因此 prompt 使用的好坏,直接决定了大模型生成结果的质量(是否符合预期)。 那问题来了,在 Spring AI/Spring AI Alibaba 如何用好提示词?
6/24/2025 12:00:00 AM
磊哥

奥特曼YC硬核访谈:走ChatGPT之路必死,世界差点没有OpenAI!

奥特曼YC创业学院访谈,终于放出了。 四十多分钟的访谈中,他回溯了打造OpenAI的艰难历程,首次透露了职业生涯至暗时刻,以及内部正在构建的GPT-5。 最令人印象深刻的是,他劝告所有人——不要开发类ChatGPT,这是OpenAI的护城河,要勇闯无人区。
6/23/2025 5:59:17 PM

对标Cursor!百度文心快码AI IDE上线,首创设计稿一键转代码、支持MCP

6月23日,百度AI开放日举行,百度智能代码助手文心快码迎来重大突破。 百度副总裁陈洋现场发布了文心快码独立AI原生开发环境工具——Comate AI IDE,是行业首个多模态、多智能体协同的AI IDE,首创设计稿一键转代码,开箱即用,为国内企业和开发者打造高效、智能、安全可靠的AI IDE。 目前,百度每天新增的代码中,文心快码生成的代码占比已超过43%。
6/23/2025 4:51:29 PM

AI时代的开源进化论:安全、成本与选择的破局之道

自ChatGPT横空出世引爆AI大模型热潮以来,科技界一场关于"开源"与"闭源"的辩论被推向新的高潮。 这场争论的源头可追溯至计算机文明的启蒙时代——1998年2月3日,自由软件运动活动家克里斯汀·彼得森(Christine Peterson)首次提出"Open Source"这一革命性术语,次日Linux创始人林纳斯·托瓦兹(Linus Torvalds)发布具有里程碑意义的GPL版权许可说明,正式为开源运动奠定法律基石。 在开源运动早期,埃里克·雷蒙德(Eric S.
6/23/2025 3:55:46 PM

真急了!AI落后、Siri彻底输给ChatGPT,拯救苹果全靠她?

苹果急了! 据彭博最新报道:苹果在今年接触过OpenAI前首席技术官Mira Murati,讨论了和Thinking Machines Lab交易的初步意向。 苹果与Thinking Machines Lab并没有进入到高级谈判阶段。
6/23/2025 3:19:11 PM

马斯克放大招:Robotaxi 真的来了!首批10辆开跑,千万网友围观,全网猜测:安全监控员干啥的?网友:不知道该怎么定义接管了

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)统一车费 4.20 美元、首发奥斯汀、仅10余辆车上线运行……马斯克的 Robotaxi 终于开跑了。 6月23日清晨,马斯克在 X 上官宣:特斯拉自动驾驶出租车服务正式在德州奥斯汀启动试点,每单统一收取 4.20 美元,用户可以通过 Tesla App 体验这一“未来交通”。 并在置顶的帖子上表示:向 @Tesla_AI 的软件和芯片设计团队表示超级祝贺,@Robotaxi 成功上线!
6/23/2025 12:27:01 PM
云昭

PyTorch 从 0 到 1:超详细的安装与入门实战指南

PyTorch 是一个由 Meta (Facebook) AI 研究实验室主导开发的开源机器学习库。 它以其灵活性、易用性和强大的GPU加速功能而闻名,已成为学术界和工业界进行深度学习研究和应用开发的首选框架之一。 PyTorch 的两大核心特性:张量 (Tensor) 计算:类似于 NumPy 的多维数组,但提供了强大的 GPU 加速能力,使得大规模数值计算变得极其高效。
6/23/2025 10:20:00 AM
用户007

大模型缓存系统 LMCache,知多少 ?

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的大模型缓存系统 - LMCache。 在当前 AI 生态系统中,大型语言模型(Large Language Model,LLM)推理已逐渐演变为核心基础设施。 无论是在驱动代码智能助手(Copilot)、搜索引擎、文档理解工具,还是支撑企业级对话系统等场景中,绝大多数现实世界的 AI 应用都需要依赖运行在 GPU 集群上的高吞吐量推理引擎来完成模型调用任务。
6/23/2025 10:08:22 AM
Luga Lee

掌控 AI 智能体自主性:五级框架下的人机协作之道

大家好,我是肆〇柒,在AI飞速发展的时代,AI 智能体自主性已成为一个备受瞩目的焦点。 一方面,它能够为我们带来前所未有的创新应用,极大提升工作效率和生活便利性;另一方面,若不当使用,也可能引发一系列难以预料的风险。 随着大型语言模型(LLM)等前沿 AI 技术的飞速进步,AI 智能体的自主性不再是停留在科幻小说中的情节,它已逐渐走进现实,引起了大家的广泛关注和深入探讨。
6/23/2025 10:05:40 AM
肆零柒

MemOS:打破 LLM “记忆”孤岛,实现 Agent 协同智能

大家好,我是肆〇柒。 在浏览论文时,我发现了一款用于构建 AI 应用的infra框架,它可以应用在 Agent 的 Memory 的管理构建上。 今天,我就为大家介绍一下这款框架 ——MemOS。
6/23/2025 9:26:24 AM
肆零柒

RAG系列:解析优化 - 使用 Doc2X 将 PDF 高效转换为 Markdown

引言在构建高质量的企业级的智能问答系统的过程中,如何高效精准地处理企业已有的海量文档是大部分开发者亟待解决的核心痛点。 有了高效精准的文档解析能力,才能够构建高质量的知识库和高效的信息检索系统,这样 LLM 才能给用户更准确更全面的回答。 在RAG系列(七):解析优化 - 不同文件类型统一转换成Markdown中我们介绍了一款开源的文档解析工具 - MinerU,今天再给大家介绍一款优秀强大的文档解析产品 - Doc2X[1]。
6/23/2025 9:21:53 AM
燃哥讲AI

OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式

AGI所需突破已经实现! OpenAI前研究主管Bob McGrew公开表示:AGI的「技术拼图」已经齐全,关键在于如何将推理能力落地,并重塑价值创造路径作为研究主管,他见证了OpenAI从GPT-3的突破到如今推理模型的演变。 他认为,实现通用人工智能 (AGI) 的三大支柱是:Transformer、规模化预训练和推理。
6/23/2025 9:16:00 AM