资讯列表
深入了解如何通过 LM Studio 优化本地 LLM 性能
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 如何通过 LM Studio 优化本地 LLM 性能。 在人工智能浪潮席卷全球的 2025年,本地大语言模型(LLM)的性能优化已成为开发者和企业关注的焦点。 随着计算资源需求激增,如何在本地环境中提升模型的效率、降低延迟并释放其最大潜力,成为了亟待解决的关键挑战。
5/20/2025 9:24:15 AM
Luga Lee
字节提出从单一主题发展到多主题定制的通用框架UNO,通过情境生成释放更多可控性
字节跳动的智能创作团队提出了一个从单一主题发展到多主题定制的通用框架UNO,从少到多的泛化:通过情境生成释放更多可控性。 能够将不同的任务统一在一个模型下。 在单主题和多主题驱动的生成中都能实现高度一致性,同时确保可控性。
5/20/2025 9:13:45 AM
AIGC Studio
谢赛宁团队提出BLIP3-o:融合自回归与扩散模型的统一多模态架构,开创CLIP特征驱动的图像理解与生成新范式!
BLIP3-o 是一个统一的多模态模型,它将自回归模型的推理和指令遵循优势与扩散模型的生成能力相结合。 与之前扩散 VAE 特征或原始像素的研究不同,BLIP3-o 扩散了语义丰富的CLIP 图像特征,从而为图像理解和生成构建了强大而高效的架构。 此外还发布了包含 2000 万张带详细标题的图片(BLIP3o Pretrain Long Caption)和 400 万张带短标题的图片(BLIP3o Pretrain Short Caption)的数据集。
5/20/2025 9:08:59 AM
震撼全网,AlphaEvolve矩阵乘法突破被证明为真!开发者用代码证实
就在刚刚,有人用Claude写代码证实——谷歌DeepMind的AlphaEvolve求解矩阵乘法的突破,100%正确! 即使已经过去好几天,AI圈依然有许多人沉浸在这个AI的余震中。 在时隔半个世纪(56年)后,AlphaEvolve将4×4的复数矩阵计算次数,从1969年Strassen的49次减少到了48次。
5/20/2025 9:07:00 AM
英伟达新“桌面超算”800GB大内存,满血DeepSeek R1能装1个半
英伟达官宣新办公室落户中国台湾省台北市,但居然是从太空飞下来的吗? 当然,这只是黄仁勋在Computex大会上展示的CG特效,但背后还有这样一层意思:如此逼真的画面中,只有1/10的像素是显卡渲染的,剩下全部内容为AI预测。 当初是GeForce显卡让AI成为现实,现在AI反过来给GeForce显卡带来颠覆性变革。
5/20/2025 9:02:00 AM
火山引擎发布大模型生态广场 MCP Servers
火山引擎正式发布了其大模型生态广场——MCP Servers,这一创新平台的推出标志着AI开发进入了一个全新的模块化组装时代。 通过“MCP Market(工具广场) 火山方舟(大模型服务) Trae(应用开发环境)”的深度协同,MCP Servers实现了从工具调用、模型推理到应用部署的全链路开发闭环,极大地简化了开发流程,让开发者能够以更高效的方式构建AI应用。 MCP Servers被形象地称为“大模型工具超市”,它集成了众多高质量的MCP协议适配工具,覆盖了搜索、数据库、业务系统API等高频应用场景。
5/20/2025 9:00:56 AM
AI在线
字节跳动豆包AI耳机Ola Friend升级 可直接唤醒英语学习智能体
5月19日,字节跳动豆包旗下的AI智能体耳机Ola Friend迎来重要升级。 此次升级后,用户使用该耳机时,可直接通过语音唤起独立英文学习智能体Owen进行实时对话,为英语学习带来全新体验。 在此次升级之前,Ola Friend仅支持语音唤起主动智能体“豆包”。
5/20/2025 9:00:56 AM
AI在线
英伟达等巨头联手打造欧洲最大AI园区,计划 2028 年投入运营
近日,阿布扎比的 AI 投资基金 MGX、法国国家投资银行、AI 初创公司 Mistral AI 与科技巨头英伟达宣布了一项重磅合作计划,目标是在巴黎地区建立欧洲最大的人工智能园区。 该项目的初步规划显示,园区的最终装机容量预计将达到1.4吉瓦,规模之大让人期待。 这个新 AI 园区的建设预计将于2024年下半年正式启动,并计划于2028年投入运营。
5/20/2025 9:00:55 AM
AI在线
苹果高管称其自研AI聊天机器人不输OpenAI的ChatGPT
在人工智能领域的竞争日益激烈的背景下,苹果公司正在内部测试其自主开发的 AI 聊天机器人,并取得了显著的技术突破。 根据彭博社记者马克・古尔曼的最新报道,苹果在新任 AI 负责人约翰・贾南德里亚(John Giannandrea)的领导下,过去六个月里对这款聊天机器人进行了深入的研发。 知情人士透露,苹果的高管们对目前的聊天机器人版本表示乐观,认为其性能已经不逊于 OpenAI 的 ChatGPT。
5/20/2025 9:00:55 AM
AI在线
微软推出 AI 平台,200小时发现新化合物,科学研究迎来突破
在最新发布的 Build 开发者大会上,微软宣布推出名为 “Microsoft Discovery” 的企业级平台,利用人工智能技术大幅度加速科学研究和开发进程。 这一平台有潜力将传统上需要多年的实验室工作压缩为数周甚至数天完成,改变医药、材料科学和半导体行业的研发模式。 图源备注:图片由AI生成,图片授权服务商Midjourney“Microsoft Discovery” 依赖于专业化的 AI 代理和高性能计算,帮助科学家和工程师解决复杂的研究难题,且用户无需具备编程能力。
5/20/2025 9:00:55 AM
AI在线
GitHub 推出全新 AI 编程智能体,助力开发者自动修复代码漏洞
在最新举行的微软 Build 大会上,GitHub 正式发布了一款名为 AI 编程智能体的全新工具。 这款工具被集成在 GitHub Co pilot 中,旨在为开发者提供更高效的编程支持,能够自动执行诸如修复代码漏洞、添加新功能和优化文档等任务。 据悉,这款 AI 编程智能体通过自动启动虚拟机,克隆相关代码仓库并对其进行全面分析来完成工作。
5/20/2025 9:00:55 AM
AI在线
微软放大招!VS Code转型开源AI编辑器,狙击Cursor与Windsurf
微软在Build2025大会上宣布了一项震撼举措:旗下广受欢迎的代码编辑器Visual Studio Code(VS Code)将转型为全球首款开源AI编辑器,并将GitHub Copilot Chat扩展完全开源,遵循MIT许可证。 这一战略不仅深化了微软对开源社区的承诺,还通过整合AI功能重塑开发者工具生态,对Cursor、Windsurf等竞品形成强力挑战。 AIbase综合最新动态,深入解析这一里程碑式发布的技术亮点与行业影响。
5/20/2025 9:00:55 AM
AI在线
苹果高管认为内部 AI 聊天机器人已接近 ChatGPT
近日,彭博社的知名记者马克・古尔曼(Mark Gurman)报道,苹果公司正在积极测试其自主开发的 AI 聊天机器人产品。 这一消息引发了外界的广泛关注,尤其是在新任 AI 负责人约翰・贾南德里亚(John Giannandrea)的带领下,苹果的自研 AI 项目在过去六个月内取得了显著的技术突破。 知情人士透露,苹果高管们对该聊天机器人当前的技术水平感到满意,并认为其已达到与 OpenAI 的 ChatGPT 最新版本相当的水平。
5/20/2025 9:00:55 AM
AI在线
一文揭秘专为 RAG 打造的高性能开源图向量数据库:HelixDB
在人工智能技术尤其是大语言模型(LLM)蓬勃发展的浪潮中,检索增强生成(Retrieval-Augmented Generation,简称 RAG)正迅速成为提升生成式 AI 系统内容准确性、实时性与上下文相关性的核心手段。 RAG 通过将外部知识检索与语言模型推理相结合,显著缓解了模型“幻觉”问题,使其在问答系统、智能助手、企业知识中台等应用中展现出广阔前景。 然而,随着业务需求的不断升级,传统 RAG 系统所依赖的扁平向量表示与单一类型数据库架构,已难以满足对复杂语义结构建模与海量非结构化数据高效检索的双重需求。
5/20/2025 8:50:00 AM
Luga Lee
透明、可控:微软发布 Magentic-UI 人机协作新工具,你的 AI 网络任务智能伙伴
微软研究院昨日(5 月 19 日)发布博文,介绍了 Magentic-UI 开源研究原型。这是一款以人为中心的 AI 智能体,旨在通过网页浏览器,实时协助用户完成复杂的网络任务。
5/20/2025 8:45:03 AM
故渊
深度解析大模型技术演进脉络:RAG、Agent与多模态的实战经验与未来图景
作者 | jaymie大模型作为产业变革的核心引擎。 通过RAG、Agent与多模态技术正在重塑AI与现实的交互边界。 三者协同演进,不仅攻克了数据时效性、专业适配等核心挑战,更推动行业从效率革新迈向业务重构。
5/20/2025 8:30:00 AM
腾讯技术工程
Transformer 模型结构详解及代码实现!
一、Transformer简要发展史以下是Transformer模型发展历史中的关键节点:Transformer架构于2017年6月推出。 原本研究的重点是翻译任务。 随后推出了几个有影响力的模型,包括:时间模型简要说明2017 年 6 月「Transformer」Google 首次提出基于 Attention 的模型,用于机器翻译任务2018 年 6 月「GPT」第一个使用 Transformer 解码器模块进行预训练的语言模型,适用于多种 NLP 任务2018 年 10 月「BERT」使用 Transformer 编码器模块,通过掩码语言建模生成更强大的句子表示2019 年 2 月「GPT-2」更大更强的 GPT 版本,由于潜在风险未立即发布,具备出色的文本生成能力2019 年 10 月「DistilBERT」BERT 的轻量化版本,在保留 97% 性能的同时,速度更快、内存占用更低2019 年 10 月「BART、T5」使用完整的 Encoder-Decoder 架构,在各种 NLP 任务中表现优异2020 年 5 月「GPT-3」超大规模语言模型,支持“零样本学习”,无需微调即可完成新任务这个列表并不全面,只是为了突出一些不同类型的 Transformer 模型。
5/20/2025 8:15:00 AM
郭小喵玩AI
专为二次元打造!B站开源SOTA动画视频生成模型 Index-AniSora
2025年5月19日,哔哩哔哩(B站)宣布开源其最新的动画视频生成模型——Index-AniSora,这一创新技术为二次元风格视频的生成带来了革命性的突破。 Index-AniSora支持多种二次元风格视频镜头的一键生成,包括番剧、国创、漫改动画、VTuber、动画PV和鬼畜动画等,极大地提升了动画内容的生产效率与质量。 Index-AniSora的技术原理基于B站提出的AniSora模型,该模型已经在国际人工智能会议IJCAI2025上被接收。
5/20/2025 8:00:45 AM
AI在线