理论

一文详尽大型语言模型的四种量化技术

一文详尽大型语言模型的四种量化技术

大型语言模型（比如ChatGPT背后的技术）确实非常"庞大"——这不仅指它们的能力，更直接体现在它们的体积上。一个中等规模的模型就可能占用几十GB的内存，相当于几百部高清电影的大小。对于普通开发者、个人研究者或初创公司来说，这样的资源需求无疑是一道难以跨越的门槛。

3/27/2025 2:44:00 AM 云朵君

重磅发布！ChatGPT ImageGen “Shiba” 震撼来袭：你从未见过的强大AI图像生成模型！

重磅发布！ChatGPT ImageGen “Shiba” 震撼来袭：你从未见过的强大AI图像生成模型！

引言期待已久的ChatGPT ImageGen终于迎来重大更新！代号为“Shiba”的全新模型正式发布，而我可以毫不犹豫地说，这绝对是我目前为止使用过的最强大的AI图像生成工具！无论是在Prompt理解、生成质量，还是在文字排版、编辑能力和角色一致性等方面，“Shiba”都展现出了前所未有的卓越性能，可以说是全面碾压！

3/27/2025 12:04:33 AM 深海幽光

解码衰老时钟：深度学习揭示大脑衰老速度与认知功能衰退的关联

解码衰老时钟：深度学习揭示大脑衰老速度与认知功能衰退的关联

编辑 | 2049人脑的衰老速度与认知衰退、神经退行性疾病风险密切相关。然而，传统脑龄（Brain Age，BA）模型仅能反映从出生到检测时间点的累积衰老效应，无法捕捉近期或动态的衰老速率。这一问题在阿尔茨海默病（AD）等神经退行性病变的早期预警中尤为突出。

3/26/2025 2:11:00 PM ScienceAI

活性提升65倍，山大新AI工具定向进化高活性酶，外部数据集验证成功率达80%

活性提升65倍，山大新AI工具定向进化高活性酶，外部数据集验证成功率达80%

编辑丨&准确预测酶动力学参数对于酶的探索和修饰至关重要，但现有模型面临过拟合导致准确率低或泛化能力差的问题。以山东大学为主导的团队提出了一种基于预训练模型和分子指纹的深度学习模型 CataPro ，并用它来预测转换数（k(cat)）、米歇尔常数（K(m)）和催化效率（k(cat)/K(m))。与以前的基线模型相比，CataPro 在无偏数据集上表现出明显增强的准确性和泛化能力。

3/26/2025 2:10:00 PM ScienceAI

88%的AI试点未能投入生产，究竟为何？

88%的AI试点未能投入生产，究竟为何？

许多AI的概念验证(POC)项目因目标不明确、数据准备不足以及缺乏内部专业知识而失败。同样，过于激进的概念验证批准以及来自高层的误导性压力也是导致失败的原因。概念验证已成为CIO的AI战略的关键组成部分，它提供了一种低风险的方式来测试AI用例，而无需全面投入。

3/26/2025 11:40:28 AM Evan Schuman

AI巨头画饼被戳穿！研究员警告：比起专注开发诺奖级AI，取代白领工作更有利可图！智能体搞定搜索和办公软件，人类面临数十年漫长过渡

AI巨头画饼被戳穿！研究员警告：比起专注开发诺奖级AI，取代白领工作更有利可图！智能体搞定搜索和办公软件，人类面临数十年漫长过渡

许多AI大佬都给我们画过同样的饼——AI可以成为科学家。不仅如此，根据他们的说法：诺奖级AI近在眼前，届时所有的研发工作将被自动化，世界也会因为各种科学突破变得愈发繁荣和美好。 OpenAI奥特曼曾表示，AI 可能会像晶体管一样，成为一种可广泛扩展并渗透到经济各个角落的重大突破。

3/26/2025 11:27:37 AM

企业在AI创新与安全之间走钢丝

企业在AI创新与安全之间走钢丝

根据Zscaler的数据，全球范围内AI/ML工具的使用激增，企业纷纷将AI融入运营之中，员工也在日常工作流程中加以运用。该报告显示，企业使用AI/ML工具的数量同比增长了3000%以上，凸显出各行业迅速采用AI技术，以解锁生产力、效率和创新的新水平。这些发现基于Zscaler云在2024年2月至12月期间分析的5365亿笔AI和ML交易。

3/26/2025 11:26:37 AM

通过敏捷治理让 GenAI 更好为企业赋能

通过敏捷治理让 GenAI 更好为企业赋能

生成式人工智能指创建各种内容包括编码软件、自动化工业流程、创作音乐、制作深度研究报告等的工具，其正在以惊人的速度发展。近二十年，我从未见过任何技术发展得如此之快。现在，企业不再考虑是否使用生成式人工智能，而是考虑如何让其大规模发挥作用。

3/26/2025 11:21:59 AM 晓晓

突发！浪潮六家子公司、智源被列入美国实体清单！50余家中国企业又被“拉黑”

突发！浪潮六家子公司、智源被列入美国实体清单！50余家中国企业又被“拉黑”

出品 | 51CTO技术栈（微信号：blog51cto）美国当地时间周二，美国商务部工业与安全局在联邦公报上刊发两份文件，将50余个中国科技企业和机构纳入所谓的“实体清单”，预期将于3月28日生效。美国商务部声称，这些实体“从事为与中国军工复合体密切相关的中国最终用户开发先进人工智能、超级计算机和高性能人工智能芯片的活动”。图片文件PDF：，在这份实体名单中，中国云计算和大数据服务提供商浪潮集团（Inspur Group）的六家子公司被美国商务部“拉黑”。

3/26/2025 11:13:28 AM

51秒破防！AI武器化时代CISO面临生死时速

51秒破防！AI武器化时代CISO面临生死时速

51秒？是的，你没看错。从黑客拿到你的凭证到横向渗透整个网络，只需要51秒。

3/26/2025 11:05:43 AM 佚名

RAG检索全攻略：Embedding与Rerank模型的终极指南

RAG检索全攻略：Embedding与Rerank模型的终极指南

在构建基于检索增强生成（RAG）的系统时，Embedding Model和Rerank Model扮演着至关重要的角色。比如你正在搭建一个智能搜索引擎，Embedding Model就像是帮你快速找到相关书籍的“图书管理员”，而Rerank Model则像是一位经验丰富的“资深书评人”，负责从一堆书里精准挑选出最符合你需求的那几本。两者配合，就像一对完美搭档，确保RAG系统既能找到大量信息，又能精准提炼出最关键的内容。

3/26/2025 11:05:13 AM

OpenAI直播狙击谷歌，奥特曼AGI梗图现场直出！GPT-4o超强原生生图来袭

OpenAI直播狙击谷歌，奥特曼AGI梗图现场直出！GPT-4o超强原生生图来袭

就在谷歌刚刚扔出地表最强模型Gemini 2.5 Pro不久，OpenAI也有动作了。奥特曼亲自带队，展示了GPT-4o图像生成技术的各种大升级，比如制作梗图、文本渲染、多轮交互生成和指令遵循等。整个直播中最亮的演示，莫过于这张官方玩梗的表情包了。

3/26/2025 10:21:58 AM 新智元

随手一拍，高效重建大型3D开放场景，港科广GraphGS突破传统重建技术瓶颈｜ICLR 2024

随手一拍，高效重建大型3D开放场景，港科广GraphGS突破传统重建技术瓶颈｜ICLR 2024

从手机随手拍、汽车行车记录仪到无人机航拍，如何从海量无序二维图像快速生成高精度三维场景？传统方法依赖精确的相机位姿参数，实际应用成本高昂。港科广团队提出全新框架GraphGS，突破技术瓶颈——无需精准相机位姿，仅凭RGB图像即可实现大规模开放场景的高效重建和高保真新视角合成，相关论文入选ICLR 2025，代码即将开源。

3/26/2025 9:55:14 AM 量子位

AI 如何重塑 IT 运营：从救火式响应到智能进化

AI 如何重塑 IT 运营：从救火式响应到智能进化

企业的数字化转型始终在不断推进，伴随而来的是IT系统的复杂性呈指数级增长。服务器、微服务、容器、数据平台等多层技术堆栈交织在一起，遗留系统与云原生架构相互耦合，快速迭代的业务需求与全球化部署的弹性要求，使得传统IT运营模式逐渐力不从心。面对海量指标和告警、突发的故障、不断更新的运营知识以及持续的系统迭代需求，运维团队往往陷入“救火式响应”的恶性循环。

3/26/2025 9:30:00 AM Thoughtworks洞见

OpenAI在图片领域站起来了！

OpenAI在图片领域站起来了！

出品 | 51CTO技术栈（微信号：blog51cto）26日凌晨，OpenAI推出了GPT4o图像生成，可以说解决了此前Midjourney等扩散模型很难解决的问题，业内为之大为赞叹。这是用手机拍摄的玻璃白板的广角图像，拍摄地点是一间俯瞰海湾大桥的房间。视野中可以看到一位女士正在写字，她身穿一件印有大型 OpenAI 标志的 T 恤。

3/26/2025 9:29:12 AM

新版DeepSeek-V3官方报告出炉：超越GPT-4.5，仅靠改进后训练

新版DeepSeek-V3官方报告出炉：超越GPT-4.5，仅靠改进后训练

刚刚，DeepSeek官方发布DeepSeek-V3模型更新技术报告。 V3新版本在数学、代码类相关评测集成绩超过GPT-4.5！而且这只是通过改进后训练方法实现。

3/26/2025 9:16:05 AM 量子位

深夜突袭！DeepSeek V3 偷偷更新变强

深夜突袭！DeepSeek V3 偷偷更新变强

DeepSeek 刚刚悄然发布了 DeepSeek-V3-0324 模型。这次更新远超预期，不仅性能大幅提升，而且新增了多项实用功能，让开发者和企业用户都为之惊叹。回顾之前的 DeepSeek R1 版本，尽管能力出色，但仍存在几个明显短板：缺乏函数调用能力、不支持规范化的 JSON 输出。

3/26/2025 9:12:59 AM PIG AI

DeepSeek 为什么这么牛？幻方三大核心技术解密！

DeepSeek 为什么这么牛？幻方三大核心技术解密！

梁文峰说，我们缺的从来都不是钱，而是高端芯片。幻方官网显示，2022年，公司员工“一只平凡的小猪”一个人就向捐助了1.38亿。你说，这是钱的事吗？

3/26/2025 9:00:00 AM 架构师之路

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉