理论
星辰与代码:DeepSeek的发展历程
技术突破阶段2024 年,DeepSeek 强势开启生态扩张与技术爆发的新纪元,成为全球 AI 领域瞩目的焦点。 年初 1 月,DeepSeek 便以 DeepSeek-MoE 震撼登场,创新性架构设计以仅 60% 的计算量损耗,成功超越 Llama 2-7B 性能,为后续技术突破奠定坚实基础,在模型效率优化上迈出关键一步。 紧接着 2 月,DeepSeekMath 在 MATH 基准测试中表现惊艳,成绩飙升至 51.7%,无限逼近 GPT-4 水平,数学推理能力实现质的飞跃,极大提升了模型在复杂数学问题求解上的可靠性与精准度。
3/27/2025 3:50:00 AM
小牛呼噜噜
LLM中的分块技术:原理、应用与展望
在大语言模型(LLM)飞速发展的当下,分块技术(Chunking)(RAG 中的分块策略:从基础到前沿的全面剖析)作为提升模型性能的关键手段,受到了广泛关注。 它在优化信息处理、提高检索效率、增强模型理解能力等方面发挥着不可或缺的作用。 深入探究 LLMs 中的分块技术,对于推动自然语言处理(NLP)领域的发展具有重要意义。
3/27/2025 2:50:00 AM
大模型之路
一文详尽大型语言模型的四种量化技术
大型语言模型(比如ChatGPT背后的技术)确实非常"庞大"——这不仅指它们的能力,更直接体现在它们的体积上。 一个中等规模的模型就可能占用几十GB的内存,相当于几百部高清电影的大小。 对于普通开发者、个人研究者或初创公司来说,这样的资源需求无疑是一道难以跨越的门槛。
3/27/2025 2:44:00 AM
云朵君
重磅发布!ChatGPT ImageGen “Shiba” 震撼来袭:你从未见过的强大AI图像生成模型!
引言期待已久的ChatGPT ImageGen终于迎来重大更新! 代号为“Shiba”的全新模型正式发布,而我可以毫不犹豫地说,这绝对是我目前为止使用过的最强大的AI图像生成工具! 无论是在Prompt理解、生成质量,还是在文字排版、编辑能力和角色一致性等方面,“Shiba”都展现出了前所未有的卓越性能,可以说是全面碾压!
3/27/2025 12:04:33 AM
深海幽光
解码衰老时钟:深度学习揭示大脑衰老速度与认知功能衰退的关联
编辑 | 2049人脑的衰老速度与认知衰退、神经退行性疾病风险密切相关。 然而,传统脑龄(Brain Age,BA)模型仅能反映从出生到检测时间点的累积衰老效应,无法捕捉近期或动态的衰老速率。 这一问题在阿尔茨海默病(AD)等神经退行性病变的早期预警中尤为突出。
3/26/2025 2:11:00 PM
ScienceAI
活性提升65倍,山大新AI工具定向进化高活性酶,外部数据集验证成功率达80%
编辑丨&准确预测酶动力学参数对于酶的探索和修饰至关重要,但现有模型面临过拟合导致准确率低或泛化能力差的问题。 以山东大学为主导的团队提出了一种基于预训练模型和分子指纹的深度学习模型 CataPro ,并用它来预测转换数(k(cat))、米歇尔常数(K(m))和催化效率(k(cat)/K(m))。 与以前的基线模型相比,CataPro 在无偏数据集上表现出明显增强的准确性和泛化能力。
3/26/2025 2:10:00 PM
ScienceAI
88%的AI试点未能投入生产,究竟为何?
许多AI的概念验证(POC)项目因目标不明确、数据准备不足以及缺乏内部专业知识而失败。 同样,过于激进的概念验证批准以及来自高层的误导性压力也是导致失败的原因。 概念验证已成为CIO的AI战略的关键组成部分,它提供了一种低风险的方式来测试AI用例,而无需全面投入。
3/26/2025 11:40:28 AM
Evan Schuman
AI巨头画饼被戳穿!研究员警告:比起专注开发诺奖级AI,取代白领工作更有利可图!智能体搞定搜索和办公软件,人类面临数十年漫长过渡
许多AI大佬都给我们画过同样的饼——AI可以成为科学家。 不仅如此,根据他们的说法:诺奖级AI近在眼前,届时所有的研发工作将被自动化,世界也会因为各种科学突破变得愈发繁荣和美好。 OpenAI奥特曼曾表示,AI 可能会像晶体管一样,成为一种可广泛扩展并渗透到经济各个角落的重大突破。
3/26/2025 11:27:37 AM
企业在AI创新与安全之间走钢丝
根据Zscaler的数据,全球范围内AI/ML工具的使用激增,企业纷纷将AI融入运营之中,员工也在日常工作流程中加以运用。 该报告显示,企业使用AI/ML工具的数量同比增长了3000%以上,凸显出各行业迅速采用AI技术,以解锁生产力、效率和创新的新水平。 这些发现基于Zscaler云在2024年2月至12月期间分析的5365亿笔AI和ML交易。
3/26/2025 11:26:37 AM
通过敏捷治理让 GenAI 更好为企业赋能
生成式人工智能指创建各种内容包括编码软件、自动化工业流程、创作音乐、制作深度研究报告等的工具,其正在以惊人的速度发展。 近二十年,我从未见过任何技术发展得如此之快。 现在,企业不再考虑是否使用生成式人工智能,而是考虑如何让其大规模发挥作用。
3/26/2025 11:21:59 AM
晓晓
突发!浪潮六家子公司、智源被列入美国实体清单!50余家中国企业又被“拉黑”
出品 | 51CTO技术栈(微信号:blog51cto)美国当地时间周二,美国商务部工业与安全局在联邦公报上刊发两份文件,将50余个中国科技企业和机构纳入所谓的“实体清单”,预期将于3月28日生效。 美国商务部声称,这些实体“从事为与中国军工复合体密切相关的中国最终用户开发先进人工智能、超级计算机和高性能人工智能芯片的活动”。 图片文件PDF:,在这份实体名单中,中国云计算和大数据服务提供商浪潮集团(Inspur Group)的六家子公司被美国商务部“拉黑”。
3/26/2025 11:13:28 AM
RAG检索全攻略:Embedding与Rerank模型的终极指南
在构建基于检索增强生成(RAG)的系统时,Embedding Model和Rerank Model扮演着至关重要的角色。 比如你正在搭建一个智能搜索引擎,Embedding Model就像是帮你快速找到相关书籍的“图书管理员”,而Rerank Model则像是一位经验丰富的“资深书评人”,负责从一堆书里精准挑选出最符合你需求的那几本。 两者配合,就像一对完美搭档,确保RAG系统既能找到大量信息,又能精准提炼出最关键的内容。
3/26/2025 11:05:13 AM
OpenAI直播狙击谷歌,奥特曼AGI梗图现场直出!GPT-4o超强原生生图来袭
就在谷歌刚刚扔出地表最强模型Gemini 2.5 Pro不久,OpenAI也有动作了。 奥特曼亲自带队,展示了GPT-4o图像生成技术的各种大升级,比如制作梗图、文本渲染、多轮交互生成和指令遵循等。 整个直播中最亮的演示,莫过于这张官方玩梗的表情包了。
3/26/2025 10:21:58 AM
新智元
随手一拍,高效重建大型3D开放场景,港科广GraphGS突破传统重建技术瓶颈|ICLR 2024
从手机随手拍、汽车行车记录仪到无人机航拍,如何从海量无序二维图像快速生成高精度三维场景? 传统方法依赖精确的相机位姿参数,实际应用成本高昂。 港科广团队提出全新框架GraphGS,突破技术瓶颈——无需精准相机位姿,仅凭RGB图像即可实现大规模开放场景的高效重建和高保真新视角合成,相关论文入选ICLR 2025,代码即将开源。
3/26/2025 9:55:14 AM
量子位
AI 如何重塑 IT 运营:从救火式响应到智能进化
企业的数字化转型始终在不断推进,伴随而来的是IT系统的复杂性呈指数级增长。 服务器、微服务、容器、数据平台等多层技术堆栈交织在一起,遗留系统与云原生架构相互耦合,快速迭代的业务需求与全球化部署的弹性要求,使得传统IT运营模式逐渐力不从心。 面对海量指标和告警、突发的故障、不断更新的运营知识以及持续的系统迭代需求,运维团队往往陷入“救火式响应”的恶性循环。
3/26/2025 9:30:00 AM
Thoughtworks洞见
OpenAI在图片领域站起来了!
出品 | 51CTO技术栈(微信号:blog51cto)26日凌晨,OpenAI推出了GPT4o图像生成,可以说解决了此前Midjourney等扩散模型很难解决的问题,业内为之大为赞叹。 这是用手机拍摄的玻璃白板的广角图像,拍摄地点是一间俯瞰海湾大桥的房间。 视野中可以看到一位女士正在写字,她身穿一件印有大型 OpenAI 标志的 T 恤。
3/26/2025 9:29:12 AM
新版DeepSeek-V3官方报告出炉:超越GPT-4.5,仅靠改进后训练
刚刚,DeepSeek官方发布DeepSeek-V3模型更新技术报告。 V3新版本在数学、代码类相关评测集成绩超过GPT-4.5! 而且这只是通过改进后训练方法实现。
3/26/2025 9:16:05 AM
量子位
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
AI新词
智能体
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
华为
大语言模型
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
编程
DeepMind
亚马逊
特斯拉
AI模型