理论
美国CS专业卷上天,满分学霸惨遭藤校全拒!父亲大受震撼引爆热议
美国大学CS专业,卷到何种程度了? 最近,一位父亲痛心发帖:他的儿子成绩全校第一近乎完美——SAT接近满分、18门AP课程全部5分,却在申请季被所有常春藤名校拒绝。 唯一伸来橄榄枝的,只有本州的马萨诸塞大学阿默斯特分校(UMass Amherst)。
4/3/2025 8:50:00 AM
新智元
那些用ChatGPT实现10倍开发效率的顶级程序员,到底做对了什么?
大部分人都错了。 你刚刚发给ChatGPT那条“帮我写个函数实现xxx”的泛泛提示? 删了吧。
4/3/2025 8:36:31 AM
dev
我们如何构建了一个LangGraph代理以确定GitOps漏洞的优先级?
译者 | 布加迪审校 | 重楼一款基于LangGraph的开源工具可帮助你确定在特定的Kubernetes环境中最需要优先解决的漏洞。 在当今复杂的Kubernetes环境中,管理漏洞并确定优先级很快会变得令人不堪重负。 由于数十甚至数百个容器跨多个服务运行,你如何决定先处理哪些漏洞?
4/3/2025 8:33:59 AM
布加迪
DAPO:面向开源大语言模型的解耦裁剪与动态采样策略优化系统
在人工智能技术快速迭代发展的背景下,大语言模型(LLMs)已成为自然语言处理与生成领域的核心技术。 然而,将这些模型与人类偏好精确对齐并增强其复杂推理能力的挑战,促使研究者开发了一系列复杂的强化学习(RL)技术。 DAPO(解耦裁剪和动态采样策略优化,Decoupled Clip and Dynamic Sampling Policy Optimization)作为一个突破性的开源大语言模型强化学习系统应运而生,为该领域带来了技术变革。
4/3/2025 8:00:00 AM
Jenray
多模态AI核心技术:CLIP与SigLIP技术原理与应用进展
近年来,人工智能领域在多模态表示学习方面取得了显著进展,这类模型通过统一框架理解并整合不同数据类型间的语义信息,特别是图像与文本之间的关联性。 在此领域具有里程碑意义的模型包括OpenAI提出的CLIP(Contrastive Language-Image Pre-training,对比语言-图像预训练)和Google研发的SigLIP(Sigmoid Loss for Language-Image Pre-training,用于语言-图像预训练的Sigmoid损失)。 这些模型重新定义了计算机视觉与自然语言处理的交互范式,实现了从图像分类到零样本学习等多种高级应用能力。
4/3/2025 7:00:00 AM
AI算法 | 训练数据的数量、质量及语言分布等因素对中文大模型性能的影响
已有LLM研究探索了训练数据对模型性能的影响,但这些研究大多集中在英文模型上,对于中文模型的研究相对较少。 今天来看一篇来自贝壳的研究团队在2023年的一篇工作——《Towards Better Instruction Following Language Models for Chinese: Investigating the Impact of Training Data and Evaluation》。 这篇工作的核心目标是提升中文指令跟随语言模型的性能。
4/3/2025 7:00:00 AM
Goldma
深度解析:通过 AIBrix 多节点部署 DeepSeek-R1 671B 模型
原文链接: AIBrix 分布式推理平台实现 DeepSeek-R1 671B 的多节点部署。 DeepSeek-R1 通过渐进式训练框架展现出优秀的逻辑推理能力 —— 在 6710 亿总参数量中,其动态激活的 370 亿参数与 128k 上下文窗口,使其在复杂任务处理中表现卓越。 然而,如此庞大的模型规模对部署环境提出了严苛挑战,尤其是分布式推理的资源调度与性能优化。
4/3/2025 6:30:00 AM
字节跳动开源
GenAI遇上SLM:边缘计算的新纪元
小型语言模型(SLM)在效率、隐私和适应性之间实现了卓越的平衡,使其成为各种应用的理想选择。 译自GenAI Meets SLMs: A New Era for Edge Computing,作者 Pankaj Mendki。 让我们想象一个场景:一家医院的患者拥有自己的医疗记录。
4/3/2025 4:21:00 AM
岱军
美国奥数题撕碎AI数学神话,顶级模型现场翻车!最高得分5%,DeepSeek唯一逆袭
3月26号,ETH等团队的一项研究一经发布,就引起了圈内热议。 这项研究彻底撕开遮羞布,直接击碎了「LLM会做数学题」这个神话! 论文地址:,MathArena团队使用最近的2025年美国数学奥林匹克竞赛进行了详细评估,结果令人大吃一惊——所有大模型的得分,都低于5%!
4/3/2025 2:25:00 AM
新智元
DeepSeek再度升级,厉害了!
当代的程序员,避免不了各种AI工具打交道,可以说,这些AI工具早已成为我们生活和工作的一部分。 从之前的ChatGpt,到今年年初开源的DeepSeek爆火,国产新锐 DeepSeek 犹如一匹黑马,将中国的 AI 技术从“追赶者”转变为“引领者”。 现在各个大厂也都纷纷部署了DeepSeek,我也把重心从国外的产品转向了国内 AI。
4/3/2025 1:25:00 AM
刘欣
基于DeepSeek + VSCode 实现AI辅助编程
随着人工智能技术的飞速发展,AI 辅助编程逐渐成为提升开发效率、优化代码质量的重要工具。 本文通过结合 DeepSeek 的强大语言模型和 VSCode 的高效开发环境,展示了如何利用 AI 辅助编程完成一个经典的 MapReduce 词频统计任务。 这一实践不仅展示了 AI 在编程中的应用潜力,还为开发者提供了一个高效、便捷的开发流程示例,帮助读者快速上手 AI 辅助编程,并探索其在实际项目中的应用价值。
4/3/2025 12:00:01 AM
万卡集群真实部署,已节省数百万 GPU 小时!MoE 通信优化技术 COMET 开源
当前,MoE 架构是业界拓展模型规模的重要方向,然而,其在分布式训练中存在的大量通信开销,仍严重制约了训练效率和成本。 为攻克这一瓶颈,豆包大模型团队提出了一个全新的通信优化系统 COMET,通过更精准、细粒度的计算-通信重叠技术,在大规模 MoE 模型上可达到单层 1.96 倍加速,端到端平均 1.71 倍效率提升,且在不同并行策略、输入规模及硬件环境下均表现稳定。 目前,COMET 已实际应用于万卡级生产集群,助力 MoE 模型高效训练,并已累计节省了数百万 GPU 小时资源。
4/3/2025 12:00:00 AM
豆包大模型团队
超实用!Prompt程序员使用指南,大模型各角色代码实战案例
提示词(Prompt)是输入给大模型(LLM)的文本指令,用于明确地告诉大模型你想要解决的问题或完成的任务,也是大语言模型理解用户需求并生成准确答案的基础。 因此 prompt 使用的好坏,直接决定了大模型生成结果的质量(是否符合预期)。 图片Prompt 基本使用为了让大模型生成更符合预期的结果,我们在使用 Prompt 时,可以使用以下模版。
4/3/2025 12:00:00 AM
磊哥
7小时开发完成!北京语言大学团队好样的!国产大模型DeepSeek首次用于地震国际救援!
出品 | 51CTO技术栈(微信号:blog51cto)中国科技再立大功! 4月初,缅甸发生中部7.9级地震后,中国驻缅甸使馆称,前方在使用基于DeepSeek紧急开发的中缅英互译系统,据了解,该系统是国家应急语言服务团秘书处和北京语言大学迅速组建的语言服务支持团队开发出来的。 开发过程团队接到任务后争分夺秒,利用国产大模型DeepSeek仅仅七小时内就开发出中缅英三语实时互译系统,并紧急部署到救援人员的手机和终端设备上。
4/2/2025 4:07:07 PM
始于初创,成于生态:Dify.AI 与亚马逊云科技共筑生成式 AI 应用新范式
2025 年,生成式 AI 技术正经历从“内容生成”到“复杂推理”的跨越式进化。 企业不再满足于文本、图像的简单生成,而是将 AI 深度嵌入业务流程,推动自动化决策与任务执行。 然而,这一过程并非坦途,企业面临着系统整合的复杂性、规模化部署的难题以及专业人才的短缺等多重挑战。
4/2/2025 3:47:27 PM
鸢玮
准确率达85%,苏大、大连理工开发多模态特征融合ML,预测工程纳米材料诱导的慢性损伤
编辑 | 白菜叶纳米颗粒引起的慢性损伤(例如纤维化和致癌作用)引起了公众健康担忧,需要在危害识别中迅速评估。 尽管计算机分析通常用于化学品风险评估,但由于纳米生物流体和纳米亚细胞器等多个界面的复杂相互作用,预测体内慢性纳米毒性仍然具有挑战性。 苏州大学、大连理工大学的研究人员开发了一个多模态特征融合分析框架来预测金属氧化物纳米颗粒(MeONP)在雌性小鼠中的纤维化潜力。
4/2/2025 2:08:00 PM
ScienceAI
Gemini Canvas 全民玩疯了!免费可用!谷歌:我们的TPU烫麻了,简直火上浇油!皮查伊:我们是SOTA!氛围编程来了
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)自Gemini2.5 Pro发布后,被OpenAI的“吉卜力”画风成功“阻击”的谷歌,逆势火了一把。 4月1日凌晨,谷歌发布了“Google Gemini Canvas”,引起了社媒用户的疯狂转发。 图片从提示到原型只需几分钟,任何人都可以使用Canvas进行编码和创作。
4/2/2025 12:23:06 PM
云昭
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用