理论
比尔盖茨自述:中学时期就开始偷偷996写代码
57年前的西雅图冬夜,一个瘦削少年翻出卧室窗户,奔向名为“C的立方”的计算机实验室。 比尔·盖茨不会想到,这段在寒夜中追逐代码的岁月,正悄然叩响数字时代的大门。 当湖滨中学的编程少年们以无偿劳动换取珍贵的上机时间时,一场改变人类文明进程的变革已在晶体管与二进制中孕育——在这个数字时代的黎明,一群年轻的先驱者站在了浪潮之巅,他们以智慧和勇气,开辟了一个全新的领域:个人计算机软件。
2/21/2025 9:10:00 AM
量子位
抛弃OpenAI,Figure亮王牌:史上首次两个机器人「共脑」,网友直呼太恐怖!
与OpenAI分手之后,Figure自研首个模型终于交卷了! 不用ChatGPT,Figure直接把视觉-语言-动作模型(VLA)——Helix装入人形机器人大脑。 它可以让机器人感知、语言理解、学习控制,是一个端到端的通用模型。
2/21/2025 9:06:28 AM
新智元
世界首个「AI CUDA工程师」诞生!AI自己写代码优化CUDA内核,性能狂飙100倍
就在刚刚,由Transformer八大金刚之一Llion Jones创办的Sakana AI,推出了世界上首个「AI CUDA工程师」——The AI CUDA Engineer。 同时,还发布了一个由「AI CUDA工程师」生成的,包含17,000多个已验证CUDA内核的数据集。 论文地址::「AI科学家」之后,一个疑问一直萦绕在团队心头:如果可以使用AI来进行AI研究,是不是也能用AI来研究如何让AI运行得更快?
2/21/2025 9:00:00 AM
新智元
复旦视频扩散模型综述:覆盖300+文献,探讨近期研究趋势与突破,Github揽星2k+
视频扩散模型新综述来了,覆盖300 文献的那种。 最近,复旦大学、上海市智能视觉计算协同创新中心联合微软等学术机构,在国际顶级期刊《ACM Computing Surveys》(CSUR)上发表了题为《A Survey on Video Diffusion Models》的综述论文。 不仅系统地梳理了扩散模型在视频生成、编辑及理解等前沿领域的进展,还深入探讨了近期的研究趋势与突破,涵盖了该领域近年来的重要成果。
2/21/2025 8:56:49 AM
量子位
微软Muse秒生游戏登Nature,10亿级画面练出最强AI!千亿游戏市场重洗牌
同一天,微软放出两个核弹,首个拓扑量子芯片,还有首个世界与人类行动模型。 AI离数秒生成游戏视频的未来,又近了一步。 今天,微软团队首次引入了「世界与人类行动模型」(WHAM),并冠以希腊艺术女神「缪斯」(Muse)之名。
2/21/2025 8:44:06 AM
新智元
终于把卷积神经网络算法搞懂了!!!
大家好,我是小寒今天给大家分享一个强大的算法模型,卷积神经网络算法卷积神经网络算法(CNN)是一种专门用于处理具有网格结构数据(如图像)的深度学习模型,广泛应用于图像分类、目标检测、语义分割等任务。 CNN 的核心思想是通过模拟生物视觉皮层处理视觉信息的方式,能够自动从图像中提取特征,从而进行分类、检测等任务。 卷积神经网络的基本组成CNN 主要包括卷积层、池化层和全连接层。
2/21/2025 8:29:07 AM
程序员小寒
如何使用Java设计一套多智能体系统
译者 | 核子可乐审校 | 重楼2025年将成为AI智能体之年。 在本文的场景中,AI智能体是一套能够利用AI通过一系列步骤实现目标的系统,且具备就结果进行推理及更正的能力。 在实践中,智能体遵循的步骤可总结成图表形式。
2/21/2025 8:17:13 AM
核子可乐
隐形AI风险浮现:安全专家呼吁该治理“影子AI”了
网安领导者和CISO发现,近年来大量影子AI应用程序已危及企业网络,有些甚至持续运行一年多。 这些应用并非典型的攻击手段,而是员工在无IT和安全监管的情况下私自创建的AI程序。 目的是实现从自动化报告到营销自动化、数据分析等多种功能。
2/21/2025 8:10:00 AM
企业为何纷纷转向小AI模型?
当科技巨头们还在比拼千亿参数时,一场静悄悄的AI效率革命正在改写商业规则,从医疗诊断到零售库存管理,企业开始用“小模型”解决“大问题”。 大型语言模型因其多功能性、广泛的领域知识和解决复杂多步骤问题的能力而广受欢迎。 相比之下,小型模型为企业提供了一种资源消耗更少的方式,能够利用定制化的专业知识完成特定任务。
2/21/2025 8:00:00 AM
Lindsey Wilkinson
借助AI工具和版本控制实现代码库改进与重构
译者 | 刘涛审校 | 重楼随着时间的推移,代码库有可能会变得混乱且难以管理。 造成这种状况的原因包括快速修复(quik fixes:指当开发者面临时间压力时,他们经常会采用快速修复的方式来解决问题,例如临时性解决方案、不完整的修复或缺乏整体考虑,这些均会导致代码出现问题)、过时的功能或者仅仅是没有充足的时间来清理代码。 当代码变得难以阅读或修改时,会拖慢开发进度,甚至可能引发错误。
2/21/2025 8:00:00 AM
刘涛
黑客如何利用快速工程技术操纵代理人工智能
“代理”人工智能时代已经到来,企业再也不能忽视其变革潜力。 人工智能代理独立运作,根据其编程做出决策并采取行动。 Gartner预测,到2028年,15% 的日常业务决策将完全由人工智能代理自主做出。
2/21/2025 7:04:33 AM
何威风
断交OpenAI后,人形机器人独角兽首秀:一个神经网络控制整个上身,能听懂人话可抓万物
与OpenAI断交之后,Figure首个成果出炉:Helix,一个端到端通用控制模型,它能让机器人像人一样感知、理解和行动。 只需自然语言提示,机器人就能拿起任何东西,哪怕是从没见过的东西,比如这个活泼的小仙人掌。 从官方放出的演示中可以看到,它在接收到人类的提示后,就会按照指令逐一拿起桌上的物品放进冰箱。
2/21/2025 6:05:54 AM
DeepSeek R1范式复现笔记
作者 | yulei自DeepSeek R1技术报告🐳开放以来,开源社区涌现了多种「复现」工作。 本R1复现笔记旨在以多个开源项目的再复现以及交叉验证为目标,探索R1/R1-zero中强化学习步骤带来的模型效果提升,并尝试展望R1技术在未来模型训练与业务落地上的前景。 一、R1 开源项目梳理目前主流的 R1 系列复现工作如表 1 所示。
2/20/2025 3:32:28 PM
腾讯技术工程
DeepSeek创始人是谁?这个问题DeepSeek也整不会了!
梁文锋到底有多低调? 你问DeepSeek官网,连自家的产品都整不会“DeepSeek的创始人是谁”这个问题。 事情是这样的。
2/20/2025 2:54:56 PM
GPU 内存交换技术,知多少?
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的 GPU 内存交换机技术。 众所周知,LLMs 虽然在诸多任务中表现出色,但其庞大的模型体积和复杂的计算需求,使得高效利用 GPU 资源成为一大难题。 尤其是在高并发场景下,如何快速加载和卸载模型,避免 GPU 闲置,成为影响推理性能和成本的关键因素...一、GPU 设备资源调度的当前现状与困境随着AI 产业的持续落地,越来越多的公司开始将大型语言模型(LLMs)部署到生产环境,并确保能够大规模服务于用户。
2/20/2025 2:52:02 PM
架构驿站
ImageNet-D 详解:严格评估神经网络的鲁棒性
神经网络在零样本图像分类中取得了惊人的成就,但它们真的能“看”得有多好呢? 现有的用于评估这些模型鲁棒性的数据集仅限于网络上的图像或通过耗时且资源密集的手动收集创建的图像。 这使得系统评估这些模型在面对未见数据和真实世界条件(包括背景、纹理和材质的变化)时的泛化能力变得困难。
2/20/2025 2:44:06 PM
二旺
DeepSeek相关人士已辟谣:融资消息均为谣言 阿里股价微跌0.88%
出品 | 51CTO技术栈(微信号:blog51cto)针对外媒称“DeepSeek 首次考虑筹集外部资金”的消息,DeepSeek相关人士今天上午已经进行了辟谣——融资消息均为谣言。 (图1)但作为另一主角的阿里,尚无回应。 腾讯科技报道,阿里美股股价微跌0.88%。
2/20/2025 2:30:31 PM
超越炒作:四个应用实例揭示GenAI的实际奏效之处
如果说2023年是GenAI的初探之年,那么2024年无疑是它深入企业骨髓,展现真正实力的关键时期。 IBM在12月发布的一项针对2300名IT决策者的调查显示,47%的受访者已经见证了AI投资的回报,33%表示达到了收支平衡,仅有14%表示亏损。 更令人振奋的是,66%的公司计划增加对AI的投资,而计划减少投资的公司仅占5%。
2/20/2025 2:13:59 PM
Maria Korolov
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
AI新词
智能体
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
华为
大语言模型
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
编程
DeepMind
亚马逊
特斯拉
AI模型