AI在线 AI在线

深度学习

​谷歌的 TPU 业务或将冲击 9000 亿美元市场,挑战英伟达

随着人工智能技术的不断发展,谷歌正加大对 AI 硬件市场的布局,特别是其自家研发的张量处理单元(TPU)。 近期,谷歌开始与一些小型云服务提供商,如 Fluidstack、Crusoe 和 CoreWeave 合作,推广其 TPU 产品。 这一举动意味着谷歌希望在英伟达的强大市场地位上开辟出一片新的天地。
9/9/2025 4:56:50 PM
AI在线

百度文心大模型X1.1发布:深度学习能力再升级

在9月9日举行的WAVE SUMMIT深度学习开发者大会上,百度首席技术官王海峰正式发布了文心大模型X1.1。 作为一款全新的深度思考模型,文心大模型X1.1在多个核心能力上取得了显著进步,尤其在事实性、指令遵循和智能体表现上均有大幅提升。 目前,个人用户已可通过文心一言官网和文小言APP体验该模型。
9/9/2025 12:41:14 PM
AI在线

WAVE SUMMIT深度学习开发者大会2025举行 文心大模型X1.1、飞桨框架v3.2、文心快码3.5S发布

9月9日,由深度学习技术及应用国家工程研究中心主办,百度飞桨、文心大模型联合承办的WAVE SUMMIT 深度学习开发者大会2025在京举行。 会上,百度重磅发布文心大模型X1.1,并公布文心和飞桨的一系列技术、产品、生态最新成果。 文心X1.1深度思考模型上线,多个基准测试达到SOTA会上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰正式发布文心大模型X1.1深度思考模型,该模型在事实性、指令遵循、智能体等能力上均有显著提升。
9/9/2025 11:57:47 AM

Yann LeCun最新纪录片首曝!传奇AI教父的双面人生,深度学习幕后40年

在AI的璀璨星空中,有一位传奇人物始终闪耀——Yann LeCun。 他不仅是深度学习的开创者之一,也是Meta的首席AI科学家。 当扎克伯格敲定28岁的Alexander Wang出任Meta的首席AI官后,所有人同时想到一个问题。
8/18/2025 9:12:00 AM

AI 预测点球方向准确率超人类守门员,高达 52%

AI在线 7 月 27 日消息,在足球比赛中,点球常常是决定比赛胜负的关键。 目前守门员在面对点球时,大多依赖于直觉来进行判断。 近日,西班牙拉斯帕尔马斯大学的研究人员通过深度学习模型,开发出的模型在预测点球方向上表现出了比人类守门员更高的准确率。
7/27/2025 2:47:41 PM
远洋

英伟达完成从游戏芯片商到AI巨头的战略转型

全球半导体巨头英伟达(NVIDIA)近日宣布在波士顿设立量子研究中心,标志着这家以游戏显卡起家的公司已完成向人工智能领导者的战略转型。 据公开资料显示,英伟达目前市值已突破万亿美元,成为推动AI技术发展的核心力量。 从游戏硬件到AI芯片的跨越英伟达成立于1993年,最初专注于为游戏行业提供图形处理器(GPU)。
6/23/2025 4:00:38 PM
AI在线

刚刚,Gemini 2.5系列模型更新,最新轻量版Flash-Lite竟能实时编写操作系统

刚刚,Gemini 系列模型迎来了一波更新:Gemini 2.5 Pro 稳定版发布且已全面可用,其与 6 月 5 日的预览版相比无变化。 Gemini 2.5 Flash 稳定版发布且已全面可用,其与 5 月 20 日的预览版相比无变化,但价格有更新。 新推出了 Gemini 2.5 Flash-Lite 并已开启预览。
6/18/2025 9:56:53 AM
机器之心

C#与AI联姻:零依赖!用Keras.NET训练深度学习模型实录

在C#中实现深度学习通常需要依赖复杂的框架,但通过Keras.NET,我们可以在零外部依赖的情况下训练强大的深度学习模型。 下面我将分享一个完整的实战案例,展示如何用C#和Keras.NET训练一个图像分类模型。 这个实现具有以下特点:零外部依赖:仅使用Keras.NET和Numpy.NET库,无需安装Python或其他深度学习框架完整的训练流程:包括模型构建、数据加载、训练、评估和保存卷积神经网络:使用现代CNN架构进行图像分类模型检查点:自动保存验证集表现最佳的模型灵活的配置:可调整图像尺寸、批次大小和训练轮数要运行此代码,你需要安装以下NuGet包:Keras.NETNumpy.NETSciSharp.TensorFlow.Redist在实际应用中,你需要替换LoadData方法中的模拟数据加载逻辑,使用真实的图像数据。
6/17/2025 7:28:51 AM
CONAN

深度学习中Batch Size对训练过程如何影响?

之前面试过程中被问到过两个问题:(1)深度学习中batch size的大小对训练过程的影响是什么样的? (2)有些时候不可避免地要用超大batch,比如人脸识别,可能每个batch要有几万甚至几十万张人脸图像,训练过程中超大batch有什么优缺点,如何尽可能地避免超大batch带来的负面影响? 面试版回答在不考虑Batch Normalization的情况下(这种情况我们之后会在bn的文章里专门探讨),先给个自己当时回答的答案吧(相对来说学究一点):(1) 不考虑bn的情况下,batch size的大小决定了深度学习训练过程中的完成每个epoch所需的时间和每次迭代(iteration)之间梯度的平滑程度。
6/13/2025 2:55:00 AM
grok

一文讲清楚大模型中六个关键词及原理:LLM、Transformer、Bert、预训练、微调FineTuning、机器学习

什么是大模型,相信每个人都能说上一个一二三点来。 比如:OpenAI、ChatGPT、DeepSeek、豆包、Manus等。 也知道大模型需要做训练与推理。
6/10/2025 1:00:00 AM
Zack之云原生

OpenAI久违发了篇「正经」论文:线性布局实现高效张量计算

OpenAI 发论文的频率是越来越低了。 如果你看到了一份来自 OpenAI 的新 PDF 文件,那多半也是新模型的系统卡或相关增补文件或基准测试,很少有新的研究论文。 至于原因嘛,让该公司自家的 ChatGPT 来说吧:「截至目前,OpenAI 在 2025 年在 arXiv 上公开发布的论文数量相对较少,可能反映了其对研究成果公开策略的谨慎态度,可能出于商业保密或安全考虑。
6/5/2025 11:49:59 AM

深度学习原来这么好懂?这篇大白话科普,让你轻松 get 新知识!

嘿,朋友们! 你是不是也经常在新闻、科技报道里看到“深度学习”这个词? 听起来是不是特别高大上,感觉像是只有顶尖科学家才能搞懂的神秘领域?
5/14/2025 8:25:00 AM
用户007

常用模型蒸馏方法:这 N 个核心,你都知道吗?(上)

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活、健壮的模型技术体系。 随着深度学习模型规模的爆炸式增长,它们在各种任务上展现出令人惊叹的性能。 然而,庞大的参数量和计算需求也带来了新的挑战:如何在资源受限的设备上高效部署这些模型?
5/13/2025 9:48:20 AM
Luga Lee

打破Transformer霸权!液态神经网络统治风电预测!

一眼概览该论文提出一种受生物神经系统启发的Liquid Neural Network(LNN)框架,首次将其应用于风电多时间尺度预测任务,并在多个数据集上显著优于LSTM、GRU等主流方法。 核心问题风电预测面临高度不确定性和非线性动态问题,传统深度学习方法如LSTM、GRU虽有成效,但缺乏解释性和泛化能力。 该研究致力于解决如何在多时间尺度、不同分辨率和变量数下,准确且透明地预测风电输出的问题。
5/9/2025 8:48:06 AM
萍哥学AI

一文详解深度学习中的标量、向量、矩阵、张量

在深度学习领域,标量、向量、矩阵和张量是不可或缺的基本概念。 它们不仅是数学工具,更是理解和构建神经网络的关键。 从简单的标量运算到复杂的张量处理,这些概念贯穿于数据表示、模型构建和算法优化的全过程。
4/27/2025 9:59:38 AM
Goldma

AI语音革命新纪元:Sesame模型让聊天AI“活”出表情包式情绪声线

译者 | 朱先忠审校 | 重楼Sesame使用一种名为残差向量量化的深度学习技术对语音进行编码最近,Sesame人工智能公司发布了他们最新的语音转语音(Speech-to-Speech)模型的演示。 这是一个非常擅长说话的对话式人工智能代理,它们能够提供相关的答案,并带有表情地说话,而且说实话,它们非常有趣,互动性很强。 请注意,有关这方面的系统的技术论文尚未发布,但他们确实发布了一篇简短的博客文章,并提供了有关他们使用的技术和他们所构建的先前算法的大量信息。
4/25/2025 8:19:05 AM
朱先忠

微软开源“原生1bit”三进制LLM:2B参数,0.4GB内存/单CPU就能跑,性能与同规模全精度开源模型相当

微软以小搏大,发布首个开源2B参数规模“原生1bit”LLM——BitNet b1.58 2B4T,单CPU就能跑,性能与同规模全精度开源模型相当。 它采用三进制{-1, 0, 1}存储权重,相较于传统的16位浮点数可大幅降低显存需求。 只需0.4GB内存即可运行。
4/21/2025 6:43:31 PM
量子位

瑞士研究人员称AI能够识别出可能存在生命行星的隐藏位置

浩瀚宇宙,繁星亿万,寻找另一颗蓝色星球的梦想,如同大海捞针。 但现在,来自瑞士的一支科研团队,为这场史诗级的探索注入了强大的新动能。 他们精心打造了一款人工智能模型,如同一位目光锐利的星际侦探,能够穿透星尘,洞察那些可能隐藏着宜居世界的未知角落。
4/21/2025 5:00:37 PM
AI在线