网络

DiaMoE-TTS：清华 & 巨人网络开源的多方言语音合成利器

在数字化时代，语音合成技术（TTS）发展迅速，应用广泛。但方言和小语种在 TTS 领域面临数据稀缺、正字法不一致、音系变化复杂等挑战。为此，清华大学与巨人网络联合推出开源的多方言语音合成框架 DiaMoE-TTS，以创新技术支持方言保护和语言多样性。

10/29/2025 1:11:00 AM AIG小兵

比Transformer更强的架构来了？浙大新作Translution，一统卷积和自注意力

自2017年Transformer模型提出以来，Self-attention机制凭借其强大的建模能力，逐渐成为深度学习领域的核心操作。然而，随着人工智能模型的规模不断扩张，单纯依靠简单直接「堆参数、堆数据」提升性能的模式正逐渐遇到瓶颈。面对大模型训练代价高昂、性能增长趋缓等挑战，学术界和产业界亟需新的网络架构创新。

10/23/2025 8:25:08 AM 新智元

刚刚，Anthropic上线了网页版Claude Code

今天凌晨，Anthropic 上线了「Claude Code on the web」（即网页版 Claude Code）功能，这种全新的方式可以让用户直接从浏览器中委派编程任务。博客地址：，网页版 Claude Code 处于 Beta 阶段，作为研究预览版向 Pro 和 Max 用户开放使用。用户可以将多个编程任务交给 Claude 执行，这些任务会在 Anthropic 托管的云端基础设施上运行，非常适合处理漏洞积压、常规修复或并行开发工作。

10/21/2025 9:05:00 AM

深层网络通过分层抽象能够学习到更复杂的特征表示，从而提升模型对复杂数据的建模能力

神经网络层数越多效果越好这一观点，在特定条件下成立，其核心逻辑在于深层网络通过分层抽象能够学习到更复杂的特征表示，从而提升模型对复杂数据的建模能力。图片理论机制：分层抽象与特征表示能力增强特征抽象的层次化神经网络通过堆叠层数实现特征的逐层抽象。以图像识别为例：底层：学习边缘、纹理等简单特征（如卷积核检测水平/垂直边缘）；中层：组合底层特征形成形状、部件（如检测车轮、车窗）；高层：整合中层特征构成完整对象（如识别整辆汽车）。

10/14/2025 1:11:00 AM 幻风magic

27亿美元天价回归！谷歌最贵「叛徒」、Transformer作者揭秘AGI下一步

大模型需要什么？在硅谷举行的科技盛会Hot Chips 2025首日的主题演讲上，谷歌DeepMind的Noam Shazeer回答了这一问题，发表了题为《下一阶段AI的预测》的主题演讲。图片除了是Transformer论文《Attention Is All You Need》的作者之一，他还推动了许多技术创新，例如显著提升谷歌搜索中的拼写校正功能。

9/22/2025 3:37:23 PM 新智元

理论到实战，高可用架构踩坑说明书

在构建高可用系统时，开发者常常面临应用、数据库、缓存、消息队列等多维度的挑战。本文结合京东真实技术场景，系统梳理高可用架构实践中常见的技术陷阱与解决方案，深入剖析每个技术组件的可用性保障要点。旨在为工程师提供一套踩坑说明书，帮助团队在系统设计阶段规避潜在风险，提升线上系统的稳定性和容错能力。

9/5/2025 1:25:00 AM

什么是网络安全转型？成功的最佳实践

在监管压力不断增加和网络威胁不断上升的情况下，高管必须优先考虑网络安全转型，以保护资产、促进增长并确保弹性。在当今的数字世界中，网络安全不应再被抛在脑后，而是企业至关重要的必需品。如果不积极主动地进行网络安全转型，企业将面临监管处罚、运营中断、网络安全漏洞和声誉受损的风险。

7/15/2025 4:00:00 AM 何威风

阿里发布信息检索Agent，可自主上网查资料，GAIA基准超越GPT-4o

Agent能“看懂网页”，像人类一样上网？阿里发布WebDancer，就像它的名字一样，为“网络舞台”而生。只要输入指令，它就可以帮你上网搜索、做攻略，实现自主信息检索代理和类似深度研究模型的推理。

6/27/2025 3:45:28 PM

2025年，Mamba“联姻”Transformer，打造史上最强视觉骨干网络！

一眼概览MambaVision 提出一种混合 Mamba-Transformer 视觉骨干网络，首次将状态空间模型（SSM）与自注意力机制融合，显著提升图像分类、检测和分割任务的准确率与效率，达到新一代性能-速度最优前沿。核心问题虽然 Mamba 模型在语言任务中展现了优秀的长序列建模能力，但其自回归结构难以高效捕捉图像中的全局空间依赖，限制了在计算机视觉中的表现。如何在保持高吞吐和低复杂度的前提下建模图像中的长程依赖，是本研究要解决的核心问题。

6/5/2025 2:15:00 AM 萍哥学AI

不要小看线性回归！

在数据领域初学时，大家常听到的一个建议是：不要试图把整个机器学习都学透——因为它实在太庞大且变化太快，根本不现实；而更应该聚焦在少数几个与数据工作日常紧密相关的模型，比如决策树、支持向量机，当然，还有线性回归。线性回归本身就是一个非常实用的模型，更有意思的是，许多其他机器学习模型其实都是在它的基础上稍作改动而来。本文的目的，就是想让大家看到这一点。

4/27/2025 4:02:00 AM

强化学习也涌现？自监督RL扩展到1000层网络，机器人任务提升50倍

虽然大多数强化学习（RL）方法都在使用浅层多层感知器（MLP），但普林斯顿大学和华沙理工的新研究表明，将对比 RL（CRL）扩展到 1000 层可以显著提高性能，在各种机器人任务中，性能可以提高最多 50 倍。论文标题：1000 Layer Networks for Self-Supervised RL: Scaling Depth Can Enable New Goal-Reaching Capabilities论文链接：链接：，强化学习的重要性因为 DeepSeek R1 等研究再次凸显出来，该方法通过试错让智能体学会在复杂环境中完成任务。尽管自监督学习近年在语言和视觉领域取得了显著突破，但 RL 领域的进展相对滞后。

3/22/2025 9:01:00 PM 机器之心

终于把卷积神经网络算法搞懂了！！！

大家好，我是小寒今天给大家分享一个强大的算法模型，卷积神经网络算法卷积神经网络算法（CNN）是一种专门用于处理具有网格结构数据（如图像）的深度学习模型，广泛应用于图像分类、目标检测、语义分割等任务。 CNN 的核心思想是通过模拟生物视觉皮层处理视觉信息的方式，能够自动从图像中提取特征，从而进行分类、检测等任务。卷积神经网络的基本组成CNN 主要包括卷积层、池化层和全连接层。

2/21/2025 8:29:07 AM 程序员小寒

Transformer 的三大优化技术！！

Transformer 是一种基于自注意力（Self-Attention）机制的深度学习模型，最早由 Vaswani 等人在 2017 年的论文《Attention Is All You Need》中提出。与传统的循环神经网络（RNN）和长短期记忆网络（LSTM）不同，Transformer 丢弃了递归计算结构，而是通过自注意力机制并行处理输入序列，从而大大提高了计算效率。 Transformer 广泛用于自然语言处理（NLP）和计算机视觉（CV）领域，如机器翻译、文本生成、文本分类、目标检测等。

2/20/2025 12:28:59 AM 程序员小寒

DeepSeek本地部署教程，小白也能搞定！

安装环境操作系统：Windows 10及以上准备工具：轻量级AI模型调用工具Ollama，调用AI模型为deepseek-r1AI 模型管理工具Cherry-Studio或AnythingLLM（二选一）资源链接：复制安装步骤第一步、下载安装Ollama并修改环境变量要运行大模型，首先需要一个好用的工具，推荐使用 Ollama ，它是一个轻量级的工具，支持快速安装和运行大语言模型（如deepseek、Llama、Qwen 等）。 ollama下载地址：官网链接（文章开头）选择合适的操作系统下载，默认安装完成即可。这里注意，ollama安装完成后先不要启用，因为它默认是会将模型下载到C盘的，deepseek、Qwen等模型最小也有好几个GB会占用C盘空间，所以需要先设置ollama的环境变量。

2/10/2025 11:11:47 AM 小云君网络

人工智能生成的攻击对云的影响较小

过去几年，人们非常关注人工智能 (AI) 技术的发展状况及其对网络安全的影响。在许多行业中，与人工智能攻击相关的风险仍然存在且令人担忧，尤其是全球平均数据泄露成本比去年增加了 10% 。然而，根据 IBM X-Force 团队发布的最新《云威胁形势报告》，针对云计算环境的人工智能攻击的近期威胁实际上相对较低。

12/25/2024 9:30:02 AM 铸盾安全

终于把图神经网络算法搞懂了！！！

今天给大家分享一个强大的算法模型，GNN。图神经网络（GNN）是一类专门处理图结构数据的深度学习模型。在传统的深度学习中，输入数据通常是结构化的（如图像、文本、时间序列等），这些数据都可以表示为一个规则的网格或序列。

12/12/2024 12:29:03 AM 程序员小寒

视觉开源 AI 推理库 YOLOv11 遭供应链投毒：模型训练成挖矿，官方已撤回问题版本

科技媒体 techtarget 昨日（12 月 6 日）发布博文，报道称 Ultralytics 公司的 YOLOv11 AI 模型遭遇供应链攻击，v8.3.41 和 v8.3.42 两个版本被植入加密挖矿软件。

12/7/2024 10:24:47 AM 故渊

华为发布星河 AI 自动驾驶网络解决方案：业界首个 L4 自动驾驶网络

在华为全联接大会 2024“星河 AI 自动驾驶网络”论坛上，华为发布了业界首个 L4 自动驾驶网络 —— 星河 AI 自动驾驶网络解决方案。▲ 图源华为华为数据通信产品线 NCE 数据通信领域总裁王辉在演讲中表示，该方案包括智能网元、数字孪生和智慧大脑三层架构，以集成百亿语料通信大模型、云图算法仿真等底层根能力，打造风险自识别、故障自闭环、变更自验证的 L4 自动驾驶网络，为金融、高校等多个行业打造了 AI 值守的运维专家。AI在线附三层架构如下：智能网元：毫秒级感知业务、流量、应用等全量数据，为整网智能化提供数

9/24/2024 8:30:43 PM 沛霖（实习）

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

网络

DiaMoE-TTS：清华 &amp; 巨人网络开源的多方言语音合成利器

比Transformer更强的架构来了？浙大新作Translution，一统卷积和自注意力

刚刚，Anthropic上线了网页版Claude Code

深层网络通过分层抽象能够学习到更复杂的特征表示，从而提升模型对复杂数据的建模能力

27亿美元天价回归！谷歌最贵「叛徒」、Transformer作者揭秘AGI下一步

理论到实战，高可用架构踩坑说明书

什么是网络安全转型？成功的最佳实践

阿里发布信息检索Agent，可自主上网查资料，GAIA基准超越GPT-4o

2025年，Mamba“联姻”Transformer，打造史上最强视觉骨干网络！

不要小看线性回归！

强化学习也涌现？自监督RL扩展到1000层网络，机器人任务提升50倍

终于把卷积神经网络算法搞懂了！！！

Transformer 的三大优化技术！！

DeepSeek本地部署教程，小白也能搞定！

人工智能生成的攻击对云的影响较小

终于把图神经网络算法搞懂了！！！

视觉开源 AI 推理库 YOLOv11 遭供应链投毒：模型训练成挖矿，官方已撤回问题版本

华为发布星河 AI 自动驾驶网络解决方案：业界首个 L4 自动驾驶网络

DiaMoE-TTS：清华 & 巨人网络开源的多方言语音合成利器