理论
火山引擎多媒体实验室重要突破!LiveGS 技术登榜 SIGGRAPH,重新定义移动端自由视角视频直播
近日,火山引擎多媒体实验室的最新研究成果 LiveGS: Live Free-Viewpoint Video via High-Performance Gaussian Splatting for Mobile Devices 成功入选计算机图形学顶会 SIGGRAPH Emerging Technologies,并于2025年8月10日至8月14日在加拿大温哥华对外展出。 这一技术突破首次实现了移动端实时自由视角视频(FVV)直播的完整链路落地,在视觉保真度、计算效率和传输成本之间达成了前所未有的平衡,为互动直播、沉浸式娱乐等场景开辟了技术新范式。 图1 论文主页打破技术瓶颈:从实验室走向移动端的实时自由视角革命自由视角视频(FVV)允许用户从任意角度探索场景,是元宇宙、沉浸式直播等前沿领域的核心技术。
9/12/2025 4:51:20 PM
多媒体实验室
一文带你了解 TiDB MCP Server
前言TiDB 已经支持 MCP 功能了,一直想看看怎么玩的,本篇是一篇实践篇,带着大家一起搭建 TiDB MCP Server,以及如何添加 TiDB MCP,如何使用 TiDB 的 MCP。 TiDB 的 AI SDK——PyTiDB,现已原生支持 MCP 协议。 这意味着开发者可以直接使用 PyTiDB 提供的 MCP Server 模块,将 TiDB 数据库接入支持 MCP 的 AI 工具(如 Claude Desktop、Cursor 等),实现自然语言驱动的数据查询与分析。
9/12/2025 4:31:04 PM
悟空聊架构
迎战软件3.0时代:新范式、新挑战、新工程
我们正处在一个技术范式剧烈变革的黎明。 从企业信息化的流程固化,到互联网时代的数据驱动,软件的形态和价值在不断演进。 如今,以大语言模型(LLM)为代表的生成式人工智能技术,正以前所未有的力量,将我们推向一个全新的纪元——Software 3.0(软件3.0),一个由“意图”驱动的智能化时代。
9/12/2025 4:23:12 PM
肖然
从单体到LLM:拆解DevOps进化的三大范式
科技史一再证明,我们常低估未来的发展速度。 正如第一台重达30吨的计算机ENIAC,或“640K内存足够”的论断,都无法预见如今远超其亿万倍算力的设备已普及到个人。 今天,我们可能正处在新的“ENIAC时刻”。
9/12/2025 4:13:12 PM
韩荣
三大科技巨头的数据中心"密码":为什么阿里、腾讯、谷歌走出了完全不同的路?
技术的发展总是螺旋式上升的,但有时候,同一个起点却能走出截然不同的道路。 最近在参与一个多云架构的咨询项目时,客户提出了一个让我印象深刻的问题:"为什么同样是做云计算,阿里云、腾讯云和谷歌云的数据中心给人的感觉完全不一样? "这个问题促使我重新审视这三家科技巨头在数据中心设计上的差异化选择。
9/12/2025 3:51:29 PM
万字长文详解腾讯优图RAG技术的架构设计与创新实践
导语在信息爆炸的时代,如何从海量数据中精准获取知识并生成智能回答,已成为AI落地的核心挑战。 腾讯优图实验室凭借前沿的RAG体系,突破传统检索与生成的局限,打造了一套覆盖语义检索、结构化表检索、图检索的全栈解决方案。 本文将为你深度解析优图实验室RAG技术的架构设计与创新实践:从多阶段训练的2B级Embedding模型、Reranker分层蒸馏,到结构化表的智能解析与查询,再到自研GraphRAG框架在构图效率与复杂推理上的突破。
9/12/2025 3:50:54 PM
优图RAG技术
牛津&SH AI lab万字综述:Agentic RL——下一代企业级AI智能体的终极路线图
大家好,我是肆〇柒。 今天我们一起看一篇综述,这是来自牛津大学、上海人工智能实验室、新加坡国立大学等全球顶尖机构联合发布的前沿综述——《The Landscape of Agentic Reinforcement Learning for LLMs: A Survey》。 这篇论文系统性地梳理了如何通过强化学习,将大语言模型从被动的文本生成器,重塑为主动的、能解决复杂现实问题的决策智能体。
9/12/2025 3:47:50 PM
肆零柒
AI实战:一键生成数字人视频!
做自媒体行业的同学都知道,制作一条可发布的视频成本是很高的,通常我们需要先录制原始视频,而录制原始视频的时间通常是发布视频时长的 3-5 倍,之后还需要花费很长的时间剪辑,最终才能制作一条可发布的视频,相当费时费力。 但是,技术发展到今天,我们可以使用数字人来自动生成视频。 这样每天就能简单且高效的产出 N 条视频了,而且无需修剪、也不用担心出错,这样就大大减低了视频制作的成本,提高了工作效率。
9/12/2025 2:39:00 PM
磊哥
为什么数智化企业最需要的是“π型”复合人才?
在当前充满不确定性的数智化浪潮和日益复杂的经济环境中,企业与个人都面临着前所未有的生存与发展考验。 在“数字中国”战略下,数据成为核心生产要素,人工智能(AI)成为新兴数智化技术的代表,AI、大数据等技术已不再是单纯的工具,而是驱动商业模式变革的核心力量,这种技术范式的大变革,使得企业对人才的价值要求空前提高,迫使我们不得不重新审视传统的人才培养模式。 1、数智化浪潮下的人才抉择在这场数智化浪潮变革中,最明显的改变莫过于人工智能的快速发展,而人工智能带来的“知识平权”效应,正像双刃剑一样深刻地重塑着人才的价值逻辑。
9/12/2025 2:24:26 PM
重塑药物研发,哈佛医学院等开源全新AI模型,用「图神经网络」破解疾病驱动因素多元难题
编辑丨coisini复杂疾病的诱发因素往往是多元的,而传统的药物发现方法侧重于激活或抑制单一蛋白质。 当疾病由多种信号通路和基因相互作用推动时,这种药物发现模式可能就不够用了。 最近,来自哈佛医学院、帝国理工学院等的研究团队设计出一种名为 PDGrapher 的人工智能模型,将重点放在疾病的多种驱动因素上,并识别最有可能使病变细胞恢复健康功能的基因。
9/12/2025 2:21:00 PM
ScienceAI
狠人研究公开!ChatGPT底层记忆系统终于被逆向了!没有RAG!用户设备信息、使用习惯统统存下来,用户知识记忆是新的研究热点!
编辑 | 云昭ChatGPT 的记忆系统为什么做得如此有魔性? 现在终于有人研究出来了! 前天,小编刷到了一篇狠人逆向研究 ChatGPT 底层记忆架构的文章,非常精彩。
9/12/2025 1:32:48 PM
云昭
一夜刷屏!27岁姚顺雨离职OpenAI,清华姚班天才转型做产品经理?
姚顺雨昨天被传加入腾讯,今早「第37手」和腾讯旗下的「鹅厂黑板报」正式辟谣! 为什么姚顺雨能引起行业如此大的关注? 为什么会传出来一亿人民币的天价薪酬传闻?
9/12/2025 1:00:05 PM
刚刚,谷歌发布71页AI科研报告!6大领域全面超越专家,几小时顶几个月
在最新一篇长达71页的论文里,谷歌给科研界丢下了一颗重磅炸弹。 过去一年,DeepMind的FunSearch已经展示了AI在数学发现中的潜力,MIT等团队也提出了AI co-scientist的概念。 但与这些探索相比,谷歌这次的系统走得更远:它不仅能提出新方法、验证实验结果,还在多个领域超越了顶尖专家。
9/12/2025 11:02:36 AM
刚刚,字节登顶世界最强图像AI!一手实测原生4K、10图融合,全网玩疯
谷歌Nano Banana一夜爆火之后,各种邪修玩法儿,至今让全网意犹未尽。 等距视角、多图合成、老照片修复、3D手办.......创意脑洞大开,全网玩疯。 谁曾想,短短半个月后,大洋彼岸就杀出来了一个最强逆袭者!
9/12/2025 11:00:09 AM
全新MoE架构!阿里开源Qwen3-Next,训练成本直降九成
大语言模型(LLM),正在进入 Next Level。 周五凌晨,阿里通义团队正式发布、开源了下一代基础模型架构 Qwen3-Next。 总参数 80B 的模型仅激活 3B ,性能就可媲美千问 3 旗舰版 235B 模型,也超越了 Gemini-2.5-Flash-Thinking,实现了模型计算效率的重大突破。
9/12/2025 10:02:21 AM
文心X1.1事实性暴涨35%25!国产AI首次正面硬刚GPT-5
有朋友问我,最近AI圈有没有什么重磅消息。 我想了想,可能是百度刚发布的文心X1.1,这个模型有点不一样。 说实话,国产AI模型这几年虽然发展很快,但在核心能力上要说能正面挑战GPT这样的国际顶级模型,我一直持保留态度。
9/12/2025 9:21:58 AM
阿丸笔记
超越90%城市规划师!清华、MIT等提出人机协作新范式 | Nature子刊
面对日益复杂的城市系统和多元化的社会需求,传统城市规划方法正遭遇瓶颈。 如今,人工智能(AI)正为这个古老而重要的领域带来颠覆性的革新。 近日,由清华大学电子工程系城市科学与计算研究中心、建筑学院与麻省理工学院(MIT)感知城市实验室、美国东北大学等顶尖机构的学者组成的跨学科团队,在国际前沿期刊《自然·计算科学》上发表观点文章,首次系统性地提出了一个由大语言模型(LLM)驱动的智能城市规划框架。
9/12/2025 9:12:00 AM
ChatGPT支持MCP了!一句Prompt即可全自动化
ChatGPT终于加上了众望所归的MCP支持! 今天,OpenAI正式官宣ChatGPT的MCP功能上线。 目前仅Plus和Pro用户可用。
9/12/2025 9:12:00 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
智能体
马斯克
AI新词
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
大语言模型
华为
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
深度学习
AGI
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
DeepMind
亚马逊
特斯拉
编程
AI模型