理论
红色警报:OpenAI的Atlas浏览器,是捅向谷歌万亿心脏的匕首吗?
浏览器「第三次世界大战」打响! OpenAI向谷歌扔下一个AI核弹,谁能掌握未来互联网之门的钥匙? 一觉醒来,变天了!
10/24/2025 12:50:34 PM
新智元
李开复:美国在AI硬件赛道已败给中国!中国AI算力将是美国十倍!警告AI速度失控:先上车再修路,将酿成重大事故!
编辑 | 云昭在旧金山TED AI大会上,创新工场董事长、AI科学家李开复通过视频连线发表演讲,罕见地直言:“在AI硬件和机器人制造方面,美国正在被中国超越。 ”李表示,这一点也不夸张。 在AI硬件与机器人赛道,中国的领先正在成为事实。
10/24/2025 12:45:11 PM
云昭
一图胜千言被实现了!DeepSeek-OCR用图片压缩文本,10倍压缩率
DeepSeek开源了DeepSeek-OCR,用1张图片的信息,还原10页书的文字,10倍的压缩率,可以做到几乎不丢失信息。 视觉编码器走了不少弯路大型语言模型记性不好,或者说,能记住的东西太有限。 你给它一篇长长的文章,它的计算量呈二次方往上飙。
10/24/2025 12:19:18 PM
斯坦福与Adobe新研究,模仿蒸馏技术轻松让200亿参数图像生成高质量大模型
高质量图像生成又加速了! 斯坦福大学和 Adobe 研究院联手,用 pi-Flow(基于策略的流模型)技术,让 200 亿参数的文本到图像大模型,在 4 步之内就生成了媲美教师模型的高质量、高多样性图片。 让图像生成模型少走几步所有玩过 AI 绘画的人都有一个共同的体验,未蒸馏的原版大模型,点击生成,看着进度条一点点爬升,从一个模糊的噪声,慢慢变得清晰。
10/24/2025 12:17:22 PM
夸克AI眼镜开售,88VIP叠加9折消费券,超低价格仅需3329元
10月24日零点,阿里巴巴首款自研的夸克AI眼镜在其天猫官方店铺——夸克智能设备旗舰店上正式首发。 天猫平台的实时成交竞速榜单显示,新品上线销售后仅7个小时,便成为双11期间智能眼镜行业top2品牌。 不少消费者已经在社交媒体及粉丝群里陆续晒出购买订单。
10/24/2025 11:18:54 AM
MinerU2.5源码拆解:双后端架构设计与企业级部署实践
8月中旬的时候,我去MinerU的办公室交流过一次。 当时对方有位工作人员表示,接下来会很快基于视觉模型的路线实现全面 SOTA。 说实话,那个时候我还挺怀疑的。
10/24/2025 11:16:41 AM
韦东东
基于JoyAgent的二开工程实践(信贷尽调报告生成)
很久没更新,书稿终于写完了,后续恢复每周一到两更。 这篇来继续聊聊 Agent, 这个现在有些烂大街的概念。 我在历史文章中提到 Agent 的案例演示时,大多是围绕 Dify,介绍了些诸如设备预测性运维、多源异构数据分析等使用场景。
10/24/2025 11:12:14 AM
韦东东
人工智能的“苦涩教训”:辛顿最清醒的警告
在人工智能的历史上,杰弗里·辛顿(Geoffrey Hinton)不仅是深度学习的奠基人,更像是一个时代的镜子。 他提出的“苦涩的教训(The Bitter Lesson)”,直到今天,依然是AI研究者绕不开的一记耳光——它提醒我们,聪明的人类往往高估了自己设计“聪明系统”的能力,而低估了计算和数据的力量。 这条教训,之所以“苦涩”,是因为它击中了人类的骄傲。
10/24/2025 11:00:58 AM
AI大模型应用开发
多轮交互驱动的Text-to-SQL智能体
在大语言模型(LLM)风头正劲的当下,让普通用户用自然语言向数据库提问、自动生成 SQL 查询成为一种重要探索方向,即所谓 Text-to-SQL 技术。 尽管近年来已有不少成果,但在真实场景下,Text-to-SQL 仍存在一些挑战,尤其是在 多轮交互、宽表(很多列)查询、可解释性 等方面:用户常常不是一次性把完整问题说出来,而是一步步迭代补充、提出子问题数据库表可能列很多、关系复杂,模型在“选列”“join”“过滤条件”上容易出错模型直接给一个 SQL 字符串,往往不透明、难以调试与纠错这篇论文 “Interactive-T2S” 正是在这类痛点中切入,提出一种 交互式、多轮驱动 的 Text-to-SQL 框架,让模型在生成 SQL 的过程中向数据库“发问”、拉取信息,从而提高准确性与可解释性。 下面,我们从核心思路、方法设计、实验结果及未来展望四个层面解读。
10/24/2025 10:58:24 AM
Apache Doris 4.0 把 AI 塞进数据库了!?
“哥,Doris 4.0 把 AI 塞进数据库了! ”凌晨一点,DBA老周在群里甩出这句话,附带一张截图:一条 SQL 直接调通简历筛选,把 30 万份数据 3 秒跑完。 我盯着屏幕,咖啡差点洒键盘——这年头,连数据库都开始抢 HR 的饭碗?
10/24/2025 10:51:05 AM
大数据AI智能圈
从零实现一个17M参数的GPT预训练模型
大家好,我是写代码的中年人! 今天我们使用开源的的中文数据进行模型的预训练,下面跟着我的步骤,从零实现你的预训练模型。 本文所有代码和数据资源位置:、预训练模型的概念预训练模型(Pretrained Model)就是一个已经在海量数据上训练过的模型,它学会了语言的基本规律、结构和语义,然后可以拿来做各种下游任务,比如写作、翻译、问答、分类、生成代码等。
10/24/2025 10:41:33 AM
写代码的中年人
揭秘大模型的魔法:从零实现一个简化版的GPT 模型
大家好,我是写代码的中年人! 今天我们结合代码从零实现一个简化版 GPT 模型。 近年来,大语言模型席卷了人工智能领域,从 ChatGPT 到 LLaMA,它们以惊人的语言理解和生成能力改变了我们与机器交互的方式。
10/24/2025 10:34:55 AM
写代码的中年人
倒计时18个月!微软AI CEO爆料:类人意识AI或将降临
AI可能产生意识吗? 如果可能,大概会在什么时间? 微软AI CEO Mustafa Suleyman认为有可能诞生「看似有意识的AI」,而且最快可能在18个月内出现:未来5年很有可能,18个月内也有一定可能性。
10/24/2025 10:13:37 AM
Meta打碎Transformer 8年铁律!改写AI最底层规则,模型首次冒出潜意识
Transformer可以说整个LLM的基石,但这个基石要松动了! 8年了! 持续了8年的Transformer底层架构似乎要被Meta打破了。
10/24/2025 10:10:22 AM
"在思考中回忆,在回忆中思考":MemGen 开启 AI 记忆新范式
大家好,我是肆〇柒。 今天要和大家分享的是一项来自新加坡国立大学的突破性研究——MemGen。 这项研究由张贵斌、付沐鑫和严水城三位研究者主导,他们发现现有LLM智能体的记忆机制存在根本局限:参数化方法导致灾难性遗忘,检索式方法则难以实现记忆与推理的无缝融合。
10/24/2025 9:41:21 AM
肆零柒
田渊栋被裁后新offer排到法国!原来Llama 4.5训完后被卸磨杀驴了
硅谷真是干啥都迅猛啊! 裁员也是……量子位刚刚从Meta一线获悉,田渊栋前脚刚发了推文说自己被裁,后脚就被解除了公司内部各种权限——嘿,亚历山大王的刀,就是这么快。 这也是这次裁员中最具争议的地方,“在Meta工作已超过十年的田渊栋和他的组员,整组被一锅端了”,这是为什么?
10/24/2025 9:31:42 AM
OpenAI收购macOS供应商,剑指GPT操作系统!微软也不装了
OpenAI也是个十足的果粉……推出Mac专属浏览器还不够,他们这次可能干脆要做一套苹果专属UX。 我们已收购SAI(Software Applications Incorporated),这家公司开发了Sky——一款面向Mac的自然语言交互界面。 消息一出,网友们直呼畅快:终于有人来帮苹果收拾AI的烂摊子了。
10/24/2025 9:14:42 AM
AI是否足够的中立?宾夕法尼亚大学发现AI训练数据中的隐形偏见
Media Psychology》上的新研究发现,人工智能训练数据里的种族偏见,即便明晃晃地摆在眼前,我们大多数人也根本看不出来。 宾夕法尼亚州立大学和俄勒冈州立大学的研究人员发表了一项研究,直接戳破了我们对自身洞察力的幻想。 这项研究的核心发现:普通用户无法注意到AI训练数据中的偏见,特别是当偏见将某个种族与某种特定情绪(比如快乐或悲伤)悄悄绑定时。
10/24/2025 8:55:40 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
Copilot
视觉