理论
数十亿人将用上免费AGI!OpenAI奥特曼高调断言:全球经济将迎来极度通缩!效率强如DeepSeek,全球AI也需百吉瓦能源!
编辑 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto)奥特曼最新判断来了:未来会有数十亿人使用免费的 AGI! 不只是价格更低,而是以一种前所未有的方式,大规模普及到全球每一个角落。 同时,他认为,AI 所带来的巨大技术红利,将推动全球经济进入极度通缩的状态。
当人工智能「看见」量子世界:AI如何改变对复杂量子系统的认知,南洋理工、上交等发布量子系统学习综述
作者 | 论文团队编辑 | ScienceAI在量子科学中,复杂性往往增长得出乎意料。 一个经典比特只能是 0 或 1,而 50 个量子比特的状态,就需要超过一千万亿个复数来完整描述,这个规模远远超过任何超级计算机的存储能力。 随着实验室里量子设备的不断扩展,科学家们逐渐面临一个悖论:我们能够制造越来越大的量子系统,却常常无法用传统方法去全面理解它们。
TextIn vs. DeepDoc性能测评:RAGFlow解析升级完整教程(附二开代码)
两个月前在星球的会员群中,有人推荐了TextIn这款解析工具。 我当时也是第一次听说,最近一段时间陆续在手头项目上测试了些以往认为是 Corner Case 的复杂布局文档后,发现居然都有不错的表现。 后续了解到TextIn背后的公司叫合合信息,看起来还是有点陌生,不过这家公司旗下另外一款叫做“扫描全能王”的产品各位应该听说过或者用过。
VLDB2025 | Magnus: 字节跳动面向大规模机器学习的数据管理方案
导读机器学习广泛应用于字节跳动,数据作为机器学习训练的核心要素,如何高效灵活的管理支撑大规模训练数据的存储、生产以及训练,成为数据基础设施的一大挑战;近两年大模型迅猛发展,对数据集管理也提出了更多新的场景需求。 字节跳动在开源 Apache Iceberg 的基础上,打造了一套面向大规模机器学习的数据管理解决方案 Magnus,在存储格式、索引、元数据管理、更新机制、训练框架集成等多个维度实现优化。 Magnus 已在字节内部部署超过五年,在搜索、广告、推荐、大模型等核心业务中大规模落地,数据规模超5EB,相关成果已被 VLDB 2025收录。
英伟达新GPU,超长上下文/视频生成专用
老黄对token密集型任务下手了。 刚刚,在AI Infra Summit上,英伟达宣布推出专为处理百万token级别的代码生成和生成式视频应用的全新GPU——NVIDIA Rubin CPX GPU。 老黄表示:Rubin CPX是首款为超大上下文AI量身定制的CUDA GPU,可以让模型“一口气”推理数百万token。
Claude用户退订潮!被指高峰期偷换缩水模型,工程师列9大罪状呼吁全网退订
Claude出现大危机,不是因为最近的某些骚操作,而是产品本身就出了问题。 已经有AI工程师带头呼吁大家退订(这里PoS指Piece of Shit,也就是一坨)。 点赞者就2000多,用实际行动退订的也不少。
腾讯开源混元Image 2.1:2K高清+完美文字嵌入,图文天花板来了
今天凌晨,腾讯开源最新图像模型混元Image 2.1。 混元Image 2.1支持原生2K分辨率图像和1000 token的超长篇复杂提示词,并且在文本语义理解和文字嵌入方面非常强几乎完美,能将中英文无缝写入到图像中,很适用于产品封面、插画、海报设计等专业场景此外,腾讯还开源了基于MeanFlow的加速版模型权重,该版本可将推理步数从100步大幅缩减至仅8步,以及业内首个工业级提示词改写模型 PromptEnhancer,能对提示词进行优化,帮助用户生成更细腻、富有表现力的图像。 开源地址: 2.1Github: 2.1?tab=readme-ov-file在线体验: 2.1案例目前,混元Image 2.1已经可以使用,下面给大家展示一下它的生成效果。
苹果发布会:耳机测心率、手表听音乐、iPhone Air超级薄
北京时间 9 月 10 日凌晨 1 点,伴随着 Tim Cook 的一声「Good Morning」,这场主题为「Awe Dropping」的 2025 苹果秋季新品发布会正式拉开帷幕。 发布会持续 75 分钟,AirPods、Apple Watch 和 iPhone17 系列轮番上阵,其中印象最深刻的卖点就是:耳机测心率、手表听音乐、iPhone Air 超级薄。 😂今年的 iPhone 17 系列总共分为四款机型,价格如下:iPhone 17 起售价 799 美元 / 5999 元;iPhone Air 起售价 999 美元 / 7999 元;iPhone 17 Pro 起售价 1,099 美元 / 8999 元;Pro Max 起售价 1,199 美元 / 9999 元;Pro Max 首次可选配高达 2TB 的存储空间,售价 1,999 美元 / 17999元。
阿里重磅杀入AI编程!Qoder十分钟造电商网站,程序员要失业了?
最近有个感觉特别强烈:AI编程这个赛道,突然变得不太一样了。 最近,阿里巴巴突然重磅杀入,直接发布了一个叫Qoder的AI编程平台。 我特意去体验了一下,结果有点被震撼到了。
=COPILOT()函数横空出世!AI自动写公式效率起飞,网友:让Excel再次伟大
Excel史诗级更新! 今天,微软官宣引入全新的=COPILOT()函数,AI直接可以在表格中分析、生成内容,以及头脑风暴。 图片假设汇总一个主要的「机场代码」,直接在Excel中,用自然语言明确需求。
Transformer作者:DeepSeek才有搞头,OpenAI指望不上了
“闭源人工智能在阻碍我们探索真正的科学。 ”说这句话的不是别人,是大名鼎鼎的Transformer发明者——Ashish Vaswani。 大佬之所以这么说,是因为他觉得OpenAI等闭源厂商被商业化冲昏了头脑,没心思做基础研究。
动动念头就能操作手机!MIT意念控制设备,不动嘴不动手,“读心”准确率92%
不动嘴不动手,只靠意念就能对手机发号施令? 请看VCR:两个人语言不通,现在也可通过意念说话,然后直接翻译成对方的语言,并通过骨传导耳机输出。 MIT初创团队推出了一款非侵入式穿戴设备,能够让人类实现用意念“说话”。
AlphaGo作者领衔,8个机械臂协同干活0碰撞,DeepMind新作登Science子刊
一群机械臂手忙脚乱地自己干活,彼此配合、互不碰撞。 科幻大片场景真的走入现实了。 优雅,实在是优雅。
人类秒懂,AI崩溃:一个简单测试,就让GPT-5、Gemini等顶级模型集体“翻车”
人类一眼就能看懂的文字,AI居然全军覆没。 来自A*STAR、NUS、NTU、清华、南开等机构的研究团队,最近有个新发现:不管是OpenAI的GPT-5、GPT-4o,还是谷歌Gemini、Anthropic Claude,甚至国内的Qwen、LLaVA,在面对一些“看得见但读不懂”的文字时,全都表现极差,直接“翻车”。 先切再叠,AI束手无策VYU团队设计了两个小实验:1、选取了100条四字成语,把每个汉字横切、竖切、斜切,再把碎片重新拼接。
如何使用Gradio快速搭建AI演示
译者 | 刘涛审校 | 重楼人工智能领域呈现出高速发展的态势。 每周均有新的模型诞生,旧有模型也在持续优化,基于这些模型开发的应用工具愈发便捷易用。 然而,在构建机器学习项目的过程中,开发者可能会遭遇一个关键挑战:如何高效地分享项目成果,以供他人进行试用。
智能体将重塑商业未来格局
商业世界正站在一场深刻变革的门槛上,而推动这场变革的正是智能体的出现与普及。 我之前已经分析过,这一代能够自主解决问题的AI将如何改变工作方式并重塑大量岗位。 许多人认为,它们的颠覆性影响将远不止于此,而是会从根本上重塑组织的运作方式、创新路径与增长模式。
AI泡沫为何反而有利于企业?
最近有关“AI泡沫”的讨论此起彼伏,AI行业的内部人士纷纷辩解称“并不存在泡沫”,但事实是,泡沫确实已经出现,而且它对企业反而可能是利好。 8月中旬,OpenAI的CEO Sam Altman表示,尽管AI极其重要,但当前的投资热潮被严重高估,“总有人会在投资狂潮中受伤”。 大约一周后,MIT发布《The GenAI Divide: State of AI in Business 2025》报告,指出95%的企业GenAI试点项目未能带来可量化的回报。
OpenAI最新研究揭秘大模型为什么会有幻觉!
引言:语言模型的“幻觉”难题在人工智能飞速发展的今天,大语言模型(LLMs)如ChatGPT、DeepSeek等已经成为我们日常生活与工作的得力助手。 然而,这些模型有时会“信口开河”,生成看似合理却完全错误的回答,这种现象被学界称为“幻觉”(hallucination)。 例如,当被问及“亚当·卡莱的生日是哪天?
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉