AI在线 AI在线

AI

幻觉成了AI的“癌症”,连OpenAI也治不了

学生参加考试,当他不知道题目的答案时,可能会猜测。 实际上,AI聊天机器人也一样。 AI给出的答案可能看起来正确,实际却是完全错误的,这就是所谓的“幻觉”。
9/11/2025 1:00:00 AM
小刀

首个Data Agent基准测试来了!2007个测试任务将数据库、PDF、视频、音频异构数据源一网打尽

数据智能体到底好不好用? 测评一下就知道了! 南洋理工大学、新加坡国立大学携手华为开源推出首个专门针对数据智能体(Data Agents)异构混合数据分析的综合性基准测试FDABench。
9/10/2025 6:03:16 PM

快慢思考不用二选一!华为开源7B模型实现自由切,精度不变思维链减近50%

国产自研开源模型,让模型不用在快思考和慢思考间二选一了! 华为最新发布openPangu-Embedded-7B-v1.1,参数只有7B,却身怀双重“思维引擎”。 要知道,长期以来,大模型快思考与慢思考模式不可兼得,这成为业界的一大痛点。
9/10/2025 6:01:33 PM

甲骨文公司股价飙升 27%,人工智能未来收入大幅增长

甲骨文公司(Oracle)日前公布了其云基础设施部门未来人工智能业务的订单量大幅增长,这一消息推动该公司股票在盘后交易中上涨了27%,创下历史新高。 该公司报告称,未完成的业绩承诺 —— 即已签订但尚未实现的收入 —— 激增至4550亿美元,远高于三个月前的1380亿美元。 图源备注:图片由AI生成,图片授权服务商Midjourney甲骨文的首席执行官萨夫拉・卡茨(Safra Catz)形容这是一个 “惊人的季度”,并表示公司在最新的三个月内与三家不同客户签署了四份数十亿美元的合同。
9/10/2025 11:55:59 AM
AI在线

英伟达新GPU,超长上下文/视频生成专用

老黄对token密集型任务下手了。 刚刚,在AI Infra Summit上,英伟达宣布推出专为处理百万token级别的代码生成和生成式视频应用的全新GPU——NVIDIA Rubin CPX GPU。 老黄表示:Rubin CPX是首款为超大上下文AI量身定制的CUDA GPU,可以让模型“一口气”推理数百万token。
9/10/2025 9:38:56 AM

Claude用户退订潮!被指高峰期偷换缩水模型,工程师列9大罪状呼吁全网退订

Claude出现大危机,不是因为最近的某些骚操作,而是产品本身就出了问题。 已经有AI工程师带头呼吁大家退订(这里PoS指Piece of Shit,也就是一坨)。 点赞者就2000多,用实际行动退订的也不少。
9/10/2025 9:37:39 AM

腾讯开源混元Image 2.1:2K高清+完美文字嵌入,图文天花板来了

今天凌晨,腾讯开源最新图像模型混元Image 2.1。 混元Image 2.1支持原生2K分辨率图像和1000 token的超长篇复杂提示词,并且在文本语义理解和文字嵌入方面非常强几乎完美,能将中英文无缝写入到图像中,很适用于产品封面、插画、海报设计等专业场景此外,腾讯还开源了基于MeanFlow的加速版模型权重,该版本可将推理步数从100步大幅缩减至仅8步,以及业内首个工业级提示词改写模型 PromptEnhancer,能对提示词进行优化,帮助用户生成更细腻、富有表现力的图像。 开源地址: 2.1Github: 2.1?tab=readme-ov-file在线体验: 2.1案例目前,混元Image 2.1已经可以使用,下面给大家展示一下它的生成效果。
9/10/2025 9:35:14 AM

苹果发布会:耳机测心率、手表听音乐、iPhone Air超级薄

北京时间 9 月 10 日凌晨 1 点,伴随着 Tim Cook 的一声「Good Morning」,这场主题为「Awe Dropping」的 2025 苹果秋季新品发布会正式拉开帷幕。 发布会持续 75 分钟,AirPods、Apple Watch 和 iPhone17 系列轮番上阵,其中印象最深刻的卖点就是:耳机测心率、手表听音乐、iPhone Air 超级薄。 😂今年的 iPhone 17 系列总共分为四款机型,价格如下:iPhone 17 起售价 799 美元 / 5999 元;iPhone Air 起售价 999 美元 / 7999 元;iPhone 17 Pro 起售价 1,099 美元 / 8999 元;Pro Max 起售价 1,199 美元 / 9999 元;Pro Max 首次可选配高达 2TB 的存储空间,售价 1,999 美元 / 17999元。
9/10/2025 9:21:12 AM

阿里重磅杀入AI编程!Qoder十分钟造电商网站,程序员要失业了?

最近有个感觉特别强烈:AI编程这个赛道,突然变得不太一样了。 最近,阿里巴巴突然重磅杀入,直接发布了一个叫Qoder的AI编程平台。 我特意去体验了一下,结果有点被震撼到了。
9/10/2025 9:14:07 AM
阿丸笔记

=COPILOT()函数横空出世!AI自动写公式效率起飞,网友:让Excel再次伟大

Excel史诗级更新! 今天,微软官宣引入全新的=COPILOT()函数,AI直接可以在表格中分析、生成内容,以及头脑风暴。 图片假设汇总一个主要的「机场代码」,直接在Excel中,用自然语言明确需求。
9/10/2025 9:08:04 AM
新智元

Transformer作者:DeepSeek才有搞头,OpenAI指望不上了

“闭源人工智能在阻碍我们探索真正的科学。 ”说这句话的不是别人,是大名鼎鼎的Transformer发明者——Ashish Vaswani。 大佬之所以这么说,是因为他觉得OpenAI等闭源厂商被商业化冲昏了头脑,没心思做基础研究。
9/10/2025 9:08:00 AM

动动念头就能操作手机!MIT意念控制设备,不动嘴不动手,“读心”准确率92%

不动嘴不动手,只靠意念就能对手机发号施令? 请看VCR:两个人语言不通,现在也可通过意念说话,然后直接翻译成对方的语言,并通过骨传导耳机输出。 MIT初创团队推出了一款非侵入式穿戴设备,能够让人类实现用意念“说话”。
9/10/2025 9:06:00 AM

AlphaGo作者领衔,8个机械臂协同干活0碰撞,DeepMind新作登Science子刊

一群机械臂手忙脚乱地自己干活,彼此配合、互不碰撞。 科幻大片场景真的走入现实了。 优雅,实在是优雅。
9/10/2025 9:00:00 AM

人类秒懂,AI崩溃:一个简单测试,就让GPT-5、Gemini等顶级模型集体“翻车”

人类一眼就能看懂的文字,AI居然全军覆没。 来自A*STAR、NUS、NTU、清华、南开等机构的研究团队,最近有个新发现:不管是OpenAI的GPT-5、GPT-4o,还是谷歌Gemini、Anthropic Claude,甚至国内的Qwen、LLaVA,在面对一些“看得见但读不懂”的文字时,全都表现极差,直接“翻车”。 先切再叠,AI束手无策VYU团队设计了两个小实验:1、选取了100条四字成语,把每个汉字横切、竖切、斜切,再把碎片重新拼接。
9/10/2025 8:31:00 AM

智能体将重塑商业未来格局

商业世界正站在一场深刻变革的门槛上,而推动这场变革的正是智能体的出现与普及。 我之前已经分析过,这一代能够自主解决问题的AI将如何改变工作方式并重塑大量岗位。 许多人认为,它们的颠覆性影响将远不止于此,而是会从根本上重塑组织的运作方式、创新路径与增长模式。
9/10/2025 7:07:00 AM
Bernard Marr

AI泡沫为何反而有利于企业?

最近有关“AI泡沫”的讨论此起彼伏,AI行业的内部人士纷纷辩解称“并不存在泡沫”,但事实是,泡沫确实已经出现,而且它对企业反而可能是利好。 8月中旬,OpenAI的CEO Sam Altman表示,尽管AI极其重要,但当前的投资热潮被严重高估,“总有人会在投资狂潮中受伤”。 大约一周后,MIT发布《The GenAI Divide: State of AI in Business 2025》报告,指出95%的企业GenAI试点项目未能带来可量化的回报。
9/10/2025 7:00:00 AM
Nicholas

AI IDE 的关键分野:Spec、模式、云端与模型选择

AI IDE 的发展已进入分水岭阶段。 产品之间的差异不再仅限于配色或操作体验,而是体现在规格驱动、模式设计、云端联动、模型选择与价格策略等深层次维度。 本文将对 Cursor、Kiro、Qoder、TRAE 及 VS Code 等代表性产品进行结构化分析,并结合行业趋势,探讨“氛围编程”如何迈向工程落地。
9/10/2025 2:11:00 AM
Jimmy Song

超大规模 AI 基础设施建设实践,极致释放算力效能

大家下午好,今天我将基于百度智能云在基础设施等方面的技术能力,以混合云的业务实践为案例,向大家描述我们在建设诸如 3.2 万卡全国产智算集群这样的超大规模集群时,都面临了哪些挑战,以及在此期间我们做了怎样的探索,去解决这些问题。 在过去几年,随着国家大力推进智算中心高质量发展,我国的智能算力实现跨越式增长,从百卡、千卡,向万卡、十万卡规模扩展。 在这个进程中要具备两方面能力:一方面如何把大规模算力建好,另一方面在建好的同时如何使这些算力得到有效使用、极致发挥。
9/10/2025 2:11:00 AM