AI在线 AI在线

人工智能

​AI 协作显神威!斯坦福研究揭示医疗诊断准确率提高 10%

最近,斯坦福大学的研究团队进行了一项有趣的实验,探讨了人工智能(AI)在医学诊断中的作用。 他们发现,当 AI 从一个简单的工具变成医生的合作伙伴时,医生的诊断准确率竟然提升了10%。 该研究涉及70名美国执业医生,旨在比较 AI 与传统诊断方法的效果。
6/16/2025 10:09:58 AM
AI在线

苹果利用AI标签提升App Store可发现性,iOS26开发者测试版已上线

苹果公司正计划通过引入人工智能标记技术,显著提升App Store的应用程序可发现性。 这项创新功能已随iOS26的开发者测试版发布,旨在更精准地分类和呈现应用程序。 尽管这些AI生成的标签尚未在面向公众的App Store中显示,也未影响当前的搜索算法,但其上线预示着App Store搜索排名机制的重大变革。
6/16/2025 10:09:57 AM
AI在线

迈向人工智能的认识论:涌现能力和思路链的忠实性

一、涌现能力:真实现象还是测量幻象过去几年中一个有趣的观察是,随着我们扩大模型规模(在参数和训练数据方面),它们开始展现出较小模型所不具备的全新定性能力。 Wei 等人(2022 年)将这些能力称为涌现能力,并将这种能力定义为“如果某种能力在较小模型中不存在,但在较大模型中存在,则为涌现能力”,以至于“不能简单地通过推断较小模型的性能来预测它”。 换句话说,这种技能不是平稳的改进,而是在模型超过某个规模阈值后突然出现。
6/16/2025 9:28:09 AM
晓晓

脑机接口技术迎来重大突破:可使渐冻症患者重新流畅说话、唱歌

脑机接口技术迎来一项重大突破:加州大学戴维斯分校研发的新型植入系统,让一位瘫痪患者不仅能顺畅说话,甚至还能借助电脑“哼唱”旋律,几乎没有任何延迟。
6/16/2025 7:56:19 AM
清源

AI 改写流量逻辑:谷歌搜索地位动摇,导致依赖其服务的网站访问量骤减

过去的企业主要通过谷歌搜索引流,如今越来越多用户则转向 ChatGPT、Perplexity 等 AI 平台获取答案,不再需要点击链接或访问网站。
6/16/2025 7:46:07 AM
清源

麻省理工开发 AI 修复新技术:三个半小时“复活”15 世纪油画

借助这项新方法,原本可能需时数月甚至数年的修复工作,现在只需几个小时即可完成。
6/16/2025 7:25:42 AM
清源

迈向人工智能的认识论:真的没有人真正了解大型语言模型 (LLM) 的黑箱运作方式吗

如果大型语言模型能够推理,但没有人能够看到它是如何推理的,那么它真的在思考吗? 简而言之,像 GPT-4 这样的大型语言模型 (LLM) 展现出卓越的能力,但其运作方式却如同“黑匣子”,这意味着它们的内部决策过程在很大程度上是不透明的,甚至对其创建者而言也是如此。 本系列文章综合了近期关于 LLM 可解释性的研究,重点关注这些模型的推理方式、其解释的可靠性(思维链)以及对安全性和部署的影响。
6/16/2025 2:30:00 AM
晓晓

Text2SQL案例演示:信贷风控策略场景(Coze工作流版)

半个月前,知识星球中有个关于 text2sql 的讨论,后续又陆续有成员私信沟通。 这篇节取了个目前手头项目的 MVP (最小可行化)版本,来和各位做个分享交流,也希望听到来自不同场景的最佳实践。 这篇试图说清楚:信贷风控策略迭代场景的标准流程、Text2SQL 三类技术方案,MVP 版本的 Coze text2sql 工作流,以及对人机协同的一些碎片思考。
6/16/2025 2:00:00 AM
韦东东

纽约州通过 AI 安全强制披露法案:旨在防范重大人员伤亡或财产损失事故

该法案名为 RAISE 法案,标志着 AI 安全阵营的一次胜利,更有杰弗里·辛顿和约书亚·本吉奥等重量级学者为法案背书。若最终成为法律,RAISE 将开创全美首部强制前沿 AI 实验室公开信息的法规。
6/14/2025 10:36:16 AM
清源

挑战英伟达主导地位,AMD 联手多家 AI 初创公司改进芯片及软件设计

随着越来越多的AI企业寻求英伟达芯片的替代方案,AMD 开始扩大布局,计划打造竞争力更强的硬件,并收购了服务器制造商 ZT Systems。
6/14/2025 8:52:59 AM
清源

腾讯开源混元 3D 2.1 大模型:首个全链路开源工业级 3D 生成大模型,PC 也能“跑”

新模型使网格精度更高,具备更好的拓扑一致性,为后续纹理映射提供了基础;还可生成基础颜色、金属度、法线、粗糙度等贴图,支持皮革、木质、金属、陶瓷等的高质量渲染。
6/14/2025 7:04:07 AM
清源

腾讯元宝“高考志愿咨询”功能上线:可提供专属深度建议

用户在元宝手机端、电脑版、网页版升级到最新版本,选择任意模型,开启深度思考,提问志愿填报相关问题,元宝会自动触发深度搜索,提交专属深度建议。
6/13/2025 10:36:15 AM
清源

驯服AI幻觉:通过人在循环(HITL)测试减轻AI应用中的幻觉

译者 | 晶颜审校 | 重楼引言人工智能展现出的“自信表达”,实则暗藏风险。 随着生成式人工智能解决方案在医疗、金融、法律、零售、教育等诸多领域广泛应用,自动化的强大吸引力令企业纷纷加速将大型语言模型整合至客户支持、医疗保健、法律及金融等应用场景之中。 然而,在此过程中,一个潜在的隐患——人工智能幻觉问题,正悄然潜伏于每一次指令交互背后。
6/13/2025 8:06:41 AM
晶颜

2025上半年大模型领域盘点:创新与争议交织前行

随着大模型的快速迭代,该技术不仅成为了驱动科技发展的重要动力,同时也是推动社会各领域智能化转型的关键力量。 2025年上半年,大模型领域迎来了快速发展与变革。 从DeepSeek发布其推理大模型R1,到百度宣布大模型开源,再到多家厂商纷纷推出大模型一体机,这些事件共同推动了大模型技术在硬件解决方案上的显著进步。
6/13/2025 3:30:00 AM
Yu

当人工智能推理遭遇瓶颈:大型推理模型的崩溃

最近,我们听说人工智能已经学会了思考。 OpenAI 的 o1 系列、DeepSeek 的 R1、Claude 的思维模型——这些“大型推理模型”声势浩大地问世,有望在机器解决复杂问题方面取得突破。 与之前那些仅仅通过模式匹配完成任务的模型不同,这些系统显然能够进行“真正的”推理,甚至拥有与人类思维相符的内心独白。
6/13/2025 1:00:00 AM

谷歌首次增设“首席 AI 架构师”职位,大力加码人工智能战略

谷歌近年来持续整合 DeepMind 与公司整体架构,并试图将其AI技术商业化。不过,尽管行业内技术快速演进,AI仍未为多数公司带来显著回报。与此同时,资本支出却持续攀升。
6/12/2025 11:56:33 AM
清源

免费GPU算力部署DeepSeek-R1 32B

前言DeepSeek-R1发布最新版本DeepSeek-R1-0528,显著提升了模型的思维深度与推理能力,在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。 另外,API接口还增加了Function Calling和JsonOutput 的支持。 DeepSeek-R1团队已经证明,大模型的推理模式可以蒸馏到小模型中,与通过强化学习在小模型上发现的推理模式相比,性能更优。
6/12/2025 9:48:27 AM

刚刚,LeCun亲自出镜,Meta推出新世界模型!

最近,Meta 大动作不断。 前些天有外媒曝出马克・扎克伯格正在组建一个名为「超级智能团队」的专家团队,以实现通用人工智能。 随后开出 9 位数的薪酬为该团队吸纳人才。
6/12/2025 9:37:30 AM
机器之心