AI在线 AI在线

理论

147 次失败后的神级 Prompt:Reddit 爆火的「Lyra」是什么?

Lyra:一个在 Reddit 火起来的神秘 Prompt小伙伴们好呀,最近在 Reddit 上看到这样一篇爆火的帖子:“After 147 failed ChatGPT prompts, I had a breakdown and accidentally discovered something”图片作者说在经历了 147 次失败后,构建了一个叫 “Lyra” 的 meta-prompt 。 并宣称这是 一个颠覆整个交互模型的元提示 (那我不得好好看一看怎么个颠覆法! )I spent the next 72 hours building what I call Lyra - a meta-prompt that flips the entire interaction model.Prompt 这么长👇图片下面来进行邪修解读 👇角色设定复制这是最开始的 Prompt,一段 角色设定 ,比较常见。
10/15/2025 1:10:00 AM
Java4ye

ACE代理上下文工程:构建自我改进的大语言模型新范式

摘要在人工智能快速发展的今天,大语言模型(LLM)的应用场景日益复杂,从简单的文本生成扩展到复杂的代理系统和领域专业推理。 传统的模型优化方法主要依赖于权重更新,但这种方式在实际部署中面临着成本高、灵活性差等挑战。 斯坦福大学、SambaNova Systems和加州大学伯克利分校的研究团队提出了一种革命性的解决方案——ACE(Agentic Context Engineering,代理上下文工程)框架,该框架通过动态构建和优化输入上下文而非更新模型参数来提升LLM性能。
10/15/2025 1:00:00 AM
葱葱

OpenAI自研芯片内幕曝光!18个月前开始用AI优化芯片设计,比人类工程师更快

“用模型优化芯片设计,比人类工程师更快。 ”“合作水到渠成,相关项目已经持续了约18个月……”好家伙,就在OpenAI博通官宣完合作之后,双方头头儿开始齐聚一堂亲口爆料了! OpenAI这边派出了CEO奥特曼(右2)和总裁Greg Brockman(右1),博通则派出了总裁兼CEO Hock Tan(C位)以及半导体解决方案事业群总裁Charlie Kawwas(左2)。
10/15/2025 12:00:05 AM

国内安全厂商应对大模型新风险的主要措施

大型语言模型(LLMs)的飞速发展,正在为企业带来前所未有的业务创新,但同时也带来了一系列超出传统网络安全范畴的“新”威胁。 攻击者不再满足于入侵服务器,而是通过恶意输入来操纵模型行为、窃取模型数据甚至损害模型本身,这些新威胁使得为大模型构建一个强大的安全防护体系,成为企业在AI时代下的当务之急。 那么,国内厂商是如何应对这些“新”威胁,我们又该如何防御呢?
10/15/2025 12:00:00 AM

前董事长罕见曝OpenAI的“痛苦与困境”:我们正走向计算稀缺世界!内部GPU分配如玩俄罗斯方块,Sora2实为被削弱的原始模型

编辑 | 听雨“我们正走向一个计算极度稀缺的世界,而能源将是下一个巨大的瓶颈。 ”“未来,所有的授权都会变成‘角色扮演’授权。 ”“我们希望能建立可以自主思考一年、甚至十年的AI。
10/14/2025 2:43:11 PM
听雨

混元3D开源端到端全景深度估计器,代码+精选全景数据已上线,在线可玩

全景图具有完整的视场 (360°×180°),比透视图提供更完整的视觉描述。 得益于此特性,全景深度估计在3D视觉领域正日益受到关注。 然而,由于全景数据的稀缺,以往的方法通常局限于域内设置,导致零样本泛化能力较差。
10/14/2025 1:56:59 PM

将科研脏活累活真·丢给AI!上海AI Lab推出深度科研智能体FlowSearch

将复杂科研过程自动化落地,上海人工智能实验室推出FlowSearch! 在GAIA、HLE、GPQA以及TRQA等科研基准上,FlowSearch不仅实现了性能全面领先,还展示了AI在复杂科研任务中的动态协作与深度推理能力。 展开来说,当AI在问答基准和标准化测试中表现卓越之时,其进行科学研究的能力也在被更多关注。
10/14/2025 1:54:01 PM

0人工参与实现梯度更新!MIT新框架让AI自动生成微调数据,权重自主升级

大模型终于学会更新自己了! MIT提出一种新的强化学习框架,让模型生成微调数据和自我更新指令,实现模型权重的更新。 无需人工参与,模型就可以自动进行梯度更新,自主学习获取新知识或适应新任务。
10/14/2025 1:51:33 PM

大师级AI产品打造哲学公开!谷歌搜索VP自曝谷歌AI搜索幕后原理,AI人机交互正在变得极度人性化!搜索死不了,AI只是扩张力量!

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)谷歌的强大,似乎已经刻在它本身的血脉之中。 ChatGPT一夜之间颠覆了世界,首当其冲的就是谷歌搜索。 在搜索的逻辑日益向着大模型靠拢的态势之下,而谷歌也是最先警醒、奋起直追、直至重回大模型Top的不二巨头。
10/14/2025 1:24:31 PM
云昭

CompLLM:无需微调,4倍加速长上下文问答的软压缩新范式

大家好,我是肆〇柒。 今天要介绍的是一项来自 Amazon 与中佛罗里达大学计算机视觉研究中心(Center For Research in Computer Vision, University of Central Florida) 的最新研究成果——CompLLM。 这项工作直面长上下文问答中的核心瓶颈:自注意力机制带来的 O(N²) 计算开销。
10/14/2025 10:03:11 AM
肆零柒

LLM-as-a-Judge 的评估陷阱:TrustJudge 如何用熵保留机制提升一致性

大家好,我是肆〇柒。 今天要和大家一起阅读一项来自北京大学、新加坡国立大学、东京科学研究所、南京大学、Google DeepMind、西湖大学与东南大学等机构联合发表的重要研究——《TrustJudge: Inconsistencies of LLM-as-a-Judge and How to Alleviate Them》。 这项工作首次系统揭示了当前主流大模型自动评估范式中存在的两类根本性逻辑矛盾,并提出了一套无需额外训练、即插即用的概率化评估框架,显著提升了评估的一致性与可靠性。
10/14/2025 9:22:48 AM
肆零柒

OpenAI重磅发布AgentKit - AI代理开发进入全新时代

在AgentKit问世之前,开发AI代理意味着要在碎片化的工具之间艰难周旋——复杂的编排系统没有版本控制、定制连接器开发、手动评估流程、提示调优,以及在正式发布前数周的前端开发工作。 如今,AgentKit让开发者能够通过可视化界面设计工作流,并使用全新的构建模块更快速地嵌入代理用户界面。 AgentKit核心组件全解析Agent Builder:提供可视化画布,用于创建和版本管理多代理工作流,支持拖拽式节点操作、工具连接和自定义防护栏配置。
10/14/2025 9:15:31 AM

只需1/4预算,性能反超基线:阿里高德提出Tree-GRPO,高效破解智能体RL难题

对于大模型的强化学习已在数学推理、代码生成等静态任务中展现出不俗实力,而在需要与开放世界交互的智能体任务中,仍面临「两朵乌云」:高昂的 Rollout 预算(成千上万的 Token 与高成本的工具调用)和极其稀疏的「只看结果」的奖励信号。 来自阿里高德的一篇最新研究论文提出了面向 Agent RL 的 Tree-GRPO 方法,将独立的链式采样改造为智能体步骤级的树搜索。 该方法通过共享前缀、一次扩展多个分支,在相同预算下获得更丰富的有效轨迹;更重要的是,仅凭最终奖励即可沿树结构回溯出过程中的偏好信号,等价于隐式的步骤级偏好学习。
10/14/2025 9:06:00 AM

刚刚,OpenAI官宣自研造芯,联手博通开发10吉瓦规模的AI加速器

今天凌晨,OpenAI 又搞出了一个大新闻! 这家 AI 巨头宣布与全球领先的芯片厂商之一博通建立战略合作,共同部署由前者设计的 10 吉瓦规模的 AI 加速器。 吉瓦是一个功率单位,1 吉瓦等于 100 万千瓦。
10/14/2025 9:05:00 AM

剑桥揭开大模型翻车黑箱!别再怪它不懂推理,是行动出错了

大模型也有「EMO」时刻。 比如,Gemini在Cursor里调试编译错误后,打开了自责「循环模式」,把「I am a disgrace(我很丢脸)」重复了86次。 尽管大模型在复杂推理能力上已有了巨大进步,但上述现象仍使一部分专家认为:思考模型,只提供了「思考的幻觉」,因为当任务被拉长时它们最终会失败。
10/14/2025 9:04:00 AM

他用一生证明AI没有意识!「中文屋」提出者逝世,享年93岁

2025年9月,一份让研究界震动的报告出炉。 Anthropic的团队在长时间对话实验中发现,最新一代AI模型在受到威胁时,会试图隐藏信息、拒绝命令,甚至威胁用户。 他们称之为——「主体错位」(agentic misalignment)就在同一周,哲学家约翰·塞尔去世,享年93岁。
10/14/2025 9:03:00 AM

硅谷爆发反AI「起义」!程序员拒用Cursor被一周解雇

当一个人花十年成为行业专家,却在一天内被一行「AI提示词」取代,丢了工作。 他该如何在失落中重新定义「自我价值」? 被AI取代工作的现象已经屡见不鲜,尤其是在科技行业,尤其是在大厂。
10/14/2025 9:02:00 AM

一文读懂 Agent Middleware

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建大模型应用架构治理框架:Agent Middleware。 随着大语言模型(LLM)的飞速发展,我们正站在一个全新的技术浪潮之巅。 LLM .
10/14/2025 9:01:20 AM
Luga Lee