资讯列表
NUS 推出 OmniConsistency:低成本实现图像风格化一致性,挑战 GPT-4o!
近日,新加坡国立大学(NUS)团队发布了一个名为 “OmniConsistency” 的创新项目,旨在以极低的成本复现 OpenAI 的 GPT-4o 模型在图像风格化上的一致性。 这项技术不仅解决了当前开源社区在图像风格化和一致性之间的矛盾,还为广大开发者提供了可行的解决方案。 近年来,图像风格化的技术不断发展,但在实际应用中,风格与内容一致性之间的平衡一直是个难题。
6/3/2025 10:01:04 AM
AI在线
AI 攻击 AI:全球超 1.7 万 Open WebUI 实例被入侵,威胁 Linux 和 Win10 / Win11 用户
网络安全公司 Sysdig 示警,有攻击者利用配置不当的 Open WebUI 实例,通过 AI 生成的恶意软件入侵系统,威胁 Linux 和 Windows 用户。
6/3/2025 9:38:37 AM
故渊
极简设计铸就卓越性能:Alita 通用智能体的进化思考
大家好,我是肆〇柒。 今天,我要和大家聊一篇极具创新性的论文 ——《ALITA: GENERALIST AGENT ENABLING SCALABLE AGENTIC REASONING WITH MINIMAL PREDEFINITION AND MAXIMAL SELF-EVOLUTION》。 该论文由普林斯顿大学、清华大学、上海交通大学等多所顶尖高校等机构提出。
6/3/2025 9:31:16 AM
肆零柒
微信自研高性能推理计算引擎 XNet-DNN:跨平台 GPU 部署大语言模型及优化实践
作者 | yannicXNet-DNN 是微信高性能计算团队自主研发的一款全平台神经网络推理引擎。 我们在 XNet 的 RCI 基础设施之上构建了全平台的 GPU LLM . 推理能力。
6/3/2025 9:25:00 AM
腾讯技术工程
5700问答对全面评估拷问AI空间感!最新空间智能评测基准来了丨浙大&成电&港中文
这个对人类来说非常简单的问题,连GPT-4o这样级别的视觉语言大模型(VLMs)也可能答错。 究其根本,还是当前的视觉语言大模型在大规模图文数据中学习到的空间信息往往是片段化的,仅限于静态视角的理解,缺乏多维度、多视角的空间推理能力。 因此,当面对需要多视角空间推理的任务时,这些模型们就频频卡壳。
6/3/2025 9:16:00 AM
LSTM之父22年前构想将成真?一周内AI「自我进化」论文集中发布,新趋势涌现?
让 AI 实现自我进化是人类一直以来的梦想。 早在 2003 年,AI 先驱、LSTM 之父 Jürgen Schmidhuber 就提出过一种名为「哥德尔机(Gödel Machine)」的构想——它使用一种递归的自我改进协议,如果能够证明新代码的策略较佳,就会重写自己的代码。 但这终究只是一个假想。
6/3/2025 9:14:00 AM
CVPR 2025 | 解决XR算力瓶颈,FovealSeg框架实现毫秒级IOI分割
本文共同第一作者为纽约大学研究生 Hongyi Zeng 和Wenxuan Liu。 合作作者为 Tianhua Xia、Jinhui Chen、Ziyun Li。 通讯作者为纽约大学电子工程系和计算机系教授 Sai Qian Zhang,研究方向为高效人工智能,硬件加速和增强现实。
6/3/2025 9:12:00 AM
人类程序员依然远强于LLM:为什么说 AI 目前还差点火候
这是一篇来自 Antirez(Redis 之父Salvatore Sanfilippo)的博文,分享给大家人类程序员依然技高一筹:为什么说 AI 目前还差点火候这篇短文,是想聊聊为什么我觉得咱们人类程序员,比起现在大火的 LLM(大语言模型)还是要强太多。 先声明,我可不是什么 AI 反对者,了解我或者关注我动态的朋友应该都清楚。 LLM 我经常用,就像今天,我会用它来碰撞灵感、做代码评审、看看有没有比我最初构想更好的方案、探索那些快要超出我知识边界的领域,诸如此类吧。
6/3/2025 9:11:38 AM
2 万英国公务员洞察:AI 可帮助其每天节省 26 分钟
英国政府数字服务部门(GDS)昨日(6 月 2 日)发布涉及 2 万公务员的调查报告,结果显示,使用 Microsoft 365 Copilot 的参与者平均每天节省 26 分钟时间,超 70% 用户表示减少了搜索信息和日常任务的时间,82% 用户不愿回到未使用 Copilot 的工作状态。
6/3/2025 9:11:03 AM
故渊
AI已学会改自己代码,性能提升100%,还会「改绩效」!程序员,还不慌?
编程智能体杀疯了! 不仅能协助写代码,如今编程智能体甚至能实现自我「进化」! 最近,Transformer作者初创Sakana AI和加拿大UBC的Jeff Clune实验室合作,推出了自我改进的智能体——「达尔文-哥德尔机」(Darwin Gödel Machine,简称DGM)。
6/3/2025 9:10:00 AM
逆向工程:ChatGPT 的记忆是如何工作的
这篇文章是名为eric 工程师对ChatGPT记忆系统的深度逆向工程和技术实现推测。 它详细拆解了“可保存记忆”和包含“当前会话历史”、“对话历史”、“用户洞察”三个子系统的“聊天历史”,分析了它们的工作原理、可能的实现方案(如向量数据库、聚类算法),并探讨了这些记忆系统如何显著提升ChatGPT的用户体验,认为“用户洞察”是体验提升的关键文章深度剖析了“用户洞察”(User Insights)高级记忆系统,分析了ChatGPT如何从你的多轮对话中自动学习、总结你的专业背景(如对Rust编程的深入理解)、知识领域乃至沟通偏好,并附上置信度和时间范围,悄然注入后续对话的上下文中。 这正是ChatGPT能提供“千人千面”且高度相关回复的核心秘密地址:,这里做一个重点梳理ChatGPT的记忆系统:不止一种,而是一套组合拳Eric发现,ChatGPT的记忆并非单一系统,而是主要由两大部分构成:“可保存记忆(Saved Memory)”和“聊天历史(Chat History)”。
6/3/2025 9:08:49 AM
AI竟会「自己认错」?破解多智能体协作「罗生门」,斩获ICML 2025 Spotlight
你打造了一支「超级AI战队」——战队里每个AI都各司其职:有的收集信息、有的负责判断,还有的协调执行,一起协作攻克复杂任务。 这个愿望看似天衣无缝,结果却往往以失败告终。 问题就出在:当「问题」出现的时候,如何知道是哪个AI干的?
6/3/2025 9:08:00 AM
硅谷今夜集体失眠!互联网女皇340页AI报告猛料刷屏,大佬熬夜头秃
互联网女皇、传奇投资者Mary Meeker,再度出山! 曾经,女皇的《互联网趋势报告》一出,整个科技圈都要抖三抖。 硅谷大佬觉都不睡了,都要连夜研读这份刷屏圈内头条的重磅报道。
6/3/2025 9:06:00 AM
免费使用Sora!微软发布Bing Video Creator
今天凌晨1点,微软在官网发布了Bing搜索引擎全新功能——Bing Video Creator。 Bing Video Creator由OpenAI的文生视频模型Sora提供技术支持,通过自然语言就能生成写实、风景、卡通、影视等各种视频。 同时会免费为用户提供该服务,生成速度分为快速和标准两种模式,初始有10次快速生成机会,用完后可消耗 100 微软奖励积分继续使用,或继续选择标准速度。
6/3/2025 9:05:29 AM
无需人工标注!AI自生成训练数据,靠「演绎-归纳-溯因」解锁推理能力
当AI试图破解数学、编程与科学的难题时,它常常像一位灵感乍现的天才,却又难以稳定发挥。 新加坡国立大学、清华大学和Salesforce AI Research的研究者,提出了一种革命性的训练框架——元能力对齐,赋予模型稳健的推理能力,让顿悟成为常态。 论文链接:,能够高效地系统化培养大模型的数学,编程和科学问题上的基本推理能力。
6/3/2025 9:05:00 AM
LeCun新作反杀AGI派!AI连「鸟」都搞不懂,拿什么超越人类?
LLM真的可以像人类一样「思考」了? 图灵奖得主Yann LeCun联手斯坦福团队最新论文,狠狠打脸了LLM类人的神话。 论文链接:,LeCun认为,大模型就是随机鹦鹉,它们的智力甚至连阿猫阿狗都不如。
6/3/2025 9:02:00 AM
谷歌 Gemini Live 功能正式登陆 iOS 平台,开启 AI 识别新体验
近日,谷歌宣布其创新的 Gemini Live 功能现已正式上线苹果 iOS 和 iPadOS 平台,但目前仅限于美国地区的用户体验。 这项新功能允许用户通过 Gemini App,轻松享受 AI 识别场景和屏幕内容的便利。 令人惊喜的是,这一切都是免费的,无需额外的订阅费用。
6/3/2025 9:01:10 AM
AI在线
AI 招聘初创 Moonhub 关停:Salesforce 吸纳部分人才
据 TechCrunch 报道,Salesforce 发言人澄清,该公司并非如最初报道那样“收购”了 AI 招聘初创公司 Moonhub。 发言人表示,Moonhub 实际上正在关闭,只有部分团队成员将加入 Salesforce,而非此前 Moonhub 声明中暗示的整个团队。 Moonhub 由前 Meta 工程师 Nancy Xu 于2022年创立,专注于开发利用人工智能技术筛选和招聘人才的工具。
6/3/2025 9:01:05 AM
AI在线