AI在线 AI在线

AI

DeepSeek-R2!?神秘模型惊现竞技场,真实身份引网友猜测

DeepSeek-R2,终于要来了? 大模型竞技场秘密上线了一个叫steve的神秘模型,在对话中透露自己来自DeepSeek。 不过,网友们并不满足于知道steve的厂商,开始讨论起了steve的具体身份。
7/3/2025 2:57:51 PM

一份假简历领5份硅谷AI工资,印度老哥真是不得了

离谱!  一群AI初创公司竟然集体控诉:我们被一个印度老哥骗了。 这个名叫Soham Parekh的人,在隐瞒真实情况下进行远程兼职,最多一次打了五份工。
7/3/2025 2:56:12 PM

谢赛宁团队新作:不用提示词精准实现3D画面控制

henry 发自 凹非寺量子位 | 公众号 QbitAI曾几何时,用文字生成图像已经变得像用笔作画一样稀松平常。 但你有没有想过拖动方向键来控制画面? 像这样,拖动方向键(或用鼠标拖动滑块)让画面里的物体左右移动:还能旋转角度:缩放大小:这一神奇操作就来自于谢赛宁团队新发布的 Blender Fusion框架,通过结合图形工具 (Blender) 与扩散模型,让视觉合成不再仅仅依赖文本提示,实现了精准的画面控制与灵活操作。
7/3/2025 2:31:12 PM
henry

高端 AI 服务博弈:Perplexity Max 订阅上线,月费 200 美元

Perplexity 公司针对资深高级用户,推出了 Perplexity Max 订阅计划,月费为 200 美元(IT之家注:现汇率约合 1433 元人民币),可以享受诸多权益。
7/3/2025 2:29:11 PM
故渊

Claude含AI量超Cursor一倍!资深工程主管揭秘AI编码真相!谷歌谨慎全搞自研;软件架构教父:像从汇编时代跃迁到高级语言

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)这应该是我听过最扎实、最客观的一场 AI 编程演讲。 它不讲“奇迹”,也不兜售“焦虑”。 而是抛出一个很实在的问题:“今天我们能不能做一次现实核查: 那些极度乐观的 AI 编程预言,靠谱吗?
7/3/2025 2:09:01 PM
伊风

超CLIP准确率11%!伯克利港大阐明「LLM文本-视觉」对齐深层机制

多模态对齐模型近年来凭借对比学习范式在图像检索、文生图等任务中表现出色。 然而,主流框架(如 CLIP)需要从零训练文本和图像编码器,导致计算成本高昂,尤其在处理长文本或大规模数据时更加明显。 近期,相关工作尝试将预训练的大语言模型(LLM)作为文本编码器融入多模态对齐框架,并在分类和检索任务上观察到性能提升。
7/3/2025 9:49:43 AM

周志华团队新作:LLM中存在奖励模型,首次理论证明RL对LLM有效性

将大语言模型(LLMs)与复杂的人类价值观对齐,仍然是 AI 面临的一个核心挑战。 当前主要的方法是基于人类反馈的强化学习(RLHF)。 该流程依赖于一个通过人类偏好训练的奖励模型来对模型输出进行评分,最终对齐后的 LLM 的质量在根本上取决于该奖励模型的质量。
7/3/2025 9:41:27 AM

刚刚,神秘模型火了!网友:是OpenAI要开源?

刚刚,OpenRouter 上出现了一个神秘模型,该模型被命名为「Cypher Alpha」。 其可以免费使用,100 万 token 上下文,还具有推理能力。 注:OpenRouter 是一个大模型 API 路由器,旨在将各种 AI 模型和服务集成到一个统一的接口中。
7/3/2025 9:31:52 AM

让GUI智能体不再「过度执行」,上海交大、Meta联合发布OS-Kairos系统

本文第一作者是上海交通大学计算机学院三年级博士生程彭洲,研究方向为多模态大模型推理、AI Agent、Agent 安全等。 通讯作者为张倬胜助理教授和刘功申教授。 一、论文概述1.1 研究背景随着多模态大语言模型(Multimodal Large Language Models, MLLMs)的快速发展,越来越多的研究聚焦于构建能够在图形用户界面(GUI)中执行复杂任务的智能体。
7/3/2025 9:27:57 AM

前不久,苹果差点犯下最愚蠢的错误

8年资深研究员离职,整个核心团队威胁集体跳槽,数百万美元的挖角邮包 —— 这不是什么好莱坞大片的剧情,而是最近一周苹果AI部门正在经历的真实危机。 6月30日,Bloomberg爆出一个让整个科技圈都震惊的消息:苹果最核心的AI团队MLX,差点就这么没了。 具体发生了什么?
7/3/2025 9:19:28 AM
阿丸笔记

IEEE TPAMI 2025 | 北京大学提出LSTKC++,长短期知识解耦与巩固驱动的终身行人重识别

本文的第一作者为北京大学博士二年级学生徐昆仑,通讯作者为北京大学王选计算机研究所研究员、助理教授周嘉欢。 近日,北京大学王选计算机研究所周嘉欢团队在人工智能重要国际期刊 IEEE TPAMI 发布了一项最新的研究成果:LSTKC  。 该框架引入了长短期知识解耦与动态纠正及融合机制,有效保障了模型在终身学习过程中对新知识的学习和对历史知识的记忆。
7/3/2025 9:16:41 AM

字节图像生成新模型:主打多主体一致性,新基准数据集同时亮相

设定角色,让AI照“本”生成主角不变的不同图像,对于各路AIGC工具来说一直是不小的挑战。 而现在,字节再进一步,最新发布多主体控制生成模型Xverse——既可以对设定好的每个主体进行精确控制,也不会破坏图像的生成质量。 多主体?
7/3/2025 9:09:51 AM

ChatGPT诞生内幕大曝光!发布前一晚还在纠结

ChatGPT诞生内幕最新大曝光:纳尼? ? 原来“ChatGPT”这个名字,直到发布前一晚才确定下来。
7/3/2025 9:01:49 AM

社交平台 X 剖析社区注释:提高事实核查效率同时,存扩散错误信息风险

社交媒体 X 计划利用 AI 撰写社区注释(community notes),其目的是提高事实核查效率,但官方也承认存在明显风险。
7/3/2025 8:40:50 AM
故渊

同时监督和强化的单阶段大模型微调,告别“先背书再刷题”,推理泛化双提升|中科院&美团等

通过单阶段监督微调与强化微调结合,让大模型在训练时能同时利用专家演示和自我探索试错,有效提升大模型推理性能。 中国科学院自动化研究所深度强化学习团队联合美团,提出一种单阶段监督-强化微调方法——SRFT (Supervised Reinforcement Fine-Tuning)。 该方法通过基于熵的动态加权机制,将两种训练范式结合。
7/3/2025 8:33:00 AM

OpenAI播客再谈AI编程大战!开发者是最有福的人:特定需求的代码模型将涌现!主持人说漏嘴:我最喜欢Claude!

编译、整理 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)OpenAI第二期播客来了! 阵容也是相当重磅! 嘉宾是OpenAI 首席研究官 马克·陈(Mark Chen)和ChatGPT 负责人 尼克·特利(Nick Turley)。
7/3/2025 7:55:29 AM
伊风

AI能经营实体店吗?Anthropic的Claude尝试后,结果糟糕得既离谱又滑稽

想象一下这样的场景:你让AI完全掌控一家小店,不仅负责收银机,而且负责整个店铺的运营,包括定价、库存管理、客户服务、与供应商的谈判,那么,可能会出什么错呢?新的研究给出了明确的答案:一切皆有可能出错。 Anthropic公司的AI助手Claude在旧金山办公室管理了一家小店约一个月,结果读起来就像是一个从未真正经营过业务的人写的商学院案例研究——而事实证明,确实如此。 这项名为“Project Vend”的实验,是与AI安全评估公司Andon Labs合作进行的,是对具有显著经济自主权的AI系统进行的首次现实世界测试之一。
7/3/2025 7:07:00 AM
Michael

AI在不安全代码上训练后变得邪恶

研究揭示,用不安全代码微调 LLM 会导致“突发不一致”,模型可能产生有害建议。 GPT-4o 等模型在编码无关查询中表现出反人类、赞扬纳粹等行为。 需警惕数据投毒和后门攻击,加强 AI 对齐,防范 ASI 风险。
7/3/2025 4:00:00 AM
岱军