AI
首创像素空间推理,7B模型领先GPT-4o,让VLM能像人类一样「眼脑并用」
视觉语言模型(VLM)正经历从「感知」到「认知」的关键跃迁。 当OpenAI的o3系列通过「图像思维」(Thinking with Images)让模型学会缩放、标记视觉区域时,我们看到了多模态交互的全新可能。 然而,当前主流VLM仍被困在「文本茧房」中——依赖文本token间接翻译视觉信息,在高清图像中的微小物体、视频里的动态细节等场景中,常常因缺乏直接视觉操作能力而「视而不见」。
6/10/2025 9:07:00 AM
无需SFT也不用RL,样本级推理优化神器SLOT来了,准确率轻松+10%
试想一下,如果你参加考试时,可以在答题前花几秒钟「适应」一下这道具体的题目,你的表现会不会更好? 这正是西湖大学研究团队在最新论文中提出的核心思想。 他们开发的 SLOT(Sample-specific Language Model Optimization at Test-time)方法,把每个输入 prompt 本身当作一份「迷你训练数据」,让模型在生成答案前先「学习」理解这个具体问题。
6/10/2025 9:05:00 AM
我如何仅用 0.80 美元使用 Cursor 构建 17,000 行代码库
市面上出现过不少工具来来去去,但 Cursor 搭配 Claude Sonnet 4 这组合,绝对称得上革命性。 三小时内,仅在 /lib 目录,就生成了超过 17,000 行代码,花费却不到一美元。 要么 Cursor 在赔钱运营,就像我叔叔烤火鸡烤焦那样惨烈,要么我找到了一个让 AI 编码极度低价的秘密。
6/10/2025 8:10:59 AM
前端小智
如何在不陷入复杂性陷阱的情况下构建生产就绪的 AI 代理
一、从“大而全”到“小而精”的范式转变在医疗管理领域,当凌晨2点的紧急审批因某个隐蔽漏洞被驳回时,那些标榜“全能”的超级智能体架构正在暴露其致命缺陷。 这些试图将资格审核、医疗必要性评估、申诉处理和医患沟通等功能一网打尽的“巨无霸”系统,如同希腊神话中试图吞噬一切的海妖卡律布狄斯,在演示阶段展现出雄心壮志,却在真实医疗场景中成为不可预测的风险黑洞。 这种困境折射出人工智能领域的一个深层矛盾:我们是否应该追求“全能型”智能体,还是回归“专精化”的本质?
6/10/2025 4:18:00 AM
大模型之路
我们一起聊聊聊聊智能体的基础架构
2023年下半年,智能体这个概念开始随着AI的突进式发展而被很多人关注起来。 到了2024年,大模型的能力进一步增强,为智能体快速发展提供了底层能力支撑。 随着2025年DeepSeek的爆火,智能体在各行各业的落地应用案例开始明显增加。
6/10/2025 3:00:00 AM
写文章的老张
智能体式推理与工具集成:ARTIST 基于强化学习的新思路
大家好,我是肆〇柒。 这两天,我看到一篇论文《Agentic Reasoning and Tool Integration for LLMs via Reinforcement Learning》讲述的是ARTIST 框架,为 LLM 赋予智能体式推理与工具集成的全新维度。 今天,就一起了解一下这个 ARTIST 框架,看看 LLM 如何借助强化学习突破局限,开启智能体式推理与工具集成。
6/10/2025 2:30:00 AM
肆零柒
AI疯狂进化6个月,一张天梯图全浓缩!30+模型混战,大神演讲爆火
半年之期已到,AI龙王归位! (AI卷成啥样了? )就在刚刚,AI圈大神Simon Willison在旧金山AI工程师世博会(AI Engineer World’s Fair)上带来爆笑又干货满满的主题演讲:「过去六个月中的LLM——由骑自行车的鹈鹕来解释」。
6/10/2025 2:10:00 AM
AI成为企业勒索软件防御的关键角色
支付赎金并不总是能带来预期的结果,约四分之一支付赎金的受访者表示,他们没有拿回所有数据,在英国这一比例上升到了三分之一,即使他们拿回了数据,对手仍可能会尝试将其变现。 “勒索软件已经演变成一种形态多变、AI驱动的威胁,任何企业都不能掉以轻心,”Delinea的CEO Art . Gilliland表示,“为了应对当今攻击的复杂性,企业必须利用AI对抗AI,并采取主动的身份安全策略,如零信任架构、特权访问管理和持续的凭证监控,以保持领先。
6/10/2025 12:20:00 AM
D1net编译
83% 员工用 AI 却工资不变,NBER研究揭露:AI 带来的时间红利被谁吞了?
2025 年,ChatGPT 已进入千行百业。 但一项来自丹麦的研究提醒我们,流行并不等于变革。 图注:论文标题“Large Language Models, Small Labor Market Effects”这项覆盖 2.5 万名员工、7000 家公司的调研数据显示:即便像 ChatGPT 这样的生成式 AI 已被广泛使用,它对员工工资、工作时长、雇佣状况等核心劳动指标的影响几乎为零。
6/10/2025 12:00:00 AM
奇作!现在的AI脚本僵化臃肿、万金油、一遇混乱就崩溃!骑单车荷兰一日游,竟然改变了我对AI的看法:MCP、A2A应该是这样!
作者 | Natasha Wijesekare编译 | 云昭智慧总是藏在自然之中。 而作为人工制造的AI,更不例外。 然而对于感悟 AI 而言,有时候却需要我们换个环境去散散心。
6/9/2025 5:35:59 PM
云昭
AI 成本直降 90%!女股神 Cathie Wood 圈定 3 条迁徙线:Robotaxi、端侧大模型、AI 医药
(视频来源:对话ARK Invest创始人Cathie Wood)北京时间 6 月 5 日,在《The Diary of a CEO》最新一期节目中,ARK Invest 创始人、掌管 300 亿美元资产的‘女股神’ Cathie Wood(凯茜·伍德),用三组数据划出 AI 落地的爆发路径:训练侧:过去两年,GPT-3 级别模型的训练成本从 460 万美元跌到 45 万美元,年降幅约 70%,堪称“断崖式”跳水;应用侧:ARK 测算 Robotaxi 单英里成本可低至 0.25 美元,比现有网约车便宜近 90%;消费侧:AI 代理激发的新消费行为,2030 年线上支出或达 9 万亿美元,改写全球最大产业链的资金流。 在同一天,特朗普在 Truth Social 威胁“取消特斯拉全部政府合同”,引发政商关系骤然紧张。 但 Cathie Wood 的判断更冷静、更本质:“Robotaxi 的成败,关键不是谁在互呛,而是成本模型能不能跑通。
6/9/2025 5:32:09 PM
影视级3D生成新王:Direct3D-S2全面开源!8块GPU超越闭源登顶HF
HuggingFace是全球最大的开源大模型社区,汇集了来自世界各地的上百个开源大模型。 其趋势榜(HuggingFace Trending)展示了各类开源大模型在全球开发者中的受欢迎程度,DeepSeek、Qwen等大模型就因曾登顶HuggingFace榜单而获得了全球开发者的关注与热议。 可以说,这是当前最具权威性的榜单之一。
6/9/2025 3:25:43 PM
3B超越DeepSeek,大模型终于理解时间了!Time-R1一统过去/未来/生成
时间,是我们日常生活中最基础的概念。 但对于大语言模型(LLM)来说,它们或许能写诗作画、通晓古今,但在真正理解和运用时间概念时,却常常显得力不从心。 这个技术短板来自于大模型的底层设计,无法避免:训练语料库是静态的,存在知识截断时间;在按非时间顺序的语料训练过程中,跨越不同时期的时间信息是同时处理的,不像人类逐步接收知识,阻碍了在事件与其对应时间之间建立可靠的逻辑映射。
6/9/2025 3:25:03 PM
Google AI Studio 政策变动:Gemini2.5Pro 模型免费访问遭“限流”
Google 正在逐步调整其 AI 模型使用政策。 自5月起,面向开发者的 AI 测试平台 Google AI Studio 已停止向免费用户提供 Gemini2.5Pro 系列模型的调用权限。 官方回应称,这是转向全新 基于 API 密钥的使用系统 的一部分,未来开发者将需自行提供 API 密钥接入模型服务。
6/9/2025 2:00:56 PM
AI在线
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
编译 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)Ilya终于出现了! 自从OpenAI宫斗风波之后,这位GPT背后的技术灵魂便鲜少露面。 甚至,where is Ilya的各种阴谋论一度成为整个AI圈的热梗。
6/9/2025 1:48:59 PM
伊风
微软发布AI Agent故障白皮书,万字解读各种恶意智能体
微软发布了《AI Agent系统故障模式分类》白皮书,以帮助开发者和用户更好的理解、解决日常Agent出现的各种故障。 这些故障主要分为新型故障和既有故障两大类,并详细解读了出现这些故障的原因以及如何解决。 由于内容太多,「AIGC开放社区」就为大家介绍一些典型的恶意智能体攻击方法和原理。
6/9/2025 9:54:20 AM
英国多个组织呼吁监管机构限制 Meta 利用人工智能进行风险评估
互联网安全活动人士呼吁英国通信监管机构Ofcom限制AI在社交媒体风险评估中的使用,Meta计划自动化风险评估流程引发担忧。多个组织认为AI驱动的风险评估不符合《在线安全法案》要求。Meta回应称AI仅用于辅助工具,决策仍由人类监督。#AI安全# #社交媒体监管#
6/9/2025 9:51:32 AM
远洋
AI模型的耗电量惊人 下一步是建设太空数据中心?
随着人工智能(AI)技术的飞速发展,地球上的数据中心面临着巨大的电力供给压力。 据美国能源部报告,预计到2028年,美国的数据中心将消耗总发电量的12%,而这一比例在2023年仅为4.4%。 AI模型的耗电量惊人,导致电力公司难以满足不断增长的需求,电费持续上涨。
6/9/2025 9:47:53 AM
资讯热榜
智谱AI全新企业级超级助手Agent CoCo正式上线
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
ChatGPT 语音功能升级,实时翻译对话更自然流畅
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
苹果向开发者开放本地AI能力,推出全新Foundation Models框架
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊