AI
打败 Qwen2.5-VL,完全开源可复现 LLaVA-OneVision-1.5 的多模态模型
一个完全开源多模态模型,全面超越 Qwen2.5-VL。 LLaVA(Large Language and Vision Assistant,大型语言与视觉助手)的故事,是开源社区用两年时间,真正复现出一个顶级的多模态模型的拼搏史。 23年4月,一个名为 LLaVA 的开创性工作横空出世。
10/17/2025 10:03:23 AM
谷歌142页报告首发揭秘:90%码农每天用AI超2小时!
十年来,Google Cloud的DORA报告一直被视为观察全球软件团队的风向标。 而2025年这份新报告,把焦点放在了一个前所未有的主题上——AI已经全面渗透开发流程。 近五千名技术从业者的调研结果表明,AI不再是尝鲜,而是主流。
10/17/2025 9:59:28 AM
RL微调,关键在前10%奖励!基于评分准则,Scale AI等提出新方法
让大模型按照人类意图行事,一直是AI领域的核心挑战。 目前主流的强化学习微调(RFT)方法虽然有效,但存在一个致命弱点:奖励过度优化(reward over-optimization)。 奖励过度优化是大模型对齐的「阿喀琉斯之踵」。
10/17/2025 9:56:05 AM
李飞飞全新「世界模型」问世!单张H100实时生成3D永恒世界
就在刚刚,李飞飞World Labs重磅发布全新实时生成式世界模型——RTFM(Real-Time Frame Model,实时帧模型)! 这是一款效率极高的,在大型视频数据上进行端到端训练的自回归扩散Transformer模型。 仅需一块H100 GPU,RTFM就能在你与之交互时,实时渲染出持久且3D一致的世界,无论是真实场景还是想象空间。
10/17/2025 9:53:23 AM
报告揭示互联网新趋势:超半数新内容由 AI 生成
根据 一份最新报告,人工智能(AI)正在逐渐主导互联网内容的生成,令人惊讶的是,目前新产生的内容中超过一半是由 AI 创作的。 这一趋势反映出 AI 在技术领域的重要性与日俱增。 虽然有观点认为 AI 会导致大规模失业,但调查数据显示,技术招聘的需求仍保持稳定,尤其是在美国,科技公司对人才的需求显著增加。
10/17/2025 9:47:33 AM
AI在线
LangGraph如何提升Agent可靠性的秘密:human-in-the-loop
LangGraph的创始人在最近的一次技术分享中说:"Human-in-the-loop不只是一个功能,它是AI系统从工具变成伙伴的关键转折点。 "这句话让我想了很久。 说实话,刚开始接触LangGraph的时候,我对这个"人机交互"功能还挺困惑的。
10/17/2025 9:17:19 AM
阿丸笔记
AI时代的五大技能误区:2026年将让企业损失数百万
到2026年,企业想要在竞争中取胜所需的技能,将与几年前所依赖的技能大不相同。 AI和自动化正推动着新的工作方式,虽可能使某些岗位上的人类变得多余,但同时也创造出了全新的岗位。 在这个新世界里,技能提升、再培训和持续教育并非人力资源部门需要完成的任务,而是企业的首要任务。
10/17/2025 7:05:00 AM
Bernard Marr
2025 年最值得关注的十大 AI Agent 平台
一个指南,帮助你挑选合适的框架来构建自主AI代理——从开源巨头到企业级解决方案。 你来这儿是因为你看到了未来,而未来就是自主的。 AI代理不再只是聊天机器人了——它们是复杂的程序,能分析信息、做决定,还能执行复杂任务,而不需要人类一直盯着。
10/17/2025 2:11:00 AM
AI研究生
Karpathy的nanochat:百元就能造ChatGPT?AI圈炸锅了!
AI圈最近被一颗重磅炸弹炸醒了。 不是什么新的千亿参数大模型,而是一个由Andreij Karpathy,这位曾是特斯拉AI总监、OpenAI创始成员的大佬,亲手打造的开源项目——nanochat。 它的宣传语大胆而诱人:“$100就能买到的最好的ChatGPT。
10/17/2025 1:22:00 AM
墨风如雪
OpenAI 放宽 ChatGPT 成人内容引争议,奥尔特曼回应称“我们不是世界道德警察”
10 月 16 日消息,当地时间周三,OpenAI 首席执行官萨姆・奥尔特曼(Sam Altman)在面对外界对其放宽内容限制政策的批评时回应称,该公司“并非世界选出的道德警察”。 图源:OpenAI 官网此前,奥尔特曼宣布将放松对旗下聊天机器人 ChatGPT 的内容管制,允许包括情色内容在内的成人主题内容上线,此举引发了广泛争议。 作为回应,奥尔特曼于周三表示,OpenAI 并不打算充当全球用户行为的道德裁决者。
10/16/2025 6:10:22 PM
远洋
后端老鸟的崩溃独白:两个月从热爱到绝望!Vibe Coding彻底让我对编程失去了兴趣,我们不该是AI保姆
编辑 | 听雨出品 | 51CTO技术栈(微信号:blog51cto)这两天,小编在 Reddit 上刷到一篇帖子,标题瞬间戳中我:“因为 AI 和那些被 AI 洗脑的人,我对这份职业彻底失去了兴趣。 ”作者是一名后端工程师,他说,仅仅用了两个月时间,自己就从「我想在这家公司干一辈子」变成了「我是不是该换个行业了? 这听起来夸张吗?
10/16/2025 11:33:12 AM
听雨
Scality 推出20多种关键工具的 AI 认证,助力企业加速 AI 应用开发
在人工智能(AI)迅猛发展的今天,数据的安全性和应用的高效性变得尤为重要。 近日,全球领先的网络弹性存储软件公司 Scality 宣布,其全面的 AI 生态认证计划进一步升级,目前已覆盖20多种行业内最关键的 AI 和机器学习(ML)工具及框架。 图源备注:图片由AI生成,图片授权服务商Midjourney这一认证项目建立在 Scality 的网络弹性存储架构上,旨在确保工具之间的互操作性,并在整个 AI 生命周期中保护数据的完整性和安全性。
10/16/2025 10:12:42 AM
AI在线
紧急应对Sora 2,谷歌推出Veo 3.1版本:一手实测
刚刚,谷歌Veo 3进行了更新,最新版本Veo 3.1,可以在这里体验,fast模式每次生成耗费20积分,相比sora 2 看起来贵很多,sora 2到目前为止都是无限制生成,完全免费我第一时间就做了一个Veo 3.1和sora 2的初步对比测试,测试下来,Veo 3.1审美以及提示词遵循能力还是不如sora 2,不过好处是,Veo 3.1支持上传人像进行创作,sora 2 目前图生视频不支持人像废话不多说,看玩法:上手测试1.图生视频:nanobanana Veo 3.1先用nanobanana生成一个超高清小姐姐提示词:复制进入:,提示词:展示穿搭。
10/16/2025 9:37:11 AM
AI挖出癌症潜在新疗法!谷歌耶鲁联手突破免疫系统冷肿瘤难题
靠AI挖出了癌症潜在新疗法,AI医疗领域再添猛将。 谷歌、耶鲁联手,给攻克冷肿瘤找到了新方法。 他们推出Cell2Sentence-Scale 27B大模型,目标是寻找能在特定免疫情境环境中增强免疫信号的药物,突破了癌症免疫疗法中冷肿瘤难以被免疫系统察觉的难题。
10/16/2025 9:11:23 AM
AI玩拼图游戏暴涨视觉理解力,告别文本中心训练,无需标注的多模态大模型后训练范式
在多模态大模型的后训练浪潮中,强化学习驱动的范式已成为提升模型推理与通用能力的关键方向。 然而,大多数现有方法仍以文本为中心,视觉部分常被动地作为辅助信号输入。 相比之下,我们认为在后训练阶段重新审视视觉自监督学习的潜力,设计以视觉为中心的后训练对于增强多模态大模型对于视觉信息本身的细粒度深入理解也同样至关重要。
10/16/2025 9:00:00 AM
「重要性采样」并不「重要」?快手清华ASPO攻克重要性采样权重错配
从ChatGPT到DeepSeek,强化学习(Reinforcement Learning, RL)已成为大语言模型(LLM)后训练的关键一环。 然而,随着模型参数规模的不断扩大,一个长期被忽视的问题正悄然成为性能瓶颈:重要性采样真的「重要」吗? 近期,由快手与清华合作的研究团队发现,现有的结果监督强化学习范式存在一种深层次的权重错配现象,它不仅让模型「过度自信」,甚至可能导致熵坍缩与训练早熟收敛。
10/16/2025 8:55:00 AM
王兴兴硕士论文惊现GitHub,宇树雏形那时候就有了
人火了是连毕业论文都要被翻出来的(doge)。 这不,宇树科技CEO王兴兴的硕士毕业论文就被网友们掘地三尺找到了。 (不在知网,而是在GitHub上找到的。
10/16/2025 8:46:00 AM
波士顿动力狗gogo回来了!“五条腿”协同发力
机器狗搬轮胎,“五只腿”齐发力! 在波士顿动力人工智能研究所的最新方法——结合采样与学习的动态全身操作中,波士顿动力的机器狗Spot最快仅用3.7秒就能搬起轮胎。 搬运的轮胎重达15公斤,相当于Spot自身重量的一半(32.7千克),并远超其最大臂力。
10/16/2025 8:26:15 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
开源
AI新词
Meta
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
AI for Science
Agent
苹果
芯片
Claude
腾讯
Stable Diffusion
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
RAG
人形机器人
AI视频
研究
大语言模型
具身智能
生成
百度
Sora
工具
GPU
华为
计算
字节跳动
AI设计
大型语言模型
AGI
搜索
视频生成
场景
生成式AI
深度学习
架构
DeepMind
亚马逊
编程
特斯拉
视觉
Transformer
AI模型
预测
MCP