AI在线 AI在线

资讯列表

硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码

8月5日,在GPT-5发布前两天,OpenAI推出了它的两款开源权重大语言模型:gpt-oss-120b、gpt-oss-20b。 这是自2019年GPT-2,近六年来OpenAI首次发布开放权重的模型。 得益于巧妙的优化技术,这些模型甚至可以在本地设备上运行。
8/18/2025 9:15:00 AM

Yann LeCun最新纪录片首曝!传奇AI教父的双面人生,深度学习幕后40年

在AI的璀璨星空中,有一位传奇人物始终闪耀——Yann LeCun。 他不仅是深度学习的开创者之一,也是Meta的首席AI科学家。 当扎克伯格敲定28岁的Alexander Wang出任Meta的首席AI官后,所有人同时想到一个问题。
8/18/2025 9:12:00 AM

奥特曼神秘晚宴讲话曝出!OpenAI的CEO或将是个AI,Chrome我也想买

你们有没有发现,GPT-5最近好像变得不太一样了? 刚刚,OpenAI宣布GPT-5即将恢复GPT-4o的「温暖」风格。 奥特曼认为模型变暖只是第一步,让用户自定义ChatGPT风格才能真正解决问题。
8/18/2025 9:10:00 AM

最惨就业季!CS学霸GPA 3.98,投2500份简历仅10次面试,AI吞噬入门级岗位

每一个计算机专业的学生,都梦想着自己编写的代码,能够改变世界。 退而求其次,至少,也会有一份高薪和光明前程等着自己。 没想到世界被AI改了,还顺便带走了你的实习机会。
8/18/2025 9:09:00 AM

告别「AI脑萎缩」!Claude Code像健身私教一样逼你学编程

你可能没意识到,AI正在悄悄偷走你的大脑!  今年6月,MIT耗时4个月,公布了一项争议颇大的研究: 短期里,AI让效率爆表;但长期里,它却让我们思考力退化,像肌肉长期不用一样逐渐萎缩。  所谓「AI脑萎缩」,并非只是危言耸听,就像考试作弊,学生用AI取得好成绩,有什么意义?
8/18/2025 9:02:00 AM

大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大语言模型(LLM)正从工具进化为“裁判”(LLM-as-a-judge),开始大规模地评判由AI自己生成的内容。 这种高效的评估范式,其可靠性与人类判断的一致性,却很少被深入验证。 一个最基础、却也最关键的问题是:在评判一个模型是否“入戏”之前,AI裁判能准确识别出对话中到底是谁在说话吗?
8/18/2025 9:00:00 AM

谷歌最新「0.27B」Gemma 3开源!身板小却猛如虎,开发者直呼救命稻草

大块头不等于大智慧。 这在生成式AI领域,已逐渐成为共识。 Gemma 3系列的成功就是一个很好的例证。
8/18/2025 8:57:00 AM

AI顶会反噬整个学术圈!「不发表就会死」,NeurIPS爆仓,博士年肝4.5篇大崩溃

或许你也注意到了这个现象——AI和机器学习的繁荣,已经造成了一场少有人谈论的危机。 学生和研究人员过剩,就业前景有限,整个学术体系已经不堪重负。 随着NeurIPS、ICML和CVPR等会议的投稿数量激增,同行评审流程正在崩溃。
8/18/2025 8:51:00 AM

拥抱AI:转转客服智能质检系统—客服服务质检效率革新

1、困境与破局2、抽象建模,流程支持质检项质检方案质检任务质检配置设计思路质检流程3、质检演变,持续探索大模型关键词质检程序性判断4、自建模型,针对训练项目成果5、使用现状6、后续规划细化质检项,提高质检准确性质检流程优化李女士在某电商平台下单了一箱牛奶,下单前特意咨询客服:“这箱牛奶的保质期到什么时候? 能放多久? ”客服回复:“都是近期生产的,您放心”。
8/18/2025 4:00:00 AM
柴建

微软推Agent Lightning:AI 智能体训练与执行彻底解耦,零改代码即用!

近日,微软研究院的一个团队发布了一个名为 Agent Lightning 的框架,它使任何人工智能(AI)智能体都能通过强化学习进行训练。 图片这个框架的核心突破在于,它实现了智能体执行与强化学习(RL)训练过程的完全解耦。 这一设计允许开发者将该框架无缝集成到他们现有的智能体中,并且几乎不需要修改任何代码。
8/18/2025 3:00:00 AM

炸裂!Spring Boot 3 搭配 AI 实现智能弹幕审核 + Redis 热点缓存 + 上下文识别

我们用 Spring Boot 3 WebSocket 打造了一个实时弹幕系统。
8/18/2025 2:11:00 AM
编程疏影

“完美候选人”可能啥都不会?AI造假攻陷远程面试!

Gartner预测,到2028年,每四份候选人资料中,就会有一份是假的。 这是一个让人瞠目的结论,却不是空穴来风。 Gartner对3000名求职者的调研显示,6%的人承认在面试中动过手脚,要么冒充别人,要么找人替自己出镜。
8/18/2025 2:00:00 AM

刚刚!谷歌内部揭秘Genie 3:Sora后最强AI爆款,开启世界模型新时代

Genie 3是有史以来最先进的世界模型之一。 仅通过文本,它能够实时生成完全互动、高度一致的世界。 它不仅是DeepMind积累的结晶,还是通向AGI和具身智能体的关键一步。
8/18/2025 1:00:00 AM
新智元

即梦保姆级教程!零基础1小时做出3个商业级作品(附提示词)

往期教程:案例 1:夏日防晒爆款海报——安热沙清凉防护战. 即梦功能:文生图 产品融合 | deepseek 功能:关键词文案优化1. 即梦中的 deepseek 使用.
8/18/2025 12:50:52 AM

绿动算力 超智融合

“天苍苍,野茫茫,风吹草低见牛羊”,雄浑壮阔的草原风景与“绿水青山就是金山银山”的发展智慧在鄂尔多斯交相辉映。 8月13-16日在鄂尔多斯国际会展中心举办的第21届CCF全国高性能计算学术大会(CCF HPC China 2025),让草原的辽阔与算力的澎湃、大自然的馈赠与科技的突破在此碰撞融合,书写了数智化时代自然禀赋与数字革命共生共荣的新篇章。 作为全球三大超算盛会之一,本届大会以“绿动算力 超智融合”为主题,紧扣当下行业趋势和技术热点,延续并彰显“学术引领、产业融合”的特色,汇聚众多特邀嘉宾,11位院士莅临现场,另外还包括戈登贝尔奖获得者、权威专家、资深学者、企业精英等。
8/17/2025 9:37:00 PM
郑佳美

400万人围观的分层推理模型,「分层架构」竟不起作用?性能提升另有隐情?

还记得分层推理模型(Hierarchical Reasoning Model,HRM)吗? 这项工作于 6 月份发布,当时引起了不小的轰动——X/Twitter 上的相关讨论获得了超过 400 万的浏览量和数万个点赞,剖析这项工作的 YouTube 视频观看量也超过了 47.5 万次。 在论文中,作者表示:他们提出了一种受大脑启发的 HRM 架构,仅用 1000 个训练任务和一个 2700 万参数(相对较小)的模型,就在 ARC-AGI-1 基准上取得了 41% 的得分。
8/17/2025 8:00:00 PM
机器之心

CoRL 2025|隐空间扩散世界模型LaDi-WM大幅提升机器人操作策略的成功率和跨场景泛化能力

在机器人操作任务中,预测性策略近年来在具身人工智能领域引起了广泛关注,因为它能够利用预测状态来提升机器人的操作性能。 然而,让世界模型预测机器人与物体交互的精确未来状态仍然是一个公认的挑战,尤其是生成高质量的像素级表示。 为解决上述问题,国防科大、北京大学、深圳大学团队提出 LaDi-WM(Latent Diffusion-based World Models),一种基于隐空间扩散的世界模型,用于预测隐空间的未来状态。
8/17/2025 7:49:00 PM
机器之心

SEAgent:开启从实战经验中自我进化的GUI智能体新纪元

当前计算机使用智能体(CUA)的发展,主要依赖于大量昂贵的人工标注数据 。 这极大地限制了它们在缺少现成数据的新颖或专业软件中的应用能力 。 为了打破这一瓶颈,来自上海交通大学和香港中文大学的学者们提出了 SEAgent,一个全新的、无需任何人类干预,即可通过与环境交互来自主学习和进化的智能体框架。
8/17/2025 7:45:00 PM
机器之心