AI在线 AI在线

模型

只会「氛围编程」,永远成不了真正工程师!还差这几个关键环节

Cursor等智能IDE相继推出,带来了更智能的编程体验。 与此同时,Claude 4等基座大模型的编码性能不断提升。 再加上Andrej Karpathy的大力推广,Vibe Coding迅速走红,已成野火燎原之势。
9/3/2025 9:10:00 AM

别误会00后了!美国千人调查揭秘:85%学生都用AI,首要目的不是偷懒

GenAI席卷全球,高校课堂成为最前沿的实验场。 有人担心学位贬值、课堂失守;有人则看到新技术催生的新机遇。 刚刚,国外的「Inside Higher Ed」发布了最新的调查。
9/2/2025 5:42:47 PM

14B打败671B!微软rStar2-Agent在数学推理上超过DeepSeek-R1

现在,LLM 已经可以获得非常强大的推理能力,而其中关键便是测试时扩展(test-time scaling)。 通常而言,延长思维链(CoT)就可以延长「思考时间」,从而显著提升性能,尤其是当使用大规模强化学习和可验证奖励 (RLVR) 进行优化时。 然而,对于容易出现细微中间错误或需要创造性推理转变的难题,较长的思维链仍然存在根本性的局限性。
9/2/2025 10:20:10 AM

刚刚,DeepSeek最新发文!V3/R1训练细节全公开,信息量巨大

今天,网信办《人工智能生成合成内容标识办法》正式生效。 其中,第四条要求:对符合要求的AI生成合成内容添加显式标识。 紧跟最新政策,DeepSeek出手了。
9/2/2025 10:17:07 AM

腾讯开源WMT2025冠军大模型:拿下30个第一,同类最佳

昨晚,腾讯开源了2025年世界机器翻译大会(WMT2025)上斩获佳绩的翻译大模型Hunyuan-MT-7B。 根据比赛成绩显示,Hunyuan-MT-7B在中文、英文、法语、德语、马拉地语、爱沙尼亚语、冰岛语、芬兰语、匈牙利语、罗马尼亚语、波斯语、印地语、孟加拉语、泰米尔语、乌尔都语、僧伽罗语等31种主流、小众语言测试中,拿下30个语种第一。 Hunyuan-MT-7B在面对不同语言的复杂语法规则、独特词汇体系以及丰富文化内涵时, 均展现出强大的适应能力与翻译水准,成为同类最佳开源模型。
9/2/2025 9:02:08 AM

炸了!Google新发图片大模型简直逆天!

如果说 ChatGPT 真正的开创了聊天时代的智能对话,那么这次 Google 发布的 Nano Gemini 2.5 Flash Image(Nano Banana)将真正开启了图片智能生成的时代。 先来看看他的生成效果吧。 1.生成3D手办2.旧照片修复3.换装不需要手工 PS 了。
9/1/2025 5:18:55 PM
磊哥

Meta和Scale AI闹翻!砸143亿买的高管跑路,业务也合作不下去

两个多月前,Meta豪掷143亿美元收购Scale AI 49%的股份。 这才过去多久,两家不和的消息就被摆上了明面? 据TechCrunch报道,双方目前正在团队融合、业务合作方面产生一系列纠葛:跟随Alexandr Wang(Scale AI前CEO)一起去Meta的重要高管已经火速跑路了;Meta老员工和从Scale AI过来的人摩擦不断;Meta内部研究人员抱怨Scale AI数据质量太低,并采用了Scale AI对家数据;……u1s1,虽然这些摩擦的出现并不意外,但对比之前的“风光”,落差还是有点明显了。
9/1/2025 5:17:42 PM

NeurIPS近3万投稿爆仓,强拒400篇论文!博士疯狂内卷,AI顶会噩梦来袭

AI顶会,一场「爆仓危机」正在上演。 由于会议场地限制,NeurIPS 2025正通知「高级领域主席」(SAC),拒收已被录用的论文。 一位SAC爆料,大约400篇论文直接被砍掉,即便是三位审稿人和AC已通过初审。
9/1/2025 5:09:21 PM

王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1

没想到啊,最新SOTA的开源大模型……来自一个送外卖(Waimai)的——有两个AI,确实不一样。 这个最新开源模型叫:Longcat-Flash-Chat,美团第一个开源大模型,发布即开源,已经在海内外的技术圈子里火爆热议了。 一方面是因为成绩亮眼:它在部分benchmark上,比如Agent工具调用、指令遵循的表现超过DeepSeek-V3.1、Qwen3 MoE-2507,甚至比闭源的Claude4 Sonnet还要好。
9/1/2025 2:22:03 PM

143亿美金买来一场空!小扎向谷歌OpenAI低头,史上最大AI赌注失速

自从Llama 4发布后,Meta深陷「性能评测造假」丑闻,声誉跌落神坛。 之后,小扎坐不住了,斥143亿美元(约1000亿元)收购Scale AI,同时大举用九位数年薪挖角AI顶尖人才。 然而,近日Meta爆出离职潮,大批人才甚至还未入职便决定告别Meta。
9/1/2025 9:15:00 AM

Hinton神预言!斯坦福惊人实锤:00后20%初级IT岗蒸发,AI失业潮来了

AI无声掀起就业地震! 斯坦福大学最新研究显示:AI正无情吞噬美国年轻人的「饭碗」。 过去三年,最容易被AI取代的岗位里,22-25岁新人就业率猛降13%!
9/1/2025 9:13:00 AM

R-Zero 深度解析:无需人类数据,AI 如何实现自我进化?

本文第一作者黄呈松 (Chengsong Huang) 是圣路易斯华盛顿大学的博士生,Google scholar citation 五百多次,目前的研究的兴趣是强化学习和大语言模型。 机器之心曾经报道过其之前工作 Lorahub 已经被引超过 250 次。 大型语言模型(LLM)的发展长期以来受限于对大规模、高质量人工标注数据的依赖,这不仅成本高昂,也从根本上限制了 AI 超越人类知识边界的潜力 。
9/1/2025 9:09:00 AM

谷歌"香蕉"模型震撼发布!图像编辑能力一骑绝尘

最近有个感觉特别强烈:AI图像生成领域正在迎来一个全新的时代。 谷歌悄悄发布了代号为"Nano Banana"的Gemini 2.5 Flash Image模型,这个有着可爱名字的模型,可能要彻底改写图像编辑的游戏规则。 说实话,刚看到"香蕉"这个名字时,我还以为谷歌是在开玩笑。
9/1/2025 9:08:41 AM
阿丸笔记

DeepSeek、GPT-5带头转向混合推理,一个token也不能浪费

在最近的一档脱口秀节目中,演员张俊调侃 DeepSeek 是一款非常「内耗」的 AI,连个「1 加 1 等于几」都要斟酌半天。 在 AI 领域,这种情况被称为「过度思考」。 它的存在让 AI 大模型公司非常头疼,因为实在是太浪费算力了,那点订阅费根本 cover 不住。
9/1/2025 8:59:00 AM

比Claude好用10倍,便宜10倍!世界上最快的Agentic编程模型!刚刚,xAI发布全新模型,免费用!网友:抽卡任务有奇效

编辑 | 云昭昨天凌晨,马斯克之前预告的全新编程模型终于发布了! 距离 xAI 推出 Grok Code 不到三天,马斯克又带着一款大杀器来跟奥特曼的 GPT-5 来打(抬)擂(杠)了! “感觉比 Claude 好用 10 倍,速度也快 10 倍!
9/1/2025 2:11:00 AM
云昭

突发!微软与OpenAI同日开火:语音之战+通用大模型,AI霸权决战打响

就在OpenAI发布最新的语音大模型之际,微软掏出了自研语音大模型! 微软AI掌门人、DeepMind联合创始人Mustafa Suleyman正式宣布:微软AI正式推出MAI-Voice-1以及MAI-1-预览版! 而且还有更多内容即将推出。
8/29/2025 2:41:52 PM

今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

今天凌晨1点,OpenAI接连扔出AI语音能力的两个重磅更新。 一个是Realtime API,可支持生产级的实时智能体。 另一个是最先进的语音到语音模型gpt-realtime。
8/29/2025 2:38:42 PM

Andrej Karpathy再次看衰强化学习:奖励函数非常可疑,RL环境才是最重要的

AK再次看衰RL本身,当然指的是长期来看刚刚Prime Intellect公司开源了一个叫Environments Hub的平台,简单来说Environments Hub是一个开源的的强化学习环境(RL environments)平台,强化学习环境被认为是下一波人工智能进步的关键瓶颈,但大型实验室正在将其锁定环境是Agent学习的地方,它们定义了世界、规则以及状态 → 动作 → 奖励的反馈循环。 从编程/数学任务到游戏和多轮对话评估,一切都可以被视为环境。 没有它们,强化学习就只是数学,没有任何交互可言详细内容看这里:,以下是AK的观点:在预训练(pretraining)时代,最重要的是互联网文本。
8/29/2025 9:01:40 AM