AI在线 AI在线

模型

刚刚,DeepSeek最新发文!V3/R1训练细节全公开,信息量巨大

今天,网信办《人工智能生成合成内容标识办法》正式生效。 其中,第四条要求:对符合要求的AI生成合成内容添加显式标识。 紧跟最新政策,DeepSeek出手了。
9/2/2025 10:17:07 AM

腾讯开源WMT2025冠军大模型:拿下30个第一,同类最佳

昨晚,腾讯开源了2025年世界机器翻译大会(WMT2025)上斩获佳绩的翻译大模型Hunyuan-MT-7B。 根据比赛成绩显示,Hunyuan-MT-7B在中文、英文、法语、德语、马拉地语、爱沙尼亚语、冰岛语、芬兰语、匈牙利语、罗马尼亚语、波斯语、印地语、孟加拉语、泰米尔语、乌尔都语、僧伽罗语等31种主流、小众语言测试中,拿下30个语种第一。 Hunyuan-MT-7B在面对不同语言的复杂语法规则、独特词汇体系以及丰富文化内涵时, 均展现出强大的适应能力与翻译水准,成为同类最佳开源模型。
9/2/2025 9:02:08 AM

炸了!Google新发图片大模型简直逆天!

如果说 ChatGPT 真正的开创了聊天时代的智能对话,那么这次 Google 发布的 Nano Gemini 2.5 Flash Image(Nano Banana)将真正开启了图片智能生成的时代。 先来看看他的生成效果吧。 1.生成3D手办2.旧照片修复3.换装不需要手工 PS 了。
9/1/2025 5:18:55 PM
磊哥

Meta和Scale AI闹翻!砸143亿买的高管跑路,业务也合作不下去

两个多月前,Meta豪掷143亿美元收购Scale AI 49%的股份。 这才过去多久,两家不和的消息就被摆上了明面? 据TechCrunch报道,双方目前正在团队融合、业务合作方面产生一系列纠葛:跟随Alexandr Wang(Scale AI前CEO)一起去Meta的重要高管已经火速跑路了;Meta老员工和从Scale AI过来的人摩擦不断;Meta内部研究人员抱怨Scale AI数据质量太低,并采用了Scale AI对家数据;……u1s1,虽然这些摩擦的出现并不意外,但对比之前的“风光”,落差还是有点明显了。
9/1/2025 5:17:42 PM

NeurIPS近3万投稿爆仓,强拒400篇论文!博士疯狂内卷,AI顶会噩梦来袭

AI顶会,一场「爆仓危机」正在上演。 由于会议场地限制,NeurIPS 2025正通知「高级领域主席」(SAC),拒收已被录用的论文。 一位SAC爆料,大约400篇论文直接被砍掉,即便是三位审稿人和AC已通过初审。
9/1/2025 5:09:21 PM

王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1

没想到啊,最新SOTA的开源大模型……来自一个送外卖(Waimai)的——有两个AI,确实不一样。 这个最新开源模型叫:Longcat-Flash-Chat,美团第一个开源大模型,发布即开源,已经在海内外的技术圈子里火爆热议了。 一方面是因为成绩亮眼:它在部分benchmark上,比如Agent工具调用、指令遵循的表现超过DeepSeek-V3.1、Qwen3 MoE-2507,甚至比闭源的Claude4 Sonnet还要好。
9/1/2025 2:22:03 PM

143亿美金买来一场空!小扎向谷歌OpenAI低头,史上最大AI赌注失速

自从Llama 4发布后,Meta深陷「性能评测造假」丑闻,声誉跌落神坛。 之后,小扎坐不住了,斥143亿美元(约1000亿元)收购Scale AI,同时大举用九位数年薪挖角AI顶尖人才。 然而,近日Meta爆出离职潮,大批人才甚至还未入职便决定告别Meta。
9/1/2025 9:15:00 AM

Hinton神预言!斯坦福惊人实锤:00后20%初级IT岗蒸发,AI失业潮来了

AI无声掀起就业地震! 斯坦福大学最新研究显示:AI正无情吞噬美国年轻人的「饭碗」。 过去三年,最容易被AI取代的岗位里,22-25岁新人就业率猛降13%!
9/1/2025 9:13:00 AM

R-Zero 深度解析:无需人类数据,AI 如何实现自我进化?

本文第一作者黄呈松 (Chengsong Huang) 是圣路易斯华盛顿大学的博士生,Google scholar citation 五百多次,目前的研究的兴趣是强化学习和大语言模型。 机器之心曾经报道过其之前工作 Lorahub 已经被引超过 250 次。 大型语言模型(LLM)的发展长期以来受限于对大规模、高质量人工标注数据的依赖,这不仅成本高昂,也从根本上限制了 AI 超越人类知识边界的潜力 。
9/1/2025 9:09:00 AM

谷歌"香蕉"模型震撼发布!图像编辑能力一骑绝尘

最近有个感觉特别强烈:AI图像生成领域正在迎来一个全新的时代。 谷歌悄悄发布了代号为"Nano Banana"的Gemini 2.5 Flash Image模型,这个有着可爱名字的模型,可能要彻底改写图像编辑的游戏规则。 说实话,刚看到"香蕉"这个名字时,我还以为谷歌是在开玩笑。
9/1/2025 9:08:41 AM
阿丸笔记

DeepSeek、GPT-5带头转向混合推理,一个token也不能浪费

在最近的一档脱口秀节目中,演员张俊调侃 DeepSeek 是一款非常「内耗」的 AI,连个「1 加 1 等于几」都要斟酌半天。 在 AI 领域,这种情况被称为「过度思考」。 它的存在让 AI 大模型公司非常头疼,因为实在是太浪费算力了,那点订阅费根本 cover 不住。
9/1/2025 8:59:00 AM

比Claude好用10倍,便宜10倍!世界上最快的Agentic编程模型!刚刚,xAI发布全新模型,免费用!网友:抽卡任务有奇效

编辑 | 云昭昨天凌晨,马斯克之前预告的全新编程模型终于发布了! 距离 xAI 推出 Grok Code 不到三天,马斯克又带着一款大杀器来跟奥特曼的 GPT-5 来打(抬)擂(杠)了! “感觉比 Claude 好用 10 倍,速度也快 10 倍!
9/1/2025 2:11:00 AM
云昭

突发!微软与OpenAI同日开火:语音之战+通用大模型,AI霸权决战打响

就在OpenAI发布最新的语音大模型之际,微软掏出了自研语音大模型! 微软AI掌门人、DeepMind联合创始人Mustafa Suleyman正式宣布:微软AI正式推出MAI-Voice-1以及MAI-1-预览版! 而且还有更多内容即将推出。
8/29/2025 2:41:52 PM

今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

今天凌晨1点,OpenAI接连扔出AI语音能力的两个重磅更新。 一个是Realtime API,可支持生产级的实时智能体。 另一个是最先进的语音到语音模型gpt-realtime。
8/29/2025 2:38:42 PM

Andrej Karpathy再次看衰强化学习:奖励函数非常可疑,RL环境才是最重要的

AK再次看衰RL本身,当然指的是长期来看刚刚Prime Intellect公司开源了一个叫Environments Hub的平台,简单来说Environments Hub是一个开源的的强化学习环境(RL environments)平台,强化学习环境被认为是下一波人工智能进步的关键瓶颈,但大型实验室正在将其锁定环境是Agent学习的地方,它们定义了世界、规则以及状态 → 动作 → 奖励的反馈循环。 从编程/数学任务到游戏和多轮对话评估,一切都可以被视为环境。 没有它们,强化学习就只是数学,没有任何交互可言详细内容看这里:,以下是AK的观点:在预训练(pretraining)时代,最重要的是互联网文本。
8/29/2025 9:01:40 AM

一文带你开启 SmartNotebook 的 GPU 支持(PyTorch 实测)

在数据科学与深度学习的日常工作中,GPU 已经成为不可或缺的计算加速工具。 无论是训练大规模 Transformer 模型,还是运行复杂的图像处理与科学计算任务,GPU 都能显著提升性能。 SmartNotebook 作为一款类似 Hex.tech 的现代化 DataNotebook 平台,不仅支持在容器环境中快速部署,还可以通过简单的配置实现 GPU 加速,让用户在 DataNotebook 内即可运行深度学习任务。
8/29/2025 8:10:18 AM
新叔

OpenAI/微软争夺AGI控制权!重组谈判激烈,年底谈不成软银700亿或撤

OpenAI就重组问题与微软持续进行了胶着的谈判,重写合作合同,至今悬而未决。 今年年底是一个关键节点,关系到软银对OpenAI的100亿美元投资能否到账。 OpenAI在接受了微软的注资后,双方的利益诉求点始终处在不同的轨道上。
8/28/2025 3:27:22 PM

谷歌"香蕉"模型nano banana震撼发布!图像编辑能力碾压所有对手

想象一下这个场景:你正在设计一个品牌Logo,客户突然要求修改颜色、调整字体,还要保持角色的一致性。 以往你可能需要在Photoshop里折腾半天,但现在,只需要一句话就能搞定——"把这个logo改成蓝色调,让角色表情更友善一些"。 这不是科幻电影,而是谷歌刚刚发布的Gemini 2.5 Image模型,代号"Nano Banana"正在创造的现实。
8/28/2025 9:17:50 AM
阿丸笔记