模型
刚刚,DeepSeek最新发文!V3/R1训练细节全公开,信息量巨大
今天,网信办《人工智能生成合成内容标识办法》正式生效。 其中,第四条要求:对符合要求的AI生成合成内容添加显式标识。 紧跟最新政策,DeepSeek出手了。
9/2/2025 10:17:07 AM
腾讯开源WMT2025冠军大模型:拿下30个第一,同类最佳
昨晚,腾讯开源了2025年世界机器翻译大会(WMT2025)上斩获佳绩的翻译大模型Hunyuan-MT-7B。 根据比赛成绩显示,Hunyuan-MT-7B在中文、英文、法语、德语、马拉地语、爱沙尼亚语、冰岛语、芬兰语、匈牙利语、罗马尼亚语、波斯语、印地语、孟加拉语、泰米尔语、乌尔都语、僧伽罗语等31种主流、小众语言测试中,拿下30个语种第一。 Hunyuan-MT-7B在面对不同语言的复杂语法规则、独特词汇体系以及丰富文化内涵时, 均展现出强大的适应能力与翻译水准,成为同类最佳开源模型。
9/2/2025 9:02:08 AM
炸了!Google新发图片大模型简直逆天!
如果说 ChatGPT 真正的开创了聊天时代的智能对话,那么这次 Google 发布的 Nano Gemini 2.5 Flash Image(Nano Banana)将真正开启了图片智能生成的时代。 先来看看他的生成效果吧。 1.生成3D手办2.旧照片修复3.换装不需要手工 PS 了。
9/1/2025 5:18:55 PM
磊哥
Meta和Scale AI闹翻!砸143亿买的高管跑路,业务也合作不下去
两个多月前,Meta豪掷143亿美元收购Scale AI 49%的股份。 这才过去多久,两家不和的消息就被摆上了明面? 据TechCrunch报道,双方目前正在团队融合、业务合作方面产生一系列纠葛:跟随Alexandr Wang(Scale AI前CEO)一起去Meta的重要高管已经火速跑路了;Meta老员工和从Scale AI过来的人摩擦不断;Meta内部研究人员抱怨Scale AI数据质量太低,并采用了Scale AI对家数据;……u1s1,虽然这些摩擦的出现并不意外,但对比之前的“风光”,落差还是有点明显了。
9/1/2025 5:17:42 PM
NeurIPS近3万投稿爆仓,强拒400篇论文!博士疯狂内卷,AI顶会噩梦来袭
AI顶会,一场「爆仓危机」正在上演。 由于会议场地限制,NeurIPS 2025正通知「高级领域主席」(SAC),拒收已被录用的论文。 一位SAC爆料,大约400篇论文直接被砍掉,即便是三位审稿人和AC已通过初审。
9/1/2025 5:09:21 PM
王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1
没想到啊,最新SOTA的开源大模型……来自一个送外卖(Waimai)的——有两个AI,确实不一样。 这个最新开源模型叫:Longcat-Flash-Chat,美团第一个开源大模型,发布即开源,已经在海内外的技术圈子里火爆热议了。 一方面是因为成绩亮眼:它在部分benchmark上,比如Agent工具调用、指令遵循的表现超过DeepSeek-V3.1、Qwen3 MoE-2507,甚至比闭源的Claude4 Sonnet还要好。
9/1/2025 2:22:03 PM
143亿美金买来一场空!小扎向谷歌OpenAI低头,史上最大AI赌注失速
自从Llama 4发布后,Meta深陷「性能评测造假」丑闻,声誉跌落神坛。 之后,小扎坐不住了,斥143亿美元(约1000亿元)收购Scale AI,同时大举用九位数年薪挖角AI顶尖人才。 然而,近日Meta爆出离职潮,大批人才甚至还未入职便决定告别Meta。
9/1/2025 9:15:00 AM
Hinton神预言!斯坦福惊人实锤:00后20%初级IT岗蒸发,AI失业潮来了
AI无声掀起就业地震! 斯坦福大学最新研究显示:AI正无情吞噬美国年轻人的「饭碗」。 过去三年,最容易被AI取代的岗位里,22-25岁新人就业率猛降13%!
9/1/2025 9:13:00 AM
R-Zero 深度解析:无需人类数据,AI 如何实现自我进化?
本文第一作者黄呈松 (Chengsong Huang) 是圣路易斯华盛顿大学的博士生,Google scholar citation 五百多次,目前的研究的兴趣是强化学习和大语言模型。 机器之心曾经报道过其之前工作 Lorahub 已经被引超过 250 次。 大型语言模型(LLM)的发展长期以来受限于对大规模、高质量人工标注数据的依赖,这不仅成本高昂,也从根本上限制了 AI 超越人类知识边界的潜力 。
9/1/2025 9:09:00 AM
谷歌"香蕉"模型震撼发布!图像编辑能力一骑绝尘
最近有个感觉特别强烈:AI图像生成领域正在迎来一个全新的时代。 谷歌悄悄发布了代号为"Nano Banana"的Gemini 2.5 Flash Image模型,这个有着可爱名字的模型,可能要彻底改写图像编辑的游戏规则。 说实话,刚看到"香蕉"这个名字时,我还以为谷歌是在开玩笑。
9/1/2025 9:08:41 AM
阿丸笔记
DeepSeek、GPT-5带头转向混合推理,一个token也不能浪费
在最近的一档脱口秀节目中,演员张俊调侃 DeepSeek 是一款非常「内耗」的 AI,连个「1 加 1 等于几」都要斟酌半天。 在 AI 领域,这种情况被称为「过度思考」。 它的存在让 AI 大模型公司非常头疼,因为实在是太浪费算力了,那点订阅费根本 cover 不住。
9/1/2025 8:59:00 AM
比Claude好用10倍,便宜10倍!世界上最快的Agentic编程模型!刚刚,xAI发布全新模型,免费用!网友:抽卡任务有奇效
编辑 | 云昭昨天凌晨,马斯克之前预告的全新编程模型终于发布了! 距离 xAI 推出 Grok Code 不到三天,马斯克又带着一款大杀器来跟奥特曼的 GPT-5 来打(抬)擂(杠)了! “感觉比 Claude 好用 10 倍,速度也快 10 倍!
9/1/2025 2:11:00 AM
云昭
突发!微软与OpenAI同日开火:语音之战+通用大模型,AI霸权决战打响
就在OpenAI发布最新的语音大模型之际,微软掏出了自研语音大模型! 微软AI掌门人、DeepMind联合创始人Mustafa Suleyman正式宣布:微软AI正式推出MAI-Voice-1以及MAI-1-预览版! 而且还有更多内容即将推出。
8/29/2025 2:41:52 PM
今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇
今天凌晨1点,OpenAI接连扔出AI语音能力的两个重磅更新。 一个是Realtime API,可支持生产级的实时智能体。 另一个是最先进的语音到语音模型gpt-realtime。
8/29/2025 2:38:42 PM
Andrej Karpathy再次看衰强化学习:奖励函数非常可疑,RL环境才是最重要的
AK再次看衰RL本身,当然指的是长期来看刚刚Prime Intellect公司开源了一个叫Environments Hub的平台,简单来说Environments Hub是一个开源的的强化学习环境(RL environments)平台,强化学习环境被认为是下一波人工智能进步的关键瓶颈,但大型实验室正在将其锁定环境是Agent学习的地方,它们定义了世界、规则以及状态 → 动作 → 奖励的反馈循环。 从编程/数学任务到游戏和多轮对话评估,一切都可以被视为环境。 没有它们,强化学习就只是数学,没有任何交互可言详细内容看这里:,以下是AK的观点:在预训练(pretraining)时代,最重要的是互联网文本。
8/29/2025 9:01:40 AM
一文带你开启 SmartNotebook 的 GPU 支持(PyTorch 实测)
在数据科学与深度学习的日常工作中,GPU 已经成为不可或缺的计算加速工具。 无论是训练大规模 Transformer 模型,还是运行复杂的图像处理与科学计算任务,GPU 都能显著提升性能。 SmartNotebook 作为一款类似 Hex.tech 的现代化 DataNotebook 平台,不仅支持在容器环境中快速部署,还可以通过简单的配置实现 GPU 加速,让用户在 DataNotebook 内即可运行深度学习任务。
8/29/2025 8:10:18 AM
新叔
OpenAI/微软争夺AGI控制权!重组谈判激烈,年底谈不成软银700亿或撤
OpenAI就重组问题与微软持续进行了胶着的谈判,重写合作合同,至今悬而未决。 今年年底是一个关键节点,关系到软银对OpenAI的100亿美元投资能否到账。 OpenAI在接受了微软的注资后,双方的利益诉求点始终处在不同的轨道上。
8/28/2025 3:27:22 PM
谷歌"香蕉"模型nano banana震撼发布!图像编辑能力碾压所有对手
想象一下这个场景:你正在设计一个品牌Logo,客户突然要求修改颜色、调整字体,还要保持角色的一致性。 以往你可能需要在Photoshop里折腾半天,但现在,只需要一句话就能搞定——"把这个logo改成蓝色调,让角色表情更友善一些"。 这不是科幻电影,而是谷歌刚刚发布的Gemini 2.5 Image模型,代号"Nano Banana"正在创造的现实。
8/28/2025 9:17:50 AM
阿丸笔记
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
开源
AI新词
Meta
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
Anthropic
图像
英伟达
AI创作
训练
LLM
论文
代码
算法
AI for Science
Agent
苹果
Claude
芯片
腾讯
Stable Diffusion
蛋白质
开发者
xAI
生成式
神经网络
机器学习
3D
RAG
具身智能
AI视频
人形机器人
研究
大语言模型
百度
生成
GPU
Sora
工具
华为
计算
字节跳动
AI设计
大型语言模型
AGI
搜索
视频生成
场景
生成式AI
深度学习
DeepMind
架构
AI模型
亚马逊
特斯拉
Transformer
编程
视觉
MCP
预测