模型
只会「氛围编程」,永远成不了真正工程师!还差这几个关键环节
Cursor等智能IDE相继推出,带来了更智能的编程体验。 与此同时,Claude 4等基座大模型的编码性能不断提升。 再加上Andrej Karpathy的大力推广,Vibe Coding迅速走红,已成野火燎原之势。
9/3/2025 9:10:00 AM
别误会00后了!美国千人调查揭秘:85%学生都用AI,首要目的不是偷懒
GenAI席卷全球,高校课堂成为最前沿的实验场。 有人担心学位贬值、课堂失守;有人则看到新技术催生的新机遇。 刚刚,国外的「Inside Higher Ed」发布了最新的调查。
9/2/2025 5:42:47 PM
14B打败671B!微软rStar2-Agent在数学推理上超过DeepSeek-R1
现在,LLM 已经可以获得非常强大的推理能力,而其中关键便是测试时扩展(test-time scaling)。 通常而言,延长思维链(CoT)就可以延长「思考时间」,从而显著提升性能,尤其是当使用大规模强化学习和可验证奖励 (RLVR) 进行优化时。 然而,对于容易出现细微中间错误或需要创造性推理转变的难题,较长的思维链仍然存在根本性的局限性。
9/2/2025 10:20:10 AM
刚刚,DeepSeek最新发文!V3/R1训练细节全公开,信息量巨大
今天,网信办《人工智能生成合成内容标识办法》正式生效。 其中,第四条要求:对符合要求的AI生成合成内容添加显式标识。 紧跟最新政策,DeepSeek出手了。
9/2/2025 10:17:07 AM
腾讯开源WMT2025冠军大模型:拿下30个第一,同类最佳
昨晚,腾讯开源了2025年世界机器翻译大会(WMT2025)上斩获佳绩的翻译大模型Hunyuan-MT-7B。 根据比赛成绩显示,Hunyuan-MT-7B在中文、英文、法语、德语、马拉地语、爱沙尼亚语、冰岛语、芬兰语、匈牙利语、罗马尼亚语、波斯语、印地语、孟加拉语、泰米尔语、乌尔都语、僧伽罗语等31种主流、小众语言测试中,拿下30个语种第一。 Hunyuan-MT-7B在面对不同语言的复杂语法规则、独特词汇体系以及丰富文化内涵时, 均展现出强大的适应能力与翻译水准,成为同类最佳开源模型。
9/2/2025 9:02:08 AM
炸了!Google新发图片大模型简直逆天!
如果说 ChatGPT 真正的开创了聊天时代的智能对话,那么这次 Google 发布的 Nano Gemini 2.5 Flash Image(Nano Banana)将真正开启了图片智能生成的时代。 先来看看他的生成效果吧。 1.生成3D手办2.旧照片修复3.换装不需要手工 PS 了。
9/1/2025 5:18:55 PM
磊哥
Meta和Scale AI闹翻!砸143亿买的高管跑路,业务也合作不下去
两个多月前,Meta豪掷143亿美元收购Scale AI 49%的股份。 这才过去多久,两家不和的消息就被摆上了明面? 据TechCrunch报道,双方目前正在团队融合、业务合作方面产生一系列纠葛:跟随Alexandr Wang(Scale AI前CEO)一起去Meta的重要高管已经火速跑路了;Meta老员工和从Scale AI过来的人摩擦不断;Meta内部研究人员抱怨Scale AI数据质量太低,并采用了Scale AI对家数据;……u1s1,虽然这些摩擦的出现并不意外,但对比之前的“风光”,落差还是有点明显了。
9/1/2025 5:17:42 PM
NeurIPS近3万投稿爆仓,强拒400篇论文!博士疯狂内卷,AI顶会噩梦来袭
AI顶会,一场「爆仓危机」正在上演。 由于会议场地限制,NeurIPS 2025正通知「高级领域主席」(SAC),拒收已被录用的论文。 一位SAC爆料,大约400篇论文直接被砍掉,即便是三位审稿人和AC已通过初审。
9/1/2025 5:09:21 PM
王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1
没想到啊,最新SOTA的开源大模型……来自一个送外卖(Waimai)的——有两个AI,确实不一样。 这个最新开源模型叫:Longcat-Flash-Chat,美团第一个开源大模型,发布即开源,已经在海内外的技术圈子里火爆热议了。 一方面是因为成绩亮眼:它在部分benchmark上,比如Agent工具调用、指令遵循的表现超过DeepSeek-V3.1、Qwen3 MoE-2507,甚至比闭源的Claude4 Sonnet还要好。
9/1/2025 2:22:03 PM
143亿美金买来一场空!小扎向谷歌OpenAI低头,史上最大AI赌注失速
自从Llama 4发布后,Meta深陷「性能评测造假」丑闻,声誉跌落神坛。 之后,小扎坐不住了,斥143亿美元(约1000亿元)收购Scale AI,同时大举用九位数年薪挖角AI顶尖人才。 然而,近日Meta爆出离职潮,大批人才甚至还未入职便决定告别Meta。
9/1/2025 9:15:00 AM
Hinton神预言!斯坦福惊人实锤:00后20%初级IT岗蒸发,AI失业潮来了
AI无声掀起就业地震! 斯坦福大学最新研究显示:AI正无情吞噬美国年轻人的「饭碗」。 过去三年,最容易被AI取代的岗位里,22-25岁新人就业率猛降13%!
9/1/2025 9:13:00 AM
R-Zero 深度解析:无需人类数据,AI 如何实现自我进化?
本文第一作者黄呈松 (Chengsong Huang) 是圣路易斯华盛顿大学的博士生,Google scholar citation 五百多次,目前的研究的兴趣是强化学习和大语言模型。 机器之心曾经报道过其之前工作 Lorahub 已经被引超过 250 次。 大型语言模型(LLM)的发展长期以来受限于对大规模、高质量人工标注数据的依赖,这不仅成本高昂,也从根本上限制了 AI 超越人类知识边界的潜力 。
9/1/2025 9:09:00 AM
谷歌"香蕉"模型震撼发布!图像编辑能力一骑绝尘
最近有个感觉特别强烈:AI图像生成领域正在迎来一个全新的时代。 谷歌悄悄发布了代号为"Nano Banana"的Gemini 2.5 Flash Image模型,这个有着可爱名字的模型,可能要彻底改写图像编辑的游戏规则。 说实话,刚看到"香蕉"这个名字时,我还以为谷歌是在开玩笑。
9/1/2025 9:08:41 AM
阿丸笔记
DeepSeek、GPT-5带头转向混合推理,一个token也不能浪费
在最近的一档脱口秀节目中,演员张俊调侃 DeepSeek 是一款非常「内耗」的 AI,连个「1 加 1 等于几」都要斟酌半天。 在 AI 领域,这种情况被称为「过度思考」。 它的存在让 AI 大模型公司非常头疼,因为实在是太浪费算力了,那点订阅费根本 cover 不住。
9/1/2025 8:59:00 AM
比Claude好用10倍,便宜10倍!世界上最快的Agentic编程模型!刚刚,xAI发布全新模型,免费用!网友:抽卡任务有奇效
编辑 | 云昭昨天凌晨,马斯克之前预告的全新编程模型终于发布了! 距离 xAI 推出 Grok Code 不到三天,马斯克又带着一款大杀器来跟奥特曼的 GPT-5 来打(抬)擂(杠)了! “感觉比 Claude 好用 10 倍,速度也快 10 倍!
9/1/2025 2:11:00 AM
云昭
突发!微软与OpenAI同日开火:语音之战+通用大模型,AI霸权决战打响
就在OpenAI发布最新的语音大模型之际,微软掏出了自研语音大模型! 微软AI掌门人、DeepMind联合创始人Mustafa Suleyman正式宣布:微软AI正式推出MAI-Voice-1以及MAI-1-预览版! 而且还有更多内容即将推出。
8/29/2025 2:41:52 PM
今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇
今天凌晨1点,OpenAI接连扔出AI语音能力的两个重磅更新。 一个是Realtime API,可支持生产级的实时智能体。 另一个是最先进的语音到语音模型gpt-realtime。
8/29/2025 2:38:42 PM
Andrej Karpathy再次看衰强化学习:奖励函数非常可疑,RL环境才是最重要的
AK再次看衰RL本身,当然指的是长期来看刚刚Prime Intellect公司开源了一个叫Environments Hub的平台,简单来说Environments Hub是一个开源的的强化学习环境(RL environments)平台,强化学习环境被认为是下一波人工智能进步的关键瓶颈,但大型实验室正在将其锁定环境是Agent学习的地方,它们定义了世界、规则以及状态 → 动作 → 奖励的反馈循环。 从编程/数学任务到游戏和多轮对话评估,一切都可以被视为环境。 没有它们,强化学习就只是数学,没有任何交互可言详细内容看这里:,以下是AK的观点:在预训练(pretraining)时代,最重要的是互联网文本。
8/29/2025 9:01:40 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
数据
机器人
大模型
Midjourney
开源
Meta
智能
用户
微软
GPT
学习
AI新词
技术
智能体
马斯克
Gemini
图像
AI创作
英伟达
Anthropic
训练
论文
代码
LLM
算法
Stable Diffusion
芯片
腾讯
苹果
AI for Science
Claude
蛋白质
Agent
开发者
生成式
神经网络
xAI
机器学习
3D
研究
人形机器人
生成
AI视频
百度
工具
计算
RAG
大语言模型
GPU
华为
Sora
具身智能
AI设计
字节跳动
搜索
大型语言模型
AGI
场景
深度学习
视频生成
预测
视觉
架构
伟达
Transformer
DeepMind
编程
神器推荐
AI模型
亚马逊
特斯拉