模型
Karpathy氛围编程最新指南!三层AI编程结构:顺境Cursor,逆境Claude,绝境GPT-5 Pro
刚刚,大神Karpathy发布全新Vibe Coding指南! 在这份指南中,Karpathy不死磕单一模型,而是集众模之所长,总结出了一套AI编程的三层结构:Cursor——主要负责自动补全与小范围代码修改,高效传达任务意图。 Claude Code/Codex——用于实现较大功能块,快速原型开发和跨领域代码尝试。
8/26/2025 9:00:00 AM
揭秘大语言模型的“开挂神器”:ReAct 框架与推理应用
大语言模型看似神通广大,但其实也有犯迷糊的时候。 今天就带大家揭开一个能让大语言模型瞬间“开挂”的秘密武器——ReAct 引导式学习框架,还有超厉害的 ReACT 推理应用。 想知道它们到底有多神?
8/26/2025 4:11:00 AM
demo123567
Java融合AI,手把手教你整合大语模型
人工智能(AI)正加速重构各行业发展模式,大型语言模型(LLM)无疑是这场技术革命的核心驱动力。 对于Java开发者而言,如何将LLM的强大能力融入现有应用,是拓展技术边界、提升产品价值的重要方向。 本文聚焦LLM与Java集成的核心流程,从实际操作步骤、工具选型到行业最佳实践展开讲解,为Java开发者提供清晰的入门路径,助力快速落地AI集成需求。
8/26/2025 1:32:00 AM
学研妹
谷歌大脑之父首次坦白!茶水间闲聊引爆万亿帝国,AI自我突破触及门槛
刚刚,「现代互联网架构之父」Jeff Dean的最新对谈流出。 这位AI领域的传奇,是Google Brain的奠基者,也是推动神经网络走向规模化的关键人物。 从让神经网络「看懂猫」的重大突破,到TensorFlow与TPU的诞生,他的故事几乎是一部AI发展史。
8/25/2025 9:12:00 AM
刚刚,苹果AI华人总监跳槽Meta!核心团队再-1,库克被迫求助谷歌
就在刚刚,苹果AI工程总监Frank Chu被曝加入Meta。 他将在MSL Infra的新团队工作,负责AI基础设施相关事务。 这是自苹果模型团队的创建者庞若鸣,被Meta以一份价值2亿美元的薪酬包挖走之后,苹果AI项目面临的最重大的损失之一。
8/25/2025 8:56:00 AM
刚刚,马斯克开源Grok 2.5:中国公司才是xAI最大对手
就在刚刚,马斯克一手开源动作,引发了大伙儿的高度关注——xAI现在正式开源Grok 2.5,Grok 3将在半年后开源。 其实早在本月初的时候,马斯克就公开表示过:是时候开源Grok了,将会在下周。 虽然开源的时间已经超过了他说的节点,但也正如网友所说:迟到总比没有的好。
8/25/2025 8:54:00 AM
比GPT-5还准?AIME25飙到99.9%刷屏,开源模型首次!
如何让模型在思考时更聪明、更高效,还能对答案有把握? 最近,Meta AI与加州大学圣地亚哥分校的研究团队给出了一个令人振奋的答案——Deep Think with Confidence(DeepConf),让模型自信的深度思考。 论文地址::「置信度筛选」,不仅让模型在国际顶尖数学竞赛AIME 2025上拿下了高达99.9%的正确率。
8/25/2025 8:53:00 AM
诺贝尔物理学成果48年后终获数学证明!中科大少年班尹骏又出现了
诺奖得主都没找到的证明方法,现在被两位华人学者突破了。 凝聚态物理奠基人菲利普·安德森(Philip Warren Anderson)提出的Anderson模型,因解释了半导体材料中电子为何突然不再流动而闻名。 这一成果也助力他获得诺奖。
8/25/2025 8:51:00 AM
首个故事可视化综合评估框架来了!80个故事单元53种类别,20种技术方案全面对比
随着AIGC技术的进步,连环画与故事绘本生成(故事可视化)逐渐引发学界与业界的广泛关注,成为电影生成叙事性的基础。 故事可视化旨在用一段文字或照片生成一组连续的图片。 但生成的质量如何呢?
8/22/2025 3:12:23 PM
又一个Genie 3来了!刚上线挤爆服务器,Mirage 2把世界模型玩成在线游戏
世界模型也卷起来了! 全球首款AI原生UGC游戏引擎,2.0版本来了。 Mirage 2,一个可在线游玩的实时、通用领域生成式世界引擎。
8/22/2025 9:41:59 AM
一张图0.1秒生成上半身3D化身!清华IDEA新框架入选ICCV 2025
一张图就能创建上半身动作视频,方法还入选了ICCV 2025! 来自清华大学、IDEA(粤港澳大湾区数字经济研究院)的研究人员提出新框架GUAVA,不需要多视角视频、不需要针对不同个体单人训练,仅需0.1秒就能从单图创建一个上半身3D化身。 通常来说,创建逼真且富有表现力的上半身人体化身(如包含细致面部表情和丰富手势),在电影、游戏和虚拟会议等领域具有重要价值。
8/21/2025 11:06:55 AM
字节突然开源Seed-OSS,512K上下文碾压主流4倍长度!推理能力刷新纪录
字节跳动突发开源大模型,一出手就是360亿参数的Seed-OSS-36B。 图片这个Seed-OSS的命名方式,明显是在呼应OpenAI此前发布的GPT-OSS系列。 与OpenAI的开源策略也是一样,并没有直接开源核心商业模型豆包(Doubao),而是基于内部技术打造了一个专门面向开源社区的版本。
8/21/2025 10:59:42 AM
突破Agent长程推理效率瓶颈!MIT&新加坡国立联合推出强化学习新训练方法
AI Agent正在被要求处理越来越多复杂的任务。 但当它要不停地查资料、跳页面、筛选信息时,显存狂飙、算力吃紧的问题就来了。 针对这一难题,MIT和新加坡国立大学联合提出了MEM1框架。
8/21/2025 9:10:00 AM
OpenAI史上最大失误:放走这位MIT学霸!美国AI「三朝元老」,现实韦小宝
AI算力竞赛,比阿波罗更庞大,比曼哈顿更疯狂! Anthropic联合创始人Tom Brown直言,AI基础设施的规模超越阿波罗与曼哈顿计划。 AGI算力投入正疯狂膨胀,每年增速高达3倍。
8/21/2025 9:07:00 AM
奥特曼首曝GPT-6,亲口承认GPT-5「搞砸了」!接入大脑读心,估值或飙破5000亿
GPT-5还没捂热,奥特曼又来捧GPT-6了。 这几天,奥特曼在旧金山的采访中表示,「人们想要记忆功能,希望未来ChatGPT能让用户自定义语气和个性」。 虽未公布下一代AI模型的具体时间,但从奥特曼口中,可以感受出GPT-6确实不一样。
8/21/2025 9:05:00 AM
Meta AI大洗牌!超级智能一拆四,小扎押注硅谷华人,LeCun或已出局
扎克伯格,这次是铁了心了,他要All in AI,不留一点后路。 8月20号,Meta又扔下一颗炸弹! 超级智能团队,再一次大重组,短短6个月这已经是第四次重组AI团队了。
8/20/2025 12:41:10 PM
dLLM的「Free Lunch」!浙大&蚂蚁利用中间结果显著提升扩散语言模型
本文第一作者王文,浙江大学博士生,研究方向是多模态理解与生成等。 本文通讯作者沈春华,浙江大学求是讲席教授,主要研究课题包括具身智能、大模型推理增强、强化学习、通用感知模型等。 近年来,扩散大语言模型(Diffusion Large Language Models, dLLMs)正迅速崭露头角,成为文本生成领域的一股新势力。
8/20/2025 12:38:26 PM
深度揭秘OpenAI如何让GPT-5「技术性」超越Claude:悄悄跳过最难的23道题
几天前,OpenAI发布会上,奥特曼宣布GPT-5登顶了,号称代码能力全球第一。 但发布会上搞了一个大乌龙,52.8>69.1=30.8? 于是,OpenAI那些年薪上亿的天才们做的一张表格火遍了全世界(左边)。
8/20/2025 12:24:23 PM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
数据
机器人
大模型
Midjourney
开源
Meta
智能
用户
微软
GPT
学习
AI新词
技术
智能体
马斯克
Gemini
图像
AI创作
英伟达
Anthropic
训练
论文
代码
LLM
算法
Stable Diffusion
芯片
腾讯
苹果
AI for Science
Claude
蛋白质
Agent
开发者
生成式
神经网络
xAI
机器学习
3D
研究
人形机器人
生成
AI视频
百度
工具
计算
RAG
大语言模型
GPU
华为
Sora
具身智能
AI设计
字节跳动
搜索
大型语言模型
AGI
场景
深度学习
视频生成
预测
视觉
架构
伟达
Transformer
DeepMind
编程
神器推荐
AI模型
亚马逊
特斯拉