模型
OpenAI女CEO太狠了!智商148,GPT-5才是真印钞机
为什么GPT-5会让老用户失望,但免费用户沸腾到要限流? 为什么一个聊天模型,会突然懂得「花钱买成果」? 为什么OpenAI用GPT-5在下一盘大棋,可能让广告公司和搜索引擎都睡不着?
8/13/2025 6:31:52 PM
马斯克删除xAI「研究员」职位引爆网络!LeCun怒批:如此暴力将扼杀创新
1945年7月16日凌晨,美国新墨西哥州的荒漠深处,人类历史上第一颗原子弹试验即将启动。 就在倒计时前,年轻的数学家与工程师理查德·哈明(Richard Hamming)还在焦虑地反复检查他的计算结果。 因为曼哈顿计划的科学家们曾严肃提出一个极端假设:原子弹造成的高温是否可能引发空气中氮/氧核聚变从而点燃大气层。
8/13/2025 6:31:26 PM
OpenAI没开源的gpt-oss基础模型,他去掉强化学习逆转出来了
前些天,OpenAI 少见地 Open 了一回,发布了两个推理模型 gpt-oss-120b 和 gpt-oss-20b。 但是,这两个模型都是推理模型,OpenAI 并未发布未经强化学习的预训练版本 gpt-oss 基础模型。 然而,发布非推理的基础模型一直都是 AI 开源 / 开放权重社区的常见做法,DeepSeek、Qwen 和 Mistral 等知名开放模型皆如此。
8/13/2025 11:42:09 AM
解决扩散模型过拟合的创新框架T-LoRA
随着预训练的大型文本到图像扩散模型的发展,越来越多的企业和个人开发者开始探索如何通过少量样本对这些模型进行定制化,以生成特定的对象或风格。 但这种定制化过程面临着一个严峻的挑战:当训练样本数量有限时,模型往往会过度拟合训练数据的背景和位置信息,导致生成的图像缺乏多样性和灵活性。 为了解决这一难题,来自 AIRI 和 HSE 大学的研究团队提出了一种名为 T-LoRA 的新框架,旨在通过单张图像对扩散模型进行定制化,同时避免过度拟合的问题。
8/13/2025 9:27:55 AM
大型语言模型稳定强化学习的新路径:几何平均策略优化GMPO
本文主要作者:赵毓钟,中国科学院大学在读博士,微软亚洲研究院 MSRA 实习生,主要研究方向为多模态学习、语言模型后训练。 刘悦,中国科学院大学在读博士,微软亚洲研究院 MSRA 实习生,主要研究方向为视觉表征模型。 指导老师:万方,中国科学院大学计算机学院副教授,博导。
8/13/2025 9:25:06 AM
靠AI破解癌症,初创公司融下3000万刀!新目标:建10亿单细胞数据集
在AI模拟蛋白质取得了巨大突破后,一些人把目标瞄准了整个活细胞。 福布斯杂志最新介绍,有一家初创公司刚刚融资3000万美元,用于构建活细胞的AI模型。 这家公司名为Tahoe Therapeutics,目前估值达1.2亿美元,他们开发了一种可扩展的方法,能够快速生成AI模型所需的关键生物数据,并利用这些数据寻找治愈癌症的新方法。
8/13/2025 9:19:14 AM
李飞飞押注的「世界模型」,中国自研Matrix-3D已抢先实现了?
一花一世界,一叶一菩提。 千百年来,人类只能凭想象勾勒图画之外的世界,梦境与现实之间始终隔着一层不可触及的纱幕。 而今天,当AI的力量被无限延伸,这层纱幕终于被揭开——Matrix-3D,一个真正从「一图生万境」的世界模型!
8/13/2025 9:16:00 AM
具身智能体主动迎战对抗攻击,清华团队提出主动防御框架
面对对抗攻击,具身智能体除了被动防范,也能主动出击! 在人类视觉系统启发下,清华朱军团队在TPMAI 2025中提出了强化学习驱动的主动防御框架REIN-EAD。 该框架让智能体也能学会“看第二眼”,提升对抗场景下的感知鲁棒性。
8/13/2025 9:07:00 AM
GPT-5编程成绩有猫腻!自删23道测试题,关键基准还是自己提的
别急着用GPT-5编程了,可能它能力没有你想象中那么强。 有人发现,官方测试编程能力用的SWE-bench Verified,但货不对板,只用了477个问题。 什么意思呢?
8/13/2025 8:50:00 AM
免费使用GPT-5!一手实测案例,代码能力强的离谱
上周五OpenAI发布期待已久的GPT-5,并宣布会免费开放使用。 经过几天调试,从今天开始,免费版ChatGPT可以正式使用GPT-5了,下面「AIGC开放社区」就基于免费版为大家展示一下GPT-5强大的功能。 我们先试试GPT-5的拿手好戏代码能力,输入提示词:用 JavaScript 结合 HTML5 Canvas 开发一个打砖块网页游戏,要求,包含可移动的挡板,通过鼠标或左右键控制、随机位置生成的砖块矩阵,小球撞到挡板、砖块、上下左右边界时有正确的物理反弹效果,砖块被击中后消失,全部砖块消除则通关,小球掉落挡板下方则游戏结束。
8/12/2025 9:18:00 AM
2025全球大模型应用报告:红海混战「忠诚度」瓦解,用户脚踏4.7条船!
2025年上半年,大模型正在从技术边界走向生产现实。 横跨欧美亚上千家企业的最新调研揭示,生成式AI已不再只是研发试验品,45%的企业已将其部署到生产环境中。 工程研发、客户支持和营销成为AI最活跃的前线!
8/12/2025 9:15:00 AM
硅谷精英放弃生娃!MIT女记者揭秘:人类只是AI垫脚石,世界很快就毁灭
有人说,AI是人类的未来。 但是事实恰恰相反,AI正在奔向未来,留下的却是人类的裂缝。 它吞噬电力、污染水源、毁掉工作、扰乱情绪...它以「智能」的名义,接管人类的表达、判断与决策。
8/12/2025 9:13:00 AM
GPT-5数字母依然翻车!马库斯:泛化问题仍未解决,Scaling无法实现AGI
大模型好不容易学会数r,结果换个字母就翻车了? 而且还是最新的GPT-5。 杜克大学教授Kieran Healy表示,自己让GPT-5数了数blueberry里有几个b,结果GPT-5斩钉截铁地回答3个。
8/12/2025 9:06:00 AM
Attention Sink产生的起点?清华&美团首次揭秘MoE LLM中的超级专家机制
稀疏激活的混合专家模型(MoE)通过动态路由和稀疏激活机制,极大提升了大语言模型(LLM)的学习能力,展现出显著的潜力。 基于这一架构,涌现出了如 DeepSeek、Qwen 等先进的 MoE LLM。 然而,随着模型参数的迅速膨胀,如何高效部署和推理成了新的挑战。
8/12/2025 8:55:00 AM
机器人上下文协议首次开源:阿里达摩院一口气放出具身智能「三大件」
8 月 11 日,在世界机器人大会上,阿里达摩院宣布开源自研的 VLA 模型 RynnVLA-001-7B、世界理解模型 RynnEC、以及机器人上下文协议 RynnRCP ,推动数据、模型和机器人的兼容适配,打通具身智能开发全流程。 开源链接:机器人上下文协议 RynnRCP - 语言 - 动作模型 RynnVLA-001 RynnEC ,但仍面临开发流程碎片化,数据、模型与机器人本体适配难等重大挑战。 达摩院将 MCP(Model Context Protocol)理念引入具身智能,首次提出并开源了 RCP(Robotics Context Protocol)协议以推动不同的数据、模型与本体之间的对接适配。
8/11/2025 6:09:37 PM
让OpenAI只领先5天,百川发布推理新模型,掀翻医疗垂域开源天花板
刚刚,全球最强开源医疗模型发布,来自中国。 百川开源最新医疗推理大模型Baichuan-M2-32B,在OpenAI发布的Healthbench评测集上,超越其刚刚发布5天的开源模型gpt-oss-120b。 不仅以小博大,而且领先除GPT5以外所有的开源闭源前沿模型。
8/11/2025 6:01:12 PM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
开源
AI新词
Meta
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
Anthropic
图像
英伟达
AI创作
训练
LLM
论文
代码
算法
AI for Science
Agent
苹果
Claude
芯片
腾讯
Stable Diffusion
蛋白质
开发者
xAI
生成式
神经网络
机器学习
3D
RAG
具身智能
AI视频
人形机器人
研究
大语言模型
百度
生成
GPU
Sora
工具
华为
计算
字节跳动
AI设计
大型语言模型
AGI
搜索
视频生成
场景
生成式AI
深度学习
DeepMind
架构
AI模型
亚马逊
特斯拉
Transformer
编程
视觉
MCP
预测