AI在线 AI在线

理论

轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错

朋友会离开你,兄弟会背叛你。 但数学不会,数学不会就是不会。 相信学不好高等数学的人,对上面这个梗深有感悟。
3/11/2025 1:42:19 PM
新智元

OpenAI最强模型惨遭剖脑,CoT写下作弊自白书!不写代码耍心机被当场抓包

就在刚刚,OpenAI博客放出了一项新的研究。 他们发现,前沿推理模型一旦有机会,就会试图钻漏洞! 这种行为,被称为奖励欺骗。
3/11/2025 1:39:08 PM
新智元

从鹦鹉学舌到灵魂对话,AI的人话革命

2030年,一位老人对家庭机器人说:“我想念年轻时在西湖划船的日子。 ”AI不仅能调出当年的老照片,还能结合实时天气与老人健康数据,规划一场安全舒适的怀旧之旅,并同步预约无人游船。 当机器对人类产生“主动关怀”,标志着AI从工具进化为“生活伴侣”。
3/11/2025 1:20:43 PM
佚名

稚晖君机器人“葡萄缝针”神技再现江湖,这次是人形的!骑自行车惊呆众人:又抽象又硬核

刚刚! 鸽了两年之后,稚晖君罕见更新视频——上线号称史上最复杂项目灵犀X2,能够像人一样灵动地骑自行车。 评论区早已经是听取哇声一片。
3/11/2025 1:19:26 PM
量子位

人工智能重塑美国就业市场,AI技术正成为职场必备技能

据华尔街日报报道,人工智能(AI)正在深刻改变美国的就业格局,其渗透程度远超预期。 最新数据显示,2025年至今,美国近四分之一的技术岗位招聘明确要求应聘者具备AI技能,这一比例在过去几年中呈爆发式增长。 科技行业引领AI岗位增长在信息科技领域,人工智能的影响力尤为突出。
3/11/2025 1:14:15 PM
小菲

使用DeepSeek的GRPO,7B模型只需强化学习就能拿下数独

没有任何冷启动数据,7B 参数模型能单纯通过强化学习学会玩数独吗? 近日,技术博主 Hrishbh Dalal 的实践表明,这个问题的答案是肯定的。 并且他在这个过程中用到了 DeepSeek 开发的 GRPO 算法,最终他「成功在一个小型数独数据集上实现了高奖励和解答」。
3/11/2025 1:07:58 PM
机器之心

美股一夜蒸发1.75万亿!特斯拉、英伟达七巨头集体跳水,马斯克DOGE再干一年

昨夜,美国上演了真正的黑色星期一。 截止10日收盘,美股三大指数集体暴跌,道指跌2.08%,纳指跌4%,标普500跌近2.8%。 纳指暴跌创2022年以来最大跌幅,而标普500已经抹去了自去年11月美国大选以来所有涨幅。
3/11/2025 1:04:21 PM
新智元

L²M条件,MIT团队为长文本建模建立新理论框架

编辑 | ScienceAI在追求更强大 AI 系统的道路上,大语言模型处理长上下文的能力始终是制约其发展的关键瓶颈。 尽管 DeepSeek、GPT-4、LLaMA-3 等顶尖模型已能处理数万 token 的文本,但学界对「模型究竟需要何种能力才能有效理解长文本」这一根本问题仍缺乏理论指导。 近日,麻省理工学院 Zhuo Chen、Oriol Mayn ́e i Comas 、Zhuotao Jin 、Di Luo 、Marin Soljači 领衔的研究团队提出自然语言中隐藏的互信息缩放定律(Mutual Information Scaling Law),并由此提出长上下文语言建模的 L²M 条件(Long-context Language Modeling condition),为理解大语言模型的长文本处理能力建立了首个系统化理论框架。
3/11/2025 12:17:00 PM
ScienceAI

基于药效团与GPT从头生成分子,北大开发TransPharmer助力药物发现

编辑 | 萝卜皮深度生成模型推动了药物发现,但生成的化合物通常结构新颖性有限,限制了药物化学家的灵感。 为了解决这个问题,北京大学的研究人员开发了 TransPharmer,这是一种生成模型,它将基于配体的可解释药效团指纹与基于生成预训练 Transformer(GPT)的框架相结合,用于从头生成分子。 TransPharmer 在无条件分布学习、从头生成和药效团约束下的骨架构建方面表现出色。
3/11/2025 12:16:00 PM
ScienceAI

陶哲轩亲测点赞o3-mini:专家级证明,我收到了一个完美的答案

刚刚,陶哲轩亲测了一下o3-mini,然后他给出了这样的结论:重建图论中一个标准(专家级)结果的证明,o3-mini是完全可以hold住的。 图片陶哲轩要重建的这个证明,叫做三角形移除引理(triangle removal lemma),由Ruzsa和Szemeredi于1978年提出,是极值图论中的重要结果:对于任意的η>0,都存在c0,使得对于任意一个足够大的有n个顶点的图,如果该图中最多包含cn3个三角形,那么可以通过移除最多ηn2条边,使这个图变为无三角形的图。 用另一种表述方式就是,如果一个有n个顶点的图包含o(n3)个三角形,那么可以通过移除o(n2)条边来删除所有的三角形。
3/11/2025 12:07:10 PM

基于Dify与DeepSeek:零门槛训练自己的专属AI大模型

在人工智能(AI)技术日益普及的今天,训练属于自己的AI大模型不再是遥不可及的梦想。 随着DeepSeek  R1的发布,其部署成本仅为ChatGPT的十分之一,这一突破让更多企业和个人能够轻松参与AI开发。 未来,垂直领域的AI大模型和应用将如雨后春笋般涌现,这无疑是一个巨大的机遇。
3/11/2025 10:51:35 AM
冰河技术

Magic Mirror:可从单个参考图像生成电影级质量身份一致性和自然运动视频

Magic Mirror 可以生成合成身份配对的视频数据。 该框架利用视频扩散模型,能够在保持身份一致性的同时,生成具有电影级质量和动态运动的视频。 Magic Mirror 根据 ID 参考图像生成文本转视频结果。
3/11/2025 10:15:00 AM
AIGC Sdudio

如何评价智元GO-1大模型?“一脑多形”加速智能机器人落地

2025年3月10日,由华为前“天才少年”稚晖君(彭志辉)创立的智元机器人,正式发布首个通用具身基座大模型GO-1。 这一突破性技术不仅填补了国内该领域空白,更以独特的ViLLA架构和32%成功率提升的实测数据,将具身智能推向新高度。 这款模型如何重新定义机器人智能?
3/11/2025 10:12:07 AM
舒云

DPG-Bench榜首!智谱开源文生图模型CogView4:支持中英文输入和生成,免费商用授权!

在图像生成技术的浪潮中,智谱开源再次引领潮流,推出了全新的文生图模型——CogView4。 这款模型不仅支持中英双语提示词输入,更擅长理解和遵循中文指令,让创意表达无界限。 尤为值得一提的是,CogView4开创了先河,成为首个能在画面中直接生成汉字的开源文生图模型,让文字与图像的融合更加自然流畅。
3/11/2025 10:00:00 AM
AIGC Studio

AI代理、AGI、ASI 和“推理”等人工智能流行术语真正的含义是什么

如果您曾参与过 AI 讨论,无论是在研究、行业还是浏览网页,您可能已经遇到过诸如AI 代理、AGI、ASI 和推理等流行术语被广泛使用。 但这些术语真的有意义吗? 还是它们只是助长了炒作周期和误导性对话?
3/11/2025 9:51:14 AM
晓晓

腾讯混元-TurboS:首个混合Transformer-Mamba MoE超大模型来了

腾讯混元团队发布了他们最新的力作——Hunyuan-TurboS,首个混合Transformer-Mamba MoE架构的超大模型大家都知道,传统Transformer模型在处理长文本时一直面临挑战,O(N²)的复杂度以及KV-Cache问题让长文本训练和推理效率大打折扣。 而这次,混元-TurboS巧妙地融合了Mamba和Transformer两种架构的优势:• Mamba的高效长序列处理能力• Transformer强大的上下文理解能力强强联合,效果自然惊艳! 官方数据显示,Hunyuan-TurboS在多个关键benchmark上表现出色:• 数学、推理、对齐能力超越或持平 GPT-4o-0806、DeepSeek-V3 以及各类开源模型。
3/11/2025 9:42:00 AM
AI寒武纪

哥大本科生靠AI横扫硅谷大厂offer,学校震怒!预言码农两年内淘汰准备退学

硅谷大型科技公司FAANG的面试,对不少人来说都是一场噩梦。 结果,哥大的一位大二学生Roy Lee,居然利用AI,顺利斩获了亚马逊、Meta和TikTok的offer,获得了直通梦中情厂的实习机会! 这个消息一出,震惊了不少人。
3/11/2025 9:40:00 AM
新智元

微软开源多模态AI基础模型!无需额外微调轻松拿捏网页、机器人

微软研究院官宣开源多模态AI——Magma模型。 首个能在所处环境中理解多模态输入并将其与实际情况相联系的基础模型。 该模型近期已被计算机视觉顶会CVPR接收,只要给定一个目标描述,Magma就能制定计划、执行行动,无论是在数字界面中还是物理世界里,都能展现出灵活而高效的交互能力。
3/11/2025 9:35:00 AM
量子位