AI在线 AI在线

AI

Agentic Enterprise:把 AI 从神坛拉回用户办公桌

大家好,我是肆〇柒,AI 的蓬勃发展正以前所未有的速度渗透到人类生活的各方面。 而在商业领域,AI 的影响力更是不容小觑,尤其在企业决策这一关键环节。 企业各职能、任务和运营都离不开高效的决策,而 AI 正展现出助力企业提升决策效能的巨大潜力。
7/22/2025 11:24:32 AM
肆零柒

南洋理工、北大、上海AI实验室开源长记忆世界模型

目前,世界模型的模拟方法在维持长期一致性方面仍面临巨大挑战。 许多模拟环境在视角移动或时间推移后会出现内容变化,导致 3D 空间不一致,严重影响了用户体验和模拟效果的可靠性。 为了解决这一难题,南洋理工大学、北京大学王选计算机技术研究所、上海人工智能实验室的研究人员联合开源了长记忆世界模型WORLDMEM。
7/22/2025 10:45:55 AM

碾压DeepSeek V3!阿里开源新版Qwen-3,屠榜级断层第一

今天凌晨1点,阿里巴巴开源了Qwen3系列新版本Qwen3-235B-A22B-2507。 比较意外的是,阿里已经停用了混合思考模型,新版Qwen3是一个非思维推理,又回到了指令微调模型,但性能非常强劲。 根据阿里公布的数据显示,新版Qwen3在知识、推理、代码、对齐、智能体、多语言测试6大类几十种测试基准中,全部大幅度超过了DeepSeek开源的新版V3-0324模型。
7/22/2025 10:43:25 AM

并行革命,32倍吞吐量跃升!英伟达Helix架构突破百万Token推理瓶颈

想象一个使用大模型的任务,需要一次处理百万字符的文档,例如从百科全书中获取信息,或是分析数百页的法律卷宗,异或追踪持续数月的对话记录,都需要越来越长的上下文。 而大模型生成的每个词都需要扫描存储在所谓的KV缓存中存储的过去标记。 反复读取这个缓存会消耗GPU内存带宽。
7/22/2025 10:40:00 AM

刷新世界纪录!神秘学生击败谷歌AlphaEvolve难题最优解,优势仅0.00006442

一个还在上学的少年在AI的帮助下,击败了谷歌最先进的技术,创造了新的世界纪录! 当IMO闹剧还在争论,这个少年靠着AI已经在数学问题上逆袭了谷歌最先进的、用于设计高级算法的AlphaEvolve。 在「Circle Packing」问题上,这个少年的算法以「0.00006442」的优势超过了谷歌AlphaEvolve,也超过了此前的FICO Xpress创造的纪录。
7/22/2025 10:38:02 AM

超越Claude 3.5和o1!8B模型靠「分层投票+测试时训练」逆袭

测试时训练(test-time training)是一种通用的训练方法。 该方法将单个未标记的测试实例转化为自监督学习问题,在对测试样本进行预测之前更新模型参数。 而对于大模型训练,通常会使用一种称为情境学习的技术来提高其模型在新任务上的性能。
7/22/2025 10:22:02 AM

深度解密国内BAS如何实现AI赋能的智能化安全验证攻防新范式!

在网络安全形势日益复杂、各类威胁不断涌现的当下,人工智能(AI)已然成为推动各行业数字化转型以及提升安全防御能力的关键力量。 AI正从根本上重塑BAS(入侵与攻击模拟),使其从传统的“模拟验证工具”进化为“智能对抗中枢”。 其核心价值在于:通过赋能动态攻击生成、自适应路径探索、智能化结果分析与自动化策略闭环,将BAS的全生命周期智能化。
7/22/2025 2:11:00 AM
安全牛

Dify 1.6.0原生MCP开发出行助手智能体

前言AI智能体通过感知环境、自主决策和执行任务,突破传统大模型仅限于语言交互的局限。 然而,智能体的开发长期受制于接口碎片化与工具兼容性难题。 开发者需为不同数据源编写适配代码,这一痛点催生了MCP协议的诞生。
7/22/2025 2:00:00 AM
AI大模型应用开发

IMO怒斥OpenAI自封夺金,“91位评委均未参与评分”,网友:炒作无下限

OpenAI声称新模型获得IMO金牌不到24小时,剧情就出现了大反转! 多位IMO官方人士和学界大佬纷纷发声,直指OpenAI的做法“粗鲁且不恰当”。 IMO主办方要求AI公司在闭幕式一周后再公布结果,让关注的焦点留在参赛的青少年上,然而OpenAI偏偏选择在闭幕式刚结束就急不可耐地宣布了成绩。
7/21/2025 2:27:44 PM

数百个虚拟人在线逃生!天大等发布:首个实时在线多智能体模拟方法

人群疏散模拟对于提高公共安全至关重要,也是构建逼真虚拟动态环境所需要的技术,其发展面临着复杂人类行为建模难的挑战。 现有的疏散模拟方法常以2D点表示人群,关注人群位置和轨迹,但忽略了复杂人类行为,如碰撞、交互、摔倒等,以及三维环境、个体行为能力的影响,导致模拟结果不真实。 而现有的三维运动生成方法和角色控制方法也无法同时保证实时性、合理性、个性化、动态感知、以及适用于任意场景和地形,如表1所示。
7/21/2025 11:51:58 AM

斯坦福开源复杂推理AI Agent,融合超十种工具

传统的AI助手通常依赖于单一模型或有限的工具集,难以应对需要多步推理、跨领域知识融合及高精度数据分析的任务。 例如,解决视觉谜题,需要精细图像理解和基于文本的混合推理。 为了解决这一难题,斯坦福开源了OctoTools,这是一个融合了11种不同工具专用于复杂推理的AI Agent。
7/21/2025 11:51:12 AM

仅需0.7秒单图像实时3D重建,开源扩散模型

单图像3D重建,即从单一视角的二维图像中恢复出三维物体的形状和结构,是计算机视觉领域的一项基础且极具挑战的难题。 学术界和工业界主要探索了两种不同的技术路线:基于回归的建模方法和生成式建模方法。 基于回归的方法能够高效地推断出可见表面,但在处理遮挡区域时却力不从心,常常导致表面和纹理估计不准确。
7/21/2025 9:26:00 AM

代码碾压一切!OpenAI神秘模型o3-alpha一夜刷屏,却遭41岁大神绝地反杀

OpenAI果然藏了一手。 昨天夜里,一个名为「o3-alpha-responses-2025-07-17」的神秘模型被爆出。 网友们疯狂测试后,得出一致结论,这个模型强得离谱。
7/21/2025 9:19:00 AM

谷歌AlphaFold得了诺奖,但DeepMind根本没引用前人论文?

AlphaFold因获得诺奖而声名大噪。 在大多数情况下,AlphaFold 2的预测精度几乎可与X射线晶体学相媲美,令人震撼。 生物化学界持续了半个世纪的难题,终于被攻克。
7/21/2025 9:16:00 AM

《AI 2027》揭秘:人类会被超级智能取代吗?等等,还有另一个结局!

2021年,Daniel Cocotal团队发布了一份研究报告《AI 2027》。 他以超前且精准的预测闻名,成为了洞悉AI未来发展方向的先驱。 那时ChatGPT还没问世,Daniel就准确预测了聊天机器人的崛起、耗资1亿美元的AI训练项目,以及对AI芯片的出口管制。
7/21/2025 9:15:00 AM

黄仁勋说的对!Meta绝密AGI梦之队曝光,44人天团一半来自中国

一张Meta「超级智能实验室」成员名单图,全网传疯了! 今早,硅谷VC大佬Deedy从一位匿名的Meta员工手中,获取了一份44人「顶尖天才」的绝密名单。 这份密密麻麻的列表中,详细记录了每位成员的:· 名字 国籍 工作经验· Meta目前岗位及任期· 曾任职的公司 岗位· 教育背景 专业能力小扎耗费数月的「挖人」战绩,真是令人惊叹。
7/21/2025 9:13:00 AM

ICML'25 |大模型再爆弱点!旧记忆忘不掉,新记忆分不出,准确率暴降

人们越来越意识到,大语言模型(LLM)里「找信息」这件事,并不是简单地翻字典,而和「写信息」的能力紧紧绑在一起。 一般认为,给模型塞入更长的上下文就能让它找得更准,不过上下文内部存在「互相干扰」,但这种现象却很少被研究。 为了看清这个问题,弗吉尼亚大学和纽约大学神经科学中心研究人员借用了心理学里的「前摄干扰」(proactive interference)概念:先出现的信息会妨碍我们回忆后来更新的内容。
7/21/2025 9:09:00 AM

英伟达GPU被曝严重漏洞,致模型准确率暴跌99.9%

英伟达GPU,被白帽黑客发现了严重漏洞。 通过一种名为GPUHammer的攻击方式,可以让GPU上跑的大模型,准确率从80%直接掉到0.02%,可以说是渣都不剩。 多伦多大学的研究人员形容,这种攻击就像在模型中引发灾难性的脑损伤。
7/21/2025 9:05:00 AM