理论
高考作文“抽象”上热搜,大模型来战能拿几分?
6月7日上午,2025年全国高考正式拉开帷幕。 首场语文考试结束后,作文题目便迅速成为众人讨论的焦点。 有网友表示,今年的高考作文太难了,甚至是有些抽象。
6/9/2025 3:23:26 PM
Yu
Cursor1.0 发布引热议!高风险后台智能体埋雷点,网友:用VS Code分叉是战略性错误!最多150万付费用户!
作者 | Tim Anderson出品 | 51CTO技术栈(微信号:blog51cto)上周周末,Anysphere 正式发布了其 AI 编辑器 Cursor 的 1.0 版本,并引入了多项新功能,包括自动审查 Pull Request(PR)并发现问题的 BugBot 预览版、可在远程环境中修改代码的 Background Agent(后台智能体)功能、能记忆并引用 AI 对话信息的 Memories(记忆)功能以及一键安装MCP的功能。 然而,在真实的开发者当中,人们对于 Cursor 的评价开始出现了不一样的声音,不少网友认为 Cursor 单 IDE 的孤岛打法有违开发者的习惯,开发者更喜欢“多 IDE 多任务 多 AI”无缝接入现有工具链的产品;另有一些网友认为 Cursor 最好的归宿是被七大 AI 巨头收购。 此外,本文还带领大家梳理了目前海外AI编程产品的竞争格局。
6/9/2025 2:13:54 PM
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
编译 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)Ilya终于出现了! 自从OpenAI宫斗风波之后,这位GPT背后的技术灵魂便鲜少露面。 甚至,where is Ilya的各种阴谋论一度成为整个AI圈的热梗。
6/9/2025 1:48:59 PM
伊风
微软发布AI Agent故障白皮书,万字解读各种恶意智能体
微软发布了《AI Agent系统故障模式分类》白皮书,以帮助开发者和用户更好的理解、解决日常Agent出现的各种故障。 这些故障主要分为新型故障和既有故障两大类,并详细解读了出现这些故障的原因以及如何解决。 由于内容太多,「AIGC开放社区」就为大家介绍一些典型的恶意智能体攻击方法和原理。
6/9/2025 9:54:20 AM
AI模型的耗电量惊人 下一步是建设太空数据中心?
随着人工智能(AI)技术的飞速发展,地球上的数据中心面临着巨大的电力供给压力。 据美国能源部报告,预计到2028年,美国的数据中心将消耗总发电量的12%,而这一比例在2023年仅为4.4%。 AI模型的耗电量惊人,导致电力公司难以满足不断增长的需求,电费持续上涨。
6/9/2025 9:47:53 AM
报告称83%的Z世代愿与AI结婚 专家警告本质上属于"行为上瘾"
人工智能企业Joi AI发布的报告显示,在1995-2009年出生的Z世代中,约83%的受访者愿与AI结婚,83%愿与人工智能建立深厚情感联系。 针对这一现象,Joi AI提出,继亲情、爱情、友情后,人类社会或将新增“AI关系”这一关系形态。 专业人士Jaime Bronstein指出:“AI关系无意取代真实人类关系,而是提供一种独特的情感支持类型,助力提升个人整体情感健康。
6/9/2025 9:45:04 AM
小刀
小红书开源首个大模型,11万亿非合成训练数据
国内著名社交平台小红书,开源了首个大模型——dots.llm1。 dots.llm1是一个1420亿参数的专家混合模型(MoE),在推理过程中仅激活140亿参数,能保持高性能的同时大幅度降低训练和推理成本。 dots.llm1最大特色是使用了11.2万亿token的非合成高质量训练数据,这在现阶段的开源大模型中非常罕见,看来小红书也得益于自己庞大的语料库出手就是阔啊。
6/9/2025 9:41:25 AM
美IT业裁员狂飙35%,「硅谷梦」彻底崩塌!打工人怒喷PIP
2025,美国裁员之年。 本周四,职业介绍机构 Challenger, Gray & Christmas 发布了美国全国就业报告。 与去年同期相比,美国全国裁员人数上涨了47%。
6/9/2025 9:35:56 AM
大模型强化学习新突破——SPO新范式助力大模型推理能力提升!
当前,强化学习(RL)在提升大语言模型(LLM)推理能力方面展现出巨大潜力。 DeepSeek R1、Kimi K1.5 和 Qwen 3 等模型充分证明了 RL 在增强 LLM 复杂推理能力方面的有效性。 然而,要实现有效的强化学习,需要解决一个根本性的挑战,即信用分配问题(credit assignment):在大语言模型的场景下,如何将整个序列(LLM 的回复)最终的评估结果,归因到序列中具体的决策动作(token)上。
6/9/2025 9:32:35 AM
引领京城AI盛宴,金蝶开创企业管理AI新时代
在新一轮人工智能技术浪潮推动下,企业数字化转型正加速迈向智能化变革的新阶段。 6月6日,金蝶云苍穹AI峰会北京站盛大启幕,300余位来自央国企、行业龙头企业及生态伙伴的AI先行者共聚一堂,围绕“AI赋能企业管理”的新思想、新技术、新应用展开深入研讨,加速推动AI技术在企业管理中从“可想象”走向“可落地”。 助力企业实现智能化转型,是金蝶“予力企业、成就不凡”这一使命在AI时代的具体体现。
6/9/2025 9:24:23 AM
ICML 2025 | 全局池化+局部保留,CCA-Attention为LLM长文本建模带来突破性进展
琶洲实验室、华南理工大学联合推出关键上下文感知注意力机制(CCA-Attention),实现超长文本的高效上下文建模。 在 128K 超长序列上下文建模任务中,CCA-Attention 的推理速度是标准自注意力机制的 7.9 倍,同时键值缓存(KV Cache)显存占用减少 93%,性能全面优于现有高效注意力方法。 论文标题:Core Context Aware Transformers for Long Context Language Modeling论文链接:::2024年12月17日该成果已被 ICML 2025 接收,最早于 2024 年 12 月 17 日提交至 ArXiv,早于 DeepSeek NSA 和 Kimi MoBA 公开。
6/9/2025 9:23:05 AM
ALPHAONE(α1):LRM 自适应推理效率与准确性的平衡之道
大家好,我是肆〇柒。 今天,我们来聊大型推理模型(LRM)领域的一项研究 ——ALPHAONE(α1)框架。 当前,大型推理模型如 OpenAI 的 o1 和 DeepSeek-R1 等,已经在诸多复杂推理任务上展现出了强大的能力,但它们在推理过程中也面临着一些挑战,比如容易陷入过度推理或推理不足的困境。
6/9/2025 9:17:44 AM
肆零柒
人工智能和知识图谱八(完):知识图谱的挑战、缺点和陷阱
知识图谱虽然功能强大,但在实际场景中实现它们并非一帆风顺。 我们必须意识到其中的挑战、局限性和潜在风险,包括技术问题,比如可扩展性、数据质量、模式复杂性、与非结构化或动态数据的集成障碍,以及偏见和隐私等道德问题。 可扩展性和性能:一个挑战是将知识图谱扩展到极大规模(数十亿个节点/边),同时保持复杂查询和更新的性能。
6/9/2025 9:10:26 AM
晓晓
算力终结者来了!华人天团「降维打击」注意力瓶颈,AI狂飙进对数时代
LLM苦算力太久了! 为缓解长序列建模中的算力瓶颈,研究界持续探索高效替代方案。 这次Mamba作者Tri Dao、华人AI领域大牛Eric P.
6/9/2025 9:05:00 AM
为什么用错奖励,模型也能提分?新研究:模型学的不是新知识,是思维
本文主要作者是吕昂和谢若冰。 吕昂,中国人民大学博士生,研究方向为语言模型结构优化,导师为严睿教授;谢若冰,腾讯高级研究员,研究方向为大语言模型、推荐系统。 最近的一篇论文中,来自人大和腾讯的研究者们的研究表明,语言模型对强化学习中的奖励噪音具有鲁棒性,即使翻转相当一部分的奖励(例如,正确答案得 0 分,错误答案得 1 分),也不会显著影响下游任务的表现。
6/9/2025 9:04:00 AM
交互式生成视频(IGV):重塑游戏、智能与驾驶的交互革命
大家好,我是肆〇柒。 今天,我们来聊聊交互式生成视频(IGV)技术。 这是一项在当下技术革命中产生的前沿技术,它具备强大的生成能力和交互特性,正在改变我们与虚拟世界互动的方式。
6/9/2025 9:03:58 AM
肆零柒
顶会0篇,一夜RLHF爆文刷屏!他靠写作逆袭AI圈,院士都说好
Ai2的高级研究科学家Nathan Lambert,最近分享了他如何走上AI之路。 尽管起步艰难、几经波折,他依旧在AI领域站稳脚跟、有所成就。 博士毕业时,他没有在NeurIPS/ICML/ICLR等顶会上发表过文章。
6/9/2025 9:00:00 AM
告别「失忆」AI!首个大模型记忆操作系统开源框架来了!
该项目来自百家 AI,是北京邮电大学白婷副教授所指导的研究小组, 团队致力于为硅基人类倾力打造情感饱满、记忆超凡的智慧大脑。 大语言模型受限于固定上下文窗口,长期对话中「失忆」、记忆断裂等问题频发,北邮百家 AI 团队重磅推出首个大模型记忆操作系统开源框架 MemoryOS。 巧妙融合计算机操作系统原理与人脑分层记忆机制,构建段页式三级存储架构及四大核心模块(存储、更新、检索、生成),提供全链路用户记忆管理方案,让 AI 智能体拥有持久「记性」与深度「个性」。
6/9/2025 8:56:00 AM
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
英伟达
Anthropic
智能体
代码
算法
Stable Diffusion
训练
芯片
开发者
蛋白质
腾讯
生成式
苹果
LLM
神经网络
AI新词
Claude
3D
研究
生成
机器学习
AI for Science
xAI
计算
人形机器人
Sora
Agent
AI视频
GPU
百度
AI设计
华为
搜索
大语言模型
工具
场景
字节跳动
RAG
大型语言模型
具身智能
预测
深度学习
伟达
视觉
Transformer
神器推荐
AGI
亚马逊
视频生成
Copilot
DeepMind
模态
架构
LLaMA