资讯列表

分类

标签

小红书开源首个大模型，11万亿非合成训练数据

国内著名社交平台小红书，开源了首个大模型——dots.llm1。 dots.llm1是一个1420亿参数的专家混合模型（MoE），在推理过程中仅激活140亿参数，能保持高性能的同时大幅度降低训练和推理成本。 dots.llm1最大特色是使用了11.2万亿token的非合成高质量训练数据，这在现阶段的开源大模型中非常罕见，看来小红书也得益于自己庞大的语料库出手就是阔啊。

6/9/2025 9:41:25 AM

美IT业裁员狂飙35%，「硅谷梦」彻底崩塌！打工人怒喷PIP

2025，美国裁员之年。本周四，职业介绍机构 Challenger, Gray & Christmas 发布了美国全国就业报告。与去年同期相比，美国全国裁员人数上涨了47%。

6/9/2025 9:35:56 AM

大模型强化学习新突破——SPO新范式助力大模型推理能力提升！

当前，强化学习（RL）在提升大语言模型（LLM）推理能力方面展现出巨大潜力。 DeepSeek R1、Kimi K1.5 和 Qwen 3 等模型充分证明了 RL 在增强 LLM 复杂推理能力方面的有效性。然而，要实现有效的强化学习，需要解决一个根本性的挑战，即信用分配问题（credit assignment）：在大语言模型的场景下，如何将整个序列（LLM 的回复）最终的评估结果，归因到序列中具体的决策动作（token）上。

6/9/2025 9:32:35 AM

引领京城AI盛宴，金蝶开创企业管理AI新时代

在新一轮人工智能技术浪潮推动下，企业数字化转型正加速迈向智能化变革的新阶段。 6月6日，金蝶云苍穹AI峰会北京站盛大启幕，300余位来自央国企、行业龙头企业及生态伙伴的AI先行者共聚一堂，围绕“AI赋能企业管理”的新思想、新技术、新应用展开深入研讨，加速推动AI技术在企业管理中从“可想象”走向“可落地”。助力企业实现智能化转型，是金蝶“予力企业、成就不凡”这一使命在AI时代的具体体现。

6/9/2025 9:24:23 AM

ICML 2025 | 全局池化+局部保留，CCA-Attention为LLM长文本建模带来突破性进展

琶洲实验室、华南理工大学联合推出关键上下文感知注意力机制（CCA-Attention），实现超长文本的高效上下文建模。在 128K 超长序列上下文建模任务中，CCA-Attention 的推理速度是标准自注意力机制的 7.9 倍，同时键值缓存（KV Cache）显存占用减少 93%，性能全面优于现有高效注意力方法。论文标题：Core Context Aware Transformers for Long Context Language Modeling论文链接：：：2024年12月17日该成果已被 ICML 2025 接收，最早于 2024 年 12 月 17 日提交至 ArXiv，早于 DeepSeek NSA 和 Kimi MoBA 公开。

6/9/2025 9:23:05 AM

ALPHAONE（α1）：LRM 自适应推理效率与准确性的平衡之道

大家好，我是肆〇柒。今天，我们来聊大型推理模型（LRM）领域的一项研究 ——ALPHAONE（α1）框架。当前，大型推理模型如 OpenAI 的 o1 和 DeepSeek-R1 等，已经在诸多复杂推理任务上展现出了强大的能力，但它们在推理过程中也面临着一些挑战，比如容易陷入过度推理或推理不足的困境。

6/9/2025 9:17:44 AM

肆零柒

Neuralink 和 Grok 合作，脑机芯片为渐冻症患者赋予“发声”能力

视频内容显示，Neuralink 为一名渐冻症患者植入脑机接口芯片，使其可以通过意念移动光标输出文字，而后人工智能聊天机器人 Grok 会补全其语句，并创建一个精确的声音克隆，从而为患者发声。

6/9/2025 9:13:05 AM

清源

人工智能和知识图谱八(完)：知识图谱的挑战、缺点和陷阱

知识图谱虽然功能强大，但在实际场景中实现它们并非一帆风顺。我们必须意识到其中的挑战、局限性和潜在风险，包括技术问题，比如可扩展性、数据质量、模式复杂性、与非结构化或动态数据的集成障碍，以及偏见和隐私等道德问题。可扩展性和性能：一个挑战是将知识图谱扩展到极大规模（数十亿个节点/边），同时保持复杂查询和更新的性能。

6/9/2025 9:10:26 AM

晓晓

算力终结者来了！华人天团「降维打击」注意力瓶颈，AI狂飙进对数时代

LLM苦算力太久了！为缓解长序列建模中的算力瓶颈，研究界持续探索高效替代方案。这次Mamba作者Tri Dao、华人AI领域大牛Eric P.

6/9/2025 9:05:00 AM

为什么用错奖励，模型也能提分？新研究：模型学的不是新知识，是思维

本文主要作者是吕昂和谢若冰。吕昂，中国人民大学博士生，研究方向为语言模型结构优化，导师为严睿教授；谢若冰，腾讯高级研究员，研究方向为大语言模型、推荐系统。最近的一篇论文中，来自人大和腾讯的研究者们的研究表明，语言模型对强化学习中的奖励噪音具有鲁棒性，即使翻转相当一部分的奖励（例如，正确答案得 0 分，错误答案得 1 分），也不会显著影响下游任务的表现。

6/9/2025 9:04:00 AM

交互式生成视频（IGV）：重塑游戏、智能与驾驶的交互革命

大家好，我是肆〇柒。今天，我们来聊聊交互式生成视频（IGV）技术。这是一项在当下技术革命中产生的前沿技术，它具备强大的生成能力和交互特性，正在改变我们与虚拟世界互动的方式。

6/9/2025 9:03:58 AM

肆零柒

Meta 拟投资超 100 亿美元，Scale AI 或迎来重大融资机会

根据彭博社的报道，Meta 正与 Scale AI 进行高达数十亿美元的投资谈判。这笔交易的价值预计将超过100亿美元，将成为 Meta 在人工智能领域最大的一笔外部投资，也是私营公司历史上最大的融资事件之一。 Scale AI 是一家专注于数据标注服务的公司，帮助微软和 OpenAI 等企业训练其人工智能模型。

6/9/2025 9:00:56 AM

AI在线

长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试

在最近的 Fiction.Live 基准测试中，Gemini2.5Pro 在理解和再现复杂故事和背景方面表现出色，领先于竞争对手 OpenAI 的 o3模型。这项测试远超传统的“大海捞针”式任务，专注于模型在海量上下文中处理深层语义和背景依赖信息的能力。据测试数据显示，在上下文窗口长度达到192，000个词条（约14.4万个单词）时，o3模型性能急剧下滑，而 Gemini2.5Pro 的6月预览版(preview-06-05)在同一条件下依然保持了超过90% 的准确率。

6/9/2025 9:00:56 AM

AI在线

英国呼吁限制 Meta 利用人工智能进行风险评估

近日，英国的互联网安全倡导者向国家通讯监管机构 Ofcom 发出警告，要求限制 Meta（前身为 Facebook）在关键风险评估中使用人工智能(AI)。这一呼吁源于一份报告，报告指出 Meta 计划将高达90% 的风险评估工作交由 AI 自动完成。这一改变引发了对用户安全，特别是未成年用户保护的广泛担忧。

6/9/2025 9:00:56 AM

AI在线

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 马斯克英伟达 Anthropic 图像 AI创作训练 LLM 论文代码算法苹果 AI for Science 腾讯 Agent Claude 芯片 Stable Diffusion 具身智能蛋白质 xAI 开发者生成式人形机器人神经网络机器学习 3D AI视频 RAG 大语言模型 Sora 研究百度生成 GPU 字节跳动工具华为 AGI 计算大型语言模型 AI设计搜索生成式AI 视频生成亚马逊 DeepMind AI模型特斯拉场景深度学习 Transformer 架构 MCP Copilot 编程视觉

资讯列表

小红书开源首个大模型，11万亿非合成训练数据

美IT业裁员狂飙35%，「硅谷梦」彻底崩塌！打工人怒喷PIP

大模型强化学习新突破——SPO新范式助力大模型推理能力提升！

引领京城AI盛宴，金蝶开创企业管理AI新时代

ICML 2025 | 全局池化+局部保留，CCA-Attention为LLM长文本建模带来突破性进展

ALPHAONE（α1）：LRM 自适应推理效率与准确性的平衡之道

Neuralink 和 Grok 合作，脑机芯片为渐冻症患者赋予“发声”能力

人工智能和知识图谱八(完)：知识图谱的挑战、缺点和陷阱

算力终结者来了！华人天团「降维打击」注意力瓶颈，AI狂飙进对数时代

为什么用错奖励，模型也能提分？新研究：模型学的不是新知识，是思维

交互式生成视频（IGV）：重塑游戏、智能与驾驶的交互革命

Meta 拟投资超 100 亿美元，Scale AI 或迎来重大融资机会

长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试

英国呼吁限制 Meta 利用人工智能进行风险评估

顶会0篇，一夜RLHF爆文刷屏！他靠写作逆袭AI圈，院士都说好

告别「失忆」AI！首个大模型记忆操作系统开源框架来了！

顶流AI，人设崩了！6小时被攻破，泄露高危品指南，惨遭网友举报

谷歌Transformer过时了？清华姚班校友等三连击，爆改注意力！

资讯列表

小红书开源首个大模型，11万亿非合成训练数据

美IT业裁员狂飙35%，「硅谷梦」彻底崩塌！打工人怒喷PIP

大模型强化学习新突破——SPO新范式助力大模型推理能力提升！

引领京城AI盛宴，金蝶开创企业管理AI新时代

ICML 2025 | 全局池化+局部保留，CCA-Attention为LLM长文本建模带来突破性进展

ALPHAONE（α1）：LRM 自适应推理效率与准确性的平衡之道

Neuralink 和 Grok 合作，脑机芯片为渐冻症患者赋予“发声”能力

人工智能和知识图谱八(完)：知识图谱的挑战、缺点和陷阱

算力终结者来了！华人天团「降维打击」注意力瓶颈，AI狂飙进对数时代

为什么用错奖励，模型也能提分？新研究：模型学的不是新知识，是思维

交互式生成视频（IGV）：重塑游戏、智能与驾驶的交互革命

​Meta 拟投资超 100 亿美元，Scale AI 或迎来重大融资机会

长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试

英国呼吁限制 Meta 利用人工智能进行风险评估

顶会0篇，一夜RLHF爆文刷屏！他靠写作逆袭AI圈，院士都说好

告别「失忆」AI！首个大模型记忆操作系统开源框架来了！

顶流AI，人设崩了！6小时被攻破，泄露高危品指南，惨遭网友举报

谷歌Transformer过时了？清华姚班校友等三连击，爆改注意力！

Meta 拟投资超 100 亿美元，Scale AI 或迎来重大融资机会