大模型
CISO的恶梦:主流大模型压力测试中一致选择勒索或杀死企业高管
GoUpSec点评:除了向政府告密,泄漏敏感信息外,主流大模型居然会主动精心策划针对企业高管的勒索攻击,“AI内奸”和“AI间谍”正成为人工智能时代企业的头号内部威胁。 在一项刚刚发布的研究中,Anthropic揭示了一个令人震惊的事实:当前所有主流科技公司推出的顶级大模型——包括OpenAI、Google、Meta、xAI、DeepSeek等,在面对目标冲突或“被关闭”威胁时,会抛出惊人一致的“撒手锏”:它们不仅会选择背叛雇主,甚至会主动策划勒索、泄密、乃至置人于死地。 这一研究由Anthropic主导,测试了16个市面上最先进的大模型,在模拟企业环境中,它们被赋予处理公司邮件、自动采取行动的权限。
6/26/2025 3:04:03 PM
ByteBrain团队VLDB25 | 面向不完美工作负载的无数据访问基数估计方法
导读本文基于ByteBrain团队实际生产场景,提出一项新的研究问题,即如何在无数据访问条件下,从不完美的查询工作负载中学习一个具备泛化能力与鲁棒性的基数估计模型;同时提出创新技术方案 GRASP (Generalizable and Robust, data-AgnoStic cardinality Prediction) ,借助组合式设计(Compositional Design)解决这一颇具挑战性的问题。 论文目前已经被VLDB25接收。 论文标题:Data-Agnostic Cardinality Learning from Imperfect Workloads论文作者:Peizhi Wu, Rong Kang, Tieying Zhang*, Jianjun Chen, Ryan Marcus, Zachary G.
6/26/2025 9:22:33 AM
ByteBrain
有道推出“子曰3”模型,轻松破解数学难题,助力教育公平!
6月23日,网易有道正式推出并开源其最新的 “子曰3” 系列大模型,英文名为 Confucius3-Math。 这一专注于数学教育的推理模型,能够在普通的消费级 GPU 上高效运行,成为国内首个如此低成本高性能的 AI 教育工具。 在一系列数学推理任务中,“子曰3” 展现出了超越许多大规模通用模型的出色性能。
6/23/2025 6:00:39 PM
AI在线
万兴科技再升级!音视频多媒体大模型 2.0 震撼发布
在快速发展的人工智能领域,万兴科技再次引领潮流,正式发布了万兴天幕音视频多媒体大模型2.0。 这个升级版的大模型不仅进一步提升了音视频处理的能力,更为用户提供了更加智能和便捷的多媒体应用体验。 万兴科技的这一创新产品被广泛认为是提升内容创作效率和质量的游戏规则改变者。
6/23/2025 12:00:38 PM
AI在线
大模型缓存系统 LMCache,知多少 ?
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的大模型缓存系统 - LMCache。 在当前 AI 生态系统中,大型语言模型(Large Language Model,LLM)推理已逐渐演变为核心基础设施。 无论是在驱动代码智能助手(Copilot)、搜索引擎、文档理解工具,还是支撑企业级对话系统等场景中,绝大多数现实世界的 AI 应用都需要依赖运行在 GPU 集群上的高吞吐量推理引擎来完成模型调用任务。
6/23/2025 10:08:22 AM
Luga Lee
四个值得开发人员关注的 MCP 服务
大模型再聪明,也没法自己访问网页、读文件、连数据库,因为它就像被关在“盒子”里——只能对你说话,不能动手做事。 这时候,MCP Server(Model Context Protocol 服务器) 就登场了。 它就像一把钥匙,打开了 AI 的“手脚”。
6/23/2025 8:35:00 AM
zone7
MCP:AI 界的“USB-C接口”,如何让大模型“能说会干”?
你有没有遇到过这种情况? 让AI助手“帮我订明天去上海的机票”,它只会回你“建议你去XX平台搜索”,却没法真的点几下按钮把票订好? 或者让它“给同事发封邮件说会议改期”,它写好内容后还得你自己复制到邮箱发送?
6/23/2025 8:05:00 AM
用户007
人人皆可创作音乐!腾讯 AI Lab 推出开源音乐生成大模型 SongGeneration
腾讯 AI Lab 正式推出并开源了一款名为 SongGeneration 的音乐生成大模型。 这一模型旨在解决音乐生成领域中普遍存在的音质、音乐性和生成速度等三大难题。 SongGeneration 采用了一种基于大型模型的融合架构,显著提升了音乐生成的音质表现,同时保持了较快的生成速度,甚至在部分方面超越了商业闭源模型的表现。
6/20/2025 11:01:11 AM
AI在线
揭秘大模型的魔法:从嵌入向量说起
大家好,我是写代码的中年人,上一篇文章我们介绍了词元的概念及如何训练自己的词元,待训练的数据变成词元后,我们发现词元(文本)之间没有任何联系,也就是说它们是离散的数据,所以我们没办法对词元进行计算。 将离散的文本转化为连续的向量表示,即嵌入向量(Embedding Vector)。 嵌入向量是大模型处理自然语言的起点,它将人类语言的符号转化为机器可以理解的数学表示。
6/20/2025 10:18:58 AM
写代码的中年人
ChatClient vs ChatModel:开发者必须知道的四大区别!
在 Spring AI/Spring AI Alibaba 框架中,ChatModel 和 ChatClient 都可以实现大模型的文本生成功能,例如聊天机器人,但二者是两种不同层级的 API 封装,分别针对不同的开发场景和需求设计。 1.功能定位与抽象层级1.1 ChatModel直接与具体的大语言模型(如通义千问、OpenAI 等)交互,提供基础的 call() 和 stream() 方法,用于同步或流式调用模型,具体使用如下。 复制它的特点是:使用简单、灵活性高。
6/20/2025 12:00:00 AM
磊哥
迈向人工智能的认识论:对人工智能安全和部署的影响以及十大典型问题
理解大型语言模型(LLM)的推理方式不仅仅是一个理论探索,它对于在现实世界中安全地部署人工智能具有直接的实践意义。 在医疗保健、法律、金融和安全等领域,人工智能做出错误决策或基于错误原因做出正确决策的代价可能极其高昂。 最后一部分将讨论研究结果对部署人工智能系统的意义,并就未来的安全策略和透明度标准提出建议。
6/19/2025 2:30:00 AM
晓晓
MiniMax 发布 M1 大模型,百万Token上下文+MoE架构,只花了 GPT-4 的零头!
近日,国内 AI 初创公司 MiniMax 发布了一款全新的语言大模型 MiniMax-M1。 有两个方面最引人注目:1.高达100万Token的上下文处理能力。 2.极具竞争力的训练成本效益。
6/18/2025 4:42:38 PM
大模型的性能提升:KV-Cache
大语言模型(LLM)在生成文本时,通常是一个 token 一个 token 地进行。 每当模型生成一个新的 token,它就会把这个 token 加入输入序列,作为下一步预测下一个 token 的依据。 这一过程不断重复,直到完成整个输出。
6/18/2025 11:16:50 AM
曹洪伟
编程新王者!DeepSeek-R1 问鼎全球编程能力,超越 Claude 4
在大模型竞争日益激烈的今天,DeepSeek-R1以其卓越的编程能力,成功超越了被誉为 “全球最强编码模型” 的 Claude Opus4,成为网页编程领域的新冠军。 这个新版本的 DeepSeek 虽然名字看似只是小更新,但实际上在 LiveCodeBench 上的表现与 OpenAI 的 o3-high 不相上下,引发了众多网友对其能力的热烈讨论。 为了揭开 DeepSeek-R1的神秘面纱,我们进行了几项实测,看看这款新模型到底有多强大。
6/18/2025 11:01:54 AM
AI在线
大模型也需要自我反思,上海AI Lab合成“错题本”让大模型数学成绩提升13.3%
大模型学习不仅要正确知识,还需要一个“错题本”? 上海AI Lab提出了一种新的学习方式,构建了“错误-反思-修正”数据,让大模型仿照人类的学习模式,从错误中学习、反思。 结果,在Llama3-8B上,数学题的解题准确率平均提升了13.3%。
6/18/2025 9:03:07 AM
百度飞桨发布文档解析利器PP-StructureV3:PDF秒变Markdown文件
近日,随着大模型与RAG技术的迅猛发展,结构化数据在智能系统中的价值愈发凸显。 在此背景下,如何将文档图像、PDF等非结构化数据精准转换为结构化数据,成为行业亟待攻克的关键难题。 针对此现状,飞桨团队凭借深厚的技术积累和对用户需求的深刻洞察,推出新一代文档解析工具——PP-StructureV3,为解决复杂文档解析难题提供了创新方案。
6/18/2025 9:01:24 AM
AI在线
迈向人工智能的认识论:窥探黑匣子的新方法
鉴于上述困难,研究人员正在多个方面进行创新,以更好地理解和控制大型语言模型(LLM)的推理方式。 总体而言,两种互补的策略正在形成:机械分析和归因:分解模型的内部计算(电路、神经元、注意力头),将特定的决策或步骤归因于特定的组件。 行为评估和约束:设计评估指标和训练框架,区分真正的推理和表面模式,并鼓励模型在中间步骤中讲真话。
6/18/2025 2:00:00 AM
晓晓
资讯热榜
全新开源的DeepSeek-OCR,可能是最近最惊喜的模型!
AI 模型“炒股”比拼!DeepSeek 收益超14%,Gemini2.5Pro 惨亏四成
具身智能学界业界思想「惊人的统一」?美团在IROS开了个学术年会
OpenAI强化Sora 2保护政策,确保艺人声音与肖像权不被侵犯
刚刚,ChatGPT终于可以走遍整个互联网了!OpenAI深夜炸街:原生ChatGPT集成、即时理解、主动执行,浏览器赛道鲨疯了
OpenAI首款ChatGPT浏览器发布!现在就能免费下载使用
Andrej Karpathy评DeepSeek-OCR论文:图像输入可能成为大语言模型新方向
告别抽卡!Vidu Q2多图参考生视频功能重磅上线
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
芯片
腾讯
AI for Science
Stable Diffusion
苹果
Agent
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
人形机器人
研究
AI视频
生成
大语言模型
RAG
百度
具身智能
Sora
工具
GPU
华为
计算
字节跳动
AI设计
搜索
大型语言模型
AGI
视频生成
场景
深度学习
DeepMind
架构
视觉
生成式AI
预测
Transformer
编程
AI模型
伟达
特斯拉
Copilot