大模型
Anthropic重磅开源!“电路追踪”工具解锁AI大脑,揭秘大模型决策全过程
近年来,大语言模型(LLM)的快速发展为人工智能领域带来了前所未有的突破,但其内部决策过程却常常被视为“黑盒子”,难以捉摸。 5月29日,AI研究领域的明星公司Anthropic发布了一项重大开源成果——“电路追踪”(Circuit Tracing)工具,为破解大模型的内部工作机制提供了全新视角。 这一工具不仅能帮助研究人员深入探索AI的“思考”过程,还为推动更透明、可控的AI发展迈出了重要一步。
博士级AI智能体写的论文,首次登上顶会ACL!人类作者只是监工
有个叫Zochi的AI系统写了一篇研究论文,并且被顶级学术会议ACL 2025的主会场接受了! ACL是自然语言处理(NLP)领域里最顶尖的会议之一。 Zochi是Intology AI开发的首个博士级智能体,就像一个从头到尾完成科学研究「AI科学家」。
百度智能云千帆大模型平台、文小言接入DeepSeek-R1-0528模型
百度智能云千帆大模型平台正式上架了 DeepSeek 最新的 R1-0528大模型。 这一重要更新于5月29日上线,旨在为企业和用户提供更强大的 AI 能力和支持。 千帆模型开发平台不仅上架了这一全新大模型,还同步推出了一系列实用功能,包括批量推理、模型评估、推理日志挖掘分析以及模型蒸馏。
AI仅凭“自信”学会推理,浙大校友复刻DeepSeek长思维链涌现,强化学习无需外部奖励信号
复刻DeepSeek-R1的长思维链推理,大模型强化学习新范式RLIF成热门话题。 UC Berkeley团队共同一作Xuandong Zhao把这项成果称为:大模型无需接触真实答案,仅通过优化自己的信心,就能学会复杂推理。 具体来说,新方法完全不需要外部奖励信号或标注数据,只需使用模型自身的置信程度作为内在奖励信号。
一文教你玩转 RAG 大模型应用开发
Part.1.RAG这么火,你会用吗? 自从大模型技术走向市场以来,“幻觉”现象总是对用户造成困扰,而RAG(Retrieval-Augmented Generation,检索增强生成)技术正在成为解决这一难题的利器。 国内众多科技大厂在实践RAG技术时都取得了阶段性的成果。
AI 大脑如何被 “套路”?— 揭秘大模型提示词攻防
在人工智能技术爆发式发展的当下,大模型(Large Language Models, 以下简称LLM)凭借其强大的自然语言处理能力,广泛渗透于智能助手、内容创作、代码生成等诸多关键领域,深度重塑着人们的生活与工作范式。 然而,随着 LLM 应用场景的持续拓展与深化,一系列严峻的安全挑战接踵而至,其中提示词攻击已逐渐演变为威胁人工智能系统安全的核心隐患,亟待深入剖析与应对。 一、提示词攻击定义与影响提示词攻击是指攻击者精心构思并输入恶意构造的文本内容,意图干扰和操纵LLM的内部运行逻辑,使其偏离既定的正常行为模式。
模型吞噬代码,Agent重构世界:当AI Agent与模型协同进化
大家好,我是肆〇柒。 AI 圈的进化速度之快,已是不争的事实。 去年,MCP(模型上下文协议)发布,随后 AI Coding 赛道愈发热闹,Cursor、Cline、Devin、MGX 等产品层出不穷。
中国石油发布3000亿参数昆仑大模型,助力智能化油气全产业链
中国石油天然气集团有限公司在北京正式发布了其最新的3000亿参数昆仑大模型。 这一重大成果标志着中国在大模型技术领域的又一次重要突破,体现了中央企业在人工智能领域的快速发展和创新能力。 新的昆仑大模型相比于2024年11月发布的700亿参数版本有了显著提升。
多模态大模型不会画辅助线?最新评估得分:o3仅25.8%,远低于人类82.3%
多模态时代应如何评估模型的视觉输出能力? 来自清华大学、腾讯混元、斯坦福大学、卡耐基梅隆大学等顶尖机构的研究团队联合发布了RBench-V:一款针对大模型的视觉推理能力的新型基准测试。 过去的评估基准主要集中于评估多模态输入和纯文本推理过程。
告别卡脖子,华为黑科技破局!昇腾推理加速1.6倍打破LLM降智魔咒
LLM发展到今天,下一步该往哪个方向探索? 显然,如今最明显的一个问题就是,大模型的参数规模还是太大了——DeepSeek-V3的参数为671B,Llama 3.1系列最大为405B,GPT-4o为200B,Claude 3.5 Sonnet为175B。 参数规模在不断增长,高昂的计算成本和推理延迟,该怎么破?
知识图谱、大模型与幻觉:自然语言处理的视角
摘要大型语言模型(LLMs)已经彻底改变了基于自然语言处理(NLP)的应用,包括自动化文本生成、问答系统、聊天机器人等。 然而,它们面临一个重大挑战:产生幻觉,即模型生成听起来合理但实际上错误的内容。 这削弱了信任,并限制了LLMs在不同领域的适用性。
DeepSeek-V3:硬件与模型的完美统协,奏响 AI 高效新乐章
大家好,我是肆〇柒。 DeepSeek-V3 曾经一度备受全球瞩目,从 V3 发布至今,这一开源模型已经在众多企业场景中成功落地。 然而,在落地过程中,由于其复杂的工程细节,相信许多团队也遇到了不少挑战。
基于大模型的智能问答系统
在构建基于大模型的智能问答系统时,LangChain 提供了一个强大的框架,支持各种模块来帮助开发者构建更复杂、更智能的语言处理应用。 以下是构建此类系统的一些关键组件和步骤。 模型接入:使用 LangChain 支持的模型,通过 API 接入外部模型,或利用 api-for-open-llm 框架调用 本地llm模型。
舍弃自回归!国内团队打造纯扩散多模态大模型LLaDA-V,理解任务新SOTA
本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。 游泽彬和聂燊是中国人民大学高瓴人工智能学院的博士生,导师为李崇轩副教授。 该研究基于团队前期发布的、首个性能比肩 LLaMA 3 的 8B 扩散大语言模型 LLaDA。
国内首创!夸克健康大模型通过12门副主任医师职称考试,4个学科达主任医师水平
夸克健康大模型近日创造了国内AI医疗领域的重要里程碑,在12门国家副主任医师职称考试中成绩全部超过合格线,成为国内首个成功跨越这一专业门槛的大模型。 这一突破标志着AI在医疗专业能力方面达到了新的高度,目前用户已可通过夸克搜索直接调用这一全新的大模型能力。 技术架构与创新突破夸克健康大模型以阿里巴巴的通义千问为技术基础,通过海量高质量数据构建和多阶段后训练策略实现了关键性突破。
国内首个!夸克健康大模型成功通过副主任医师考试
夸克健康大模型在全国副主任医师职称考试中表现出色,成功通过12门学科的评测,成为国内首个跨越这一门槛的大模型。 此次考试涵盖了全科医学、普通内科学、普通外科学、妇产科学、小儿内科学、肿瘤内科学、口腔医学、耳鼻咽喉科学、眼科学、皮肤与性病学、精神病学和麻醉学等12个常用学科。 夸克健康大模型在所有测试科目中均超过了合格线,并在全科医学、肿瘤内科学、皮肤与性病学、精神病学等四个学科达到了主任医师的及格线。
阿里妈妈推出URM大模型,引领广告智能化新潮流
近日,在 TongAI 大会上,阿里妈妈正式发布了 URM 通用召回大模型。 这一全新的技术成果,结合了深度学习与大数据分析能力,旨在提升电商广告的智能投放效果。 URM 大模型不仅能够精准解析消费者的行为和兴趣偏好,还能有效提高广告投资回报率(ROI),标志着阿里妈妈在生成式推荐领域的首次技术落地,为广告行业的智能化转型注入了新的动力。
LLM能理解数学吗?最新研究揭露大模型数学推理的致命缺陷
你有没有想过,那些在聊天中侃侃而谈的AI大模型,遇到数学题时会是什么样子? 就像一个平时很会聊天的朋友,突然被问到复杂的数学问题时支支吾吾的样子。 最近有研究团队专门研究了这个问题,结果发现了一些让人意外的真相。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉