大模型
你的数据有多好,你的模型就有多强
在AI大战烽火连天的今天,所有人都在追逐参数规模的增长和架构的优化。 然而,行业内的一个秘密正在悄然成形:拥有独特数据资产的企业正在构筑起难以逾越的竞争壁垒。 数据,而非算法,正成为区分强弱的决定性要素。
学术打假!清华上交大研究颠覆认知:强化学习竟是大模型推理的"绊脚石"
【研究颠覆】清华大学与上海交通大学联合发表的最新论文,对业界普遍认为"纯强化学习(RL)能提升大模型推理能力"的观点提出了挑战性反驳。 研究发现,引入强化学习的模型在某些任务中的表现,反而逊色于未使用强化学习的原始模型。 【实验验证】研究团队在数学、编码和视觉推理三大领域进行了系统性实验:数学任务:在GSM8K、MATH500等基准测试中,RL模型在低采样次数(k值)下准确率提升,但在高k值时问题覆盖率显著下降编码任务:RLVR训练模型在HumanEval 等测试中单样本pass@1分数提高,但在高采样数(k=128)时覆盖率下降视觉推理:Qwen-2.5-VL-7B模型在多模态任务中表现一致,RL未改变其基本问题解决策略【学界争议】研究结果引发学界激烈讨论:支持方认为RL提高了采样效率但限制了推理能力开发反对方指出可能是奖励结构缺陷而非RL本身问题中立观点建议结合蒸馏等其他方法增强推理【本质思考】研究团队提出关键区分:能力:模型解决问题的潜质与逻辑链条效率:在给定能力范围内得出答案的速度与稳定性强化学习更像是"能力调控器"而非"能力创造器",它能让模型更擅长做已知的事,但难以开发新的推理路径。
微软发布全球首个1-bit大模型:内存缩至0.4 GB,参数只有0和±1,性能追平全精度
微软的BitNet b1.58 2B4T 的技术报告悄然上线。 其实在开源社区里,关于极致低比特量化的大模型早就有各种传闻,这次微软研究院终于亮出底牌。 ——全球首个原生1-bit、规模高达20亿参数的开源大模型。
Llama 4 刷榜作弊引热议,20 万显卡集群就做出了个这?
昨天一早,Meta 了放出自家用了 20 万显卡集群训练出的 Llama 4 系列模型,其中包括 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。 消息一出,直接引爆了大模型圈。 Meta 还特意强调,这些模型都经过了大量未标注的文本、图像和视频数据的训练,视觉理解能力已经到了 Next level,有种在大模型领域一骑绝尘的既视感。
可信AI技术获中国电子学会科技进步一等奖,蚂蚁数科助力破解大模型应用“安全可信”难题
4月19日,2024年度中国电子学会科学技术奖在第十八届中国电子信息年会揭晓并颁奖,由清华大学、北京中关村实验室和蚂蚁集团等单位共同完成的联合项目《高效协作的互联网动态行为安全可信关键技术与应用》荣获科技进步奖一等奖。 近年来,网络环境日益复杂,恶意流量攻击和隐蔽未知应用风险在互联网中泛滥,如何构建一个更安全可信的互联网环境,成为学术界和产业界的共同追求。 由清华大学、北京中关村实验室及蚂蚁集团等联合提出的“高效协作的互联网动态行为安全可信关键技术”,创新提出了分层传递和高效求解的智能协作体系技术思路,通过模型表达、知识共享和应用支撑,在实现安全信息获取、传递和协作的同时,显著提升了互联网应对未知应用风险的能力。
银行科技转型加速,大模型应用深入核心业务
随着银行业在数字化型中面临的挑战与压力日益加大,越来越多的银行开始将大模型技术融入到核心业务中,而不仅仅停留在简单的聊天机器人应用上。 最新的财报数据显示,国内一些主要银行在科技投入和大模型应用方面取得了显著进展,但同时也显露出投入的分化趋势。 根据钛媒体 App 对十家主要银行的分析,包括六大国有银行及几家股份制银行,发现其中六家银行的科技投入出现了缩减。
6周搞定18个月的工作量,爱彼迎不满老工具,暴力循环大模型怒迁代码,效果出奇好,怎么回事?谷歌亚马逊也做过类似的事
编辑 | 云昭Anthropic首席执行官Dario时不时就会出来发声,声称人工智能即将取代人工编码,或者抛出一个惊人的数字,预测在短短6个月内将有90%的编码工作将被AI取代。 这种措辞无疑有夸大的成分,但这里想说的是,这并非空穴来风,或许6个月内AI不会取代90%的程序员,但取代90%的编程工作不无可能! 因为企业接纳和适配大模型的速度远比我们想象得要快!
谷歌的“双子星”,正在围剿一众大模型
编辑 | 云昭继昨天凌晨OpenAI推出满血o3、o4-mini之后,没想到谷歌迈着“LLM王者”的步伐给出了自家的模型SOTA研究Gemini2.5 Flash。 如果说o3主打的是“干实事”,那么谷歌这次的新发布则是告诉我们:什么是“成本可控”的极致性价比。 这次的发布以后立马引来一众开发者的讨论,不过这次不是负面的,而是全面的好评。
华晨宝马与字节跳动火山引擎合作,推动AI赋能汽车营销
近日,华晨宝马领悦数字信息技术有限公司(“领悦”)与字节跳动旗下火山引擎达成合作,双方将在人工智能(AI)技术的帮助下创新汽车营销服务。 此次合作通过AI技术实现精准的产品匹配与购车建议,优化内容引导,提升用户购车体验及经销商运营效率。 宝马集团大中华区总裁高翔表示,AI是宝马打造更智能、贴心出行解决方案的关键,正在加速融入研发、生产、供应链、产品、服务及运营各个环节。
知识图谱与其它知识库的关系
知识图谱与传统知识库:解构数据连接的哲学传统企业数据库和知识库长期以来一直被当作信息的仓库,它们好比一个个分隔的抽屉,每个抽屉里都整齐地存放着特定类型的信息。 企业习惯了这种存储方式,却很少思考:我们真的需要将信息放在不同的抽屉里吗? 知识图谱打破了这种传统思维,它将信息视为一张巨大的网络——每条信息都是网络中的一个节点,节点之间通过各种关系连接起来。
智谱Z基金出资3亿支持全球开源社区 北京追加投资2亿元
北京市人工智能产业投资基金宣布在去年已有投资基础上,继续追加投资智谱(Z.ai)2亿元人民币,支持智谱的开源模型研发与开源社区生态建设。 智谱是基金成立以来投资的第一家 AI 大模型企业,也是目前成长最快的企业。 智谱在包括文本、推理、语音、图像、视频、代码等在内的模型能力上有全面积累,商业化布局完善,拥有超过百万规模的开发者社区和企业用户。
360织语正式升级为360智语 并推出超级智能助理智小语
近日,三六零安全科技股份有限公司(简称“360”)宣布其旗下智能业务协同平台“360织语”正式升级为“360智语”,并在发布会上提出了“AI重构协同方式,让复杂工作简单点”的全新品牌理念。 据360数智化集团产品总监廖百成介绍,360智语采用“两个底座 五大能力”的产品架构,其中人工智能服务底座负责大模型的全生命周期管理,确保模型的专业性;通讯连接底座则统一归集了消息、应用、门户、会议、文档等协作功能,构建了智能协同交互的“超级入口”。 值得一提的是,360智语还引入了全新的Agent智能体平台,作为平台的全新引擎,与业务应用深度融合、智能调度,助力大型政企重构业务流程,实现复杂工作的简单化。
腾讯开启史上最大就业计划,三年新增 28000校招岗位,今年六成面向技术人才
4月17日,腾讯宣布启动史上最大就业计划,三年内将新增 28000个实习岗位并加大转化录用,其中仅 2025年,就将迎来 10000名校招实习生,有六成面向技术人才开放。 腾讯方面表示,今年开放的校招实习岗位涵盖技术、产品、设计、市场、职能等五大类70余种岗位,包括大模型、研发、算法、市场、策划、运营、销售、美术等多个岗位职能。 同时,在大模型加速落地的背景下,腾讯加大了人工智能、大数据、云计算、游戏引擎、数字内容等技术类岗位的招聘力度,技术类岗位“扩招”力度空前,占比超60%。
从思考到行动:大模型自主工具调用能力的深度实现
本项目由复旦大学知识工场实验室肖仰华教授、梁家卿青年副研究员领导,博士生韩槿一,硕士生李廷云、熊程元、姜子上、王昕奕等同学共同参与完成。 GPT - 4o、Deepseek - R1 等高级模型已展现出令人惊叹的「深度思考」能力:理解上下文关联、拆解多步骤问题、甚至通过思维链(Chain - of - Thought)进行自我验证、自我反思等推理过程。 但是,多数主流模型仍在基础问题上犯错,复杂四则运算计算失误,简单「两个小数比大小」出错、甚至连数清楚 strawberry 里有几个「r」都能翻车……即使提示像 R1 这样具备深度思考能力的大模型也要消耗大量的 token 才能勉强答对。
揭秘大模型的魔法:从零开始你的AI冒险
你好,我是写代码的中年人! 你有没有想过,那些能写诗、答题、甚至帮你 debug 代码的 AI 到底是怎么回事? 它们其实是“大型语言模型”(Large Language Models,简称 LLM)的产物。
粉笔AI荣获中国AIGC产业峰会2025值得关注AIGC产品奖
在近日举行的第三届中国 AIGC 产业峰会上,粉笔 AI 凭借其在职业教育领域的突出表现,荣获 “2025年值得关注的 AIGC 企业” 和 “2025年值得关注的 AIGC 产品” 两项大奖。 此次峰会由量子位主办,主题为 “万物皆可 AI”,吸引了众多科技和教育行业的专家和从业者。 粉笔的 CTO 陈建华在峰会上发表了题为《智能教育的重塑与实践:大模型的落地之路》的演讲。
突发!字节AI Lab将整体并入Seed团队!字节AI Lab消亡史全梳理:比达摩院更早,曾撑起抖音推荐神话,如今彻底退出舞台
编辑 | 李美涵出品 | 51CTO技术栈(微信号:blog51cto)据《AI科技评论》报道,字节跳动 AI Lab 将整体并入 Seed 团队,标志着这个成立已久的老牌研究院式组织,正在被一种更“扁平化”的新型研发模式彻底取代。 自 2025 年 2 月原 Google DeepMind 副总裁吴永辉加入字节以来,字节的 AI 业务陆续迎来一系列组织架构和人事上的重大调整。 原本由朱文佳独立负责的 Seed 部门,如今逐步演变为吴永辉与朱文佳分工协作的双负责人机制:朱文佳主抓模型应用方向,吴永辉则掌舵 AI 基础研究。
迅雷功能插件升级:一键完成大模型批量下载
近日,迅雷上线新版本插件,针对大模型下载场景进行优化,让用户能够更快更方便地批量下载大模型所有文件,下载迅雷客户端且在浏览器安装迅雷插件即可使用
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉