AI大模型
AI训练师必看!5个章节带你快速掌握RAG检索增强项目
在 AI 应用日益深入的今天,RAG(Retrieval-Augmented Generation)正成为提升模型实用性的关键技术。 本文将从 AI 训练师的视角出发,系统拆解 RAG 的核心机制、应用场景与训练要点,帮助你在构建高质量智能体时少走弯路、精准发力。 今天我向大家介绍检索增强也就是 RAG,在公司里面也是一个独立的项目,并且有自己的考核指标。
北京人形开源最新VLM模型,推动具身智能再迈关键一步 !
11月13日,北京人形机器人创新中心全面开源具身智能VLM模型——Pelican-VL 1.0。 该模型覆盖7B、72B参数规模,是迄今为止“最大规模的开源具身多模态大模型”,同时,也是迄今为止全球性能最强大的具身智能VLM模型,根据测试,其性能超越GPT-5 同类模型15.79% ,与Google gemini 系列模型相比提升19.25%,同时也超越通义千问、书生万象等国内模型,成为了目前最强的开源具身多模态大模型 。 另外值得注意的是,Pelican-VL的核心主创团队都是由女性组成,这也充分体现了女性力量在我国科技研发中的重要贡献。
新手必看!AI训练师必须掌握的大模型训练流程
你知道 ChatGPT 背后到底经历了哪些训练流程吗? AI 训练师在其中扮演了什么角色? 本篇文章用最接地气的方式,拆解大模型训练的三大阶段,带你看懂那些“看不见的幕后工程”。
LMArena公布最新大模型排名:Claude、GPT-5与智谱GLM-4.6并列第一
近日,全球知名的 AI 模型评测平台 LMArena 公布了最新的 AI 大模型排名,令人瞩目的是,美国的 Anthropic 公司推出的 Claude、OpenAI 的 GPT-5 以及智谱科技的 GLM-4.6,这三款 AI 编程模型在排行榜上不分上下,齐齐占据了全球第一的位置。 这些模型专为编程任务而设计,旨在帮助开发者更加高效地进行代码编写、调试和优化。 随着科技的不断进步,AI 编程模型的出现不仅提升了软件开发的效率,也为各类开发者提供了强大的工具支持。
阿里云通义模型首次大规模赋能双11,单日翻译调用量突破14亿次
据阿里云近日公布的信息显示,其自主研发的 通义系列模型 在今年的“双11”电商狂欢节中首次实现了大规模应用,标志着 AI 大模型在电商领域的深度整合。 淘宝天猫方面已在消费者体验、电商经营、流量分发等各个关键环节全面采用 AI 大模型技术。 其中,通义系列模型在跨语种交易和信息处理方面扮演了核心角色。
一张合影就能泄露全家信息?央视紧急预警:“读心AI”正让社交晒图变成隐私炸弹
你以为只是随手发了张旅行合照?在AI大模型的“火眼金睛”下,这张照片可能正在泄露你的住址、身份证号、家庭关系甚至行程轨迹。 在2025年世界互联网大会期间,央视新闻罕见发出高危警示:随着多模态AI的普及,看似无害的日常图片正成为隐私泄露的新黑洞,而普通用户对此几乎毫无防备。 图源备注:图片由AI生成,图片授权服务商MidjourneyAI“读图术”已远超人类想象网络安全专家指出,现代AI不仅能识别人脸、车牌、证件文字,还能通过上下文推理还原敏感信息。
苹果豪掷10亿美元牵手谷歌!新Siri明年春季上线,Gemini大模型驱动语音助手重生
沉寂多年的Siri即将迎来史诗级升级。 据可靠消息,苹果公司已与谷歌达成重磅合作,每年支付约10亿美元,获得定制版Gemini大模型的独家使用权,并计划于2026年春季随iOS26.4正式推送全新Siri。 此举标志着苹果在自研大模型进展不及预期的背景下,果断选择借力外部顶尖技术,以重夺智能语音交互的主导权。
小鹏汽车重磅发布第二代 VLA:颠覆传统,开创智能驾驶新时代
在2025小鹏科技日盛会上,小鹏汽车推出了其第二代VLA(视觉-语言-动作)模型,这一重磅发布不仅打破了行业内传统的模型架构,更是实现了从视觉信号直接到动作指令的端到端输出,摆脱了语言转译的束缚。 小鹏的这一创新举措,使其成为首个量产的物理世界大模型,为智能驾驶、人工智能机器人及飞行汽车等多领域提供了强大的智能基础。 第二代 VLA 的能力之强,令人瞩目。
苹果Siri将大变样!付费请谷歌助力AI升级
近日,彭博社报道称,苹果公司在自研 Siri 大模型的过程中遭遇了重重困难,因此决定调整策略,委托谷歌为其定制基于 Gemini 的先进语言模型。 苹果希望借此解决 Siri 在处理复杂 AI 任务方面的短板,并提升用户体验。 根据报道,苹果的 Siri 将采用 “端云协同” 混合模式,这意味着 Siri 将结合云端强大的大模型能力,同时又能确保用户数据的隐私安全。
中国智能音箱销量破千万,大模型渗透率仅33%!AI音箱的爆发前夜来了?
根据洛图科技(RUNTO)最新发布的数据,2025年前三季度,中国智能音箱市场交出了一份亮眼成绩单:总销量已达1054万台,全年有望冲击1420万台。 然而,在这波增长浪潮之下,一个关键信号正引发行业深思——搭载AI大模型的智能音箱渗透率仅为33%,意味着近七成设备仍停留在基础语音交互阶段,真正的“智能化”尚未全面落地。 “超级小爱”引爆高端市场,大模型成新卖点今年,小米推出的首款大模型智能音箱“超级小爱”一经上市便迅速走红,成为高端市场的现象级产品。
中国模型打服硅谷:Airbnb联创CEO感叹又好又快又便宜!ChatGPT合作都拒了
西风 发自 凹非寺. 量子位 | 公众号 QbitAI当OpenAI为ChatGPT各种造势时,中国模型也在凭实力圈粉老外。 最近,爱彼迎(Airbnb)联合创始人兼CEO Brian Chesky的一番公开表态掀起波澜:我们很大程度上依赖阿里巴巴的Qwen模型。
网易有道词典 “AI 同传” 用户突破 2000 万
近日,网易有道词典发布了最新的运营数据,其核心 AI 功能 “AI 同传” 累计用户已经突破2000万,2025年9月的使用人数相比去年同比增长了近60%。 随着出国留学、跨境电商及国际学术交流等需求的日益增加,AI 同传逐渐成为用户频繁使用的工具。 这一变化也表明,词典类工具正在向更智能的 AI 应用转型,有效提升了用户的语言学习和沟通效率。
视觉中国坐拥7亿合规数据,获阿里、微软等头部 AI 公司模型训练订单
近日,视觉中国公司宣布已与多家 AIGC(人工智能生成内容)头部企业达成深度战略合作,共同建设“可商用 可溯源”的视觉创意行业大模型,旨在推动 AI 在创意领域的健康、高质量应用与版权合规。 在数据服务业务方面,视觉中国凭借其在全球范围内积累的丰富资源,已展现出强大的市场吸引力。 公司成功获得来自阿里巴巴、微软等国内外多家头部大模型公司提供的合规数据服务业务订单,这些高质量内容被用于模型训练等关键目的。
两部门联合发布《政务领域人工智能大模型部署应用指引》 大力推动AI技术应用
近日,中央网信办与国家发展改革委联合发布了《政务领域人工智能大模型部署应用指引》,这是一份针对政府部门如何安全、稳妥推进人工智能技术应用的指导文件。 其目的是为各级政务部门提供清晰的方向和基本的参考,确保人工智能的有效利用。 在这份指引中,特别强调了政务部门可以围绕政务服务、社会治理、机关办公及辅助决策等多个高频需求,结合地方实际,选择典型场景进行 AI 大模型的应用探索。
DeepSeek V3.1终结版发布:修复关键漏洞提升稳定性,V4新架构呼之欲出
国产AI大模型DeepSeek迎来重要更新。 该公司近日发布DeepSeek V3.1-Terminus版本,这一命名颇具深意的新版本不仅解决了此前困扰用户的技术问题,更暗示着V3系列可能即将落下帷幕。 此次更新的核心亮点在于对模型稳定性的显著提升。
2025爆火的RAG技术是什么?从原理到应用全面科普!
前言. 最近,RAG 这个词在网络中爆火,特别是一些 AI 方向的小伙伴,网上铺天盖地的文章、视频等教程,但是他们都各有各的不同看法,接下来就让我从一名 AI 产品经理角度,带你们彻底了解什么是 RAG、前世今生是什么、实用场景、工作原理、具体应用。 上期回顾:一、RAG 是什么.
国内首个AI大模型众测结果出炉!发现281个安全漏洞,未来治理刻不容缓
在第22届中国网络安全年会(暨国家网络安全宣传周网络安全协同防御分论坛)上,国内首次针对AI大模型的众测结果揭晓。 此次活动由中央网信办网络安全协调局指导,国家计算机网络应急技术处理协调中心主办,吸引了559名白帽子安全专家参与,对15款AI大模型和应用产品进行了全面的安全漏洞测试。 这项测试涵盖了从基础大模型到智能体和模型开发平台等多种产品,旨在从攻击者的角度发掘潜在的安全隐患。
数据集质量正成为AI大模型的终极壁垒
"老板,我们的模型效果怎么还是这么差? "小李拿着测试报告,一脸无奈地走进了技术总监的办公室。 "数据质量怎么样?
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉