大模型
字节开源Dolphin,高精度文档图像解析大模型,创新先分析后解析新范式
在数字时代,从扫描文档、图片等非结构化数据中高效、准确地提取结构化信息,是人工智能领域长期面临的挑战。 无论是复杂的表格、交织的文本段落,还是难以识别的数学公式,都对文档解析技术提出了严苛要求。 传统的解决方案往往依赖于多个专业模型的串联,不仅集成成本高昂,还容易在处理过程中累积误差 。
5/26/2025 4:46:38 PM
贝塔街的万事屋
阿里妈妈在TongAI大会推出全新URM通用召回大模型,重塑购物体验
在首届国际通用人工智能大会 TongAI 上,阿里妈妈隆重推出了其 LMA2广告大模型系列中的 URM 通用召回大模型。 这一新模型在生成式推荐(AIGR)领域的首次亮相,标志着阿里妈妈在智能广告技术上的又一次重大突破。 URM 通用召回大模型的设计理念是为了更精准地预测消费者的购物需求。
5/26/2025 4:00:50 PM
AI在线
智能取证新利器:大模型装入 “小箱子”
近日,福建厦门举办了2025年 “智会” 生态合作大会,吸引了众多行业专家和科技企业代表的参与。 本次大会重点讨论了公共安全、司法取证技术创新以及智能装备发展等前沿议题,其中一款名为 “星睿取证分析大模型一体机” 的智能设备备受瞩目。 这款一体机的亮点在于其将深度学习与便携性结合,内置了 DeepSeek 等先进的大模型技术。
5/23/2025 7:00:45 PM
AI在线
全球规模最大的单细胞基础大模型 CellFM 发布:基于国产超算,中山大学、华为等研发
该模型创新性地整合了超 1 亿人类单细胞数据(规模达同类 2 倍以上),构建了 8 亿参数的深度学习框架(参数量超同类 8 倍),在生物表征学习和跨数据集泛化能力上取得重大突破。
5/22/2025 5:55:33 PM
汪淼
TCL联手阿里云深度布局AI赛道,半导体显示专家大模型"星智"正式亮相
家电巨头TCL与云计算龙头阿里云正式宣布达成全栈AI战略合作,这一合作将重点围绕半导体显示和智能终端两大核心领域展开。 双方计划充分利用阿里云在"云 AI"方面的技术优势,联合开发面向垂直行业的专业大模型解决方案。 在技术研发层面,TCL与阿里云将基于Qwen3、Qwen-VL、QwQ等先进模型,持续优化升级半导体显示专家大模型——星智X-Intelligence。
5/22/2025 5:00:55 PM
AI在线
腾讯全面展示AI大模型战略,推动企业智能化转型
在2025年的 AI 产业应用峰会上,腾讯首次全景展示了其大模型战略,标志着公司在人工智能领域的重要进展。 此次峰会不仅让人们看到了腾讯在自研大模型方面的努力,更体现了其致力于为各行业企业提供全面智能解决方案的决心。 会上,腾讯首席执行官汤道生表示,随着人工智能技术的不断成熟,未来每个企业都将成为 AI 公司。
5/22/2025 4:00:55 PM
AI在线
杭州市政府工作报告点名 DeepSeek,力挺算法模型企业发展
据澎湃新闻报道,在5月22日开幕的杭州市十四届人大五次会议上,市长姚高员所作的政府工作报告中特别提到了人工智能企业 DeepSeek(深度求索)及其开源大模型。 报告回顾了2024年杭州的工作成就,肯定了 DeepSeek 等一批大模型在低成本下取得出色表现,并指出其发展“震动全球同业”。 DeepSeek 作为杭州本土新兴科技力量的代表,与其他五家初创公司一同在去年底至今年初迅速崛起,被誉为“杭州六小龙”。
5/22/2025 3:00:30 PM
AI在线
AI也能当情感大师?腾讯发布最新AI社交智能榜单,最新版GPT-4o拿下第一
判断AI是否智能,评价维度如今已不仅限于刷榜成绩。 当大模型在“IQ”上不断实现新的突破,“懂人心”、“解人意”开始成为实际应用中,人们对大模型新的要求。 所以,AI的“EQ”又该如何评价?
5/22/2025 1:42:28 PM
TCL 联手阿里云,打造半导体显示行业首个强推理大模型
TCL 集团与阿里云达成全栈 AI 战略合作,聚焦半导体显示和智能终端领域,共同研发垂直行业专业大模型,加速制造业智能化转型。 TCL 创始人李东生与阿里云 CEO 吴泳铭共同见证签约。 此次合作将聚焦大模型推理、多模态理解和智能检索三大核心技术。
5/22/2025 11:00:55 AM
AI在线
百度飞桨PaddleOCR 3.0开源发布 OCR精度跃升13%
2025年5月20日,百度飞桨团队正式发布了PaddleOCR3.0版本,并对外开源。 这一新版本在文字识别精度、多语种支持、手写体识别以及高精度文档解析等方面取得了显著进展,进一步提升了PaddleOCR在OCR领域的技术实力和应用价值。 PaddleOCR自发布以来,凭借其学术前沿算法和产业落地实践,受到了产学研各方的喜爱,并被广泛应用于众多知名开源项目。
5/22/2025 10:00:56 AM
AI在线
前端 x AI:从了解提示工程、RAG和微调开始
在AI工程应用中有三种应用范式,他们分别是提示工程(Prompt Engineering)、RAG(Retrieve Augmented Generation)、微调(Fine Tuning),那么在工程应用中我们该如何选择呢? 在具体介绍这三种范式之前,首先我们需要了解什么是大模型。 大模型通常指的是拥有大量参数和复杂结构的深度学习模型,它经过海量的多样化的数据预训练之后,具备了非常多的能力,包括编码、数学、金融、教育和法律等行业的能力。
5/22/2025 1:00:00 AM
赖祥燃
告别“单打独斗”!AI 协作新范式 MoA,如何集结大模型“梦之队”?
大模型浪潮下,你的 AI 应用遇到瓶颈了吗? 当 GPT、Claude、文心一言等各类强大模型如繁星般涌现,我们惊喜于它们令人惊叹的能力。 然而,在实际落地中,我们常常发现,即使是最顶尖的单一模型,也难以完美应对所有复杂场景的需求。
5/21/2025 4:27:00 PM
贝塔街的万事屋
面壁智能获新一轮数亿元融资,引领端侧大模型高效发展与应用普及
近日,面壁智能完成新一轮数亿元融资,本轮融资由洪泰基金、国中资本、清控金信和茅台基金联合投资。 本轮融资的完成,将进一步为面壁智能构筑高效大模型技术、产品壁垒、加速行业赋能与生态拓展奠定坚实基础,协同产业上下游推动「端侧大脑」在千行百业规模化应用。 2025 年伊始,全球人工智能竞赛进入白热化,以「高效、低耗」为代表的创新路径正在引领全球 AI 变革。
5/21/2025 4:18:00 PM
徐咪
DeepSeek发布大模型训练端到端论文,展示卓越工程深度
近日,DeepSeek发布了一篇关于大模型训练的最佳端到端技术论文,引发业界广泛关注。 该论文全面阐述了DeepSeek在大模型研发中的技术突破,涵盖软件、硬件及混合优化方案,展现了其令人惊叹的工程深度。 在**软件**层面,论文详细介绍了多头潜在注意力机制(MLA),显著降低推理过程中的内存占用;FP8混合精度训练通过低精度计算提升效率,同时保证数值稳定性;DeepEP通信库优化了专家并行(EP)通信,支持FP8低精度操作,加速MoE模型训练与推理;LogFMT对数浮点格式则通过均匀化激活分布,进一步优化计算效率。
5/21/2025 11:01:05 AM
AI在线
大模型全面爆发,所有榜一都是Gemini!谷歌一夜站到了台前
北京时间今天凌晨 1 点,今年的 Google I/O 2025 开发者大会正式开启。 谷歌最近的大模型技术风头正劲,今年的这场「科技春晚」吸引了全球关注的目光。 没有意外,今年的核心主题自然是 AI。
5/21/2025 9:40:11 AM
机器之心
解锁 LLM 新高度!一文深度解读 Qwen3 大模型
1、模型架构Qwen3 系列涵盖 6 种密集型模型和 2 种 MoE 模型,参数规模从 0.6 亿到 2350 亿不等,满足不同下游应用需求。 旗舰模型 Qwen3-235B-A22B 作为 MoE 模型,总参数量达 2350 亿,每 token 激活参数量为 220 亿,在性能与效率间取得平衡。 密集型模型Qwen3 的密集型模型架构与 Qwen2.5 类似,采用 Grouped Query Attention(GQA)和 QK-Norm 改进注意力机制,使用 SwiGLU 作为激活函数,搭配 Rotary Positional Embeddings(RoPE)进行位置编码,采用 RMSNorm 并预归一化。
5/21/2025 9:04:38 AM
Goldma
百度文心 X1 Turbo 大放异彩,斩获信通院最高评级!
在5月20日举行的百度 AI Day 上,中国信息通信研究院(信通院)公布了最新的大模型推理能力评估结果,令众多科技爱好者为之振奋。 百度的文心大模型 X1Turbo 成为国内首个获得 “4 级” 最高评级的大模型,这一成就让人刮目相看。 此次评估共涵盖24项能力,X1Turbo 在其中表现不凡,16项能力满分达到5分,展示了其强大的技术实力。
5/21/2025 9:01:06 AM
AI在线
面壁智能获新一轮数亿元融资 推动「端侧大脑」规模化应用
面壁智能宣布完成新一轮数亿元融资,本轮融资由洪泰基金、国中资本、清控金信和茅台基金联合投资。 这一融资的完成,将为面壁智能在高效大模型技术、产品壁垒、行业赋能与生态拓展方面奠定坚实基础,推动“端侧大脑”在千行百业的规模化应用。 面壁智能是一家专注于打造高效大模型的公司,以“高效”为第一性原理,致力于在同等参数下实现更高的性能、更低的成本、更低的功耗和更快的速度。
5/21/2025 9:01:06 AM
AI在线
资讯热榜
智谱AI全新企业级超级助手Agent CoCo正式上线
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
ChatGPT 语音功能升级,实时翻译对话更自然流畅
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
苹果向开发者开放本地AI能力,推出全新Foundation Models框架
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊