LLaMA
Meta推出J1系列模型,最强“AI法官”上线
近日,Meta 公司发布了其全新 J1系列模型,这是一项旨在提升 AI 判断能力的创新技术。 通过结合强化学习和合成数据的训练方法,J1模型不仅在判断的准确性上取得显著进步,还在公平性方面表现出色。 此次发布的消息由科技媒体 marktechpost 报道,令人瞩目。
5/22/2025 4:00:55 PM
AI在线
Meta 推出 “Llama 创业计划”,支持初创企业使用 AI 模型
Meta 公司近日宣布推出一项名为 “Llama 创业计划” 的新项目,旨在鼓励初创企业采用其 Llama AI 模型。 该计划为参与公司提供 “直接支持”,并在某些情况下提供资金支持。 任何在美国注册、融资少于1000万美元、拥有至少一名开发人员并正在开发生成式 AI 应用的公司,均可在5月30日前申请参与。
5/22/2025 4:00:55 PM
AI在线
Google Gemma AI 模型下载量突破 1.5 亿次
Google 近期宣布,其人工智能模型集合 Gemma 的下载量已经突破1.5亿次,标志着该项目取得了显著进展。 Google DeepMind 的开发者关系工程师 Omar Sanseviero 在社交平台 X 上分享了这一消息,并透露,目前在人工智能开发平台 Hugging Face 上,开发者们已经创造出了超过7万个不同版本的 Gemma 模型。 Gemma 于2024年2月正式发布,旨在与 Meta 的 Llama 等其他开放模型系列进行竞争。
5/13/2025 9:00:52 AM
AI在线
英伟达新开源模型 Llama-Nemotron 震撼发布,推理性能超越 DeepSeek-R1
近日,英伟达正式推出了其最新开源模型系列 ——Llama-Nemotron,该系列模型不仅在推能力上超越了 DeepSeek-R1,更是在内存效率和吞吐量上实现了显著提升。 根据最新发布的技术报告,Llama-Nemotron 的训练过程与众不同,采用了合成数据监督微调与强化学习的方法,以全方位提升模型的推理能力。 Llama-Nemotron 系列模型包括 LN-Nano8B、LN-Super49B 和 LN-Ultra253B。
5/7/2025 10:01:04 AM
AI在线
实时口语聊天大模型 LLaMA-Omni 2 来了,能让你的 AI 聊天体验起飞!
最近 AI 圈可是热闹非凡,今天咱们就来聊聊其中的 “狠角色”——LLaMA-Omni2。 这是一系列超厉害的语音语言模型(SpeechLMs),参数规模从0.5B 到14B 不等,专门为实现高质量实时语音交互而生,在 Hugging Face 上一经发布,就引起了广泛关注。 语音交互发展历程回顾:从 “卡顿” 到 “丝滑”语音交互在人机交互领域的地位愈发重要,它就像是为我们打开了一扇便捷的大门,极大地提升了交互效率和用户体验。
5/6/2025 6:00:52 PM
AI在线
68 页论文再锤大模型竞技场:Llama4 发布前私下测试 27 个版本,只取最佳成绩
最近一篇名为《排行榜幻觉》(The Leaderboard Illusion)的论文在学术圈引发关注。
5/2/2025 8:41:36 PM
汪淼
Meta Llama AI 模型下载量突破 12 亿,开发者贡献数万个衍生模型
Meta在首届LlamaCon大会上宣布,其开源AI模型Llama下载量已达12亿次,用户近10亿。首席产品官Chris Cox透露,数千开发者贡献了数万衍生模型。与此同时,阿里巴巴Qwen3模型家族发布,形成有力竞争。#AI开源##LlamaCon#
4/30/2025 2:50:04 PM
远洋
Meta 发布 Llama API,开发者可体验最新 AI 模型
在刚刚结束的首届 LlamaCon AI 开发者大会上,Meta 公司正式发布了其 Llama 系列 AI 模型的 API,名为 Llama API。 该 API 目前处于有限预览阶段,旨在让开发者能够探索和试验基于不同 Llama 模型的产品。 Meta 表示,这一新工具将与公司的 SDK 配合使用,允许开发者创建由 Llama 模型驱动的服务、工具和应用程序。
4/30/2025 11:00:50 AM
AI在线
Meta Llama AI模型下载量突破12亿,开发者热情高涨
在人工智能领域,Meta 公司近期传来了一个令人振奋的消息:其 “开放式” AI 模型系列 Llama 的下载量已突破12亿次。 这个数字在不久前的3月中旬刚刚达到10亿次,显示出 Llama 模型在开发者和用户中获得的广泛认可和热情。 在首届 LlamaCon 开发者大会上,Meta 的首席产品官 Chris Cox 在主题演讲中透露了这一令人瞩目的数据。
4/30/2025 10:00:55 AM
AI在线
Llama 4开源王者归来!推理、编码打平DeepSeek V3但参数减一半,一张H100就能跑,还有巨兽2万亿参数模型!
编辑 | 李美涵出品 | 51CTO技术栈(微信号:blog51cto)深夜,Meta如期发布了全新的开源大型模型系列——Llama 4,并未出现任何“跳票”传闻中的推迟情况! 图片此次发布也标志着Meta与近来崛起的开源新王 DeepSeek 正面硬钢。 Meta官推更是表示:表示:“今天开启了原生多模态AI创新的新时代”。
4/7/2025 7:00:00 AM
李美涵
GPT-2后首次!OpenAI将开源带推理能力的开源权重模型!网友:能比DeepSeek R1强吗?
出品 | 51CTO技术栈(微信号:blog51cto)奥特曼发布X文,宣布了一个重磅推理开源权重模型:长话短说:我们即将在未来几个月发布一个强大的开源语言模型,具备推理能力,并希望与开发者交流如何让它更有用:! 我们计划发布自 GPT-2 以来的首个开源语言模型。 我们已经考虑了很久,但之前有其他优先事项。
4/1/2025 10:35:37 AM
开源版Suno来了!AI音乐生成模型YuE可生成专业级的歌声和伴奏
近日,由香港科技大学与音乐领域的 DeepSeek 合作开发的开源音乐生成模型 YuE 正式发布,震惊了不少乐迷和音乐创作者。 这一模型不仅能够生成多种风格的音乐,还可以模拟人声,给听众带来全新的音乐体验。 YuE 的特点在于其双 LLaMA 语言模型架构,这使其能够无缝适配各种大语言模型,并且能够处理长达5分钟的完整歌曲。
3/28/2025 3:06:00 PM
AI在线
星辰与代码:DeepSeek的发展历程
技术突破阶段2024 年,DeepSeek 强势开启生态扩张与技术爆发的新纪元,成为全球 AI 领域瞩目的焦点。 年初 1 月,DeepSeek 便以 DeepSeek-MoE 震撼登场,创新性架构设计以仅 60% 的计算量损耗,成功超越 Llama 2-7B 性能,为后续技术突破奠定坚实基础,在模型效率优化上迈出关键一步。 紧接着 2 月,DeepSeekMath 在 MATH 基准测试中表现惊艳,成绩飙升至 51.7%,无限逼近 GPT-4 水平,数学推理能力实现质的飞跃,极大提升了模型在复杂数学问题求解上的可靠性与精准度。
3/27/2025 3:50:00 AM
小牛呼噜噜
扎克伯格:Meta 的 Llama 模型下载量已达 10 亿次
Meta 公司首席执行官马克・扎克伯格在 Threads 平台上宣布,Meta 的“开放”人工智能模型家族 Llama 的下载量已达到 10 亿次,相较于 2024 年 12 月初的 6.5 亿次下载量,在短短约三个月内增长了约 53%。
3/19/2025 4:33:17 PM
远洋
Meta Llama 模型下载量突破十亿,增长速度惊人!
Meta 公司的开源人工智能模型家族 Llama 近日迎来了一个重要里程碑,下载量已超过十亿次。 这一消息由公司首席执行官马克・扎克伯格在社交媒体 Threads 上宣布。 与2024年12月的6.5亿次下载相比,Llama 的下载量在短短三个月内激增了153%。
3/19/2025 2:16:00 PM
AI在线
为什么 Qwen 能自我改进推理,Llama 却不行?斯坦福找到了原理
给到额外的计算资源和「思考」时间,为什么有的模型能好好利用,把性能提升一大截,而有的模型就不行? 当遇到困难问题时,人类会花时间深入思考以找到解决方案。 在 AI 领域,最近的一些大语言模型在通过强化学习进行自我改进训练时,也已经开始表现出类似的推理行为。
3/6/2025 6:00:00 AM
机器之心
为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理
虽然 Qwen「天生」就会检查自己的答案并修正错误。 但找到原理之后,我们也能让 Llama 学会自我改进。 给到额外的计算资源和「思考」时间,为什么有的模型能好好利用,把性能提升一大截,而有的模型就不行?
3/5/2025 2:54:00 PM
机器之心
硅基流动:下线部分未备案模型,用户请注意迁移
近日,硅基流动在其更新公告中宣布,为了进一步优化资源配置,提供更先进、优质、合规的技术服务,将于2025年3月6日对部分模型进行下线处理。 此次下线的模型主要为未经审查的国外模型,特别是生图模型,仅保留KColor。 请用户注意,如果之前接入了公告中提及的模型,务必在3月6日前完成迁移。
3/5/2025 10:00:25 AM
AI在线
资讯热榜
昆仑万维面向全球发布天工超级智能体Skywork Super Agents
超多案例!让 Lovart 作图更好看更高效的提示词在这里了!
昆仑万维天工超级智能体发布!AI Office革命来袭,Deep Research碾压OpenAI,成本仅40%!
Flowith NEO发布!全球首款无限步骤、上下文与工具的AI Agent
谷歌发布Flow AI剪辑工具:Veo3 与Imagen4 驱动、镜头控制与场景扩展
告别“单打独斗”!AI 协作新范式 MoA,如何集结大模型“梦之队”?
字节跳动开源多模态模型 BAGEL:图文生成与编辑的新突破
Google搜索推出AI Mode实验,探索全新智能问答体验
标签云
人工智能
AI
OpenAI
AIGC
ChatGPT
模型
DeepSeek
AI绘画
机器人
数据
谷歌
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
芯片
英伟达
生成式
蛋白质
开发者
腾讯
Anthropic
神经网络
研究
3D
计算
Sora
机器学习
AI设计
AI for Science
生成
苹果
GPU
AI视频
搜索
场景
华为
百度
训练
人形机器人
Claude
预测
伟达
xAI
深度学习
Transformer
大语言模型
智能体
字节跳动
模态
文本
具身智能
神器推荐
Copilot
驾驶
LLaMA
视觉
API
算力
应用
安全
干货合集
工具
大型语言模型
视频生成
Agent