LLaMa 3

奖励模型：为什么要用评估专家及其设计方案

奖励模型：为什么要用评估专家及其设计方案

大模型最根本的价值就是替代人的工作，而在训练大模型的过程中，还有很多操作是需要人工的。比如数据工程里的数据质量检查、模型评估阶段的人工测评等。关于这个问题，我的答案是使用评估专家模型技术，让这些过程实现完全无人化。

9/26/2025 2:11:00 AM greencoatman

Nature推荐的大模型，现如今最好用的AI工具应当更好地助力科学研究

Nature推荐的大模型，现如今最好用的AI工具应当更好地助力科学研究

编辑丨toileterAI 大模型的演变随着时间呈现出井喷的增长趋势，几乎每周甚至于没几天就会有全新的 AI 工具被推出，引来蜂拥而至的研究人员去尝试它们。现如今花样百出的 AI 工具，让研究者们无论在何种需求上都能自行配置最得心应手的模型，每个大型语言模型（LLM）都得以适配不同的任务需要。总部位于华盛顿州西雅图的 Fred Hutchinson 癌症中心的数据科学家 Carrie Wright 表示，尽管 LLM 会产生类似人类的反应，但它们仍然太容易出错，无法单独使用。

2/19/2025 3:02:19 PM ScienceAI

为超越 OpenAI GPT-4，Meta 不惜使用争议数据训练 Llama 3

为超越 OpenAI GPT-4，Meta 不惜使用争议数据训练 Llama 3

周二，在一场涉及 Meta 的人工智能版权案件（Kadrey 诉 Meta 案）中，法院公开了 Meta 高管和研究人员的内部通信记录。这些文件显示，Meta 在开发其最新 AI 模型 Llama 3 的过程中，高管和研究人员将超越 OpenAI 的 GPT-4 视为核心目标，并在内部讨论中表现出极强的竞争意识。

1/15/2025 4:22:09 PM 远洋

腾讯Hunyuan超越Llama 3，成为NLP领域新霸主

腾讯Hunyuan超越Llama 3，成为NLP领域新霸主

腾讯最近发布了一款名为Hunyuan的先进Moe（Mixture of Experts）模型，该模型在多个基准测试中表现出色，超越了Llama 3，成为自然语言处理（NLP）领域的新领导者。地址如下：github: : ：合成数据增强： Hunyuan-Large通过合成数据增强训练，能够学习到更丰富的表示，处理长上下文输入，并更好地泛化到未见数据。 KV缓存压缩：采用分组查询注意力（GQA）和跨层注意力（CLA）策略，显著减少了KV缓存的内存占用和计算开销，提高了推理吞吐。

11/6/2024 12:31:41 PM 哎呀AIYA

英伟达对话模型ChatQA进化到2.0版本，上下文长度提到128K

英伟达对话模型ChatQA进化到2.0版本，上下文长度提到128K

开放 LLM 社区正是百花齐放、竞相争鸣的时代，你能看到 Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1 等许多表现优良的模型。但是，相比于以 GPT-4-Turbo 为代表的专有大模型，开放模型在很多领域依然还有明显差距。在通用模型之外，也有一些专精关键领域的开放模型已被开发出来，比如用于编程和数学的 DeepSeek-Coder-V2、用于视觉 - 语言任务的 InternVL

7/25/2024 3:25:00 PM 机器之心

面壁新模型：早于Llama3、比肩 Llama3、推理超越 Llama3！

面壁新模型：早于Llama3、比肩 Llama3、推理超越 Llama3！

图注：面壁Eurux-8x22B 模型在 LeetCode 和 TheoremQA这两个具有挑战性的基准测试中，刷新开源大模型推理性能 SOTA。图注：面壁Eurux-8x22B 模型综合性能比肩 LlaMa3-70B，超越开源模型 WizardLM-2-8x22b, Mistral-8x22b-Instruct,DeepSeek-67b，以及闭源模型 GPT-3.5-turbo。 Eurux-8x22B 由 Mistral-8x22B对齐而来。

5/1/2024 9:38:00 PM 张进

首批中文版Llama3模型来了，解释成语、答弱智吧问题

首批中文版Llama3模型来了，解释成语、答弱智吧问题

中文问题，中文回答。最近，Meta 推出了 Llama 3，为开源大模型树立了新的标杆。和以往的原始 Llama 模型一样，Llama 3 对中文的支持效果欠佳，经常会出现你用中文提问，它用英文或中文英文回复的现象。因此，要想让国内用户用上该模型，开发者还需对其进行微调。最近，在 Github 以及 HuggingFace 平台上，我们已经陆陆续续地看到了一些这样的项目，比如 llama3-Chinese-chat 和 Llama3-8B-Chinese-Chat。这篇文章将逐一介绍。llama3-Chinese

4/25/2024 11:23:00 AM 机器之心

AI在用| 没错，树莓派5也能飙上Llama 3了！

AI在用| 没错，树莓派5也能飙上Llama 3了！

机器之能报道编辑：山茶花以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。4 月 18 日，Meta 发布了 Llama 3，号称「迄今最强的开源大模型」。根据 Meta 的说法，Llama 3 在多个关键基准测试中超越了业界领先的同类模型，在代码生成等任务上实现了全面领先。该模型能够进行复杂的推理

4/23/2024 6:55:00 PM 机器之能

Llama 3超大杯有何惊喜？Meta会一直开源吗？当初为何笃信元宇宙？扎克伯格新访谈回应一切

Llama 3超大杯有何惊喜？Meta会一直开源吗？当初为何笃信元宇宙？扎克伯格新访谈回应一切

昨天凌晨，Meta 突然官宣了 Llama 3，把开源模型的实力又往上提了一截。Llama 3 总共有三个版本 ——8B、70B 和 405B。其中，8B 和 70B 版本已经开源，405B 版本仍在训练中。根据现有的评测数据，405B 版本的性能已经逼近 GPT-4（参见《开源大模型 Llama 3 王者归来！最大底牌 4000 亿参数，性能直逼 GPT-4》）。这可能促使 OpenAI 尽早发布下一代模型，从而保持其最强 AI 模型的地位。那么，这个还没有亮相的 Llama 3 405B 大模型将带来哪些惊喜？

4/22/2024 11:02:00 AM 机器之心

LLaMa 3或将推迟到7月发布，剑指GPT-4，从Gemini吸取教训

LLaMa 3或将推迟到7月发布，剑指GPT-4，从Gemini吸取教训

LLaMa 3 正寻找安全与可用性的新平衡点。过去的图像生成模型常被人们诟病人物主要以「白人」为主，而谷歌 Gemini 正在因为它的矫枉过正而深陷翻车风波。它「过度谨慎」的文生图结果会与历史事实出现极大偏差，让用户们瞠目结舌。谷歌表示，该模型变得比开发者预期的更加谨慎。这不仅体现在生成图片的问题上，还体现在常常将一些提示认作敏感提示，从而拒绝回答。在此事不断发酵时，这项安全与可用性如何平衡的难题也给 Meta 提出了巨大挑战。LLaMA 2 是开源领域的「强中手」，更是 Meta 的招牌模型，一经发布即改变了大模

2/29/2024 3:12:00 PM 机器之心

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉