开源

马斯克与扎克伯格终于对上眼了：AI 大模型 Llama 3.1 开源值得赞扬
周二，Meta 发布了最新的 AI 模型 Llama 3.1。Meta 声称，该模型优于 OpenAI 的 GPT-4o，并且是开源的，已向公众免费提供。随后，马斯克罕见地向扎克伯格致敬。马斯克在回应特斯拉前 AI 总监 Andrej Karpathy 关于该模型的帖子时表示：“这令人印象深刻，扎克（伯格）的开源决定确实值得赞扬。”对此，Meta 代表尚未发表评论。对于主导 AI 的野心，扎克伯格…
应用
- 3
- 0
刘明亮7月24日
开源是未来 AI 之路，扎克伯格：Meta 要将 Llama 打造成为“AI 界的 Linux”
Meta 创始人兼首席执行官马克・扎克伯格（Mark Zuckerberg）昨日（7 月 23 日）发布博文，表达了他对开源 AI 生态系统的愿景，认为 Llama 有潜力成为“AI 界的 Linux”。扎克伯格表示 Linux 凭借着开源特性，近乎成为通过其开源特性已成为云计算和移动操作系统的行业标准，而 Meta 公司希望将 Llama 打造成 AI 领域的 Linux。扎克伯格阐述了开源人工…
应用
- 2
- 0
故渊7月24日
英特尔发布 AI Playground 开源软件：支持在锐炫 Arc 显卡本地运行 AI 图像生成与聊天机器人
在 6 月预告之后，英特尔今天正式推出 AI Playground 开源软件的 Beta 测试版。AI Playground 目前支持在配备 8GB 或更多显存的锐炫 Arc 显卡的 Windows 电脑上运行，未来还将支持英特尔酷睿 Ultra-H 处理器。据介绍，AI Playground 是一款免费开源的 AI PC 入门应用程序，支持在本地运行 AI 图像生成与增强、AI 聊天机器人功能。…
应用
- 3
- 0
泓澄（实习）7月23日
构筑 AI 安全防线，谷歌、微软、英伟达等 14 家公司组建安全 AI 联盟
感谢昨日举办的阿斯彭安全论坛（Aspen Security Forum）会议中，谷歌、微软、OpenAI、亚马逊、英伟达、英特尔等 14 家 AI 领域的大公司宣布联合组建安全人工智能联盟（Coalition for Secure AI，CoSAI）。CoSAI 由 OASIS 全球标准机构主办，是一项开源计划，旨在为所有 AI 从业人员和开发人员提供创建设计安全人工智能系统所需的指导和工具。Co…
应用
- 2
- 0
故渊7月19日
通义千问、GPT-4o 等七款 AI 大模型“高考成绩”公布：前三名文科过一本，理科过二本
感谢上海人工智能实验室 17 日公布了针对 7 个 AI 大模型的高考全科目测试结果，据大模型开源开放评测体系“司南”相关负责人介绍，“当前大模型仍存在很大的局限性。组织 AI 大模型‘参加高考’，目的是评测当前大模型的真实水平，找准问题，持续推进技术进步。”测试结果显示，书生・浦语 2.0 系列文曲星大模型（浦语文曲星）、阿里通义千问大模型 Qwen2-72B 以及 GPT-4o 再次包揽文、理…
应用
- 0
- 0
清源7月18日
PyTorch 团队首发技术路线图，近百页文档披露 2024 下半年发展方向
最近，PyTorch 团队首次公布了开发路线图，由内部技术文档直接修改而来，披露了这个经典开源库下一步的发展方向。如果你在 AI 领域用 Python 开发，想必 PyTorch 一定是你的老朋友之一。2017 年，Meta AI 发布了这个机器学习和深度学习领域的开源库，如今已经走到了第 7 个年头。根据 Assembly AI 2021 年的统计数据，HuggingFace 上最受欢迎的 to…
应用
- 4
- 0
清源7月15日
“最强开源 AI 模型”，4050 亿参数版 Meta Llama 3 被曝 7 月 23 日发布
感谢科技媒体 The Information 本周五发布博文，援引内部员工曝料称 Meta 公司计划 7 月 23 日发布开源 AI 模型 Llama 3-405B，在现有 80 亿和 700 亿参数两个版本之外，推出 4050 亿参数版本，号称是最强大的开源大语言模型。Meta 公司今年 4 月发布 Llama 3 AI 模型时，扎克伯格就在采访中透露正在训练 4050 亿像素的密集模型，但当时…
应用
- 6
- 0
故渊7月13日
2024 世界人工智能大会线下参观人数创历史新高，预计总投资额超 400 亿元
2024 世界人工智能大会（WAIC 2024）暨人工智能全球治理高级别会议闭幕式于今日下午举行。截至今日 14 时，大会线下参观人数突破 30 万人次，全网流量突破 10 亿，比上届增长了 90%，均创下历史新高。据悉，本次大会对接 132 个采购团组，形成了 126 个项目采购需求，预计意向采购金额达 150 亿元，推动 24 个重大产业项目的签约，预计总投资额超过 400 亿元。本次大会的展…
应用
- 0
- 0
清源7月6日
消息称国际首款鸿蒙人形机器人正在蔚来、利市等工厂检测验证
据《科创板日报》报道，国际首款搭载鸿蒙操纵系统的人形机器人夸父正在蔚来、江苏利市集团等工厂检测验证。据悉，“盘古大模型夸父人形机器人”将在工业和家庭两大场景同步推进应用。IT之家注意到，去年 12 月，乐聚机器人宣布推出机器人新品夸父，号称是“国际首款可腾跃、可顺应多地形行走的开源鸿蒙人形机器人”。该机器人搭载深开鸿基于开源鸿蒙研发的 KaihongOS，采用全栈开源设计，运动把持器全面开源，可…
应用
- 8
- 0
浩渺7月6日
阿里云 CTO 周靖人：通义开源模型下载量破 2000 万，坚定拥抱开源
感谢在今日的 2024 上海全国人工智能大会上，阿里云 CTO 周靖人宣布近期通义大模型和阿里云百炼平台的最新进展：近 2 个月，通义千问开源模型下载量增长 2 倍，突破 2000 万次；阿里云百炼服务客户数从 9 万增长至 23 万，涨幅超 150%。周靖人重申了阿里云拥抱开源凋谢的坚定立场，“两年前，我们在全国人工智能大会上发布通义大模型系列，当时我们宣布，通义核心模型将开源凋谢。到本日，通义…
应用
- 4
- 0
汪淼7月5日
开源 AI 大模型“洗牌”：阿里通义千问 Qwen2-72B 成“王者”，傲视 Meta Llama-3、微软 Phi-3 等群雄
感谢Hugging Face 联合创始人兼首席执行 Clem Delangue 于 6 月 26 日在 X 平台发布推文，表示阿里云开源的通义千问（Qwen）指令微调模型 Qwen2-72B 在开源模型排行榜上荣登榜首。Hugging Face 公布了崭新的开源大谈话模型排行榜，通过 300 片英伟达 H100 GPU，重新运行 MMLU-pro 等标准评价目前支流的大谈话模型，并在其要点介绍中称…
AI
- 8
- 0
故渊6月28日
腾讯混元文生图大模型开源训练代码，公布LoRA与ControlNet插件
6月21日，腾讯混元文生图大模型（以下简称为混元DiT模型）宣布全面开源训练代码，同时对外开源混元DiT LoRA 小规模数据集训练规划与可控制插件ControlNet。这意味着，全球的企业与个人开发者、创作者们，都可以鉴于混元DiT训练代码从事精调，创造更具个性化的专属模型，从事更大自由度的创作；或鉴于混元DiT的代码从事修改和优化，鉴于此构建自身应用，推动技能的快速迭代和创新。作为华文原生模型…
应用
- 3
- 0
新闻助手6月21日
上海人工智能实验室发布首个 AI 高考评测结果：语数英总分最高 303 分，数学全部不及格
感谢上海人工智能实验室 19 日公布了首个 AI 高考全卷评测结果。据介绍，2024 年全国高考甫一结束，该实验室旗下司南评测体系 OpenCompass 选取 6 个开源模型及 GPT-4o 进行高考“语数外”全卷能力测试。评测采用全国新课标 I 卷，参与评测的所有开源模型开源时间均早于高考，确保评测“闭卷”性。同时，成绩由具有高考评卷经验的教师人工评判，更加接近真实阅卷标准。该机构表示，Qwe…
AI
- 2
- 0
清源6月20日
中国电信发布全球首个单体稠密万亿参数语义模型 Tele-FLM-1T
中国电信人工智能研究院（TeleAI）和智源研究院联合发布全球首个单体稠密万亿参数语义模型 Tele-FLM-1T，该模型与百亿级的 52B 版本，千亿级的 102B 版本共同构成 Tele-FLM 系列模型。TeleAI 和智源研究院鉴于模型滋生和损失预测等技术，Tele-FLM 系列模型仅使用了业界普通训练方案 9% 的算力资源，鉴于 112 台 A800 服务器，用 4 个月完成 3 个模型…
AI
- 8
- 0
沛霖（实习）6月19日
Stable Diffusion 3 开源倒计时，2B 单机可跑碾压闭源 Midjourney
【新智元导读】重磅消息！Stable Diffusion 3，大概率会在明天开源。距离 2 月 SD3 的横空出世，已经过去了 4 个月。如果此事为真，生图圈子第一个出现开源碾压闭源的奇景！强大的 MMDiT 全新架构，将彻底改变 AI 生图的格局。现在，全体 AI 社区都在翘首以盼。万众瞩目的 Stable Diffusion 3，终于要正式开源了！几天前，在 Computex 2024 大会上…
AI
- 2
- 0
清源6月12日
“全球首创”单台 RTX 4090 服务器推理，昆仑万维开源 2 千亿稀疏大模型天工 MoE
昆仑万维今日宣布开源 2 千亿稀疏大模型 Skywork-MoE，基于之前昆仑万维开源的 Skywork-13B 模型中间 checkpoint 扩展而来，号称是首个完整将 MoE Upcycling 技术应用并落地的开源千亿 MoE 大模型，也是首个支持用单台 RTX 4090 服务器（8 张 RTX 4090 显卡）推理的开源千亿 MoE 大模型。据介绍，本次开源的 Skywork-MoE 模…
AI
- 10
- 0
汪淼6月3日
超越Devin，姚班带队OpenCSG创造大模型编程新世界纪录
来自中国大模型初创公司OpenCSG推出的StarShip CodeGen Agent，以23.67%的成果刷新了普林斯顿SWEBench(大模型确实独立编程评测)排行榜，取得了全球第二名的成果，同时创造了非GPT-4o基模的最高纪录（SOTA）。SWEBench评测高度贴近确实编程场景，难度极高，不仅要求模型能理解需求、协调多个函数/类甚至文件的变更，还要求模型与执行环境交互，处理超长上下文并执…
应用
- 1
- 0
新闻助手5月31日
快速入门大模型技巧与应用，推荐你从Stable Diffusion开始学起
自 2023 年 AI 技巧爆发以来，以 ChatGPT、Stable Diffusion 为代表的大模型已然成为了大众的焦点，其中 Stable Diffusion 作为知名的视觉开源模型，凭借直观易用与令人印象深刻的图像生成能力，赢得了创作者的广泛青睐。随着人工智能技巧的不断进步和创新，Stable Diffusion 已经在艺术创作、设计领域乃至科学研究中展现出了独特的魅力和巨大的潜力。它不…
AI
- 10
- 0
机器之心5月29日
只需单卡RTX 3090，低比特量化训练就能实行LLaMA-3 8B全参微调
AIxiv专栏是机器之心发布学术、手艺内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]
理论
- 2
- 0
机器之心5月25日
WOT大会日程上线：我们找来数十位大模型试验企业现身说法
这两天的技巧圈里，估计大家都在摩拳擦掌等待体验OpenAI的GPT-4o（o为Omni缩写，意为“全能”）有多“全能”吧。我们无意给市场泼冷水，只是要提醒大家，想要让大模型真正落地，市场的热，并不意味着使用试验的成熟。尤其在企业级场景中，为什么大模型落地理想很丰满现实很骨感？为什么很少有企业能把大模型用在核心业务中？是不想用、还是用不好？在即将于6月21-22日在北京召开的WOT全球技巧创新大会上…
工程
- 3
- 0
新闻助手5月20日
苹果颁布 OpenELM，基于开源训练和推理框架的高效谈话模型
在 WWDC24 之前，苹果在 Hugging Face 平台上颁布了一个“具有开源训练和推理框架的高效谈话模型”，名为 OpenELM。当然，这是一项开源谈话模型，其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。IT之家将官方简介翻译如下：大型谈话模型的可重复性和透明性对于推进封闭研讨、确保结果的可信度以及调查数据和模型偏差以及潜在风险至关重要。为此，我们颁布了 OpenEL…
AI
- 2
- 0
问舟4月24日
Meta 发布 Llama 3，号称是最强大的开源大言语模型
感谢Meta 公司今天发布新闻稿，宣布推出下一代大言语模型 Llama 3，共有 80 亿和 700 亿参数两种版本，号称是最强大的开源大言语模型。Meta 声称，Llama 3 的性能优于 Claude Sonnet、Mistral Medium 和 GPT-3.5，IT之家附上 Llama 3 的主要特点如下：向所有人开放：Meta 开源 Llama 3 的 80 亿参数版本，让所有人都能接触…
AI
- 4
- 0
故渊4月19日
中国电信开源 TeleChat-12B 星斗语义大模型，年内开源千亿级参数大模型
感谢中国电信已开源 120 亿参数 TeleChat-12B 星斗语义大模型，还表示将于年内开源千亿级参数大模型。相较 1 月开源的 7B 版本，12 版版本在内容、性能和应用等方面整体后果晋升 30%，其中多轮推理、安全问题等领域晋升超 40%。据介绍，TeleChat-12B 将 7B 版本 1.5T 训练数据晋升至 3T，优化数据洗濯、标注策略，持续建立专项任务 SFT (监督微调) 数据，…
AI
- 4
- 0
问舟4月16日
baidu李彦宏称开源 AI 模型会越来越发展
感谢baidu创始人、董事长兼 CEO 李彦宏今日在 Create 2024 baidu AI 开发者大会上默示，开源模型会越来越发展。李彦宏介绍，因为基础模型文心 4.0 可以根据需要，兼顾效验、响应速度、推理利润等各种考虑，剪裁出适合各种场景的更小尺寸模型，并且支持精调和 post pretrain。这样通过降维剪裁出来的模型，比直接用开源模型调出来的模型，一致尺寸下，效验明显更好；一致效验下…
AI
- 4
- 0
汪淼4月16日