解决大模型复现难、合作难, 这支95后学生团队打造了一个国产AI开源社区

过去十年间,AI 手艺经历了巨大的飞跃,无论是在自然语言处理、图像识别,还是在更多的创新范畴,AI 的影响已无所不在。伴随着研讨数量的爆炸性增长,学术界和工业界同样面临着一些挑战,其中就包括「论文复现」和「跨学科合作」的难题。特别是当我们来到了大模型时代,面对动辄百亿参数量的模型研讨,开源、复现、合作变得更加重要,但难度却更上一层楼。论文复现,首先是评判一项结果价值的重要参考因素。同时,在快速发展的 AI 范畴,确保研讨的可复现性将更好地推动知识的积累和手艺的普及,也是维护学术诚信和促进持续创新的关键所在。面对这些

过去十年间,AI 手艺经历了巨大的飞跃,无论是在自然语言处理、图像识别,还是在更多的创新范畴,AI 的影响已无所不在。

伴随着研讨数量的爆炸性增长,学术界和工业界同样面临着一些挑战,其中就包括「论文复现」和「跨学科合作」的难题。特别是当我们来到了大模型时代,面对动辄百亿参数量的模型研讨,开源、复现、合作变得更加重要,但难度却更上一层楼。

论文复现,首先是评判一项结果价值的重要参考因素。同时,在快速发展的 AI 范畴,确保研讨的可复现性将更好地推动知识的积累和手艺的普及,也是维护学术诚信和促进持续创新的关键所在。面对这些问题,倡导绽放科学和透明研讨显得尤为重要。通过开源代码、数据和尝试细节、供应更低成本的、针对复现需求的算力平台,以及供应支持快速复现的交互式程序,我们或许可以或许在推进科学研讨的道路上,建立更加稳健和可靠的基础。

如果说「复现难」的问题,就像是为研讨者之间的「对话」增添了一道高墙。那么「合作难」的问题,同时也为跨学科的合作建立了无形的屏障。

大模型时代,如何搭建一个方便的、可以或许降低交流和合作门槛的平台已经成为一大挑战。我们所熟悉传统的软件开发合作方式,例如基于 Git 的代码管理与版本控制,在 A I 研发这种更依赖于尝试而非确定性过程的场景下可能不再适用,其复杂的尝试版本管理和较高的使用、摆设门槛往往阻碍了不同范畴专家之间的交流与合作。当前的 AI 范畴需要新的合作模式和工具,包括更直观、易于使用的版本控制和合作平台,让非手艺背景的专家也能方便地参与到模型的开发、评估和演示过程中来。

换句话说,无论是科研工作者还是从业者,都希望能在知识和手艺的共享基础上,实现更加高效、有深度的合作,推动 AI 范畴的进一步发展。

在这样的背景下,一个全新的 AI 开源社区平台「SwanHub」诞生了。

解决大模型复现难、合作难, 这支95后学生团队打造了一个国产AI开源社区

体验地址:https://swanhub.co/

值得关注的是,SwanHub 来自西安电子科技大学的一支非常年轻的在校研讨生和本科生团队。团队的四位成员均为 95 后,不仅有着丰富的 AI 研讨经验,还有对开源的热情。在指导老师吴家骥教授和谭茗洲教授的带领下,他们从零开始构建了一个 AI 模型一站式配合开发、开源共享、可视化揭示平台,旨在解决当前 AI 模型复现难、摆设难、管理难的核心问题。

SwanHub 解决了哪些问题?

在 SwanHub 这一平台中,AI 研讨者和从业者不仅可以获得丰富的开源模型和工具资源,还可以或许享受到配合开发的便捷与高效。目前,SwanHub 已经上线几大核心功效,包括 AI 模型托管、可视化揭示等。

首先,AI 研讨者可以将自己的代码托管到 SwanHub 上进行版本管理,像使用 Github 托管平台一样。但与 GitHub 相比,SwanHub 支持更高容量的大文件托管,研讨者可将多达几十个 GB 的模型权重文件进行托管与版本管理。

解决大模型复现难、合作难, 这支95后学生团队打造了一个国产AI开源社区

解决大模型复现难、合作难, 这支95后学生团队打造了一个国产AI开源社区

「可视化揭示」也是 SwanHub 的一大亮点。很多在顶级会议和期刊上发表的研讨文章都会揭示漂亮的效果和创新的手艺。但在实际操作中,尝试复现这些研讨结果的工程师和研讨人员却常常遇到困难。正因此,近年来很多学术会议不仅要求作者提交代码,也要求提交一定数量的 Demo,供应更充足的研讨信息,而 SwanHub 恰好供应了这样一个公开揭示结果、获取更多科研流量的平台。

如下图所示,SwanHub 平台供应了一套简易的模型 Demo 摆设工作流,让用户可以通过点击几个按钮的方式,轻松地将代码和模型权重摆设成一个可视化、可交互的网页 Demo,实现实时在线测试 AI 模型的推理结果,并支持分享给合作者、审稿人、同行或公开在互联网上。SwanHub 也支持主流的可视化框架如 Gradio、StreamLit 等。

解决大模型复现难、合作难, 这支95后学生团队打造了一个国产AI开源社区

解决大模型复现难、合作难, 这支95后学生团队打造了一个国产AI开源社区

SwanHub 不仅为想要分享结果的研讨者供应了一个揭示自己开源模型的平台,其他研讨者也可以在这里轻松地访问到其他研讨者的开源结果、体验 Demo,以及在讨论区进行学术讨论。

此外,团队表示,SwanHub 即将上线两项功效:第一项功效是代码一站式摆设服务,让用户可以轻松地将机器学习模型摆设为一个云服务 API(应用程序编程接口),并同样支持绽放给全社区或私有使用。对于绽放自己模型的 API 的研讨者而言,可以让自己的研讨结果更快地接入到各个应用场景中,提高研讨的影响力;同时对于使用者而言,也能更快地让自己的应用接入各类强大的开源 AI 能力。第二项功效是模型尝试管理工具 SwanLab,用户可以将自己的尝试日记记录程序接入 SwanLab,即可实现在线尝试日记记录和管理功效。平台不仅仅可以或许帮助记录训练日记和托管中间模型,还可以或许供应可视化训练结果、训练完成消息推送、超参数记录与推荐、模型跨版本对比等功效,便于研讨人员快速试错和开发,以及提升多人配合训练的效率。

解决大模型复现难、合作难, 这支95后学生团队打造了一个国产AI开源社区

                                 正在开发中的模型训练日记托管功效

四个年轻人的手艺理想

很少有人知道的是,SwanHub 开源社区平台的背后是四位年轻的「95 后」成员。

林泽毅、陈少宏、韩翔宇、雷清扬四人相识于西安电子科技大学的校园,曾出于各自对手艺的兴趣组建过一个名为「光年科技工作室」的社团。后来,几个志同道合的年轻人共同创立了「极创工作室」,踏上了科技创业的旅程。

打造 SwanHub 的灵感,除了来源于团队基于当前 AI 范畴对开源社区需求的洞察,其实也和他们自己的研讨经历有关。

在从事 AI 研讨的过程中,他们常常感受到来自内部合作和项目揭示方面的需求和挑战。虽然常用的一些开源平台可以或许供应基本的托管功效,但往往缺乏一个基于模型的可视化合作版块,导致尝试室成员之间的合力难以凝聚。

对于大部分的研讨者来说,诸如此类的问题是很常见的。一方面,复杂的尝试版本和多人配合带来的困难会限制研讨项目的发展,另一方面,模型的摆设难度较大以及训练过程的复现困难也阻碍团队的内部交流和知识积累。在日常的学术交流活动中,他们同样缺乏一个直观揭示结果和积累的平台。

「这些因素进一步强化了我们搭建一个属于自己的合作和揭示平台的愿望。」SwanHub 项目负责人林泽毅介绍说。「我们希望供应一个针对 AI 范畴的开源社区,在论文复现、手艺选型、手艺分享等方面帮助更多的科研工作者与从业者。此外,我们期望这种基于模型的可见、可交互的合作模式可以或许提高 AI 项目的迭代速度和团队成员之间的交流效率,减少不必要的等待和沟通成本。」

因此,SwanHub 项目的最初设想是供应一套完整的 AI 工作流程,从论文到开源代码再到摆设和可视化揭示。通过这套工作流程,人们可以在进行尝试和投稿论文的同时,轻松地搭建可视化的演示,以供同行快速复现和试验。另一方面,供应可交互 Demo 的学术项目也更容易获得更高的传播度和更好的口碑,进而获得更高的学术影响力。

同时,团队还考虑到了业界开发者的需求。与传统的软件开发不同,AI 开发是一种尝试科学,特别是到了大模型时代,手艺的开发和测试思路也发生了很大的变化:在实际应用中,尽管模型可能在某些客观指标上表现出色,但如何在实际场景中施展它们的「智能」,如何将它们融入到专业工作流程中,往往需要相关范畴的专家进行深入的实际效果测试,而这个过程同样是挑战重重的。

对于这一点,SwanHub 项目成员陈少宏的体会比较深刻。他所在的 AI 研讨团队曾经参与一家智能手机厂商视频处理算法研发的项目,当时的研讨团队成员分散在全国多个城市,大部分工作需要线上合作。但从算法更新、验证、端侧摆设、反馈的整个线上流程来看,每一次模型迭代需要以「1.5 个星期」为单位,显然赶不上项目原本规划的落地节奏。

为了加快算法更新效率,陈少宏推荐研讨小组使用了 SwanHub,每训练完一个版本的模型,都可以在平台上快速更新 Demo,厂商各部门的人员,包括 PM、产品经理、测试、市场、其他研讨人员,都可以在线试验效果,供应多样化的改进反馈,极大地提高了合作双方的沟通和合作效率,也大大提高了模型的迭代速度。

这种跨学科的合作,在此前以代码为核心的合作上是很难做到的 —— 比如让一位市场部的项目成员去安装环境、运行项目是阻力极大的事情,而以 Demo 为核心的平台让跨范畴合作成为了可能。

开源的价值:AI 手艺变革的助推力

二十年前,一本名为《开源:革命之声》的著作曾风靡科技圈。这本书深入探讨和记录了十多位开源先驱对于开源文化的理解和阐述,包括 Linux 之父 Linus Torvalds、自由软件运动创始人 Richard Stallman 等传奇人物。

比如,Linus Torvalds 一直是开源的忠实拥护者,曾公开表达:「未来的一切都是开源的(The future is open source everything)。」三十多年来,他不遗余力地为 Linux 社区注入心血,让 Linux 从一个仅有几百位用户的自由操作系统开始,逐渐成长为一个伟大而富有创造力的社区。

SwanHub 的团队成员对于开源的热情就起源于这本书籍,他们甚至尝试将此前只有英文原版的书稿译为中文,翻译的过程让他们更加深刻地认识到开源在学术交流与科技发展中所能发挥的巨大推动作用。

打造 SwanHub 开源社区的深层价值也在于此。纵观今天的 AI 范畴,大部分有影响力的进展都深深植根于绽放科学和开源的原则。这些原则不仅倡导知识的自由传播和共享,还实质性地推动了全球范围内的科研合作与创新。

Hugging Face 社区的「Transformers 库」便是一个经典的例子:这家成立于 2016 年的公司,凭借其易用的接口和大量的预训练模型迅速获得了 AI 社区的广泛认可和热烈欢迎。它不仅供应了一个用于发布、分享和合作的平台,还开启了一种创新的合作模式,大大降低了深度学习模型的使用门槛,从而让更多的开发者和科研工作者可以或许应用这些模型到实际的项目和研讨中。

最重要的是,Hugging Face 社区鼓励并促进了全球范围内的合作。开发者和研讨者们在此平台上分享自己开发的模型、贡献代码、提出问题,共同寻找解决方案。这种集思广益的合作方式极大推动了 AI 手艺的发展,也将一些前沿的、可能原本属于封闭研讨的手艺绽放给了公众。

Hugging Face 的成功不是偶然的,它揭示了一个绽放、合作的手艺社区对于科技进步起到了不可忽视的推动作用。当科研工作者有了公开分享数据、方法论、模型和工具等研讨结果的渠道,他们的贡献就能成为广大研讨社区的共同财富。

这种绽放分享的实践允许其他研讨者站在「巨人」的肩膀上,不仅能看到更远的地方,也能通过继续探索和创新。身处这样一个环境中,AI 手艺的发展才可以或许在一个正向循环中迅速推进。

在这一点上,SwanHub 的目标和 Hugging Face 是基本一致的。关于 SwanHub 的未来,团队希望可以或许持续提升 SwanHub 在配合、摆设、社区等方面的能力与体验,并将围绕 SwanHub 打造工具矩阵,包括大模型模块化编程工具 SwanChain、模型尝试管理工具 SwanLab 等,覆盖 AI 研讨的整个生命周期,并持续走开源道路。

解决大模型复现难、合作难, 这支95后学生团队打造了一个国产AI开源社区

如今,大模型风云乍起,新的结果不断涌现,谷歌和 OpenAI 这样的公司可能不会有「护城河」,而开源力量却在不断崛起和追赶,形成这一局面的因素中,也包括无数开源拥护者的共同努力。

给TA打赏
共{{data.count}}人
人已打赏
应用

清华朱文武团队:开源世界首个轻量图主动呆板进修库AutoGL-light

2023-10-23 15:09:00

应用

ChatGPT与DALL·E 3之间的行业「黑话」被人发现了

2023-10-23 15:25:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索