AI在线 AI在线

超58000星!精选AI Agent、MCP开源大合集,Github每日第一

相信有不少小伙伴正在学习AI Agent、MCP、RAG的开发和商业用例吧。 虽然Github、Hugging Face有海量开源项目,但想找出经典又实用的并不容易。 所以,「AIGC开放社区」就为大家介绍一个精选的开源大合集,包括入门级AI Agent、高级Agent、多层级智能体、语音智能体、多类型RAG等非常好用的项目。

相信有不少小伙伴正在学习AI Agent、MCP、RAG的开发和商业用例吧。虽然Github、Hugging Face有海量开源项目,但想找出经典又实用的并不容易。

所以,「AIGC开放社区」就为大家介绍一个精选的开源大合集,包括入门级AI Agent、高级Agent、多层级智能体、语音智能体、多类型RAG等非常好用的项目。不仅适合新手,开发老鸟也可以学习借鉴下启发灵感。

目前,这个合集在Github已经超过58000颗星,并且拿下过Github每日最佳趋势第一名。不用担心质量,已经过超过10万开发者的认证了。

超58000星!精选AI Agent、MCP开源大合集,Github每日第一    

开源地址:https://github.com/Shubhamsaboo/awesome-llm-apps/?tab=readme-ov-file

下面就为大家简单的介绍这个开源库的主要内容。

入门级AI Agent

这些智能体是为初学者设计的,功能较为基础,易于理解和上手。涵盖了多种常见的应用场景。例如,将博客内容转换为播客智能体,能够提取博客中的关键信息,生成适合音频传播的脚本,并结合语音合成技术将文字转化为自然流畅的音频内容,让用户可以通过听觉方式获取博客信息,丰富内容的传播形式。

医疗影像智能体,具备对医学影像如 X 光、CT 扫描、核磁共振等的识别和解读能力,能够辅助医疗人员更准确地判断影像中的异常情况,为疾病的诊断提供支持。

浏览器智能体,结合了多个大模型的能力和自动化浏览器交互,通过直接操作网站,根据文本提示生成meme。

超58000星!精选AI Agent、MCP开源大合集,Github每日第一

音乐智能体,可以根据用户的需求,如音乐风格、节奏、情绪等,生成原创的音乐作品。集成了音乐理论知识和生成模型,能够创作旋律、和声甚至编曲,为音乐爱好者、创作者提供灵感和创作辅助,降低音乐创作的入门难度。

高级AI Agent

高级AI Agent是面向更繁琐、跨平台、业务流程的智能体,通常需要结合多模型协作或领域知识,以解决高精度、复杂度的自动化需求。

例如,AI系统架构师智能体会调用 DeepSeek+ Claude双模型,分析系统架构的安全性、可扩展性,覆盖医疗数据平台、实时事件处理系统等专业场景。

AI深度研究智能体能自动爬取学术论文、行业报告,整合量子计算、可再生能源等前沿领域信息,生成结构化研究结论。

实时商业策略顾问智能体,基于 Google ADK的框架,同时集成了Perplexity AI搜索工具,实时获取最新行业动态、竞品数据及政策变化。

超58000星!精选AI Agent、MCP开源大合集,Github每日第一

个性化财务规划智能体,整合YFinance等实时金融数据接口。能分析用户收入结构与支出习惯,针对购房、养老等需求制定分阶段储蓄投资方案,并结合风险承受能力推荐低、中、高风险金融产品组合。

电影制作智能体,可评估剧本的情节逻辑与市场适配性,拆分拍摄、后期等环节的预算,建议导演、演员等团队配置,规划避开竞品的档期,通过数据分析降低制作风险、优化资源分配。

商业投资智能体,整合市场历史数据、实时行情及宏观经济指标,通过 AI 模型预测资产价格趋势,推荐股票、基金等投资标的并附风险评级,支持自定义短期投机或长期价值投资周期,输出可视化收益预期与止损建议。

健康管理智能体,基于用户体重、体脂率等身体数据及增肌、减脂等目标,生成定制化方案:包括分日、周的运动类型、强度安排,热量摄入与营养素配比的饮食建议。

产品发布智能体,采用 Firecrawl异步爬取数据,Agno Team负责多智能体协作,Streamlit 提供交互UI。能抓取竞品功能与用户评价以识别市场空白,建议发布时间、渠道组合及促销方案,还能预测用户反馈等风险并提供应对措施。

基于MCP的AI Agent

这些是基于MCP服务的智能体,能够同时处理多个上下文信息,提供更加智能和灵活的服务。

例如,浏览器MCP Agent,是一款基于Streamlit的应用,核心功能是允许用户通过自然语言命令浏览和交互网站。

支持全浏览器导航,包括访问网站、页面跳转,还能与页面元素交互,如点击按钮、填写表单、滚动内容,同时提供视觉反馈网页元素截图和信息提取能力,可从网页中提取并总结内容并完成多步骤浏览任务,如 “进入博客找到最新文章并总结要点”。

GitHub MCP智能体,可实时对对Github开源库进行全面分析。涵盖查询仓库的 issues、拉取请求、活动记录和代码统计等。同时提供用户友好的界面,包含示例查询和自定义输入选项,能实时返回仓库活动等。

超58000星!精选AI Agent、MCP开源大合集,Github每日第一

Notion MCP智能体是一款终端- based工具,能帮助用户通过自然语言与 Notion 页面交互,依托 Notion MCP 服务器实现对 Notion 内容的操作。它支持多种页面交互功能,包括更新、插入、检索内容,创建和编辑块、列表、表格等 Notion 结构,添加评论,搜索特定信息,且能记住对话上下文以支持多轮交互,同时提供会话管理确保对话的持久性。

多类型RAG

RAG作为大模型必备功能之一,通过检索大量数据来增强生成内容的准确性和相关性。这种强大的能力同样可以应用在AI Agent领域。

Agentic RAG 是一款基于GPT-4o构建的检索增强生成系统,核心在于整合 PDF 知识库与 DuckDuckGo网页搜索能力,采用LanceDB作为向量数据库实现高效的相似性检索,并提供直观的交互界面,让用户能便捷地与结合文档知识和网络信息的AI助手互动,仅需 15 行Python 代码即可实现基础功能。

Agentic RAG with Reasoning则更强调推理过程的透明度,结合Claude 3.5进行语言处理和OpenAI嵌入模型实现向量搜索,支持文档上传与 URL 动态添加,通过 LanceDB 实现向量数据的持久化存储。

其主要技术特点是实时展示智能体的思考步骤,采用左右分栏视图呈现推理过程与最终答案,同时清晰标注信息来源,让用户能直观了解RAG流程的每一步,从文档加载、文本分块、嵌入生成到检索匹配的全链路都可追溯。

超58000星!精选AI Agent、MCP开源大合集,Github每日第一

博客RAG,专注于 AI 领域博客内容的精准检索,基于LangChain和LangGraph构建,集成Google Gemini 模型处理查询与生成结果,以Qdrant作为向量数据库存储博客内容嵌入。

具备智能查询处理能力,能判断查询是否需要重写、直接回答或进一步检索,还通过 Gemini 模型实现相关性自动评估,优化检索结果。

Hybrid搜索RAG,主要提供混合搜索能力融合语义匹配与关键词检索提升文档召回率,支持 PDF 文档上传处理,自动完成文本分块与嵌入,当文档信息不足时会调用 Claude 的通用知识补充,通过 Streamlit 提供直观的聊天界面,平衡了文档特定知识与通用智能的优势。

RAG-as-a-Service偏向于将RAG能力封装为服务,便于集成到各类应用中,提供标准化的文档处理、检索与生成接口,降低开发者构建RAG系统的门槛,包含向量存储管理、模型调用、检索优化等核心功能,支持按需扩展以应对不同规模的知识处理需求。

数据库RAG具备智能查询路由能力,通过Agno智能体将用户查询分发到最相关的专业数据库包括产品信息、客户支持与 FAQ、财务信息三类,采用 Langchain 编排 RAG 流程,Qdrant 管理各数据库的文档嵌入。

当数据库中无相关信息时,触发LangGraph智能体调用DuckDuckGo进行网页搜索作为 fallback。支持多 PDF 上传分类存储,并通过Streamlit界面实现自然语言查询交互,确保查询能精准匹配到最相关的知识源。

上面只是介绍了一小部分,目前这个开源库仍在持续更新,估计以后还会加入更多好用的智能体和相关的技术。

相关资讯

微软 GitHub 推出 AI 编程智能体,可自动修复漏洞和优化代码

GitHub在微软Build大会上宣布推出AI编程智能体,集成在GitHub Copilot中,可自动修复漏洞、添加功能和优化文档。该工具已向Copilot企业版和Plus用户开放。#AI编程# #GitHubCopilot#
5/20/2025 12:23:51 AM
远洋

从现在起,GitHub上超1亿开发者可直接访问全球顶级大模型,构建AI应用

GitHub 推出的全新功能「GitHub Models」将有望加快 AI 工程师时代的到来。什么?大家熟悉的代码托管平台 GitHub 又进化了!该平台也开始提供 AI 大模型的 Playgroud 了。所有你能叫得上名字的业界流行大模型,包括微软的 Phi-3、OpenAI 的 GPT-4o、Meta 的 Llama 3.1、Cohere 的 Command R 、Mistral AI 的 Mistral Large,都可以在一个交互式沙盒中试用。在未来几个月,Github 也将添加更多语言、视觉以及其他类型的
8/4/2024 9:48:00 AM
机器之心

GitHub Copilot 推出视觉功能:图片可秒变代码

GitHub 宣布了其 AI 编程助手 Copilot 的一系列重大更新,此次更新中最引人注目的功能之一是 Copilot 的“Vision”功能。该功能允许用户在聊天中上传截图、照片或图表,Copilot 将基于这些图像生成相应的界面、代码以及替代文本(alt text),从而将用户的视觉想法转化为实际的编程成果。
2/8/2025 9:30:22 AM
远洋
  • 1