AI在线 AI在线

PandaAI:一个基于AI的对话式数据分析工具

PandaAI 是一个基于 Python 开发的自然语言处理和数据分析工具,支持问答式(ChatGPT)的数据分析和报告生成功能。 PandaAI 提供了一个开源的框架,主要核心组件包含用于数据处理的数据准备层(Pandas)以及实现 Text2SQL 功能的自然语言接口。 数据源PandaAI 支持文件、数据库以及大数据平台等多种数据源连接,包括 Excel、CSV、MySQL、PostgreSQL、Oracle、Microsoft SQL Server、Databricks、Redshift、Snowflake、ClickHouse、Supabase、BigQuery、Salesforce 等。

PandaAI:一个基于AI的对话式数据分析工具

PandaAI 是一个基于 Python 开发的自然语言处理和数据分析工具,支持问答式(ChatGPT)的数据分析和报告生成功能。

图片

PandaAI 提供了一个开源的框架,主要核心组件包含用于数据处理的数据准备层(Pandas)以及实现 Text2SQL 功能的自然语言接口。

数据源

PandaAI 支持文件、数据库以及大数据平台等多种数据源连接,包括 Excel、CSV、MySQL、PostgreSQL、Oracle、Microsoft SQL Server、Databricks、Redshift、Snowflake、ClickHouse、Supabase、BigQuery、Salesforce 等。

在这里插入图片描述

自然语言查询

用户可直接用自然语言提问,例如“GDP 排名前五的国家是哪些?,PandaAI 会自动将问题转化为 Python 代码或 SQL 查询,并返回结果。

在这里插入图片描述

可视化面板

PandaAI 支持生成多种图表(例如柱状图、 饼图、折线图等)和分析报告,通过简单指令即可实现数据可视化,无需手动编写绘图代码。

在这里插入图片描述

团队分享

PandaAI 支持用户权限管理,可以将查询结果分享给业务团队或者其他数据团队成员。

在这里插入图片描述

多语言模型

PandaAI 提供了 LiteLLM 模型接口,支持各种大语言模型(LLM),包括 OpenAI、Azure、Anthropic、Google、AWSHugging Face 等;默认使用 BambooLLM。

快速体验

PandaAI 提供了一个免费的在线体验平台(PandaBI),输入以下网址:

https://app.pandabi.ai/

在这里插入图片描述

使用邮箱注册一个免费账号,然后登录系统:

在这里插入图片描述

在输入问题之前,我们需要配置数据源。左侧的“Datasets”用于导入文件;“Connectors”用于连接数据库;“API Keys”用于生成 API 调用密钥,如果自行安装部署需要使用这个密钥。

我们使用文件导入功能导入一份员工信息数据 CSV 文件,然后提问“月薪最高的 5 名员工?”:

在这里插入图片描述

如果想要自行安装,使用 pip 工具安装 pandasai 模块的方式如下:

复制
pip install "pandasai>=3.0.0b2"

然后使用 PandaAI 回答问题:

复制
import pandasai as pai

# Sample DataFrame
df = pai.DataFrame({
    "country":["United States","United Kingdom","France","Germany","Italy","Spain","Canada","Australia","Japan","China"],
    "revenue":[5000,3200,2900,4100,2300,2100,2500,2600,4500,7000]
})

# By default, unless you choose a different LLM, it will use BambooLLM.
# You can get your free API key signing up at https://app.pandabi.ai (you can also configure it in your .env file)
pai.api_key.set("your-pai-api-key")

df.chat('Which are the top 5 countries by sales?')
复制
China, United States, Japan, Germany, Australia

或者生成可视化图表:

复制
df.chat(
    "Plot the histogram of countries showing for each one the gd. Use different colors for each bar",
)

在这里插入图片描述

进一步使用可以参考官方文档:

https://docs.getpanda.ai/v3/introduction

相关资讯

如果没有预测性AI,你的数据就浪费了

新的分析要求是在特定情境下进行描述性、预测性和规范性分析。 当我与CIO或项目赞助人会面时,我首先做的一件事就是绘制他们的分析成熟度曲线。 许多企业常常将仪表板与智能混为一谈,他们认为报告就是最终目标,但实际上,这只是第一步。
5/8/2025 7:05:00 AM
Vipin Jain

利用AI全方位优化数据分析工作流的实战技巧

我们正畅游在数据的海洋之中,每一次点击、每一笔交易、每一次传感器读数,都在为数字数据库添砖加瓦,这些数据蕴含着无数的洞察与商机,然而,对许多企业而言,这些潜力尚未得到充分挖掘。 尽管如今企业收集的数据量比以往任何时候都要多,但其中高达73%的数据并未用于分析。 数据孤岛,以及数据量之大、流动速度之快、种类之多,让许多传统分析流程不堪重负,导致宝贵的信息被束之高阁。
10/23/2025 7:23:00 AM
David

新人工智能模型使用百万小时数据分析睡眠

随着生活节奏加快、工作压力增大,越来越多的人受到失眠困扰。 世界卫生组织统计全球有约27%的人口存在睡眠障碍,涉及21.6亿人;而在我国18岁以上人群中有5.1亿人口存在不同程度睡眠障碍,占比高达48.5%。 睡眠科学家长期以来一直试图解开我们夜间睡眠的奥秘,通过筛选脑电波、心跳和呼吸模式来了解我们所经历的各个阶段。
3/26/2025 8:20:00 AM
佚名
  • 1