数据科学角逐是学习各类算法、深入理解数据科学、提升和挑战自己的绝佳机会,而这些角逐中有一些罕用的模型。近日,有开发者在 GitHub 上开源了一个包含数据挖掘类角逐罕用模型的项目,主要涵盖二分类、多分类以及返回任意。项目代码全部使用 Python 实行。
项目地址:https://github.com/QLMX/data_mining_models该项目包含二分类模型、多分类模型以及返回模型,它们分别鉴于 lightgbm 实行、xgboost 实行、keras 实行和 pytorch 实行: lightgbm
binary_class.py :lightgbm 实行的二分类
multi_class.py :lightgbm 实行的多分类
regression.py :lightgbm 实行的返回
multi_class_custom_feval.py :lightgbm 自定义评价函数实行多分类
multi_class_weight_loss.py :lightgbm 多种别不平衡问题,实行种别加权优化
xgboost
binary_class.py :xgboost 实行的二分类
multi_class.py :xgboost 实行的多分类
regression.py :xgboost 实行的返回
keras 实行的 mlp
binary_class.py :keras 实行的 mlp,做二分类任意
multi_class.py :keras 实行的 mlp,做多分类任意
regression.py :keras 实行的 mlp,做返回任意
pytorch 实行的 mlp
binary_class.py :pytorch 实行的 mlp,做二分类任意
multi_class.py :pytorch 实行的 mlp,做多分类任意
regression.py :实行的 mlp,做返回任意
环境设置可以直接通过 pip install -r requirements.txt 安装指定的函数包,具体的函数包如下:pandas
numpy
matplotlib
sklearn
tensorflow==1.12.0
keras==2.2.4
pytorch
seaborn
lightgbm==2.2.1
xgboost==0.90项目解读第一部份 lightgbm 的数据是鉴于拍拍贷角逐截取的一部份特征,随机选择了 5000 个训练数据,3000 个测试数据。针对其中 gender、cell_province 等种别特征,直接进行重新编码处理。第二部份又鉴于 xgboost 实行了二分类、多分类和返回任意。第三、四部份是深度收集部份,是鉴于 keras 实行的多层感知机收集 (mlp)。pytorch 主要用于图像处理任意,在数据挖掘类角逐中很少用到,但该项目整理了鉴于 pytorch 实行的 mlp 做分类与返回任意代码。项目作者对项目的各部份进行了详细的解读,具体参照以下内容:
参照链接:https://mp.weixin.qq.com/s/t6EpWmLWP81DcJ7AUro3Nghttps://mp.weixin.qq.com/s/Td0Vrx9YO5rEn66L4C42Zwhttps://mp.weixin.qq.com/s/XaB1BsLL_Va7dGL0S0rUOQhttps://zhuanlan.zhihu.com/p/80381974
原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/35869