使用scikit-learn对数据进行预处理

数据对于算法和模型的表现至关重要。原始数据中会包含各种各样的问题,我们在使用这些数据前要预先对这些问题进行处理 […]

990万次骑行:纽约自行车共享系统分析

Citi Bike是纽约市在2013年5月27日启动的一项自行车共享计划,由“花旗银行”(Citi Bank) […]

使用Python创建LDA模型进行分类

线性判别式分析(Linear Discriminant Analysis)简称LDA,是模式识别的经典算法。通 […]

使用Python训练SVM模型识别手写体数字

支持向量机SVM(Support Vector Machine)是有监督的分类预测模型,本篇文章使用机器学习库 […]

使用Python训练KNN模型并进行分类

K临近分类算法是数据挖掘中较为简单的一种分类方法,通过计算不同数据点间的距离对数据进行分类,并对新的数据进行分 […]

使用Python训练回归模型并进行预测

回归分析是一种常见的统计方法,用于确定不同变量间的相互关系。在Excel中可以通过数据分析菜单中的回归功能快速 […]

使用python绘制简单的图表

本文介绍如果使用python汇总常用的图表,与Excel的点选操作相比,用python绘制图表显得比较比较繁琐 […]

使用python进行数据提取

数据提取是分析师日常工作中经常遇到的需求。如某个用户的贷款金额,某个月或季度的利息总收入,某个特定时间段的贷款 […]

使用python进行数据清洗

数据清洗是一项复杂且繁琐(kubi)的工作,同时也是整个数据分析过程中最为重要的环节。有人说一个分析项目80% […]

使用pandas进行数据匹配

Pandas中的merge函数类似于Excel中的Vlookup,可以实现对两个数据表进行匹配和拼接的功能。与 […]