使用R进行数据清洗

数据清洗是整个数据分析过程中一个非常重要的环节。数据清洗的目的有两个,第一是通过清洗让数据可用。第二是让数据变 […]

使用R读取并查看数据

本篇文章介绍如何使用R读取并查看数据,包含一些最基础的函数使用方法和说明。后面还会陆续介绍数据清洗,匹配和提取 […]

使用R进行统计分析——假设检验

假设检验是统计学中的一种推断方法,用来判断两个样本或总体间的差异是由于抽样误差引起的还是本质差别造成的。R语言 […]

使用R进行统计分析——概率计算

R语言中提供了很多概率函数,可以方便的计算事件发生的概率。如二项分布概率函数和泊松分布概率函数。本篇文章介绍如 […]

使用Python创建LDA模型进行分类

线性判别式分析(Linear Discriminant Analysis)简称LDA,是模式识别的经典算法。通 […]

使用Python训练SVM模型识别手写体数字

支持向量机SVM(Support Vector Machine)是有监督的分类预测模型,本篇文章使用机器学习库 […]

使用Python训练KNN模型并进行分类

K临近分类算法是数据挖掘中较为简单的一种分类方法,通过计算不同数据点间的距离对数据进行分类,并对新的数据进行分 […]

使用Python训练回归模型并进行预测

回归分析是一种常见的统计方法,用于确定不同变量间的相互关系。在Excel中可以通过数据分析菜单中的回归功能快速 […]

使用python绘制简单的图表

本文介绍如果使用python汇总常用的图表,与Excel的点选操作相比,用python绘制图表显得比较比较繁琐 […]

使用python进行数据提取

数据提取是分析师日常工作中经常遇到的需求。如某个用户的贷款金额,某个月或季度的利息总收入,某个特定时间段的贷款 […]