使用scikit-learn进行特征选

scikit-learn中提供了用于特征选择的模块feature_selection,主要方法包括方差移除法, […]

使用scikit-learn对数据进行预处理

数据对于算法和模型的表现至关重要。原始数据中会包含各种各样的问题,我们在使用这些数据前要预先对这些问题进行处理 […]

关联规则推荐算法的原理及实现

关联规则用来发现数据间潜在的关联,最典型的应用是电商网站的购物车分析。本文将通过一个简单的例子来说明关联规则中 […]

使用R进行统计分析——回归分析

准备工作 首先导入数据并创建名为lr_data的数据表。 查看导入数据表的维度,结果显示456行,4列。 查看 […]

使用R进行数据提取

数据提取是数据分析日常工作中遇到最多的需求,本篇文章介绍如何通过R按特定的维度或条件对数据进行提取,完成数据提 […]

使用R进行数据匹配

R中的merge函数类似于Excel中的Vlookup,可以实现对两个数据表进行匹配和拼接的功能。与Excel […]

990万次骑行:纽约自行车共享系统分析

Citi Bike是纽约市在2013年5月27日启动的一项自行车共享计划,由“花旗银行”(Citi Bank) […]

使用R进行数据清洗

数据清洗是整个数据分析过程中一个非常重要的环节。数据清洗的目的有两个,第一是通过清洗让数据可用。第二是让数据变 […]

使用R读取并查看数据

本篇文章介绍如何使用R读取并查看数据,包含一些最基础的函数使用方法和说明。后面还会陆续介绍数据清洗,匹配和提取 […]

使用R进行统计分析——假设检验

假设检验是统计学中的一种推断方法,用来判断两个样本或总体间的差异是由于抽样误差引起的还是本质差别造成的。R语言 […]