层次聚类算法的原理及实现Hierarchical Clustering

层次聚类(Hierarchical Clustering)是聚类算法的一种,通过计算不同类别数据点间的相似度来 […]

K邻近(KNN)分类和预测算法的原理及实现

K邻近算法(k-NearestNeighbor)简称KNN,是分类算法中的一种。KNN通过计算新数据与历史样本 […]

线性判别分析(LDA)模型

线性判别分析(Linear Discriminant Analysis)简称LDA,是分类算法中的一种。LDA […]

朴素贝叶斯分类和预测算法的原理及实现

决策树和朴素贝叶斯是最常用的两种分类算法,本篇文章介绍朴素贝叶斯算法。贝叶斯定理是以英国数学家贝叶斯命名,用来 […]

决策树分类和预测算法的原理及实现

决策树是一种通过对历史数据进行测算实现对新数据进行分类和预测的算法。简单来说决策树算法就是通过对已有明确结果的 […]

协同过滤推荐算法的原理及实现

协同过滤推荐算法是诞生最早,并且较为著名的推荐算法。主要的功能是预测和推荐。算法通过对用户历史行为数据的挖掘发 […]

网站指标差异显著性检验——卡方检验

三个网站分析中常见的场景:A,B两版广告创意,A版本转化率4.94%,B版本转化率5.75%,是否说明B版本比 […]

跳出率差异显著性检验

跳出率的显著性检验是指特定渠道跳出率与已知的网站跳出率之间有无差异,也就是说,特定渠道跳出率是否在网站跳出率分 […]

广告访问量平均数差异的显著性检验

日常分析工作中经常会进行对比分析,其中比较常见的场景就是对两组广告带来的访问量效果进行对比。当两组访问量数据相 […]

浅析网站流量趋势预测

春节长假后的第一篇文章讨论如何对网站流量进行分析及预测。我们采取自下而上的方法,通过对不同类别的流量进行单独的 […]