数据分析行业薪资的秘密,你想知道的都在这里(4)

第四部分:数据分析薪资分布及影响因素

数据分析师的收入怎么样?哪些因素对于数据分析的薪资影响最大?哪些行业对数据分析人才的需求量最高?我想跳槽,应该选择大公司大平台还是初创的小公司?按我目前的教育程度,工作经验,和掌握的工具和技能,能获得什么样水平的薪资呢?

我们使用python抓取了2017年6月26日拉钩网站内搜索“数据分析”关键词下的450条职位信息。通过对这些职位信息的分析和建模来给你答案。

126-my-salary

本系列文章共分为五个部分,分别是数据分析职位信息抓取,数据清洗及预处理,数据分析职位分布分析,数据分析薪资影响因素分析,以及数据建模和薪资预测。这是第四篇:数据分析薪资分布及影响因素。

第四部分我们来关注数据分析从业者的薪资分布,以及哪些因素对于薪资会有较为明显的影响。想要升职,加薪,跳槽的小伙伴们请重点关注本篇文章的内容。

 

数据分析薪资范围分布

我们对450个职位的平均薪资进行了统计,从直方图中可以发现10-20K是占比最高的薪资范围。其次是0-10K。数据分析行业的薪资水平并没有传说中那么诱人。大部分职位的薪资水平都在20K以下,超过30K的职位数量较少。

下面我们依然从行业,公司和个人能力三个层面,通过多个维度对数据分析的薪资进行剖析,找出影响数据分析职位薪资的关键因素。

bins = [0,10,20,30,40,50] 
plt.hist(lagou['salary_avg'],bins,color='#99CC01',normed=1, histtype='bar', rwidth=1) 
#设置x轴标签 
plt.xlabel('薪资范围/月') 
#设置y周标签 
plt.ylabel('频率') 
#设置图表标题 
plt.title('数据分析薪资分布') 
#设置图例的文字和在图表中的位置 
plt.legend(['月薪'], loc='upper right') 
plt.grid(color='#95a5a6',linestyle='--', linewidth=1,axis='y',alpha=0.4) 
plt.show()

数据分析薪资分布
行业及城市对薪资的影响

首先从行业及城市角度来看,数据分析人才需求量较高的移动互联网行业,以及北上广深地区同样也会有较高的薪资水平吗?激烈竞争的结果是会提升行业薪资还是会降低行业整体薪资呢?

行业与平均薪资

从行业的维度来看,广告营销,社交网络和硬件三个行业数据分析职位的平均薪资最高。生活服务,旅游和游戏三个行业平均薪资水平最低。移动互联网虽然不是平均薪资最高的行业,但却是薪资极差最大的行业。数据服务和社交网络行业的薪资都有极端值的情况出现。

不同行业在平均薪资上并没有呈现出阶梯式的分布,而平均水平较高的广告营销行业,极差较大的移动互联网和电子商务行业,和存在薪资极端值的数据服务和社交网络行业可能代表了三种典型的薪资现状。

lagou_industry1=lagou.loc[(lagou['industry_1'] == '移动互联网'), ['industry_1','salary_avg']]
lagou_industry2=lagou.loc[(lagou['industry_1'] == '金融'), ['industry_1','salary_avg']]
lagou_industry3=lagou.loc[(lagou['industry_1'] == '电子商务'), ['industry_1','salary_avg']]
lagou_industry4=lagou.loc[(lagou['industry_1'] == 'O2O'), ['industry_1','salary_avg']]
lagou_industry5=lagou.loc[(lagou['industry_1'] == '数据服务'), ['industry_1','salary_avg']]
lagou_industry6=lagou.loc[(lagou['industry_1'] == '游戏'), ['industry_1','salary_avg']]
lagou_industry7=lagou.loc[(lagou['industry_1'] == '企业服务'), ['industry_1','salary_avg']]
lagou_industry8=lagou.loc[(lagou['industry_1'] == '教育'), ['industry_1','salary_avg']]
lagou_industry9=lagou.loc[(lagou['industry_1'] == '社交网络'), ['industry_1','salary_avg']]
lagou_industry10=lagou.loc[(lagou['industry_1'] == '信息安全'), ['industry_1','salary_avg']]
lagou_industry11=lagou.loc[(lagou['industry_1'] == '其他'), ['industry_1','salary_avg']
lagou_industry12=lagou.loc[(lagou['industry_1'] == '广告营销'), ['industry_1','salary_avg']]
lagou_industry13=lagou.loc[(lagou['industry_1'] == '硬件'), ['industry_1','salary_avg']]
lagou_industry14=lagou.loc[(lagou['industry_1'] == '医疗健康'), ['industry_1','salary_avg']]
lagou_industry15=lagou.loc[(lagou['industry_1'] == '生活服务'), ['industry_1','salary_avg']]
lagou_industry16=lagou.loc[(lagou['industry_1'] == '旅游'), ['industry_1','salary_avg']]
lagou_industry17=lagou.loc[(lagou['industry_1'] == '文化娱乐'), ['industry_1','salary_avg']]

#图表字体为华文细黑,字号为12
plt.rc('font', family='STXihei', size=12) 
plt.boxplot((lagou_industry1['salary_avg'],lagou_industry2['salary_avg'],lagou_industry3['salary_avg'],lagou_industry4['salary_avg'],lagou_industry5['salary_avg'],lagou_industry6['salary_avg'],lagou_industry7['salary_avg'],lagou_industry8['salary_avg'],lagou_industry9['salary_avg'],lagou_industry10['salary_avg'],lagou_industry11['salary_avg'],lagou_industry12['salary_avg'],lagou_industry13['salary_avg'],lagou_industry14['salary_avg'],lagou_industry15['salary_avg'],lagou_industry16['salary_avg'],lagou_industry17['salary_avg']),vert=False,labels=('移动互联网','金融','电子商务','020','数据服务','游戏','企业服务','教育','社交网络','信息安全','其他','广告营销','硬件','医疗健康','生服服务','旅游','文化娱乐'))
#设置x轴标签 
plt.xlabel('平均薪资') 
#设置y周标签 
plt.ylabel('行业') 
#设置图表标题 
plt.title('行业与平均薪资') 
#设置背景网格线的颜色,样式,尺寸和透明度
plt.grid(color='#95a5a6',linestyle='--', linewidth=1,axis='x',alpha=0.4)
plt.show()

行业与平均薪资
不同城市与平均薪资

从城市维度来看,北上广的平均薪资明显高于其他几个城市,其次是杭州和厦门。平均薪资最低的城市是南京和武汉。北京的平均薪资从3K到40K,是所有城市中薪资极差最大的。

lagou_city1=lagou.loc[(lagou['city'] == '北京'), ['city','salary_avg']]
lagou_city2=lagou.loc[(lagou['city'] == '上海'), ['city','salary_avg']]
lagou_city3=lagou.loc[(lagou['city'] == '深圳'), ['city','salary_avg']]
lagou_city4=lagou.loc[(lagou['city'] == '广州'), ['city','salary_avg']]
lagou_city5=lagou.loc[(lagou['city'] == '杭州'), ['city','salary_avg']]
lagou_city6=lagou.loc[(lagou['city'] == '厦门'), ['city','salary_avg']]
lagou_city7=lagou.loc[(lagou['city'] == '南京'), ['city','salary_avg']]
lagou_city8=lagou.loc[(lagou['city'] == '成都'), ['city','salary_avg']]
lagou_city9=lagou.loc[(lagou['city'] == '重庆'), ['city','salary_avg']]
lagou_city10=lagou.loc[(lagou['city'] == '武汉'), ['city','salary_avg']]

#图表字体为华文细黑,字号为12
plt.rc('font', family='STXihei', size=12) 
plt.boxplot((lagou_city1['salary_avg'],lagou_city2['salary_avg'],lagou_city3['salary_avg'],lagou_city4['salary_avg'],lagou_city5['salary_avg'],lagou_city6['salary_avg'],lagou_city7['salary_avg'],lagou_city8['salary_avg'],lagou_city9['salary_avg'],lagou_city10['salary_avg']),labels=('北京','上海','深圳','广州','杭州','厦门','南京','成都','重庆','武汉'))
#设置x轴标签 
plt.xlabel('城市') 
#设置y周标签 
plt.ylabel('平均薪资') 
#设置图表标题 
plt.title('城市与平均薪资') 
#设置背景网格线的颜色,样式,尺寸和透明度
plt.grid(color='#95a5a6',linestyle='--', linewidth=1,axis='y',alpha=0.4)
plt.show()

城市与平均薪资
公司规模对平均薪资的影响

公司规模的大小会对数据分析职位的薪资有什么影响?跳槽时应该选择大平台还是创业型的初创的小公司?下面的数据会带给你答案。

公司规模与平均薪资

从公司规模的维度来看,随着公司规模的增长,平均薪资水平也在稳步增长。大公司会比小公司有更高的平均薪资。但同时大公司也比小公司有着更大的薪资极差,具体取决于你在其中的职位情况。

lagou_csize1=lagou.loc[(lagou['companySize'] == '2000人以上'), ['companySize','salary_avg']]
lagou_csize2=lagou.loc[(lagou['companySize'] == '500-2000人'), ['companySize','salary_avg']]
lagou_csize3=lagou.loc[(lagou['companySize'] == '150-500人'), ['companySize','salary_avg']]
lagou_csize4=lagou.loc[(lagou['companySize'] == '50-150人'), ['companySize','salary_avg']]
lagou_csize5=lagou.loc[(lagou['companySize'] == '15-50人'), ['companySize','salary_avg']]
#图表字体为华文细黑,字号为12
plt.rc('font', family='STXihei', size=12) 
plt.boxplot((lagou_csize1['salary_avg'],lagou_csize2['salary_avg'],lagou_csize3['salary_avg'],lagou_csize4['salary_avg'],lagou_csize5['salary_avg']),labels=('2000人以上','500-2000人','150-500人','50-150人','15-50人'))
#设置x轴标签 
plt.xlabel('规模') 
#设置y周标签 
plt.ylabel('平均薪资') 
#设置图表标题 
plt.title('公司规模与平均薪资') 
#设置背景网格线的颜色,样式,尺寸和透明度
plt.grid(color='#95a5a6',linestyle='--', linewidth=1,axis='y',alpha=0.4)
plt.show()

公司规模与平均薪资
融资规模与平均薪资

从公司融资规模维度来看,未融资和天使轮的平均薪资较低,从A轮到D轮平均薪资的变化并不是线性增长的。但薪资的极差却逐渐拉开,有较为明显的变化。

lagou_fs1=lagou.loc[(lagou['financeStage1'] == '未融资'), ['financeStage1','salary_avg']]
lagou_fs2=lagou.loc[(lagou['financeStage1'] == '天使轮'), ['financeStage1','salary_avg']]
lagou_fs3=lagou.loc[(lagou['financeStage1'] == 'A轮'), ['financeStage1','salary_avg']]
lagou_fs4=lagou.loc[(lagou['financeStage1'] == 'B轮'), ['financeStage1','salary_avg']]
lagou_fs5=lagou.loc[(lagou['financeStage1'] == 'C轮'), ['financeStage1','salary_avg']]
lagou_fs6=lagou.loc[(lagou['financeStage1'] == 'D轮'), ['financeStage1','salary_avg']]
lagou_fs7=lagou.loc[(lagou['financeStage1'] == '不需要融资'), ['financeStage1','salary_avg']]
lagou_fs8=lagou.loc[(lagou['financeStage1'] == '上市公司'), ['financeStage1','salary_avg']]
#图表字体为华文细黑,字号为12
plt.rc('font', family='STXihei', size=10) 
plt.boxplot((lagou_fs1['salary_avg'],lagou_fs2['salary_avg'],lagou_fs3['salary_avg'],lagou_fs4['salary_avg'],lagou_fs5['salary_avg'],lagou_fs6['salary_avg'],lagou_fs7['salary_avg'],lagou_fs8['salary_avg']),labels=('未融资','天使轮','A轮','B轮','C轮','D轮','不需要融资','上市公司'))
#设置x轴标签 
plt.xlabel('融资阶段') 
#设置y周标签 
plt.ylabel('平均薪资') 
#设置图表标题 
plt.title('融资规模与平均薪资') 
#设置背景网格线的颜色,样式,尺寸和透明度
plt.grid(color='#95a5a6',linestyle='--', linewidth=1,axis='y',alpha=0.4)
plt.show()

融资规模与平均薪资

个人能力对薪资的影响

最后从个人能力的角度来看下,什么样的个人背景及能力,数据分析工具是否会影响你所获得的薪资,哪些热门工具和技能可以帮助你获得更高的薪资?

工作年限与平均薪资

在工作年限维度上,拥有较长时间的工作年限非常有助于提升平均薪资水平。对于工作年限不限,应届毕业和1年以下的职位薪资普遍较低,从1-3年工作经验开始薪资获得稳步增长。

lagou_y1=lagou.loc[(lagou['workYear'] == '不限'), ['workYear','salary_avg']]
lagou_y2=lagou.loc[(lagou['workYear'] == '应届毕业生'), ['workYear','salary_avg']]
lagou_y3=lagou.loc[(lagou['workYear'] == '1年以下'), ['workYear','salary_avg']]
lagou_y4=lagou.loc[(lagou['workYear'] == '1-3年'), ['workYear','salary_avg']]
lagou_y5=lagou.loc[(lagou['workYear'] == '3-5年'), ['workYear','salary_avg']]
lagou_y6=lagou.loc[(lagou['workYear'] == '5-10年'), ['workYear','salary_avg']]

from matplotlib import pyplot as plt
#图表字体为华文细黑,字号为12
plt.rc('font', family='STXihei', size=12) 
plt.boxplot((lagou_y1['salary_avg'],lagou_y2['salary_avg'],lagou_y3['salary_avg'],lagou_y4['salary_avg'],lagou_y5['salary_avg'],lagou_y6['salary_avg']),labels=('不限','应届毕业生','1年以下','1-3年','3-5年','5-10年'))
#设置x轴标签 
plt.xlabel('工作年限') 
#设置y周标签 
plt.ylabel('平均薪资') 
#设置图表标题 
plt.title('工作年限与平均薪资') 
#设置背景网格线的颜色,样式,尺寸和透明度
plt.grid(color='#95a5a6',linestyle='--', linewidth=1,axis='y',alpha=0.4)
plt.show()

工作年限与平均薪资
学历与平均薪资

在学历方面,较高的学历意味着较高的平均薪资水平。学历是薪资的一个加分项。但如果你只有大专学历,也有可能获得30K的高薪。此外,本科学历是个平均薪资极差最大的类别。这意味着即使没有较高的学历也有可能获得高薪。

lagou_e1=lagou.loc[(lagou['education'] == '不限'), ['education','salary_avg']]
lagou_e2=lagou.loc[(lagou['education'] == '大专'), ['education','salary_avg']]
lagou_e3=lagou.loc[(lagou['education'] == '本科'), ['education','salary_avg']]
lagou_e4=lagou.loc[(lagou['education'] == '硕士'), ['education','salary_avg']]
lagou_e5=lagou.loc[(lagou['education'] == '博士'), ['education','salary_avg']]

#图表字体为华文细黑,字号为12
plt.rc('font', family='STXihei', size=12) 
plt.boxplot((lagou_e1['salary_avg'],lagou_e2['salary_avg'],lagou_e3['salary_avg'],lagou_e4['salary_avg'],lagou_e5['salary_avg']),labels=('不限','大专','本科','硕士','博士'))
#设置x轴标签 
plt.xlabel('学历') 
#设置y周标签 
plt.ylabel('平均薪资') 
#设置图表标题 
plt.title('学历与平均薪资') 
#设置背景网格线的颜色,样式,尺寸和透明度
plt.grid(color='#95a5a6',linestyle='--', linewidth=1,axis='y',alpha=0.4)
plt.show()

学历与平均薪资
职级与平均薪资

职级对于平均薪资的影响较为明显,从图表中可以看出初级职位的实习和助理薪资较低,从主管到总监,平均薪资呈线性增长的趋势。数据工程师和数据分析师(其他)的平均薪资有着极差较大。从另一个角度来看可能说明管理类的平均薪资要高于技术类的平均薪资。但技术类的薪资体系则有较大的跨度范围。因此,如果你从事管理类,当前获得的薪资和一个较高的职级title可能都很重要。较高的职级可能会对下一份工作的薪资有积极的影响。

lagou_p1=lagou.loc[(lagou['positionName1'] == '实习'), ['positionName1','salary_avg']]
lagou_p2=lagou.loc[(lagou['positionName1'] == '助理'), ['positionName1','salary_avg']]
lagou_p3=lagou.loc[(lagou['positionName1'] == '专业'), ['positionName1','salary_avg']]
lagou_p4=lagou.loc[(lagou['positionName1'] == '主管'), ['positionName1','salary_avg']]
lagou_p5=lagou.loc[(lagou['positionName1'] == '经理'), ['positionName1','salary_avg']]
lagou_p6=lagou.loc[(lagou['positionName1'] == '专家'), ['positionName1','salary_avg']]
lagou_p7=lagou.loc[(lagou['positionName1'] == '总监'), ['positionName1','salary_avg']]
lagou_p8=lagou.loc[(lagou['positionName1'] == '工程师'), ['positionName1','salary_avg']]
lagou_p9=lagou.loc[(lagou['positionName1'] == '其他'), ['positionName1','salary_avg']]

#图表字体为华文细黑,字号为12
plt.rc('font', family='STXihei', size=12) 
plt.boxplot((lagou_p1['salary_avg'],lagou_p2['salary_avg'],lagou_p3['salary_avg'],lagou_p4['salary_avg'],lagou_p5['salary_avg'],lagou_p6['salary_avg'],lagou_p7['salary_avg'],lagou_p8['salary_avg'],lagou_p9['salary_avg']),labels=('实习','助理','专员','主管','经理','专家','总监','工程师','其他'))
#设置x轴标签 
plt.xlabel('职级') 
#设置y周标签 
plt.ylabel('平均薪资')
#设置图表标题 
plt.title('职级与平均薪资') 
#设置背景网格线的颜色,样式,尺寸和透明度
plt.grid(color='#95a5a6',linestyle='--', linewidth=1,axis='y',alpha=0.4)
plt.show()

职级与平均薪资
掌握的工具技能数量与平均薪资

对于从事技术类和执行工作的数据分析师,掌握工具的数量是否会对薪资有影响呢?答案是肯定的,掌握的分析工具数量确实会对薪资有提升作用。掌握少于2个工具时平均薪资大约为12K。掌握2-4个工具可以提升到15K的水平。而掌握6-8个工具时则可以提升到约22K的水平。需要说明的是,掌握工具数量的增加同时也会增加你选择公司和职位的范围。因此在理想情况下工具技能的数量会对薪资有积极的影响。

lagou_t1=lagou.loc[(lagou['tool_num'] <= 2), ['tool_num','salary_avg']]
lagou_t2=lagou.loc[(lagou['tool_num'] > 2) & (lagou['tool_num'] <= 4), ['tool_num','salary_avg']]
lagou_t3=lagou.loc[(lagou['tool_num'] > 4) & (lagou['tool_num'] <= 6), ['tool_num','salary_avg']]
lagou_t4=lagou.loc[(lagou['tool_num'] > 6) & (lagou['tool_num'] <= 8), ['tool_num','salary_avg']]
lagou_t5=lagou.loc[(lagou['tool_num'] > 8), ['tool_num','salary_avg']]

#图表字体为华文细黑,字号为12
plt.rc('font', family='STXihei', size=12) 
plt.boxplot((lagou_t1['salary_avg'],lagou_t2['salary_avg'],lagou_t3['salary_avg'],lagou_t4['salary_avg'],lagou_t5['salary_avg']),labels=('少于2个','2-4个','4-6个','6-8个','8个以上'))
#设置x轴标签 
plt.xlabel('工具技能') 
#设置y周标签 
plt.ylabel('平均薪资') 
#设置图表标题 
plt.title('工具技能数量与平均薪资')
#设置背景网格线的颜色,样式,尺寸和透明度
plt.grid(color='#95a5a6',linestyle='--', linewidth=1,axis='y',alpha=0.4)
plt.show()

工具技能数量与平均薪资

不同数据分析工具与平均薪资

前面介绍了掌握工具的数量会对薪资的提升有积极作用,那么紧接着下一个问题就是要掌握哪些工具提升的会最多?换句话说哪些工具会给你带来最大的薪资提升呢?我们对比了10个工具的平均薪资。Hadoop,Spark和Tableau三个工具的平均薪资最高。R和Python排名第二。而平均薪资最低的则是Excel。

sql=lagou.loc[(lagou['sql'] == 1), ['sql','salary_avg']]
python=lagou.loc[(lagou['python'] == 1), ['python','salary_avg']]
excel=lagou.loc[(lagou['excel'] == 1), ['excel','salary_avg']]
spss=lagou.loc[(lagou['spss'] == 1), ['spss','salary_avg']]
matlab=lagou.loc[(lagou['matlab'] == 1), ['matlab','salary_avg']]
sas=lagou.loc[(lagou['sas'] == 1), ['sas','salary_avg']]
r=lagou.loc[(lagou['r'] == 1), ['r','salary_avg']]
hadoop=lagou.loc[(lagou['hadoop'] == 1), ['hadoop','salary_avg']]
spark=lagou.loc[(lagou['spark'] == 1), ['spark','salary_avg']]
tableau=lagou.loc[(lagou['tableau'] == 1), ['tableau','salary_avg']]

#图表字体为华文细黑,字号为12
plt.rc('font', family='STXihei', size=10) 
plt.boxplot((sql['salary_avg'],python['salary_avg'],excel['salary_avg'],spss['salary_avg'],matlab['salary_avg'],sas['salary_avg'],r['salary_avg'],hadoop['salary_avg'],spark['salary_avg'],tableau['salary_avg']),labels=('sql','python','excel','spss','matlab','sas','r','hadoop','spark','tableau'))
#设置x轴标签 
plt.xlabel('工具') 
#设置y周标签 
plt.ylabel('平均薪资') 
#设置图表标题 
plt.title('工具与平均薪资') 
#设置背景网格线的颜色,样式,尺寸和透明度
plt.grid(color='#95a5a6',linestyle='--', linewidth=1,axis='y',alpha=0.4)
plt.show()

工具与平均薪资

本篇文章我们分析并对比了不同行业,城市,以及个人技能对于数据分析职位平均薪资的影响。数据分析师的薪资分布并没有传说中那么诱人,大部分职位的薪资都在20K以下。当然也有少部分职位的薪资可以超过40K。数据分析人才需求量最高的移动互联网行业并不是薪资最高的行业,取而代之的是广告营销行业。北京,上海,深圳是数据分析人才的淘金圣地,职位需求最多,平均薪资最高。因此逃离北上深明显不适用与数据分析的小伙伴们。大公司的薪资水平要明显高于小公司,上市公司薪资水平要高于创业公司。但薪资的极差也较大,具体取决于你的职位。管理类职位的薪资随着职级的增加而增长,均值高于技术类职位的平均薪资。但技术类职位的极差较大,说明有很大增长空间。个人技能方面多掌握几个数据分析工具会对薪资增长有帮助,R,SQL和Excel虽然是每个职位都要求的技能,但真正能让你获得高薪的工具是Hadoop。

 
当然,每个职位和薪资都不可能由一个因素决定。薪资的变化是由多个因素共同作用的结果。在下一篇文章中,我们将对以上这些影响数据分析职位薪资的数据进行建模和预测。输入你的学历,工作年限,职位和所掌握的数据分析技能。我们来预测你的薪资分类。

—【所有文章及图片版权归 蓝鲸(王彦平)所有。欢迎转载,但请注明转自“蓝鲸网站分析博客”。】—

Speak Your Mind

*