Kernel: Python 3
深入浅出pandas-2
In [1]:
In [2]:
数据透视
数据聚合(指标统计)
排序和头部值
透视表和交叉表
In [3]:
Out[3]:
In [4]:
Out[4]:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1945 entries, 0 to 1944
Data columns (total 8 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 销售日期 1945 non-null datetime64[ns]
1 销售区域 1945 non-null object
2 销售渠道 1945 non-null object
3 销售订单 1945 non-null object
4 品牌 1945 non-null object
5 售价 1945 non-null int64
6 销售数量 1945 non-null int64
7 直接成本 1945 non-null int64
dtypes: datetime64[ns](1), int64(3), object(4)
memory usage: 121.7+ KB
In [5]:
Out[5]:
In [6]:
In [7]:
Out[7]:
In [8]:
Out[8]:
销售额: 39772087元
毛利润: 27926715元
销售数量: 107403件
毛利率: 70.22%
In [9]:
Out[9]:
In [10]:
Out[10]:
In [11]:
Out[11]:
In [12]:
Out[12]:
In [13]:
Out[13]:
In [14]:
Out[14]:
In [15]:
Out[15]:
In [16]:
Out[16]:
In [17]:
Out[17]:
In [18]:
Out[18]:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1945 entries, 0 to 1944
Data columns (total 12 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 销售日期 1945 non-null datetime64[ns]
1 销售区域 1945 non-null object
2 销售渠道 1945 non-null object
3 销售订单 1945 non-null object
4 品牌 1945 non-null object
5 售价 1945 non-null int64
6 销售数量 1945 non-null int64
7 直接成本 1945 non-null int64
8 销售额 1945 non-null int64
9 毛利润 1945 non-null int64
10 月份 1945 non-null int32
11 价位 1945 non-null category
dtypes: category(1), datetime64[ns](1), int32(1), int64(5), object(4)
memory usage: 161.7+ KB
In [19]:
Out[19]:
In [20]:
Out[20]:
In [21]:
Out[21]:
In [22]:
Out[22]:
In [23]:
Out[23]:
In [24]:
Out[24]:
作业:招聘岗位数据分析
统计出城市、招聘信息、招聘岗位的数量和平均月薪。
统计每个城市的岗位数量从高到低排序。
统计每个城市的平均薪资从高到低排序。
统计招聘岗位对学历要求的占比。
统计招聘岗位对工作年限的要求占比。
分析薪资跟学历和工作年限的关系。
In [25]:
Out[25]:
In [26]:
Out[26]:
城市数量: 9
信息数量: 6487
岗位数量: 22611
平均薪资: 17.0
In [27]:
Out[27]:
In [28]:
Out[28]:
In [29]:
Out[29]:
In [30]:
Out[30]:
In [31]:
In [32]:
Out[32]:
In [33]:
In [34]:
Out[34]:
In [35]:
Out[35]:
In [36]:
Out[36]:
In [37]:
In [38]:
Out[38]: