數據簡介
- 此次分析的數據來自于城市數據團對2016年雙11天貓數據的采集和整理,原始數據為.xlsx格式
- 包括update_time/id/title/price/店名,共5個字段,其中id為商品的唯一標識,店名為品牌名。
分析工具
-
主要使用了Python中的Pandas庫進行數據處理,利用matplotlib繪制分析圖表,利用bokeh進行了可視化展示。
-
當前使用版本:Python 3.6.5 |Anaconda, Inc.| (default, Mar 29 2018, 13:32:41) [MSC v.1900 64 bit (AMD64)]
說明
- 本次數據分析主要供學習使用,目的在于熟悉Python及相關庫,同時練習數據分析的思維方式。
- 本次分析主要基于描述性統計,暫不包含預測模型。
- 文字說明會涉及實現的具體細節,而不僅是分析結果的展示。
- bokeh制圖為交互式圖表,此處截圖展示
- 數據每日只采集一次,對于一日之內的變化無法進行分析
分析目標
-
商品銷售時間分析
- 統計出商品總數和品牌總數
- 計算雙十一當天在售商品占比
- 未參與雙十一當天活動的商品,雙十一之后的去向
- 參加雙十一活動的品牌及其商品數量的分布
-
價格折扣分析
- 針對每個商品,分析其價格變化,判斷是否打折
- 針對在打折商品,計算其折扣率
- 按照品牌分析,不同品牌的打折力度
- 分析商家打折套路
-
構建商品id/品牌的匯總表
- 商品id資料表格
- 品牌匯總資料表格
- 假打折商品詳情
正文
相關模塊導入
'''
想要學習Python?Python學習交流群:1004391443滿足你的需求,資料都已經上傳群文件,可以自行下載!
'''
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
% matplotlib inline
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')
# 不發出警告
from bokeh.io import output_notebook
output_notebook()
# 導入notebook繪圖模塊
from bokeh.plotting import figure,show
from bokeh.models import ColumnDataSource
# 導入圖表繪制、圖標展示模塊
# 導入ColumnDataSource模塊
import os
加載數據和數據預處理
設置工作路徑,pandas導入數據
檢查數據是否有缺失值
檢查數據類型
對數據進行基本預處理
查看數據
?
Part1 商品銷售時間分析
統計出商品總數和品牌總數
計算雙十一當天在售商品占比
未參與雙十一當天活動的商品,雙十一之后的去向
參加雙十一活動的品牌及其商品數量的分布
統計商品總數和品牌總數 :
得到商品總數:3502,品牌總數:22
計算雙十一當天在售商品占比 :
得到雙十一當天在售商品占比為:66.68%,約1/3的商品在雙十一當天沒有上架
商品銷售情況分類
為了分析沒參加雙十一的產品去向,我們首先對所有商品id依據其上架時間進行分類。
根據date字段,統計每件商品的最早和最遲銷售時間;再統計雙11當天是否銷售;最后進行分類。
A. 11.11前后及當天都在售 → 一直在售
B. 11.11之后停止銷售 → 雙十一后停止銷售
C. 11.11開始銷售并當天不停止 → 雙十一當天上架并持續在售
D. 11.11開始銷售且當天停止 → 僅雙十一當天有售
E. 11.5 - 11.9 → 雙十一前停止銷售
F. 僅11.11當天停止銷售 → 僅雙十一當天停止銷售
G. 11.12開始銷售 → 雙十一后上架
H. 11.10下架 → 可能11.11售罄 以后單獨分析
?
未參與雙十一活動的商品去向分析
暫時下架
改名上架
預售
未參與活動
未參與雙十一當天活動的商品中:
暫時下架商品的數量為242個,更名上架商品的數量為110個,預售商品數量為453個,未參與活動商品數量為200個
參加雙十一活動的品牌及其商品數量的分布
真正參與雙十一活動的商品 = 雙十一當天在售的商品 + 預售商品
對暫時下架/更名上架/售罄商品 后續可以研究其價格變化再確定
繪制堆疊圖進行可視化
?
補充品牌數據匯總
?
Part2 價格折扣分析
1. 針對每個商品,分析其價格變化,判斷是否打折2. 針對在打折商品,計算其折扣率3. 按照品牌分析,不同品牌的打折力度4. 分析商家打折套路
針對每個商品,評估其打折情況
真打折:商品的價格在10天內有波動,雙11價格為10天內最低價,無提前漲價
假打折:雙十一之前存在漲價現象
不打折:商品價格無變化
?
觀察數據可知
假打折商品的品牌集中于妮維雅和美加凈(各6件),美寶蓮有1件
蘭蔻有一件商品在雙十一前漲價后,雙十一當日下架
SKII和薇姿各有一件商品漲價后,雙十一當天維持該價格
大牌套路深,深知法律風險,但這四件商品依舊被劃分在假打折!
真打折的商品約占比24.27%,不打折的商品數量約占比75.27%,假打折的商品約占0.46%
針對在打折商品,計算其折扣率
去除假打折商品
考慮雙十一價格對比其前后的折扣率,主要考慮前折扣率
只計算九五折以上折扣
?
?
?
觀察上圖可知,商品折扣率主要集中在五折和九折,二者共占50%以上
根據商品id匯總數據
包括商品銷售時間和價格折扣數據
?
根據品牌匯總數據
包括品牌商品銷售時間和價格折扣數據
計算品牌折扣商品比例
按照品牌分析,不同品牌的打折力度?
利用bokeh繪制浮動散點圖
y坐標為品牌名,x坐標為折扣力度
?
分析商家打折套路
篩選各品牌的折扣商品比例和平均折扣率
劃分四個象限,利用bokeh制圖
?
打折套路解析
少量大打折:雅詩蘭黛、蘭蔻、薇姿、悅詩風吟、歐珀萊
大量少打折:歐萊雅、玉蘭油、美寶蓮、妮維雅、蜜絲佛陀、美加凈
大量大打折:自然堂、相宜本草、佰草集
不打折:SKII、倩碧、蘭芝、嬌蘭、植村秀、資生堂、雅漾、雪花秀
假打折現象:妮維雅和美加凈各有6件商品
Part3 匯總表格導出
商品id資料表格
品牌匯總資料表格
假打折商品詳情
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
