根据提供的数据和核心分析维度,我们可以进行以下几个方面的深入分析:
销售集中度:
示例计算:假设北京的达人总销售额为200万,全国总销售额为5000万,则北京地区的销售额占比约为4%。
直播场次与销售额的关系:
示例计算:可以使用相关性系数或回归模型来评估直播场次和销售额之间的关系。若某达人每增加一场直播,销售额平均增长20%,则说明该达人的直播效率较高。
TOP达人销售额占比:
示例计算:假设Top10达人的总销售额为2400万,全国总销售额为5000万,则Top10达人的销售额占比约为48%。
数据整理:
计算每个地区的销售额:
import pandas as pd
# 示例数据
data = {
'达人工号': ['A01', 'B01', 'C03', 'D04'],
'地区': ['北京', '上海', '深圳', '广州'],
'销售额': [200, 350, 300, 400]
}
df = pd.DataFrame(data)
# 按地区分组并求和
region_sales = df.groupby('地区')['销售额'].sum()
print(region_sales)
计算销售集中度:
数据整理:
data = {
'达人工号': ['A01', 'B01', 'C03'],
'直播次数': [5, 8, 6],
'销售额': [200, 350, 300]
}
df = pd.DataFrame(data)
计算相关性系数:
# 计算销售额与直播次数的相关性
corr = df['直播次数'].corr(df['销售额'])
print(corr)
回归分析(可选):
数据整理:
data = {
'达人工号': ['A01', 'B01', 'C02'],
'销售额': [500, 400, 300]
}
top_sales = pd.DataFrame(data)
计算TOP达人销售额占比:
total_sales = df['销售额'].sum()
top10_sales = top_sales['销售额'].sum()
# 计算Top10达人的销售额占比
top10_sales_ratio = (top10_sales / total_sales) * 100
print(f'Top10达人销售额占比: {top10_sales_ratio}%')
以上分析数据来源:互联岛