根据提供的数据和核心分析维度,我们可以从以下几个方面进行详细分析:
# 假设df是一个包含地区、达人名、销售额等字段的数据框
import pandas as pd
# 示例数据(请替换为实际数据)
data = {
'region': ['华东', '华南', '华北', '华东', '华中'],
'da_name': ['张三', '李四', '王五', '赵六', '孙七'],
'sales': [1000, 2000, 3000, 4000, 5000]
}
df = pd.DataFrame(data)
# 按地区分组并计算销售额总和
grouped_sales = df.groupby('region')['sales'].sum()
# 计算每个地区的销售占比
total_sales = grouped_sales.sum()
sales_concentration = (grouped_sales / total_sales) * 100
print(sales_concentration)
# 假设df还有场次字段
data['live_count'] = [5, 3, 7, 4, 6]
df['efficiency'] = df['sales'] / df['live_count']
# 按地区分组计算平均效率
grouped_efficiency = df.groupby('region')['efficiency'].mean()
print(grouped_efficiency)
# 假设按销售额降序排序后取前3名(可根据实际数据调整)
top_das = df.sort_values(by='sales', ascending=False).head(3)
# 按地区分组计算TOP达人销售额占比
top_sales = top_das.groupby('region')['sales'].sum()
top_sales_concentration = (top_sales / grouped_sales) * 100
print(top_sales_concentration)
通过以上分析,可以得出以下结论和建议:
以上分析数据来源:互联岛