基于提供的数据和核心分析维度,我们可以从以下几个方面进行进一步的分析:
区域带货:
直播效率:
头部效应:
import pandas as pd
# 假设数据存储在DataFrame df 中, 地区列名为 'region'
region_sales = df.groupby('region')['sales'].sum()
region_sales_percentage = region_sales / region_sales.sum() * 100
plt.figure(figsize=(20, 8))
sns.heatmap(region_sales.unstack().fillna(0), annot=True, fmt='.0f', cmap="YlGnBu")
plt.title("销售额按地区分布热力图")
plt.ylabel('地区')
plt.xlabel('销售额(万元)')
# 或者使用柱状图
plt.figure(figsize=(12, 6))
region_sales_percentage.plot(kind='bar', color='skyblue')
plt.title("各地区的销售占比")
plt.ylabel('% of Total Sales')
for i, v in enumerate(region_sales):
plt.text(i, v + 50, str(v), ha="center", va="bottom")
# 假设数据存储在DataFrame df 中, 场次数列名为 'stream_count'
average_sales_per_stream = df.groupby('user_id')['sales'].sum() / df.groupby('user_id')['stream_count'].sum()
plt.figure(figsize=(12, 6))
sns.barplot(x=average_sales_per_stream.index, y=average_sales_per_stream.values)
plt.title("每位达人的每场直播平均销售额")
plt.ylabel('平均每场销售额(万元)')
top_n = 10 # 可以根据实际需要调整
sorted_sales = df.groupby('user_id')['sales'].sum().sort_values(ascending=False)
top_users = sorted_sales[:top_n]
remaining_sales = sorted_sales[top_n:].sum()
plt.figure(figsize=(12,6))
plt.pie([top_users.sum(), remaining_sales], labels=['Top '+str(top_n)+'达人的销售额', '其余达人的总销售额'],
autopct='%1.1f%%')
plt.title("TOP达人与其余达人销售占比")
以上分析数据来源:互联岛