基于您提供的数据,可以从以下几个核心维度进行深入分析:
计算TOP3品牌的销售额占比
import pandas as pd
# 假设df是包含所有数据的DataFrame
df = pd.read_csv('your_data.csv')
top3_brands = df.nlargest(3, '销售额').brand.tolist()
top3_sales = df[df['brand'].isin(top3_brands)]['销售额'].sum()
total_sales = df['销售额'].sum()
# 计算TOP3品牌的销售额占比
top3_sales_ratio = (top3_sales / total_sales) * 100
print(f'TOP3品牌销售额占比:{top3_sales_ratio:.2f}%')
分析关联达人/直播/视频数量与销售额的关系
# 假设df['达人数']、'直播间数'和'视频数'为相关列
df['互动量'] = df['直播间观看人数'] + df['视频互动次数']
correlation_live = df.corr().loc['销售额', '直播间数']
correlation_video = df.corr().loc['销售额', '视频数']
correlation_reach = df.corr().loc['销售额', '达人数']
print(f'直播间数量与销售额相关性:{correlation_live:.2f}')
print(f'视频数量与销售额相关性:{correlation_video:.2f}')
print(f'达人互动量与销售额相关性:{correlation_reach:.2f}')
比较多类目布局品牌的表现差异
df['类目数'] = df['类目'].str.split(',').apply(len)
# 分组计算不同类目数量的品牌的销售额均值
grouped_sales = df.groupby('类目数')['销售额'].mean().reset_index()
print(grouped_sales)
分析商品丰富度与销售的关系
# 计算每个品牌的商品总数
brand_item_count = df['品牌名称'].value_counts().rename_axis('brand').reset_index(name='item_count')
merged_data = pd.merge(brand_item_count, grouped_sales, on='brand', how='left')
# 分析商品数量与销售额的关系
print(merged_data)
# 可以进一步进行线性回归分析来验证这种关系
以上分析数据来源:互联岛