基于您提供的数据,我们可以从以下几个角度进行分析:
TOP商品的日带货达人规模与传播效率
高佣金商品的达人带货意愿
多达人带货的商品30天销量稳定性
个护家清类目的高达人覆盖特征
具体步骤如下:
import pandas as pd
# 假设数据存储在一个DataFrame中
df = pd.read_csv('your_data.csv')
# 计算每个商品30天内的总带货达人数量
total_reaches = df.groupby('商品ID')['达人数'].sum()
# 找出TOP10的商品ID
top_10_ids = total_reaches.nlargest(10).index
# 计算这些商品的日均带货达人规模
avg_daily_reach = (total_reaches[top_10_ids] / 30).reset_index()
# 假设佣金率在“佣金”列中
high_commission_items = df[df['佣金'] > 15]['商品ID']
# 统计高佣金商品的总达人数和日均带货达人规模
high_reach_count = df[df['商品ID'].isin(high_commission_items)]['达人数'].sum()
daily_high_reach = (high_reach_count / 30)
# 确定销量排名前10%的商品
total_sales = df.groupby('商品ID')['销量'].sum()
top_10_percent_items = total_sales.nlargest(int(len(total_sales) * 0.1)).index
# 检查这些商品是否有多个达人的带货情况,以及日销量的波动稳定性
multi_reach_items = df[df['商品ID'].isin(top_10_percent_items)].groupby('商品ID')['达人数'].count()
stable_sales = df[df['商品ID'].isin(top_10_percent_items)].groupby('商品ID')['销量'].std()
# 输出结果
print("多达人带货的商品销量稳定性分析:")
for item in top_10_percent_items:
if multi_reach_items[item] > 3: # 可以根据实际情况调整这个数字
print(f"商品ID {item},日均销量标准差:{stable_sales[item]}")
# 确定个护家清类目的TOP10商品
beauty_care_items = df[df['类目'] == '个护家清']['商品ID']
# 统计这些商品在不同时间点的带货达人规模变化情况
for item in beauty_care_items:
time_series = df[(df['商品ID'] == item) & (df['日期'].dt.weekday < 5)]['达人数']
print(f"商品ID {item},工作日带货达人规模:{time_series.mean()}")
holiday_series = df[(df['商品ID'] == item) & (df['日期'].dt.weekday >= 5)]['达人数']
print(f"商品ID {item},节假日带货达人规模:{holiday_series.mean()}")
# 根据实际需求调整统计方式
以上分析数据来源:互联岛