根据提供的数据,我们可以从以下几个核心维度进行分析:
头部效应:
渠道效率:
类目特征:
动销能力:
数据整理:首先对所有小店铺的基本信息、日销售额以及相关渠道信息进行整理和清洗。
头部效应分析:
渠道效率分析:
scipy.stats库)计算这些指标与日销售额的相关系数。类目特征分析:
动销能力分析:
import pandas as pd
# 假设数据已经整理在一个DataFrame中,列名为 'shop_id', 'category', 'sales', 'influencers_count', 'livestreams_count', 'videos_count'
data = {
'shop_id': [1, 2, 3, ...], # 小店ID
'category': ['玩具乐器', '智能家居', '钟表配饰', ...], # 商品类别
'sales': [1000, 800, 750, ...], # 日销售额
'influencers_count': [20, 30, 40, ...], # 关联达人数
'livestreams_count': [5, 6, 7, ...], # 直播次数
'videos_count': [10, 15, 20, ...] # 视频数
}
df = pd.DataFrame(data)
# 头部效应分析
top_3_sales = df.sort_values(by='sales', ascending=False).head(3)
total_top_3_sales = top_3_sales['sales'].sum()
total_sales = df['sales'].sum()
top_3_ratio = total_top_3_sales / total_sales
# 渠道效率分析
correlation_matrix = df.corr()
# 类目特征分析
category_sales = df.groupby('category')['sales'].sum().reset_index()
most_popular_category = category_sales.nlargest(5, 'sales')
# 动销能力分析
df['inventory_count'] = [len(str(s).split(',')) for s in df['category']] # 假设类别字符串中有多个商品
regression_model = pd.DataFrame(df.groupby('inventory_count')['sales'].mean())
print("Top 3 Shops Sales Ratio:", top_3_ratio)
print("Correlation Matrix:\n", correlation_matrix)
print("Most Popular Categories:\n", most_popular_category)
print("Average Sales by Inventory Count:\n", regression_model)
以上分析数据来源:互联岛