基于给定的数据和分析维度,我们将对每种商品进行以下四方面的评估:
首先,将数据中的销量和销售额转化为数值类型,并统计高关联视频数(视频数大于等于2)的商品数量占比。
import pandas as pd
# 示例数据
data = {
'商品编号': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
'商品名称': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'],
'视频数': [2, 3, 4, 5, 6, 1, 7, 8, 9, 0],
'销量': [120, 150, 180, 210, 240, 100, 270, 300, 330, 90],
'销售额': [5000, 6000, 7000, 8000, 9000, 4000, 10000, 12000, 14000, 3000]
}
df = pd.DataFrame(data)
# 计算视频数大于等于2的商品数量占比
high_video_count = df[df['视频数'] >= 2].shape[0] / df.shape[0]
print(f"视频数大于等于2的商品数量占比: {high_video_count:.2%}")
from scipy.stats import pearsonr
# 计算视频数和销售额的相关系数
correlation, _ = pearsonr(df['视频数'], df['销售额'])
print(f"视频数与销售额的相关系数: {correlation:.2f}")
import numpy as np
# 计算销量的标准差
sales_std = df[df['视频数'] >= 2]['销量'].std()
print(f"视频数大于等于2的商品销量标准差: {sales_std:.2f}")
# 假设给定商品类别(示例)
df['类目'] = ['食品', '个护', '食品', '个护', '食品', '食品', '个护', '食品', '个护', '食品']
# 计算各品类视频数的平均值
category_videos = df.groupby('类目')['视频数'].mean()
print(f"各类目平均视频数: \n{category_videos}")
以上分析数据来源:互联岛