皮尔森相关系数计算
import numpy as np
# 示例数据
def calculate_correlation(data):
correlation_matrix = np.corrcoef(data['引流量'], data['销售额'])
return correlation_matrix[0, 1]
# 假设我们有一个包含引流人数和销售额的数据集
data = {
'引流人次': [2000, 3000, 5000, ...],
'销售额': [5000, 7000, 9000, ...]
}
correlation = calculate_correlation(data)
print(f"引流量与销售额的相关系数: {correlation}")
TOP3直播引流比例
# 假设我们已经有前3名直播间的数据
top3_live_data = {
'主播名称': ['A', 'B', 'C'],
'引流人次': [1500, 1800, 2000]
}
total_live_data = { ... } # 其他所有直播数据
total引流人数 = sum(total_live_data['引流人次'])
top3引流比例 = sum(top3_live_data['引流人次']) / total引流人数
print(f"TOP3直播间引流占比: {top3引流比例 * 100:.2f}%")
带货类目分布
# 假设我们已经有每个直播间的商品类别数据
category_data = {
'主播名称': ['A', 'B', 'C'],
'商品类别': ['服饰', '家居用品', '电子产品']
}
high引流直播间 = { ... } # 引流人数高且销售额高的直播间
top_categories = [category for _, category in high引流直播间.items() if category in high引流直播间.values()]
print(f"高引流直播间主要带货类目: {top_categories}")
粉丝数与引流能力关系
# 假设我们已经有主播的粉丝数据和引流数据
fan_data = {
'主播名称': ['A', 'B', 'C'],
'粉丝数': [100万, 200万, 300万],
'引流人次': [2500, 3000, 4000]
}
import matplotlib.pyplot as plt
plt.scatter(fan_data['粉丝数'], fan_data['引流人次'])
plt.xlabel('粉丝数')
plt.ylabel('引流人数')
plt.title('粉丝数与引流能力关系')
plt.show()
以上分析数据来源:互联岛