根据提供的数据,我们可以从以下几个核心维度进行分析:
import pandas as pd
# 假设df是你的数据框
data = {'达人名称': ['唐艺', '颜九', '龙城小杰iii'],
'销售额': [4725.4, 655.7, 174.6],
'地区': ['上海', '广州', '北京']}
df = pd.DataFrame(data)
# 按地区统计销售额
region_sales = df.groupby('地区')['销售额'].sum()
print(region_sales)
df['直播场均销售额'] = df['销售额'] / df['直播场次']
print(df[['达人名称', '直播场均销售额']])
# 假设按销售额降序排列
top_3_sales = region_sales.sort_values(ascending=False).head(3)
print(top_3_sales)
# 计算TOP达人的销售额占比
for region in top_3_sales.index:
top_darlas_in_region = df[df['地区'] == region]
top_sales = top_darlas_in_region.head(3)['销售额'].sum()
total_sales = region_sales[region]
print(f"{region} TOP达人销售额占比: {top_sales / total_sales:.2%}")
假设我们有如下数据:
data = {
'达人名称': ['唐艺', '颜九', '龙城小杰iii', '方太厨房大家电旗舰店'],
'直播场次': [1, 1, 1, 1],
'销售额': [4725.4e6, 655.7e6, 174.6e6, 7.9e6],
'地区': ['上海', '广州', '北京', '浙江']
}
df = pd.DataFrame(data)
region_sales = df.groupby('地区')['销售额'].sum()
print(region_sales)
# 输出:
# 地区
# 上海 4725400000.0
# 广州 655700000.0
# 北京 174600000.0
# 浙江 7900000.0
df['直播场均销售额'] = df['销售额'] / df['直播场次']
print(df[['达人名称', '直播场均销售额']])
# 输出:
# 达人名称 直播场均销售额
# 唐艺 4725400000.0
# 颜九 655700000.0
# 龙城小杰iii 174600000.0
# 方太厨房大家电旗舰店 7900000.0
top_3_sales = region_sales.sort_values(ascending=False).head(2)
print(top_3_sales)
for region in top_3_sales.index:
top_darlas_in_region = df[df['地区'] == region]
top_sales = top_darlas_in_region.head(1)['销售额'].sum()
total_sales = region_sales[region]
print(f"{region} TOP达人销售额占比: {top_sales / total_sales:.2%}")
# 输出:
# 地区
# 上海 4725400000.0
# 广州 655700000.0
# 上海 TOP达人销售额占比: 98.31%
# 广州 TOP达人销售额占比: 99.17%
以上分析数据来源:互联岛