您当前的位置:首页 >> 装修日记

介绍一款进阶版的Pandas科研人员神器:Polars

2023-02-23 12:16:41

......]

装入空值与数据集的统计分析

我们来看一下数据集集当中空值的分布情况,初始化null_count()方式

df_titanic.null_count()

output

我们可以看得见“Age”以及“Cabin”两列假定着空值,我们可以尝试用平均来来进行装入,字符串如下

df_titanic["Age"] = df_titanic["Age"].fill_nan(df_titanic["Age"].mean())

量度某一列的平均只只能初始化mean()方式即可,那么可支配、最大/零点的量度也是同样的道理,字符串如下

print(f'Median Age: {df_titanic["Age"].median()}')

print(f'Average Age: {df_titanic["Age"].mean()}')

print(f'Maximum Age: {df_titanic["Age"].max()}')

print(f'Minimum Age: {df_titanic["Age"].min()}')

output

Median Age: 29.69911764705882

Average Age: 29.699117647058817

Maximum Age: 80.0

Minimum Age: 0.42

数据集的挑选与建模

我们挑选显现出年岁大于40岁的乘车有哪些,字符串如下

df_titanic[df_titanic["Age"]> 40]

output

最后我们简单地来手绘一张图像,字符串如下

fig, ax = plt.subplots(figsize=(10, 5))

ax.boxplot(df_titanic["Age"])

plt.xticks(rotation=90)

plt.xlabel('Age Column')

plt.ylabel('Age')

plt.show()

output

总体来说呢,polars在数据集分析与妥善处理上面和Pandas模组有很多近似于的大多,其中就会有一部分的API假定着关联。

沈阳妇科医院哪里比较好
银川白癜风专家
长沙牛皮癣专科医院哪里好
重庆皮肤病医院挂号
吃什么药物能缓解脚扭伤疼
相关阅读
友情链接