pandas常用操作详解——info()与descirbe()

df.info():主要介绍数据集各列的数据类型,是否为空值,内存占用情况

df.describe(): 主要介绍数据集各列的数据统计情况(最大值、最小值、标准偏差、分位数等等)。

df.info()

#导入数据
data1=pd.read_csv(r'E:\data_analysis\AB测试的假设检验实现\支付宝营销策略AB测试\effect_tb.csv',header=None,names=['dt','user_id','label','dmp_id'])
data1.head()
python pandas
数据内容
#null_counts=True 表示统计非空值数据的数量,1.2.0版本开始该参数改为show_counts
data1.info(null_counts = True)
pandas info函数
pd.info

df.describe()

参数详解:

  • percentiles:输出数据统计情况中的百分位数,默认为[0.25,0.5,0.75],即上四分位数、中位数、下四分位数;
  • include: ‘all’为数据集中的所有列;None(默认)为数据集中所有的数据列(不包括字符串);一个列表,指定相应列;
  • exclude: 排除哪些列,不显示其统计状况。;
  • datetime_is_numeric:布尔值,默认为False。是否将datetime格式的时间数据转化为数字
data1.describe()
Python pandas函数
pandas describe

原创文章,作者:somirror,如若转载,请注明出处:https://somirror.com/3378.html

(0)
上一篇 2022-12-20 09:22
下一篇 2022-12-20 22:07

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注