时间: 2020-09-4|29次围观|0 条评论

在本文中,我们将学习如何使用Pandas的 get_dummies()方法在Python中创建虚拟变量。 虚拟变量(或二进制/指标变量)通常用于统计分析以及更简单的描述性统计。 虚拟编码可以通过统计软件(例如Python、R或者SPSS)自动完成。

import pandas as pddata_url = 'Salaries.csv'df = pd.read_csv(data_url, index_col=0)print(df.head())
如何使用Pandas的get_dummies在Python中创建虚拟变量插图
如何使用Pandas的get_dummies在Python中创建虚拟变量插图1
print(pd.get_dummies(df['sex']).head())
如何使用Pandas的get_dummies在Python中创建虚拟变量插图2
df_dummies = pd.get_dummies(df, columns=['sex'])print(df_dummies.head())
如何使用Pandas的get_dummies在Python中创建虚拟变量插图3
df_dummies = pd.get_dummies(df, prefix='Gender', prefix_sep='.',                             columns=['sex'])print(df_dummies.head())
如何使用Pandas的get_dummies在Python中创建虚拟变量插图4
df_dummies = pd.get_dummies(df, prefix='', prefix_sep='',                             columns=['sex'])print(df_dummies.head())
如何使用Pandas的get_dummies在Python中创建虚拟变量插图5
print(pd.get_dummies(df['rank']).head())
如何使用Pandas的get_dummies在Python中创建虚拟变量插图6
df_dummies = pd.get_dummies(df, columns=['rank'])print(df_dummies.head())
如何使用Pandas的get_dummies在Python中创建虚拟变量插图7
df_dummies = pd.get_dummies(df, prefix='Rank', prefix_sep='.',                             columns=['rank'])print(df_dummies.head())
如何使用Pandas的get_dummies在Python中创建虚拟变量插图8
如何使用Pandas的get_dummies在Python中创建虚拟变量插图9
df_dummies = pd.get_dummies(df, prefix='', prefix_sep='',                             columns=['rank', 'sex'])print(df_dummies.head())
如何使用Pandas的get_dummies在Python中创建虚拟变量插图10
df_dummies = pd.get_dummies(df, prefix='', prefix_sep='',                             columns=['rank', 'sex', 'discipline'])print(df_dummies.head())

文章转载于:https://www.jianshu.com/p/087803eccd31

原著是一个有趣的人,若有侵权,请通知删除

本博客所有文章如无特别注明均为原创。
复制或转载请以超链接形式注明转自起风了,原文地址《如何使用Pandas的get_dummies在Python中创建虚拟变量
   

还没有人抢沙发呢~