python - 如何根据pydatatable中的数据类型选择列?
问题描述
我正在创建一个数据表,如下所示,
spotify_songs_dt = dt.fread('https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2020/2020-01-21/spotify_songs.csv')
它的列类型是,
spotify_songs_dt.stypes
这里我想只取出DT的数字字段,如何以数据表的方式实现?在 pandas 数据框中,我们有一种函数 select_dtypes() 。
解决方案
如果您有一个 frame DT
,那么选择特定类型的列的最直接方法是在DT[:,j]
选择器中使用该类型本身:
DT[:, bool] # all boolean columns
DT[:, int] # all integer columns
DT[:, float] # all floating columns
DT[:, str] # string columns
DT[:, dt.int32] # columns with stype int32
DT[:, dt.ltype.int] # columns with ltype `int`, same as DT[:, int]
还可以提供类型列表以供选择:
DT[:, [int, float]] # integer and floating columns
DT[:, [dt.int32, dt.int64]] # int32 and int64 columns
有时删除不需要的类型的列而不是选择您需要的列也可能很有用:
del DT[:, str]
推荐阅读
- sql - HQL 到 SQL 转换 - 为列定义有意义的别名
- json - 在 POST 请求中使用 GitLab CI 中的变量
- algorithm - 如何获得至少有 K 个不同数字的子数组的数量?
- c++ - 使用现代解决方案和可移植的 C++ 暂停控制台
- katalon-recorder - Katalon 记录器尝试多个选择器
- azure - Azure 应用程序网关入口控制器:尽管后端运行良好,但无法连接主机名
- shopify - Shopify - 为每个客户定制价格,使用外部 api 计算
- java - Spring Boot Common JPA 存储库类
- javascript - 自定义钩子的状态不会在所有组件中更新?
- microprofile - 如何将 Microprofile 健康检查绑定到应用程序的上下文根?