python - 将随机样本列添加到数据框中
问题描述
假设我有一张这样的桌子:
| Name | Age |
|--------|-----|
| Bob | 2 |
| John | 3 |
| Tim | 4 |
| Ben | 5 |
| Ella | 4 |
| Sophie | 5 |
| Grace | 6 |
| Bill | 34 |
| Ron | 23 |
| Harry | 2 |
我如何添加一个新列来选择随机 10% 的行并添加一个 True 的新列?然后将其余设置为 False。像这样?
| Name | Age | |
|--------|-----|-------|
| Bob | 2 | False |
| John | 3 | False |
| Tim | 4 | False |
| Ben | 5 | True |
| Ella | 4 | False |
| Sophie | 5 | False |
| Grace | 6 | False |
| Bill | 34 | False |
| Ron | 23 | False |
| Harry | 2 | False |
解决方案
您可以使用 pandas 的示例函数:
df.loc[df.sample(frac=0.1).index, "sample_column"] = True
df["sample_column"] = df["sample_column"].fillna(False)
推荐阅读
- neo4j - Neo4j 中的 randomUUID 和 GraphAware UUID 有什么区别?
- flutter - Reading asset image dimensions without loading into memory
- python - 在 Python 中循环导入字典
- c# - ASP.NET Core 让用户在部署到 IIS 并在浏览器中启动时无法工作
- javascript - Koajs,简单的应用程序不在本地主机上运行
- r - 重新编码数据框 R 中的多列
- java - How do you save data after onPause(), once the app is closed by user or device?
- javascript - 为什么这个 RegEx 匹配这个数字?
- python-3.x - How to use markdown in discord.py?
- canvas - 帆布进度轮