python-3.x - 使用 pandas 导入 csv 并在数据中删除字符串
问题描述
我有以下csv结构:
(
(0.0078125 0.0078125 0.05)
(0.03125 0.0078125 0.05)
(0.0625 0.0078125 0.05)
some string might be in here
(0.0078125 0.0078125 0.05)
(0.03125 0.0078125 0.05)
(0.0625 0.0078125 0.05)
)
我想用 pandas 导入它,但我需要帮助来分离数据。
目前我有:
data = pd.read_csv("myFolder/myFile", header = None, skiprows=22, engine ="python")
但是,它将数据导入到单个列中。我想删除数据中的括号和字符串。
对于括号,我有:
data =data.replace(to_replace='\(', value=" ", regex=True)
data =data.replace(to_replace='\)', value=" ", regex=True)
但是,我不知道如何按列拆分数据以及如何删除字符串。
帮助将不胜感激!
解决方案
您可以使用re
模块搜索相关行:
import re
import pandas as pd
r = re.compile(r"^\s*\((.*)\)\s*$")
data = []
with open("your_file.txt", "r") as f_in:
for line in f_in:
m = r.search(line)
if m:
data.append(m.group(1).split())
df = pd.DataFrame(data)
print(df)
印刷:
0 1 2
0 0.0078125 0.0078125 0.05
1 0.03125 0.0078125 0.05
2 0.0625 0.0078125 0.05
3 0.0078125 0.0078125 0.05
4 0.03125 0.0078125 0.05
5 0.0625 0.0078125 0.05
推荐阅读
- arcgis-js-api - esri 将图形从 json 添加到图形层给出错误
- excel - 如何将 Match 的值设置为 vlookup 的范围
- vpn - 尝试通过 S2P Azure Vpn 访问计算资源时出现问题
- git - 我正在尝试将本地存储库附加到 github,但不能
- javascript - 如何使用 JS/JQ 复制 DOM 选择元素并保留所选选项
- .htaccess - htaccess url 重写和 https
- java - 将 Apache Common Math 3.6.1 项目从 Maven 存储库添加到 NetBeans 12.x 中的 Maven 项目
- r - 使用插入符号的交叉验证计算样本内预测准确性
- magento - 我在哪里可以找到 Magento 2 数据库中的客户 ID?
- react-native - React 本机 datepicker 插件在 Xcode 12 上构建 iOS 时抛出错误(“Property has a previous declaration”)