python - 处理具有不同分隔符的两个文件 Python 3
问题描述
我想获取两个文本文件并将它们写入/附加到一个文件中。每个文件都有不同的分隔符。有没有一种方法可以轻松检测到分界?还是一种简单的方法来处理这种情况?如何处理未知文件分隔?
谢谢!
解决方案
不,没有简单的方法来确定未指定的分隔符。事实上,人们可以很容易地构造出分隔符不明确的病态案例。
但是,从您提供的示例中可以看到希望。您的字段似乎主要是字母数字数据 - 有时包括连字符、引号等 - 由常用标点符号分隔。您可以阅读文件的几行并根据文本特征确定可能的分隔符。
识别字母数字字段并将其折叠为单个字符,例如A
. 从剩余的字符中,寻找与这些字段或多或少交替出现的字符。使用优先考虑列表,例如(制表符、逗号、空格……)并计算一些拟合优度,直到得到一个看起来可能的数字。使用它作为分隔符来读取文件。
一旦您正确摄取了每个文件的行,使用csv
包编写文件就很简单(参见在线示例)。
推荐阅读
- apache-spark - 无法使用火花流从 kafka 主题中读取数据
- ansible - 如何在 terraform 代码中调用 ansible playbook?
- windows - 用于以其他用户身份启动进程的 Perl 脚本无法正常工作
- python - 具有 F1 分数的 Keras 多标签图像分类
- angular - 无法从 Angular 7 Universal 中的浏览器访问动态 url
- javascript - Next.js getInitialProps cookie
- uwp - 无法在 Windows 10 物联网核心中打开 (GPIO) 引脚 6
- java - 使用 java 和 intellij 连接到 postgresql 的问题
- servicenow - 从主页标题 servicenow 中删除帮助图标
- vim - Vim:在当前光标位置插入列的宏