首页 > 解决方案 > 将 CSV 转换为 JSON (Pandas) 时如何避免 \n

问题描述

我正在转换一个 csv 文件。csv 的简短内容是这样的:

<div class="post-body entry-content" id="post-body-5981440554017350027">
<center><script async="" src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script>

如您所见,之后引入了一条新行id="post-body-5981440554017350027">

我用来将 CSV 转换为 JSON 的代码是:

import pandas as pd

csv_file = pd.DataFrame(
    pd.read_csv("file.csv", sep=",", header=0,
                index_col=False, encoding='utf-8-sig'))
csv_file.to_json("newJsonfile.json", orient="records", date_format="epoch",
                 double_precision=10, force_ascii=True, date_unit="ms",
                 default_handler=None)

转换为 JSON 后\n,每行都会引入一个新的。这就是我的意思:

<div class=\"indirectlink\" id=\"post-body-5981440554017350027\">\n<center><script async=\"\" src=\"https://pagead2

是否可以避免\n字符并转换为 CSV 中的字符?

标签: pythonjsonpandascsv

解决方案


根据评论,我们可能会尝试将 json 更改为字符串,然后将其保存。因此,我们可以做到以下几点:

json_file = csv_file.to_json(orient = "records", date_format = "epoch",   double_precision = 10, force_ascii = True, date_unit = "ms", default_handler = None)
json_file = json_file.replace(r"\n","")

现在我们可以将其保存为 json:

file = open("newJsonfile.json", "w") 
file.write(json_file) 
file.close() 

推荐阅读