首页 > 解决方案 > 如何使用 pandas 在 Python 中读取包含 json 字符串的 .jlog?

问题描述

我在 .jlog 文件中有一个 json 字符串,并希望将此文件作为包含使用 python 的列的 df 读取。

我的代码如下:

   import pandas as pd
   df_weblogs=pd.read_json('C:/Users/me/my_file.jlog', orient='columns')

它给了我一个错误。

---------------------------------------------------------------------------
MemoryError                               Traceback (most recent call last)
<ipython-input-20-4085b33a005e> in <module>()
----> 1 df_weblogs=pd.read_json('C:/Users/me/my_file.jlog', orient='columns')
      2 df_weblogs.head(5)

~\Anaconda\lib\site-packages\pandas\io\json\json.py in read_json(path_or_buf, orient, typ, dtype, convert_axes, convert_dates, keep_default_dates, numpy, precise_float, date_unit, encoding, lines, chunksize, compression)
    414         keep_default_dates=keep_default_dates, numpy=numpy,
    415         precise_float=precise_float, date_unit=date_unit, encoding=encoding,
--> 416         lines=lines, chunksize=chunksize, compression=compression,
    417     )
    418 

~\Anaconda\lib\site-packages\pandas\io\json\json.py in __init__(self, filepath_or_buffer, orient, typ, dtype, convert_axes, convert_dates, keep_default_dates, numpy, precise_float, date_unit, encoding, lines, chunksize, compression)
    464 
    465         data = self._get_data_from_filepath(filepath_or_buffer)
--> 466         self.data = self._preprocess_data(data)
    467 
    468     def _preprocess_data(self, data):

~\Anaconda\lib\site-packages\pandas\io\json\json.py in _preprocess_data(self, data)
    475         """
    476         if hasattr(data, 'read') and not self.chunksize:
--> 477             data = data.read()
    478         if not hasattr(data, 'read') and self.chunksize:
    479             data = StringIO(data)

MemoryError: 

应该如何正确阅读?

标签: pythonjsonpandasdataframe

解决方案


推荐阅读