首页 > 解决方案 > 如何为 pandas 的 read_csv 选择编码类型

问题描述

我很难找到 xlsx 文件的编码类型。当我使用 pd.read_csv(file) 时,它显示一个错误(“UnicodeDecodeError: 'utf-8' codec can't decode bytes in position 15-16: invalid continuation byte”)。然后我尝试创建一个包含许多编码类型的列表来循环,但仍然不起作用。数据如下:PK!b�h^� [Content_Types]。D�҆4j�0u2js��MY�˴���S쭂������)f���C����y�� I< y��!+��E����fMy�k� ����K�5=|�t ��G)�s墙�U��tB��)����,����f��������PK !)>�\�� CU6 xl/worksheets/sheet1.xml���N�0E�H����}�8���!�!�kי4V��l��B�;�R7Vb'ϙ�� \m�&��r��<�)+]�좢/Ϸ�JB��Y������L��/C l�hcW2dF��u�K�_���΃� �$�Y��cf��tG(�1�4J�+6�����hU~hF�3�/W�@:�!b����J�����:/�uo �PH��xx������������l���KvɄ������C��]��E�k�����v�O�xK�˗+UW�# �\y��A����g|��Vx�I��T����9e�I�W���D1 2��$�Ν[����S D�҆4j�0u2js��MY�˴���S쭂������)f���C����y�� I< y��!+��E����fMy�k� ����K�5=|�t ��G)�s墙�U��tB��)����,����f��������PK !)>�\�� CU6 xl/worksheets/sheet1.xml���N�0E�H����}�8���!�!�kי4V��l��B�;�R7Vb'ϙ�� \m�&��r��<�)+]�좢/Ϸ�JB��Y������L��/C l�hcW2dF��u�K�_���΃� �$�Y��cf��tG(�1�4J�+6�����hU~hF�3�/W�@:�!b����J�����:/�uo �PH��xx������������l���KvɄ������C��]��E�k�����v�O�xK�˗+UW�# �\y��A����g|��Vx�I��T����9e�I�W���D1 2��$�Ν[����S;Ƚ�-��I �X�8s�M�EB���n}j�F����

标签: pythonpandas

解决方案


read_csv函数需要逗号分隔值或 CSV 格式的数据。Excel 将文件保存为.xlsx文件,这些文件是包含 Excel 特定数据的二进制文件。

要创建此函数可以读取的文件,请在 Excel 中打开该文件并使用“另存为”将其保存到.csv文件中。确保保留原件,因为 CSV 文件不包含任何格式(字体、颜色、数字格式等)。

或者,您可以read_excel按照 aozk 的回答中所述使用。


推荐阅读