python - 如何为 pandas 的 read_csv 选择编码类型
问题描述
我很难找到 xlsx 文件的编码类型。当我使用 pd.read_csv(file) 时,它显示一个错误(“UnicodeDecodeError: 'utf-8' codec can't decode bytes in position 15-16: invalid continuation byte”)。然后我尝试创建一个包含许多编码类型的列表来循环,但仍然不起作用。数据如下:PK!b�h^� [Content_Types]。D�҆4j�0u2js��MY�˴���S쭂������)f���C����y�� I< y��!+��E����fMy�k� ����K�5=|�t ��G)�s墙�U��tB��)����,����f��������PK !)>�\�� CU6 xl/worksheets/sheet1.xml���N�0E�H����}�8���!�!�kי4V��l��B�;�R7Vb'ϙ�� \m�&��r��<�)+]�좢/Ϸ�JB��Y������L��/C l�hcW2dF��u�K�_���� �$�Y��cf��tG(�1�4J�+6�����hU~hF�3�/W�@:�!b����J�����:/�uo �PH��xx������������l���KvɄ������C��]��E�k�����v�O�xK�˗+UW�# �\y��A����g|��Vx�I��T����9e�I�W���D1 2��$�Ν[����S D�҆4j�0u2js��MY�˴���S쭂������)f���C����y�� I< y��!+��E����fMy�k� ����K�5=|�t ��G)�s墙�U��tB��)����,����f��������PK !)>�\�� CU6 xl/worksheets/sheet1.xml���N�0E�H����}�8���!�!�kי4V��l��B�;�R7Vb'ϙ�� \m�&��r��<�)+]�좢/Ϸ�JB��Y������L��/C l�hcW2dF��u�K�_���� �$�Y��cf��tG(�1�4J�+6�����hU~hF�3�/W�@:�!b����J�����:/�uo �PH��xx������������l���KvɄ������C��]��E�k�����v�O�xK�˗+UW�# �\y��A����g|��Vx�I��T����9e�I�W���D1 2��$�Ν[����S;Ƚ�-��I �X�8s�M�EB���n}j�F����
解决方案
该read_csv
函数需要逗号分隔值或 CSV 格式的数据。Excel 将文件保存为.xlsx
文件,这些文件是包含 Excel 特定数据的二进制文件。
要创建此函数可以读取的文件,请在 Excel 中打开该文件并使用“另存为”将其保存到.csv
文件中。确保保留原件,因为 CSV 文件不包含任何格式(字体、颜色、数字格式等)。
或者,您可以read_excel
按照 aozk 的回答中所述使用。