首页 > 解决方案 > Python:编辑 CSV 文件 - 加入两行并更改列名

问题描述

我正在使用 Python 做一个项目,在该项目中我必须使用 Weka,因此我必须使用可以从我正在创建的包含分子描述符的 csv 中获取的 arff 文件。

像这样的东西:

                Name      nAcid    ALogP  ...     WPOL   XLogP  Zagreb
0         AUTOGEN_bumex      1  -1.4399   ...     37.0   1.220   124.0
1     AUTOGEN_cenestin       0   0.3269   ...     44.0   0.247   140.0
2     AUTOGEN_clozapine      0   1.6380   ...     41.0   2.583   126.0
3        AUTOGEN_diovan      3   0.5202   ...     49.0   4.409   160.0
4        AUTOGEN_evista      0   0.7973   ...     54.0   2.720   182.0
5    AUTOGEN_folic acid      2  -3.5377   ...     48.0  -3.972   162.0
6        AUTOGEN_forteo      5 -35.1594   ...    430.0 -13.601  1374.0
7   AUTOGEN_hydroxyzine      0   2.2387   ...     37.0   0.800   128.0
8        AUTOGEN_nexium      0  -0.5219   ...     39.0  -0.882   126.0
9         AUTOGEN_paxil      0  -0.2902   ...     35.0   2.271   128.0
10    AUTOGEN_potassium      0      NaN   ...      0.0   0.000     0.0
11   AUTOGEN_prednisone      0  -0.7488   ...     59.0   0.608   154.0
12      AUTOGEN_provera      0   0.5736   ...     62.0   4.279   164.0
13   AUTOGEN_cimetidine      0   0.5736   ...     62.0   4.279   164.0
14   AUTOGEN_irinotecan      0   0.5736   ...     62.0   4.279   164.0`

我需要查看这些化合物之间的已知相互作用列表,如果我发现一些相互作用(例如西咪替丁和伊立替康之间),我必须追加以创建一个新行,其中前面有“西咪替丁”行和“伊立替康”行其中,像这样:

              Name  nAcid    ALogP   ...     WPOL   XLogP  Zagreb  Name2  nAcid2    ALogP2   ...     WPOL2   XLogP2  Zagreb2
AUTOGEN_cimetidine      0   0.5736   ...     62.0   4.279   164.0  AUTOGEN_irinotecan      0   0.5736   ...     62.0   4.279   164.0

如果我没有找到该给定化合物的任何相互作用,我只是与化合物和属性有一条线,然后用于第二种化合物的属性的列将只是空白或 0。

我只是不知道我该怎么做,如果有人可以帮助我,那就太好了!:)

标签: pythoncsvconcatenationrowweka

解决方案


推荐阅读