csv - 以特定格式提取数据
问题描述
我有gene.csv 文件,大小约为1.3 GB,有300 列和超过一百万行。它看起来像以下,
id1 id2 id3 id4 count1 count2
S1001 450 GAF ARHGAP18 1.56E-05 1483
S1001 450 GAF ARHGAP12 5E-05 3698
S1001 450 GAF ARHGAP15 2.75E-06 93
S1001 450 GAF ARHGAP17 3E-05 1889
S1001 450 GAF ARHGAP19 4.291E-06 596
S1002 450 GAF ARHGAP18 5.955E-05 5353
S1002 450 GAF ARHGAP12 8.578E-08 14
S1002 450 BAF ARHGAP15 2.91E-05 5381
S1002 450 BAF ARHGAP17 1.78E-06 105
S1002 450 BAF ARHGAP19 3.62E-05 5764
S1003 450 BAF ARHGAP18 5.2697E-06 330
S1003 450 BAF ARHGAP12 5.955E-05 2263
S1003 450 BAF ARHGAP15 8.578E-08 3147
S1003 450 CAF ARHGAP17 2.91E-05 50
S1003 450 CAF ARHGAP19 5.955E-05 1595
S1004 450 CAF ARHGAP18 8.578E-08 970
S1004 450 CAF ARHGAP12 2.91E-05 816
S1004 450 CAF ARHGAP15 5.955E-05 4981
S1004 450 CAF ARHGAP17 8.578E-08 816
S1004 450 CAF ARHGAP19 2.91E-05 4981
我只想要id1。以以下格式获取的 id4 和 count2 数据(作为矩阵)
id4 S1001 S1002 S1003 S1004
ARHGAP18 1483 5353 330 970
ARHGAP12 3698 14 2263 816
ARHGAP15 93 5381 3147 4981
ARHGAP17 1889 105 50 816
ARHGAP19 596 5764 1595 4981
我需要 id1 作为列 ID(仅重复一次)。
解决方案
推荐阅读
- datadog - Filter datadog logs in the local agent before sending
- javascript - 无法通过单击图像显示模态
- perl - 如何修复 Perl Business::Hours Bad order 2 严重错误?
- c# - Unity 场景加载时间非常长
- html - 2路绑定问题,使用对象时type = radio
- powershell - 使用 PowerShell 从文件中删除特定文本
- node.js - 通过延迟和退避保护节点/快速端点免受攻击
- typescript - TypeScript 中没有调试器
- javascript - 未捕获的类型错误:无法在 onVehiclePhotoURISuccess 读取未定义的属性“substr”
- stata - 如何使 postfile 同时使用字符串和数字变量