首页 > 解决方案 > Python:构建具有多个响应的字典(嵌套字典?)

问题描述

我试图弄清楚如何最有效地搜索 python 中约 2300 万行 CSV 文件中的行。

该文件是 ZIP+4 代码的列表,以及每个代码的一些信息,主要是它们的 FIPS ID、州缩写和县。

例如第 1 行是 {02468,1405,25,017,25017,MA,MIDDLESEX} 这些值是 {5_Dig_Zip,+4_Dig_Zip,StateFIPS,CountyFIPS,TotalFIPS,State_Abbrev,County}。

我想构建一个字典或其他一些能够查询的数据结构:

data["02468"] --> 并返回 5 位数 ZIP 为 02468 的所有行,或 data["02468"]["1405"],并仅返回该行。

数据当前位于大量列表中。似乎我可能想使用嵌套字典,但我不太确定该去哪里。

谢谢!

标签: pythoncsvprocessing

解决方案


Pythonic:制作pandas具有多索引的数据框(第一级:5 位 zip,第二级 - 4 位扩展)。不那么 Pythonic,但很简单:创建一个 sqlite 数据库并以通常的方式进行查询。


推荐阅读