python - Streamlit 自动填充多选小部件以过滤数据框
问题描述
我有一个流线型应用程序,用户可以在其中上传 csv 文件。我希望 streamlit 检测对象/维度列,并为每个列创建一个多选过滤器,并在每个列内使用唯一值。例如,如果用户上传具有 3 个对象/维度的文件,则会创建 3 个单独的多选过滤器。我想出了下面的代码,但它似乎不起作用。我最终得到以下错误。我认为问题是循环创建每个多选过滤器,但我不确定另一种动态执行此操作的方法。我也尝试过放置data[y].unique()
,ucolumns
但这仍然不起作用。
任何帮助都会很棒。
for y in data.columns:
if (data[y].dtype == np.object):
ucolumns=list(data[y].unique())
data[y+"filter"]=st.sidebar.multiselect('Filter '+y, ucolumns)
else:
pass
ValueError: Length of values (0) does not match length of index (97)
File "c:\users\###\pycharmprojects\pythonproject\venv\lib\site-packages\streamlit\script_runner.py", line 332, in _run_script
exec(code, module.__dict__)
File "C:\Users\###\PycharmProjects\pythonProject\streamlittest.py", line 109, in <module>
helper.run()
File "C:\Users\###\PycharmProjects\pythonProject\streamlittest.py", line 66, in run
data[y+"filter"]=st.sidebar.multiselect('Filter '+y, ucolumns)
File "c:\users\###\pycharmprojects\pythonproject\venv\lib\site-packages\pandas\core\frame.py", line 3163, in __setitem__
self._set_item(key, value)
File "c:\users\###\pycharmprojects\pythonproject\venv\lib\site-packages\pandas\core\frame.py", line 3239, in _set_item
value = self._sanitize_column(key, value)
File "c:\users\###\pycharmprojects\pythonproject\venv\lib\site-packages\pandas\core\frame.py", line 3896, in _sanitize_column
value = sanitize_index(value, self.index)
File "c:\users\###\pycharmprojects\pythonproject\venv\lib\site-packages\pandas\core\internals\construction.py", line 751, in sanitize_index
raise ValueError(
测试一些东西,我将多选包装在 try 中,除了打印y
以查看哪些列进入异常。似乎所有维度列都进入了例外,但奇怪的是所有多选都被创建并且似乎工作?谁能向我解释发生了什么事?这是我所做的调整:
try:
data[y+"filter"]=st.sidebar.multiselect('Filter '+y, ucolumns)
except:
print(y+"had to pass")
解决方案
当您尝试将 streamlit 侧边栏分配给 pandas 的 DataFrame 列时,就会出现问题。
这就是为什么当您允许使用 try/except 块继续执行时,会设置侧边栏,但无论如何都会引发异常。
换句话说,如果将有问题的行一分为二,您将拥有以下内容:
sidebar = st.sidebar.multiselect('Filter '+y, columns) # <-- This line is OK
data[y+"filter"] = sidebar # <-- This line fails
该行失败,因为data
它是 pandas 的 DataFrame,因此 data[y+'filter'] 是一列。而且您不能将一个元素分配给一列,这是非常神秘的错误消息中所述:
ValueError: Length of values (0) does not match length of index (97)
这意味着您的数据框有 97 行,并且您正在分配一个独立元素(“长度为 0”)。
当您将该行包装在 try/except 块中时,将st.sidebar.multiselect('Filter '+y, columns)
执行有效的部分(AKA: ),这就是您确实获得侧边栏的原因:因为错误在创建后立即发生。
您可以通过在字典中收集对侧边栏的引用来解决问题
sidebars = {}
for y in data.columns:
if (data[y].dtype == np.object):
ucolumns=list(data[y].unique())
sidebars[y+"filter"]=st.sidebar.multiselect('Filter '+y, ucolumns)
推荐阅读
- django - Django admin inline 的不同字段集(如果它是“额外”表单)
- android - 如何安装旧的模拟器映像?
- azure - 将 Azure 容器连接到两个卷/文件共享
- javascript - 将 iframe url 参数动态传递给父 URL
- elixir - 主管树退出而不是重新启动子进程
- cron - 在没有打开或关闭浏览器的情况下循环木偶
- flutter - 返回类型“bool”不是“void”,正如闭包的上下文飞镖颤动所要求的那样
- javascript - JavaScript for 循环如何处理变量
- angular-material - 不能在 Material Angular mat-button-toggle 内换行
- ubuntu - 在 Ubuntu 问题中为 C++ 设置 VSCode