python-3.x - 对更改的列类型应用函数
问题描述
我有 citation.cites 文件包含两列(目标和源)。每个数字都被视为 paper_id
citations = pd.read_csv(
os.path.join(data_dir, "citeseer.cites"),
sep="\t",
header=None,
names=["target", "source"],
)
以下代码在引文数据类型为数字时运行(即引文文件采用形式
123 654
786 988
)
lass_values = sorted(papers["subject"].unique())
class_idx = {name: id for id, name in enumerate(class_values)}
paper_idx = {name: idx for idx, name in enumerate(sorted(papers["paper_id"].unique()))}
papers["paper_id"] = papers["paper_id"].apply(lambda name: paper_idx[name])
citations["source"] = citations["source"].apply(lambda name: paper_idx[name])
citations["target"] = citations["target"].apply(lambda name: paper_idx[name])
papers["subject"] = papers["subject"].apply(lambda value: class_idx[value])
但是当引文文件采用这种形式时
123 hyt
ytr 657
前面的代码不运行
解决方案
推荐阅读
- javascript - 更新子组件中的不可变变量
- python - 如何在python中的按钮上调用带有self参数的方法
- android - Intellij Idea - Android Studio 插件 - 构建失败
- geoserver - 为什么某些最新版本的 Geoserver 在 https://docs.geoserver.org 上不可用?
- docker-compose - AirFlow 1.10:调度程序不适合运行
- java - 如何在 Java 中创建一个泛型数组
- flutter - 如何从用户那里获取 2 个输入并执行计算并在颤振应用程序中显示结果
- python - 如何使用solve_ivp插值?
- google-apps-script - Paste formula as value on a certain date
- r - 在 R 中的分组条形图中重新排序组