首页 > 解决方案 > 在执行 HAC 或 K-Means 的集群代码时遇到“重新启动内核...”错误

问题描述

我正在研究 HAC 算法聚类和 K-means 聚类,我正在使用著名的 fa_cup 数据集。问题是我在输出控制台中看到“Restarting kernel ...”错误。代码看起来不错,对我来说似乎我必须增加请求超时或类似的东西。因为当我尝试将 PCA 应用于我的 tfIDF 矢量化器时,我大多会收到此错误。这是我的代码片段:

tfidf_vector=TfidfVectorizer()
X=tfidf_vector.fit(all_data)
X =tfidf_vector.transform(all_data)


df1 = pd.DataFrame(X.toarray(), columns = tfidf_vector.get_feature_names())


#Load Data and here PCA provide 2 dimensions 
data = df1
pca = PCA(2)

#Transform the data
df = pca.fit_transform(data)

plt.figure(figsize=(10, 7))  
plt.title("Dendrograms")  
dend = sch.dendrogram(sch.linkage(df, method='single'))

它主要是在线死亡pca.fit_transform(data)(我猜是由于内存使用过多或请求超时或其他原因)。我试过在网上搜索它。但是,找不到确切或接近的解决方案。我已经添加了 IDE 停止的代码。

Python Version: 3.8
Spyder Version: 4.2.5
System: Mac

标签: pythonmachine-learningspyderk-meanspca

解决方案


推荐阅读