首页 > 解决方案 > 使用 TweetTokenize 时出现不可散列类型的错误

问题描述

我首先从 Twitter 下载一些推文。

tweet_text = DonaldTrump["Tweets"] tweet_text = tweet_text.str.lower()

在此处输入图像描述

然后在下一步中,我们使用 TweetTokenizer。

Tweet_tkn = TweetTokenizer() tokens = [Tweet_tkn.tokenize(t) for t in tweet_text] tokens[0:3] 前三个令牌

有人可以向我解释并帮助我解决它。

我遇到过类似的问题,面临类似的错误,但它们提供了不同的解决方案。

错误

标签: pythonmachine-learningnltk

解决方案


列表是可变的,因此不能用作dict键。否则,程序可以将列表添加到字典中,更改其值,现在不清楚字典中的值是否应该在新列表值或旧列表值下可用,或者两者都不可用。

如果要将结构化数据用作键,则需要先将它们转换为不可变类型,例如tupleor frozenset。对于非嵌套对象,您可以简单地使用tuple(obj). 对于一个简单的光照列表,你可以使用这个:

tuple(tuple(elem) for elem in obj)

但是对于任意结构,您将不得不使用递归。


推荐阅读