python - 使用 TweetTokenize 时出现不可散列类型的错误
问题描述
我首先从 Twitter 下载一些推文。
tweet_text = DonaldTrump["Tweets"] tweet_text = tweet_text.str.lower()
然后在下一步中,我们使用 TweetTokenizer。
Tweet_tkn = TweetTokenizer()
tokens = [Tweet_tkn.tokenize(t) for t in tweet_text]
tokens[0:3]
有人可以向我解释并帮助我解决它。
我遇到过类似的问题,面临类似的错误,但它们提供了不同的解决方案。
解决方案
列表是可变的,因此不能用作dict
键。否则,程序可以将列表添加到字典中,更改其值,现在不清楚字典中的值是否应该在新列表值或旧列表值下可用,或者两者都不可用。
如果要将结构化数据用作键,则需要先将它们转换为不可变类型,例如tuple
or frozenset
。对于非嵌套对象,您可以简单地使用tuple(obj)
. 对于一个简单的光照列表,你可以使用这个:
tuple(tuple(elem) for elem in obj)
但是对于任意结构,您将不得不使用递归。
推荐阅读
- django - Django auth_views.PasswordResetView 不发送自定义电子邮件模板
- android - java.lang.ClassNotFoundException 在 Xamarin.Android 中绑定 java 库
- locking - mcrl2 红绿灯变色问题
- python - python lstm层可变输入长度
- python - Python调试器找不到模块
- c - eBPF:如何从 `struct __sk_buff` 中获取与 sock 关联的套接字
- postgresql - 使用 docker-compose 时出现 Postgres 数据库连接问题
- node.js - 从 Node.js 脚本执行子进程,并将完整的输入和输出转发给它
- angular - 在 Angular 项目中需要一个 dojo 模块
- django - “用户”对象没有属性“is_staff”