python - 有没有更有效的方法来迭代数据框?
问题描述
books_over10['Keywords'] = ""
r = Rake() # Uses stopwords for english from NLTK, and all puntuation characters.
for index, row in books_over10.iterrows():
a=r.extract_keywords_from_text(row['bookTitle'])
c=r.get_ranked_phrases() # To get keyword phrases ranked with scores highest to lowest.
books_over10.at[index, 'Keywords'] = c
books_over10.head()
我正在使用上面的代码,以便处理所有行并从 bookTitle 列中的每一行中提取关键字,然后将它们作为列表插入到同一行上名为“关键字”的新列中。问题是是否有一种更有效的方法来做到这一点,而无需遍历所有行,因为这需要很多时间。任何帮助,将不胜感激。提前致谢 !
长明解决方案:
def extractor(row):
a=r.extract_keywords_from_text(row)
return r.get_ranked_phrases() # To get keyword phrases ranked with scores highest to lowest.
r = Rake() # Uses stopwords for english from NLTK, and all puntuation characters.
books_over10['Keywords'] = books_over10['bookTitle'].map(lambda row : extractor(row))
解决方案
尝试查看地图。不确定您使用的是什么 Rake,并且您对其进行编码的方式有点令人困惑,但一般语法是这样的。
books_over10['Keywords'] = books_over10['bookTitle'].map(lambda a: FUNCTION(a))
推荐阅读
- javascript - 我如何使用 javascript 反引号?
- javascript - 设置代理以处理 arcgis js api 的 CORS
- javascript - 基于项目值的角度类名称
- android - React Native MabBox MarkerView 问题
- gcc - 为什么 gcc 使用两个存储 (`MOV %reg, (mem)`) 而不是一个?
- python - 在比较 2 个值时,嵌套 if 语句有哪些更好的替代方法?
- python - 未显示 Scrapy Pipeline 中引发的异常 file_path 函数
- python - 如何在python中以简洁的方式更改特定的子字符串?
- python - 我可以将 spark 数据帧作为参数发送给 pandas UDF
- reactjs - 部署到 github 页面后,我的图片不会显示在我的 react 应用程序中