首页 > 解决方案 > 如何从python3中的每一行读取起始N个单词

问题描述

我正在阅读列中包含自由文本的 excel。现在从熊猫读取该文件后,我想限制具有文本的列从每行开始仅读取 N 个单词。我尝试了一切,但未能成功。

data["text"] = 我要去上学,我从市场上买了一些东西。

但我只想看5个字。使它看起来像下面。

data["text"] = 我要去上学了。

我希望对 data["text"] 列的每一行都进行同样的操作。

您的帮助将不胜感激。

标签: python-3.xpandas

解决方案


def first_k(s: str, k=5) -> str:
    s = str(s)  # just in case something like NaN tries to sneak in there
    first_words = s.split()[:k]
    return ' '.join(first_words)

然后,应用函数:

data['text'] = data['text'].apply(first_k)

推荐阅读