python - 在 Pandas 的 Lambda 函数中使用条件语句的问题
问题描述
我正在尝试翻译tweet_text
我的数据集中调用的所有列。我有大约 100,000 行数据,其中大约 50% 需要翻译成英文。
以下代码有效,但我基本上是在运行该函数来翻译每一行的推文,这需要将近 2 个小时。
注意:x != " "
检查推文是否不是空字符串,因为一些推文就像" "
我从它们中删除了一些表情符号一样,这就是剩下的全部。
from deep_translator import GoogleTranslator
import swifter
import pandas as pd
df_bdtu['tweet_text'] = df_bdtu.tweet_text.swifter.apply(lambda x: GoogleTranslator(source='auto', target='en').translate(x) if x != " " else None)
因此,为了加快速度,我尝试仅在它们不是英语时才翻译它们,因为我有一个列说明推文的语言,称为lang
.
在这里,我只是遍历两列并翻译tweet_text
:
- 如果推文不是
" "
- 如果推文不在
English
df_bdtu[['tweet_text', 'lang']].swifter.apply(lambda x: GoogleTranslator(source='auto', target='en').translate(x['tweet_text']) if (x['tweet_text'] != " " and x['lang'] != "en") else None, axis = 1)
但是我收到一个错误,这表明我正在一次性传递所有文本以进行翻译,但我似乎无法修复它。我也对加快速度的方法持开放态度。
错误:
deep_translator.exceptions.NotValidPayload: --> text must be a valid text with maximum 5000 character, otherwise it cannot be translated
数据框:
data = {'tweet_text': ['100 Arsenal appearances. Congratulations, Rob! ', " Lundi soir dans l'émission , et ont débriefé la victoire dans le Der...", ' È in corso la votazione tra le 4 figurine finaliste!', ' y’a absolument zéro vanne l’avis est désastreux. ', 'FINAL 1-3 ¡El firma una gran remontada en su primera victoria de 2021! ... ', ' JÁ HÁ ONZE! ', 'HALF-TIME Southampton 1-0 LiverpoolDanny Ings’ brilliant early opener is the difference at the break ', "10' Une-deux parfaitement exécuté entre Tino et Notre capitaine voit sa frappe passer au-dessus. 0-0 ", ' ¡INCREÍBLE, DOS SANTOS! ', ' +3 '], 'lang': ['en', 'fr', 'it', 'fr', 'es', 'pt', 'en', 'fr', 'es', 'und']}
df = pd.DataFrame(data)
tweet_text lang
100 Arsenal appearances. Congratulations, Rob! en
Lundi soir dans l'émission , et ont débriefé la victoire dans le Der... fr
È in corso la votazione tra le 4 figurine finaliste! it
y’a absolument zéro vanne l’avis est désastreux. fr
FINAL 1-3 ¡El firma una gran remontada en su primera victoria de 2021! ... es
JÁ HÁ ONZE! pt
HALF-TIME Southampton 1-0 LiverpoolDanny Ings’ brilliant early opener is the difference at the break en
10' Une-deux parfaitement exécuté entre Tino et Notre capitaine voit sa frappe passer au-dessus. 0-0 fr
¡INCREÍBLE, DOS SANTOS! es
+3 und
解决方案
- 该代码适用于提供的示例,因此已将其他行添加到示例数据框中,从而生成
exceptions
. - 编写一个函数,
try - except
用于捕获无效行。 - 请注意,以下代码没有使用
import swifter
,因为它是用于加速的模块.apply
,并且不需要用于测试。
import pandas as pd
from deep_translator import GoogleTranslator as GT
from deep_translator import exceptions as excp
# sample dataframe
data = {'tweet_text': ['100 Arsenal appearances. Congratulations, Rob! ', " Lundi soir dans l'émission , et ont débriefé la victoire dans le Der...", ' È in corso la votazione tra le 4 figurine finaliste!', ' y’a absolument zéro vanne l’avis est désastreux. ', 'FINAL 1-3 ¡El firma una gran remontada en su primera victoria de 2021! ... ', ' JÁ HÁ ONZE! ', 'HALF-TIME Southampton 1-0 LiverpoolDanny Ings’ brilliant early opener is the difference at the break ', "10' Une-deux parfaitement exécuté entre Tino et Notre capitaine voit sa frappe passer au-dessus. 0-0 ", ' ¡INCREÍBLE, DOS SANTOS! ', ' +3 ', "Quoique ce détail ne touche en aucune manière au fond même de ce que nous avons à raconter, il n'est peut-être pas inutile, ne fût-ce que pour être exact en tout, d'indiquer ici les bruits et les propos qui avaient couru sur son compte au moment où il était arrivé dans le diocèse. Vrai ou faux, ce qu'on dit des hommes tient souvent autant de place dans leur vie et surtout dans leur destinée que ce qu'ils font. M. Myriel était fils d'un conseiller au parlement d'Aix; noblesse de robe. On contait de lui que son père, le réservant pour hériter de sa charge, l'avait marié de fort bonne heure, à dix-huit ou vingt ans, suivant un usage assez répandu dans les familles parlementaires. Charles Myriel, nonobstant ce mariage, avait, disait-on, beaucoup fait parler de lui. Il était bien fait de sa personne, quoique d'assez petite taille, élégant, gracieux, spirituel; toute la première partie de sa vie avait été donnée au monde et aux galanteries. La révolution survint, les événements se précipitèrent, les familles parlementaires décimées, chassées, traquées, se dispersèrent. M. Charles Myriel, dès les premiers jours de la révolution, émigra en Italie. Sa femme y mourut d'une maladie de poitrine dont elle était atteinte depuis longtemps. Ils n'avaient point d'enfants. Que se passa-t-il ensuite dans la destinée de M. Myriel? L'écroulement de l'ancienne société française, la chute de sa propre famille, les tragiques spectacles de 93, plus effrayants encore peut-être pour les émigrés qui les voyaient de loin avec le grossissement de l'épouvante, firent-ils germer en lui des idées de renoncement et de solitude? Fut-il, au milieu d'une de ces distractions et de ces affections qui occupaient sa vie, subitement atteint d'un de ces coups mystérieux et terribles qui viennent quelquefois renverser, en le frappant au coeur, l'homme que les catastrophes publiques n'ébranleraient pas en le frappant dans son existence et dans sa fortune? Nul n'aurait pu le dire; tout ce qu'on savait, c'est que, lorsqu'il revint d'Italie, il était prêtre.Quoique ce détail ne touche en aucune manière au fond même de ce que nous avons à raconter, il n'est peut-être pas inutile, ne fût-ce que pour être exact en tout, d'indiquer ici les bruits et les propos qui avaient couru sur son compte au moment où il était arrivé dans le diocèse. Vrai ou faux, ce qu'on dit des hommes tient souvent autant de place dans leur vie et surtout dans leur destinée que ce qu'ils font. M. Myriel était fils d'un conseiller au parlement d'Aix; noblesse de robe. On contait de lui que son père, le réservant pour hériter de sa charge, l'avait marié de fort bonne heure, à dix-huit ou vingt ans, suivant un usage assez répandu dans les familles parlementaires. Charles Myriel, nonobstant ce mariage, avait, disait-on, beaucoup fait parler de lui. Il était bien fait de sa personne, quoique d'assez petite taille, élégant, gracieux, spirituel; toute la première partie de sa vie avait été donnée au monde et aux galanteries. La révolution survint, les événements se précipitèrent, les familles parlementaires décimées, chassées, traquées, se dispersèrent. M. Charles Myriel, dès les premiers jours de la révolution, émigra en Italie. Sa femme y mourut d'une maladie de poitrine dont elle était atteinte depuis longtemps. Ils n'avaient point d'enfants. Que se passa-t-il ensuite dans la destinée de M. Myriel? L'écroulement de l'ancienne société française, la chute de sa propre famille, les tragiques spectacles de 93, plus effrayants encore peut-être pour les émigrés qui les voyaient de loin avec le grossissement de l'épouvante, firent-ils germer en lui des idées de renoncement et de solitude? Fut-il, au milieu d'une de ces distractions et de ces affections qui occupaient sa vie, subitement atteint d'un de ces coups mystérieux et terribles qui viennent quelquefois renverser, en le frappant au coeur, l'homme que les catastrophes publiques n'ébranleraient pas en le frappant dans son existence et dans sa fortune? Nul n'aurait pu le dire; tout ce qu'on savait, c'est que, lorsqu'il revint d'Italie, il était prêtre.Quoique ce détail ne touche en aucune manière au fond même de ce que nous avons à raconter, il n'est peut-être pas inutile, ne fût-ce que pour être exact en tout, d'indiquer ici les bruits et les propos qui avaient couru sur son compte au moment où il était arrivé dans le diocèse. Vrai ou faux, ce qu'on dit des hommes tient souvent autant de place dans leur vie et surtout dans leur destinée que ce qu'ils font. M. Myriel était fils d'un conseiller au parlement d'Aix; noblesse de robe. On contait de lui que son père, le réservant pour hériter de sa charge, l'avait marié de fort bonne heure, à dix-huit ou vingt ans, suivant un usage assez répandu dans les familles parlementaires. Charles Myriel, nonobstant ce mariage, avait, disait-on, beaucoup fait parler de lui. Il était bien fait de sa personne, quoique d'assez petite taille, élégant, gracieux, spirituel; toute la première partie de sa vie avait été donnée au monde et aux galanteries. La révolution survint, les événements se précipitèrent, les familles parlementaires décimées, chassées, traquées, se dispersèrent. M. Charles Myriel, dès les premiers jours de la révolution, émigra en Italie. Sa femme y mourut d'une maladie de poitrine dont elle était atteinte depuis longtemps. Ils n'avaient point d'enfants. Que se passa-t-il ensuite dans la destinée de M. Myriel? L'écroulement de l'ancienne société française, la chute de sa propre famille, les tragiques spectacles de 93, plus effrayants encore peut-être pour les émigrés qui les voyaient de loin avec le grossissement de l'épouvante, firent-ils germer en lui des idées de renoncement et de solitude? Fut-il, au milieu d'une de ces distractions et de ces affections qui occupaient sa vie, subitement atteint d'un de ces coups mystérieux et terribles qui viennent quelquefois renverser, en le frappant au coeur, l'homme que les catastrophes publiques n'ébranleraient pas en le frappant dans son existence et dans sa fortune? Nul n'aurait pu le dire; tout ce qu'on savait, c'est que, lorsqu'il revint d'Italie, il était prêtre.", [' '], ' '], 'lang': ['en', 'fr', 'it', 'fr', 'es', 'pt', 'en', 'fr', 'es', 'und', 'fr', 'sp', 'sp']}
df = pd.DataFrame(data)
# function to translate and catch exceptions
def translate(x):
try:
v = GT(source='auto', target='en').translate(x['tweet_text']) if (x['tweet_text'] != " " and x['lang'] != "en") else x['tweet_text']
except (excp.NotValidPayload, excp.NotValidLength) as e:
v = f'Translation Exception: {type(e)}'
return v
# translate the column
df['translated'] = df[['tweet_text', 'lang']].apply(lambda x: translate(x), axis = 1)
# find rows with Translation Exception
not_translated = df[['tweet_text', 'lang', 'translated']][df['translated'].str.startswith('Translation Exception')]
推荐阅读
- javascript - 隐藏列和过滤数据表中的数据
- python-3.x - 从另一个内部执行 python 脚本,传递参数并返回全局变量
- angular - 更改特定材料表行中的 mat-icon 状态
- flutter - 带参数的有状态小部件中的竞争条件
- bash - AppCenter 预构建 bash 脚本未使用 Xamarin Forms Project 执行
- java - JsonPath 中的条件
- php - 有没有办法将某个索引处的值与其右侧的所有值进行比较,直到它不匹配?
- html - 如何将搜索框移动到html中的最后一行
- xamarin - 为什么在 Kotlin 项目中使用 Koin 库时依赖注入不起作用
- python - 发送路径开头不带“/”的HTTP请求