python-3.x - 如何使用 BERT 将非英文文本翻译成英文
问题描述
我正在尝试使用 BERT 将非英语文本翻译成英语。到目前为止,我使用的代码如下 -
from pytorch_pretrained_bert.file_utils import
PYTORCH_PRETRAINED_BERT_CACHE, WEIGHTS_NAME, CONFIG_NAME
from pytorch_pretrained_bert.modeling import BertForSequenceClassification,
BertConfig
from pytorch_pretrained_bert.tokenization import BertTokenizer
from pytorch_pretrained_bert.optimization import BertAdam,
WarmupLinearSchedule
tokenizer = BertTokenizer.from_pretrained('bert-base-multilingual-uncased')
text = "La Banque Nationale du Canada fête cette année le 110e anniversaire
de son bureau de Paris."
marked_text = "[CLS] " + text + " [SEP]"
tokenized_text = tokenizer.tokenize(marked_text)
token_no=[]
for token in tokenized_text:
#print(tokenizer.vocab[token])
token_no.append(tokenizer.vocab[token])
# The below code obtains the tokens from the index
new_token_list=[]
for i in token_no:
new_token_list.append(list(tokenizer.vocab.keys())[i])
print(new_token_list);
在此之后,我很困惑如何获得文本的英文翻译?我走对了吗?
解决方案
推荐阅读
- c# - ASP.NET MVC - HTML 错误“没有 IEnumerable 类型的 ViewData
" - angular - 软件包更新后 Cypress e2e 出现问题
- testrigor - Testrigor - 开发人员日志
- matlab - 返回两个大小不等的数组匹配的索引
- unix - grep 条件并在字符串中打印另一个值
- python-3.x - 在 python 3.x 中遍历一个不那么普通的字典
- python - 如何使用 SymPy 加速符号集成?
- events - 发送交易和接收事件如何在以太坊区块链的后端工作
- spring - 默认值和非空约束
- reactjs - React useEffect 缺少依赖