首页 > 解决方案 > 我正在尝试通过句子和单词注释来提取 pos 标签,其中一些句子给出了句子注释错误

问题描述

我的句子注释有问题

我尝试打破对句子的评论,然后为每个句子添加 pos 标签。但它没有用。

review=as.String(servqual$Review_Text[186])
review_split=str_split(review,"[:punct:]")

for (l in 1:(lengths(review_split)-1)) 
{

  string1=as.String(review_split[[1]][l])
  sent_token_annotator=Maxent_Sent_Token_Annotator()
  word_token_annotator=Maxent_Word_Token_Annotator()
  annotate_word=annotate(string1,list(sent_token_annotator,word_token_annotator))
  pos_tag_annotator=Maxent_POS_Tag_Annotator()
  annotate_pos=annotate(string1,pos_tag_annotator,annotate_word)
  subset_word=subset(annotate_pos,type=="word")
  tags_word=sapply(subset_word$features,'[[',"POS")

  s_word_tag=as.String(sprintf("%s%s%s",string1[subset_word],"/",tags_word))
  review_split[[1]][l]=str_replace_all(s_word_tag,"\n"," ")

}

e(s, a) 中的错误:未找到句子标记注释。
traceback()
6: stop("找不到句子标记注释")
5: e(s, a)
4: paste(y$id, y$type, y$start, y$end, sep = "\r")
3:合并。注释(a,e(s,a))
2:合并(a,e(s,a))
1:注释(string1,列表(sent_token_annotator,word_token_annotator))

我希望输出为所有句子中每个单词的 pos 标签。

标签: r

解决方案


推荐阅读