首页 > 解决方案 > Bert 针对语义相似性进行了微调

问题描述

我想应用微调 Bert 来计算句子之间的语义相似度。我搜索了很多网站,但我几乎没有在下游找到这个。

我刚刚找到STS benchmark。我想知道我是否可以使用 STS 基准数据集来训练微调 bert 模型,并将其应用于我的任务。合理吗?

据我所知,计算相似度的方法有很多,包括余弦相似度、皮尔逊相关度、曼哈顿距离等。语义相似度如何选择?

标签: nlpcosine-similaritypearson-correlationsentence-similarity

解决方案


此外,如果您要进行二元判断(“语义相似”是/否),BERT 实际上是使用 MRPC(Microsoft Research Paraphrase Corpus)在此任务上进行基准测试的。google github存储库https://github.com/google-research/bert包含一些对此的示例调用,请参阅句子(和句子对)分类任务部分中的 --task_name=MRPC。


推荐阅读