deep-learning - 当我们进行微调任务时,Bert 如何改变最大序列长度?
问题描述
假设我们使用最大序列长度为 128 的预训练模型。<br /> 现在我更改配置文件,将最大序列长度从 128 减少到 64。<br /> 接下来,进行微调任务,例如 smiple 分类任务。<br />我的问题是,在微调过程中,模型的维度会改变吗?因为它有很多部分与最大序列长度相关。
当我们更改最大序列长度进行微调时,bert 是如何解决这个问题的。
解决方案
推荐阅读
- javascript - 简单的轮播滑块:将类删除到单击的元素,并将其添加到下一个兄弟元素
- python - 如何在 Django 中的两个视图之间传递两个参数?
- python - 如何使用数据透视表显示多列之间常见值的百分比?
- docker - 如何使用导出命令通过 docker exec 设置环境变量?
- javascript - 如何判断 Blazor 何时完成渲染 DOM 元素?
- swift - 如何从 Swift 中的另一个函数更新 Stepper 值
- html - 线性梯度干扰背景图像
- dockerfile - dockerfile中的条件?
- javascript - 转换 flex/bison 解析器以在浏览器中使用
- java - 使用 for 循环在数组中搜索名称