tensorflow - 从 3D 张量中提取某个标记的嵌入
问题描述
每个训练示例包含一个句子(一个标记列表)、一个起始标记索引和一个结束标记索引。开始和结束索引突出显示句子中的一些单词。标签为 True 或 False,表示突出显示的单词是否“有趣”。
例如,“新闻”是此示例中突出显示的单词。
tokens=["This", "news", "is", "sad"], start=1, end=2, label=1
这是我的模型设置。句子被馈送到预训练的 bert 层,该层返回一个 3D 张量,其中包含每个句子中每个标记的嵌入。
我想从 3D 张量中提取每个示例的高亮词的嵌入并获得它们的平均值,这样我就可以将它提供给密集层,我应该怎么做?假设我已经有了 3D 张量。
我正在使用 tensorflow 2.0 提供的 keras API。我是 tensorflow 的新手,所以非常感谢一个具体的例子。
谢谢!
解决方案
推荐阅读
- html - 如何添加网站用户可以添加图钉的地图
- reactjs - 使用 Webpack 和 Typescript 创建 React 组件库,但 WP 一直在捆绑 React
- git-bash - mkdir:无法创建目录“示例”:权限被拒绝
- ruby-on-rails - 验证rails模型中数组的长度
- sqlite - 用 SELECT 覆盖数据库
- python - 我找到了错误的原因,但我不知道如何解决
- pytorch - ONNX 和 pytorch 的输出不同
- selenium - 在具有 Background 、 @Before 和 @After 钩子的功能文件中,@Before 甚至在场景开始之前执行
- python - 使用python在视频流上绘制边界框
- mysql - 将千位mysql 5.7 数据库升级到最新的8.0 版本