bert-language-model - 函数 tf.keras.utils.get_file() 可以从平面本地文本文件而不是 URL 中提取吗?
问题描述
我正在使用 TensorflowLite Model Maker notebook 用我自己的离散主题微调 BERT Question-Answer 模型。我的主题的原始数据包含在根据 SQUAD 规范使用标签“context”和“qas”构建的 JSON 文件中。
我正在调用 tf.keras.utils.get_file() 方法来获取输入数据并将其放入 keras dataset 。默认情况下, tf.keras.utils.get_file() 采用 FilePath 和 URL。
这是我的数据加载代码:
myFile = 'volcano.json'
fullPath = os.path.abspath("./" + myFile) # or similar, depending on your scenario
train_data_path = tf.keras.utils.get_file(myFile, 'file:///'+fullPath)
validation_data_path = tf.keras.utils.get_file(myFile, 'file:///'+fullPath)
我使用file:///语法将操作系统文件转换为 URL。这不起作用。当我在加载文件后打印文件时,它不会改变。此代码无法获取文件。
有没有其他方法可以将简单的文本文件加载到 keras 数据集中?
我的下一个单元格包含我的训练和测试数据负载。
train_data = DataLoader.from_squad(train_data_path, spec, is_training=True)
validation_data = DataLoader.from_squad(validation_data_path, spec, is_training=False)
我需要将我的平面文件数据成功加载到 train_data_path 和 validation_data_path。
解决方案
推荐阅读
- php - 用于 php 的 OCR 包装器
- google-cloud-platform - Google Compute Engine - 在 GCP 和防火墙上允许端口 3389,但仍被阻止
- javascript - 当存在特定键时,Joi 至少需要一组键中的一个
- java - 为什么我必须在 Java 中的返回类型之前声明类型参数?
- javascript - 返回模型的猫鼬键未定义
- azure - ADF ARM 模板似乎不包括工厂本身
- kubernetes - 如何从 openshift 读取远程服务器上的文件
- json - Flutter 如何将嵌套的 JSON 数组插入到不同的 SQLite 表中
- python - tkinter 消息框的问题
- string - 为什么我的代码没有将字符串转换为字符?