首页 > 解决方案 > 如何将 txt 文件处理成监督学习训练数据?

问题描述

我从 Scratch https://nnfs.io购买了神经网络,这些概念很有意义,数学变得越来越容易。在尝试了解如何使用真实数据进行监督学习的第一步时,大多数(如果现在全部)示例都是非二进制的,太复杂了,它们使用计算机视觉或不显示数据。

它们要么是具有多个 [0.23,0.24,0.19] 等的广义(虹膜)数据集,要么是不适用于我的用例的计算机视觉示例。

作为一名学生,我试图将我熟悉的事物(多项选择测验)联系起来,并将其扩展到我不知道的事物(监督学习)

从简单的多项选择测验中创建监督学习模型是可能的还是一个很好的例子。

示例训练数据

  1. 内布拉斯加州的首府是什么?A. 特伦顿 B. 林肯 C. 普罗维登斯 D. 博伊西

示例答案 B

这个训练集会像这样吗?

  1. 输入“内布拉斯加州的首都是什么” = [0,0,0,0] 或 Nebraska_Capital = [0,0,0,0]
  2. 输出 = [0,1,0,0]

现在我有数百个问题和答案可以在这里使用https://github.com/shashankch292/Random-Quiz-Generator。如何将这些问题文件夹转移到训练数据中?

这会是监督学习来教授模型地理学的一个很好的例子吗?随着时间的推移,我可以添加更多数据,如纬度和经度。也许每个城市的顶级食物是什么等。我想从简单的开始,逐步向上。

标签: supervised-learning

解决方案


推荐阅读