python - Python中多变量、多类型RNN的实现
问题描述
我有一个数据集,其中包含具有以下布局/架构的项目:
{
words: "Hi! How are you? My name is Helennastica",
ratio: 0.32,
importantNum: 382,
wordArray: ["dog", "cat", "friend"],
isItCorrect: false,
type: 2
}
我有很多不同类型的数据,包括:
- 数组(仅限一种类型,例如字符串数组或数字数组,绝不是两者)
- 布尔值
- 具有固定最小值/最大值的数字(即在 0 到 1 的范围内)
- 无限整数(任何整数 -∞ 到 ∞)
- 字符串,带有一些字典,一些新词
任务是创建一个 RNN(嗯,一般来说,一个可以在给定额外数据位而不是重新处理所有数据时快速重新训练的系统 - 我认为RNN 是最好的选择;参见下面的推理),它可以使用所有这些因素将任何数据集分类为 4 个类别之一 -type
在上面的示例中由键标记,数字 0-3。
我有一组上述格式的示例(提供了答案),并且我有一个充满未分类示例的数据库。我的目的是能够在该集合上运行 ML 模型,并将所有这些模型分类。我需要能够快速重新训练的原因是反馈功能:如果 AI 出现问题,任何用户都可以报告它,在这种情况下,特定的 JSON 将被添加到数据集中。显然,为了增加一个额外的 JSON 而必须重新训练 1000 多个 JSON 需要很长时间——如果我没记错的话,RNN 可以解决这个问题。
我已经找到了很多可能的用例,但是我花了几个小时浏览 Github 试图找到一个实现,或者一些 Tensorflow 模块/插件来简化/复制,但无济于事。
我认为这使用 Tensorflow 不会太难,而且我了解它背后的一些数学和逻辑(但没有受过正规教育,所以我可能有差距!),但不幸的是,我基本上没有使用 Tensorflow/任何其他的经验ML 框架(除了一些其他项目的复制粘贴代码)。如果有人能以 Github repo/Python 框架的形式为我指明正确的方向,或者甚至编写一些演示代码来帮助解决这个问题,将不胜感激。如果您只是要纠正我的一些技术知识/告诉我哪里出了严重的错误,我会很感激您的反馈(只需将其作为评论留下)。
提前致谢!
解决方案
推荐阅读
- php - 我需要使用 pdf 导出选项报告 Laravel 包
- sapui5 - 尽管在 XML 视图中正确分配了格式化程序功能
- java - TestRestTemplate HttpHostConnectException:连接到 localhost:8082 [localhost/127.0.0.1] 失败:连接被拒绝
- javascript - 将八进制或十进制数转换为十进制字符串
- powershell - Powershell:需要获取事件查看器日志
- php - 如何使用 fetch 将数据发布到 functions.php
- excel - Excel VBA通过excel电源查询使用动态文件路径自动更新表单图像
- java - ExpoPlayer 无法获取网址
- unity3d - 检查器中 UnityAction 的序列化字段
- java - CodenameOne - 编码 HTML 字符串