tensorflow - 猜测收据的类别
问题描述
我们有大量收据(超过 2 万张)并希望对这些收据进行分类。一张收据可以属于一个或多个类别。我们目前有超过 500 个类别。
IE
- 如果收据是关于互联网付款的。然后我们的类别是“InternetService”,收据中有 ISP 信息和付款信息。
- 如果收据是关于午餐郊游的,那么我们的类别是“FoodAndBeverages”,我们有餐厅名称、食物信息和金额。
- 如果收据是关于出租车付款的,那么我们的类别是“交通”,我们有出租车公司信息、车辆、司机、位置信息和金额。
因此,除了我在上述示例中提到的类别之外,我们还有税收类别,并且大部分收据都是其中的一部分。所以每张收据可以有一个或多个类别。
所以为了猜测这个类别,我们采用了多标签分类解决方案。目前,我们将获取收据的整个文本,并使用我们拥有的收据文本和类别来训练我们的模型。
想要验证我们是否采用了正确的方法来解决这个问题。期待这里有专家的想法。
解决方案
推荐阅读
- uwp - 如何在 UWP 中从试用切换到应用内购买?
- java - Android Studio:无法删除片段
- c# - C# 使用具有不同参数的基类中的方法
- c++ - 如何在忽略 C++ 中的噪声词的同时解析用户输入?
- swift - 使intrinsicContentSize适应外部约束
- javascript - clearRect 左侧和顶部不清除
- nginx - Godaddy DNS 到 AWS EC2
- android - PHONEGAP ANDROID:仅在应用程序主屏幕 (SplashScreen) 上隐藏状态栏
- excel - 为什么我的具有相对引用的 VBA 返回不正确的引用?
- php - 无法让服务器捕获授权标头 WP Rest API