android - 使用谷歌云视觉OCR后如何解析名片中的姓名,电话号码电子邮件?安卓
问题描述
我终于通过使用google cloud vision API (OCR) 成功获得了名片内容。我的问题是,我将所有内容都存储在 TextView 中,我怎样才能从中获取姓名和电话号码以及电子邮件?有什么想法可以从字符串中获取我想要的最重要的细节吗?提前致谢。
解决方案
我了解到您希望使用 Google Cloud Vision API 从卡片中提取和识别某些数据。
您已经能够通过 OCR 获取数据,但问题在于如何识别这些数据,因为卡片的样式和结构数量不限。
正如评论中提到的@Inga,您可以尝试使用正则表达式,尽管您想要考虑的样式和结构越多,这可能会变得越难。
因此,我还建议您考虑使用机器学习方法。
例如,看看这篇关于Parsing Structured Documents with Custom Entity Extraction的文章。它使用 Google Cloud Vision API 来读取数据,和你一样;但随后它使用Google Cloud Natural Language API通过实体提取来识别某些元素。
查看自然语言实体的描述,了解您可以使用此功能识别哪些类型的元素,例如姓名、电话号码和地址。
同样,如果此功能与您需要识别的所有数据都不匹配,您还可以考虑为要提取的特定类型的数据创建和训练自定义 AutoML 自然语言模型的选项。前面提到的文章也利用它来识别餐厅菜单中的特定数据。
您还可以考虑查看Google Cloud Document AI,它还提供面向文档分析的 OCR 功能。
推荐阅读
- python - python嵌套列表访问在循环中给出错误
- xml - XML-TEI 如何调用两个属性
- javascript - 如何捕获 Google recaptchaV3 Promise Timeout?
- html - CSS网格中的Safari图像高度
- r - 在 R 中随机抽取地理空间数据的最佳方法
- python - 将networkx转换为igraph python但保留networkx图的节点ID
- r - 在 R 中将调用的 OSM 数据从 SF 转换为 Shapefile 的最佳方法
- python - Python Unicode 问题 - 如何将文本文件用作电子邮件正文?
- c# - 使用 XmlReader.Create(....) 时如何修复文件名或路径的外部控制
- python - 给定一个整数的单链表,一次反转链表“k”的节点并返回其修改后的列表