首页 > 解决方案 > 使用谷歌云视觉OCR后如何解析名片中的姓名,电话号码电子邮件?安卓

问题描述

我终于通过使用google cloud vision API (OCR) 成功获得了名片内容。我的问题是,我将所有内容都存储在 TextView 中,我怎样才能从中获取姓名和电话号码以及电子邮件?有什么想法可以从字符串中获取我想要的最重要的细节吗?提前致谢。

标签: androidparsinggoogle-cloud-vision

解决方案


我了解到您希望使用 Google Cloud Vision API 从卡片中提取和识别某些数据。

您已经能够通过 OCR 获取数据,但问题在于如何识别这些数据,因为卡片的样式和结构数量不限。

正如评论中提到的@Inga,您可以尝试使用正则表达式,尽管您想要考虑的样式和结构越多,这可能会变得越难。

因此,我还建议您考虑使用机器学习方法。

例如,看看这篇关于Parsing Structured Documents with Custom Entity Extraction的文章。它使用 Google Cloud Vision API 来读取数据,和你一样;但随后它使用Google Cloud Natural Language API通过实体提取来识别某些元素。

查看自然语言实体的描述,了解您可以使用此功能识别哪些类型的元素,例如姓名、电话号码和地址。

同样,如果此功能与您需要识别的所有数据都不匹配,您还可以考虑为要提取的特定类型的数据创建和训练自定义 AutoML 自然语言模型的选项。前面提到的文章也利用它来识别餐厅菜单中的特定数据。

您还可以考虑查看Google Cloud Document AI,它还提供面向文档分析的 OCR 功能。


推荐阅读