keras - 使用深度学习从 PDF 中提取短语
问题描述
我想教 AI 从 PDF 中提取特定的短语。例如,产品名称在文档中的某处进行了描述,人工智能必须找到并提取它。我的问题是,如果将 PDF 作为图像或提取的字符串提供更好,因为文档的结构很粗略。我希望我的问题可以理解。
也许有人也有一些想法或关键词让我开始:)
编辑:感谢 lsimmons 的提示,我找到了一种方法: https ://appliedmachinelearning.blog/2019/04/01/training-deep-learning-based-named-entity-recognition-from-scratch-disease -提取-黑客马拉松/
我将尝试此代码,当然只是使用产品名称而不是疾病。这称为“命名实体识别”,适用于遇到相同问题的每个人。我希望这行得通。
解决方案
推荐阅读
- java - Java,将 BiFunction 用于带有 parm 的 getter
- reactjs - React Mui Appbar 主题
- javascript - 如何绕过 ESLint 调用 Typescript 中未定义的 Geolocation 接口?
- python - 获取多个推文 ID 和用户名的所有回复
- python - Tesseract OCR 无法识别简单的数学符号
- php - 使用 PHP end() 将数组转换为字符串
- django - 在 django 我想从视图中更改日期
- javascript - 使用 React JS 和 Redux 过滤数据列表
- azure - 如何创建使用 azure tts 将音频发送到 Web 应用程序的 expressjs 端点?
- php - 按降序对列上的数组进行排序