nlp - 文本语义预处理
问题描述
假设我有一个车祸数据集。每起事故都有一个使用一组摄像机和其他传感器进行的文字描述。
假设现在我只有一个相机的数据(例如正面),我想删除所有与它无关的描述句子。我认为一个基本且简单的解决方案可能是使用布尔检索系统,该系统使用一组特定的关键字来删除不需要的句子,但我也不知道这是否是一个好主意,或者它是否可以工作;有人可以建议我吗?什么样的统计数据可能对研究这个问题有用?谢谢
解决方案
正则表达式可能是一种解决方案。我创建了一个匹配单词“front”的正则表达式,不区分大小写,它搜索front,然后得到一个或多个匹配的整个句子。结果可以从开始的空白处修剪一些。(可能也可以通过一些微调来删除。)
如果您需要“front”、“rear”、“side”、“right”、“left”或其他,您可以通过一些从列表中获取值的变量来交换单词。
推荐阅读
- selenium - 如何在页面对象模型中使用 select select 选择日期
- sql - 随着时间的推移计算不同的累积存储费用?
- php - 如何将字节数组转换为pdf?
- javascript - 如何执行放置在标签href内的javascript
- azure-devops - 如何在 Azure Devops 中将 2 个任务内容合并为一个
- node.js - 我应该使用 Node v6.11.2 和 npm3.10.10 安装哪个 yeoman 版本
- android - 从 recyclerView 和 sqliteDb 中通过滑动删除项目
- r - 从矩阵中提取满足条件的行
- android - 如何管理来自 ACTION_MOVE 事件的 onTouchListener 返回值,就像我想在调用 ACTION_MOVE 事件时更改(真或假)返回值
- tsql - TSQL 将行更改为合并列