r - R - 查找所有可能的组合拆分词
问题描述
我有一个函数可以从字符串中提取所有有意义的单词。在此之后,我想从这些单词中创建所有可能的句子。
例如:
MyString <- "temelproblem"
与我的函数拆分后,我得到了这样的数据框;
Data <- data.frame(
myword = c("te","tem","teme","temel","em","eme","emel","me","mel","el","pr","problem","em"),
start = c(1, 1, 1, 1, 2, 2, 2, 3, 3, 4, 6, 6, 11),
finish = c(2, 3, 4, 5, 3, 4, 5, 4, 5, 5, 7, 12, 12)
)
> Data
myword start finish
1 te 1 2
2 tem 1 3
3 teme 1 4
4 temel 1 5
5 em 2 3
6 eme 2 4
7 emel 2 5
8 me 3 4
9 mel 3 5
10 el 4 5
11 pr 6 7
12 problem 6 12
13 em 11 12
我需要所有可能的组合,规则是;下一个单词应该在前一个单词完成之后开始。我可以从这个样本中得到;
"tem" "el" "problem"
"temel" "problem"
我将不胜感激指导思想...
解决方案
推荐阅读
- javascript - Firebase 身份验证错误 - 每当我尝试使用谷歌登录时
- python - 如何从python中字符串类型的字典键中获取整数?
- python - Skit-learn with Spacy parallelization error with RandomizedSearchCV
- javascript - How to get values from two textboxes and display on third on button click using Javascript?
- assembly - How to disassemble fasm-generated binary?
- c++ - 是防止部分读取原子存储所必需的“memory_order_relaxed”
- mysql - Use subgroups in databases
- r - 从 R 中不可用的 URL 加载数据集,仅从本地加载:设置问题?
- angular - Creating volume in custom Docker image on GCP causing error
- javascript - 由按钮控制的可折叠 HTML 表格,带有多个具有不同数据集的子表格