python - 有没有办法在 python 中获取单词中的字符数?
问题描述
我想获得单词中的字符数。单词所在的特征函数参数必须是 np.array。特征函数应该返回形状(n,29)的特征矩阵。以下代码返回数据帧。有没有办法更有效地做到这一点。
def feature(a):
chars = "abcdefghijklmnopqrstuvwxyzäö-"
charlist = []
for i in chars:
charlist.append(i)
#test if char is in the word and append to list1
list1 = []
for i in charlist:
for j in a:
list1.append(len(re.findall(i, j)))
#divide list to chunks by char
l = np.array_split(np.array(list1),29)
arr = np.array(l)
arr = arr.T
df = pd.DataFrame(arr, index = a, columns = charlist)
return df
rndwords = []
for i in range(6):
rndwords.append(''.join(random.choices(string.ascii_lowercase, k = 5)) )
array = np.asarray(rndwords, dtype=np.str)
feature(array)
解决方案
我不确定我在这里是否正确理解了您的问题,但是您是否只是在给定单词 for 中的字符数之后chars
?
如果是这样,它可能就像length = len(chars)
. 这当然只会给你单词的长度,但是当你在字符之后,这就是你想要的......
你可能想在你的问题中更清楚一点。如果要计算所有字母:
chars = "abcdefghijklmnopqrstuvwxyzäö-"
for i in chars:
count += 1
current += i
if current == chars :
print(count)
推荐阅读
- typescript - vue 3 typescript Uncaught (in promise) TypeError: this.$on is not a function
- scipy - 有没有办法使用 scipy.interpolate 进行 1d 样条插值,边界条件指定远离数据?
- python - 无法在我的虚拟机上使用 Selenium Webdriver 进行身份验证和登录
- python - 从数据框列表创建 3d 曲面图
- keras - 我的基本事实是一系列灰度图像
- javascript - MUI 的 ListItemText 组件中的目标跨度以通过 useStyle 挂钩应用样式
- android - 离子电容器android模拟器使控制台日志在终端中可见
- javascript - 将 Prev Next 控件添加到 Carousel
- python - 将 Python 解释器嵌入到 C 程序中时,如何选择使用哪个 Python 解释器?
- python - 使用 python 将 PDF 插入 Postgres 数据库并检索它