首页 > 技术文章 > 机器学习:2.NPL自然语言处理

meloncodezhang 2019-09-19 20:25 原文

1. 词带的简单解释:

  每一个词出现了多少次,缺点是不知道顺序

2.seq2seq自然语言处理的核心

  RNN:

    一对一:输入一个,输出一个

    一对多:输入一个,输出多个

    多对一:输入多个,输出一个

    多对多:输入多个,输出多个

 

    原始数组:

  改变一次的数组:

  改变两次的数组:

  改变三次的数组

结果输出:

greedy decoding 避免最佳的回答方式,使用其他的解码方式

beam search decoding 从最佳回答中,选择几种方式,给出其他解决方案

二:入门自然语言处理

  基本的技能用法:

    字符串操作:1.空格处理:strip()函数默认是去重空格,而且是左右两边的空格一起去重


 

  字符串的大小转化

demo = " hello world! "

ret1 = demo.upper()
print(ret1)

HELLO WORLD! 

ret2 = demo.lower()
print(ret2)

hello world!

 

  字符串的反转

demo = " hello world! "

ret1 = demo[::-1]
print(ret1)

# 结果:!dlrow olleh 

 

  字符串子串的查找

demo = " hello world! "

ret1 = demo.find("h")
print(ret1)
# 结果:1 返回索引

 

推荐阅读