首页 > 技术文章 > 【python】使用jieba分词并导出txt

helenlee01 2020-02-13 20:21 原文

 主要步骤:

1.读取文件

2.jieba分词

3.写入文件

完整代码如下:

import jieba
fR = open('gp.txt', 'r', encoding='UTF-8') //读取文件
sent = fR.read()
sent_list = jieba.cut(sent) //使用jieba进行分词
fW = open('gp2.txt', 'w', encoding='UTF-8') //写入文件
fW.write(' '.join(sent_list))
fR.close()
fW.close()

分词后结果:

华龙 证券 新华路 营业部 总经理 邓丹 在 接受 记者 采访 时 指出 : “ 周二 尾市 收于 2900 点 之上 , 使得 短期 虽然 积累 了 下跌 的 压力 , 但是 仍然 不大可能 深幅 调整 , 更 多 地 是 盘中 洗盘 后 继续 向上 。 就 后市 来讲 , ‘ 领先 指标 ’ 上证 50 收复 了 年线 大关 , 最高 距离 回 补缺 口 只有 17 个点 , 若能 补缺 , 对 上证指数 也 有 正面 的 影响 。 而 单独 就 上证指数 来讲 , 后面 需要 关注 的 压力 位 , 一个 是 运行 到 2924 点 的 500 天线 , 其次 是 前期 提到 的 2934 点 , 然后 是 2955 点 缺口 上 沿 , 最终 要 注意 120 周线 在 2970 点 附近 的 重压 区 。 总之 , 连续 收阳尚 不能 等同于 牛市 , 不过 上证指数 短期 形势 依然 不差 , 只是 震荡 会 逐渐 加剧 , 涨速 将 慢慢 放缓 。 投资者 在 操作 上 , 关注 底部 躁动 的 资源 类 蓝筹股 和 重启 升势 且 完成 回 踩 的 二线 消费 股 。 ” 

推荐阅读