python - 快速文本使用(开始比较词向量)
问题描述
我有点惭愧我不得不问这个问题,因为我觉得我应该知道这一点。我编程时间不长,但我正在尝试将我学到的知识应用到我正在从事的项目中,这就是我遇到这个问题的方式。Fast Text 有一个单词库和相关点https://fasttext.cc/docs/en/english-vectors.html. 它用于查找单词的向量。我只想看一两个词,看看结果是什么,看看它是否对我的项目有用。他们提供了一个向量列表,然后是一个小代码块。我无法从中做出正面或反面。我得到了其中的一些,但我没有看到打印功能 - 是否将数据返回到您自己代码的不同部分?我也不确定代码块在哪里打开数据文件,通常 fname 是一个句柄,对吗?还是他们希望您在此处键入文件的路径。我也不熟悉 io,我用谷歌搜索了这个词,但没有发现任何有用的东西。这是我需要下载的东西还是它已经是python的一部分。我知道我可能有点出类拔萃,但我通过这样做学得最好,所以请不要讨厌我。
import io
def load_vectors(fname):
fin = io.open(fname, 'r', encoding='utf-8', newline='\n', errors='ignore')
n, d = map(int, fin.readline().split())
data = {}
for line in fin:
tokens = line.rstrip().split(' ')
data[tokens[0]] = map(float, tokens[1:])
return data
解决方案
尝试以下操作:
my_file_name = 'C:/path/to/file.txt' # Use the path to your file of rows of sentences
my_data = load_vectors(my_file_name) # Function will return data
print(my_data) # To see the output
推荐阅读
- python - Python OpenCV 创建带有视频帧的地图
- c# - Mongodb C# - 如何按多个字段分组(聚合)
- linux - Docker 没有启动,因为服务器上没有空间
- python-3.x - 如何在 PySimpleGUI 中重置 FileBrowse 或将 FileBrowse 设置为给定路径?
- git - 如何删除 git commit?
- python - 如果用户输入在列表中,如何从列表中删除元素?
- flutter - Flutter 如何将模型对象转换为另一个模型以将其保存到 HIVE
- reactjs - Apex 图表 - 限制缩小
- python - 如何在 Python 代码中从 Visual SFM 读取 .mat 文件?
- android - 通过 fetch、XHR 和 axios 在 React Native 中上传文件在 Android 上失败,但在 iOS 上有效