首页 > 解决方案 > 在 SEC 网站上找不到引用的 R 文件?

问题描述

我试图了解在此处找到的 2020q1 数据集:https ://www.sec.gov/dera/data/financial-statement-data-sets.html ,并使用 2020q1 文件夹中的参考文档作为“自述文件” “ 文件。参考文档指定在 Presentation (pre) 数据集中,“report”字段是一个数字(整数),其“值是指 EDGAR 网站上发布的“R 文件”。经过大量搜索后,我没有找到这样的文件,也没有办法解释“报告”字段和所有相关数据。如果可能,请链接到相应的 R 文件或引导我朝着正确的方向寻求帮助。谢谢!

标签: databasedataframesec

解决方案


所以先澄清一点,这也让我很困惑,有问题的“R文件”不是R语言的脚本文件。相反,它似乎只是一个包含格式化数据的报告文件。

因此,在深入研究自述文件后,我在 SUB.txt 数据的描述中找到了以下详细信息。

注意:要访问给定文件的完整提交文件,请参阅 SEC EDGAR 网站。SEC 网站文件夹 HTTP(s)://www.sec.gov/Archives/edgar/data/{cik}/{accession}/ 将始终包含给定提交的所有数据集。要将文件夹地址组装到 SUB 数据集中引用的任何文件,只需将 {cik} 替换为 cik 字段,并将 {accession} 替换为 adsh 字段(删除破折号后)。以下示例 SQL 查询提供了一个示例,说明如何为 SUB 数据集中包含的文件生成地址列表:

· 选择名称、形式、句号、'http(s)://www.sec.gov/Archives/edgar/data/' + ltrim(str(cik,10))+'/' + replace(adsh,'- ','')+'/'+instance as url from SUBM subm order by period desc, name

因此,看起来我们必须将每个“adsh”提交 ID 与“cik”公司 ID 关联起来,才能获得我们正在寻找的链接。

对 pre.txt 的第一个条目执行此操作,我们得到一个 adsh 值“0001032208-20-000006”。我只是用记事本搜索了 sub.txt 并找到了属于“SEMPRA ENERGY”的“1032208”的关联cik。因此,我们生成以下链接:http ://www.sec.gov/Archives/edgar/data/1032208/000103220820000006

从那里,我们找到与给定提交相关的文件目录。里面是一个以“R”为前缀的文件集合。只需单击它们将在您的浏览器中打开它们,使用“报告”和“行”字段,然后我们可以关联我们想要的文件。请注意,我们可以在生成的链接末尾添加“ /R{number}.htm ”以查找此文件夹以获取给定的报告编号。

如果您知道要查找的内容,则使用“ctr+f”查找功能手动执行此操作应该没问题。否则,您可能需要在 excel 中打开这些文档来为您生成链接。


推荐阅读