java - 从公司名称中查找公司部门/行业
问题描述
我正在做一个项目,我需要在给定公司名称的情况下找到公司的行业,例如:
对于亚马逊来说,行业是云计算、人工智能、消费电子和电子商务(来源,wiki)。
我想以编程方式获取这些行业名称(无需通过 wiki 页面爬行),我尝试如下:
- 从这里下载所有 SIC 代码
- 尝试使用公司描述和这些名称进行智能(标记化)搜索
- 收集前 3 场最接近的比赛
然而,它给出了如此多的误报。有什么方法可以让我以编程方式从名称中获取公司部门/行业?
解决方案
另一个有用的资源是公司注册的专利——专利的内容可能比公司网站更具启发性。
推荐阅读
- sql - BigQuery SQL 查询优化
- node.js - Nunjucks:如何使用自定义扩展绕过自动转义?
- python - rpyc服务器调用客户端方法
- reactjs - 在 React 中显示初始加载的加载屏幕
- python - pandas - 如何将聚合数据转换为字典
- java - 当我单击回收站视图中的项目时,我可以使用导航抽屉作为下拉菜单吗?
- php - 错误请求 400。jQuery Ajax 数据 serialize() 或 json 应该是什么样子?
- metal - 在 GPU 上评估 CoreML 自定义层“----”时出错?
- flutter - SingleChildScrollView 不起作用?放置?
- python - 如何让我的 python 程序更快地截屏?