concept - 可用计算资源的分配
问题描述
我正在尝试找出问题的解决方案。我们有一些可用的计算资源可供我们使用 - 一台具有 48 GB RAM、1 1080 Ti GPU、1TB SSD 的机器。我们希望将这些资源分配给公司的项目。如何确定在给定场景中应该给予哪个项目更高的优先级。
公司收到要求为现有客户(一位尊贵的客户)提高深度学习解决方案的效率。
与此同时,它收到了另一项任务,其中涉及为潜在客户完成涉及深度学习的概念证明。
这两个任务都可能消耗所有可用资源。
硬约束 - 仅使用本地计算资源。
解决方案
一种可能性是运行Kubernetes并管理 pod。这允许您的服务器、网络、服务、数据库等虚拟化,并允许紧密打包。
您可以在本地基础设施上运行 Kubernetes。
有点陡峭的学习曲线,但可以让您完全控制。
顺便说一句,我假设这种计算资源是用于加速项目而不是生产硬件的投资。对于生产,您可能需要关注点分离。因此,在同一个硬件上打包很多可能会带来风险(当一个部门/子系统的模块行为不端时,它可能会对其他部门产生负面影响)。是的,虚拟化应该可以防止它,总的来说,它确实可以。但软件并不完美,风险也不为零。所以,请记住这一点。
阅读材料:
推荐阅读
- spring-boot - 在 Liquibase 中执行 CustomSqlChange 不起作用
- c# - 如何阻止我的 .NET CORE API 自定义中间件被忽略
- visual-studio-code - 代码解释是否有任何 VS Code 扩展?
- apache-kafka - Kafka的动态消息编排流引擎
- javascript - 如何从映射的多个复选框中选择一个复选框 React.js
- java - 我已经用不同的方法实现了相同的功能,谁能告诉我为什么我的最后一个功能不打印错误?
- azure - 在 azure sentinel 工作簿中向下钻取
- c - 使用结构和函数时在 C 中初始化字符数组
- python-3.x - pyplot 子图因 seaborn 而失败
- c# - 枚举列表的搜索结果