vespa - 无法在多个实例上设置 Vespa 容器
问题描述
我有两个实例,我必须在 docker 容器上部署 Vespa。一个容器将充当配置集群、容器集群和内容集群,而另一个容器将充当容器集群和内容集群。
应用程序的 host.xml 文件如下所示:
<hosts>
<host name="vespa-master">
<alias>admin0</alias>
</host>
<host name="vespa-searcher">
<alias>searcher1</alias>
</host>
</hosts>
应用程序的 services.xml 如下所示:
<services version="1.0">
<admin version="2.0">
<adminserver hostalias="admin0"/>
<configservers>
<configserver hostalias="admin0"/>
</configservers>
</admin>
<container id="container" version="1.0">
<document-api />
<search/>
<nodes>
<node hostalias="admin0"/>
<node hostalias="searcher1"/>
</nodes>
</container>
<content id="content" version="1.0">
<documents>
<!--version 1 docs starts-->
<document type="document_name" mode="index" />
<!--version 1 docs ends-->
</documents>
<redundancy>2</redundancy>
<engine>
<proton>
<searchable-copies>1</searchable-copies>
</proton>
</engine>
<group name="top-group">
<distribution partitions="*"/>
<group name="group0" distribution-key="0">
<node hostalias="admin0" distribution-key="0"/>
<node hostalias="searcher1" distribution-key="1"/>
</group>
</group>
</content>
</services>
我正在使用 docker swarm 在两个实例之间建立覆盖网络连接。其命令如下所示:
docker network create --driver=overlay --subnet=<IP>/24 vespa_conn --attachable
在我使用的第一个实例上创建容器的命令是:
docker run --detach --hostname vespa-master --network=vespa_conn <other arguments> --env VESPA_CONFIGSERVERS=vespa-master vespaengine/vespa
在第二个实例上创建容器的命令是:
docker run --detach --hostname vespa-searcher --network=vespa_conn <other arguments> --env VESPA_CONFIGSERVERS=vespa-master vespaengine/vespa
这些命令的参考来自这个页面。
在创建和部署我的应用程序后,第二个容器上的节点状态没有显示出来。
vespa-get-cluster-state
Cluster content:
content/distributor/0: up
content/distributor/1: down
content/storage/0: up
content/storage/1: down
我发现的问题是:
content/distributor/0: Failed to fetch json: Connection error: socket write error
admin/cluster-controllers/0: Failed to fetch json: Connection error: socket write error
admin/slobrok.0: Failed to fetch json: Connection error: socket write error
admin/metrics/vespa-master: Failed to fetch json: Connection error: socket write error
hosts/vespa-master/sentinel: Failed to fetch json: Connection error: socket write error
hosts/vespa-master/logd: Failed to fetch json: Connection error: socket write error
[generation not up-to-date ignored]
container/container.1: Failed to fetch json: Connection error: socket write error
hosts/vespa-searcher/logd: Failed to fetch json: Connection error: socket write error
[generation not up-to-date ignored]
经过一些尝试。我通过
'override VESPA_CONFIGSERVERS vespa-master' in /opt/vespa/conf/vespa/default-env.txt
在第二个容器中添加:文件然后重新启动服务来解决了这个问题。
有没有更好的方法来做到这一点,这样我就不必手动更新 default-env.txt 文件?
此外,当我在页面中指定的 docker run 命令行的末尾添加“configserver”或“services”时,我收到了这个错误:
[2020-10-15 11:36:13.782540] 1935/8285 (vespa-model-inspect.config.frt.frtconnection) warning: Connection to tcp/localhost:19090 failed or timed out
[2020-10-15 11:36:13.782631] 1935/8285 (vespa-model-inspect.config.frt.frtconnection) warning: FRT Connection tcp/localhost:19090 suspended until 2020-10-15 11:36:23 GMT
[2020-10-15 11:36:13.782647] 1935/8285 (vespa-model-inspect.config.frt.frtconfigagent) info: Error response or no response from config server (key: name=model,namespace=cloud.config,configId=admin/model) (errcode=104, validresponse:0), trying again in 6000 milliseconds
这个错误的原因是什么,我在这里做错了吗?
解决方案
要使其正常工作,您应该避免在网络名称中使用下划线,使用配置服务器的完全限定名称并命名容器以使 DNS 正常工作。
在 manager swarm 主机上创建网络:
docker network create --driver=overlay --attachable vespa-net
启动一个同时运行配置服务器和服务的 Vespa 容器(入口点没有参数):
docker run --detach --name vespa-master --hostname vespa-master.vespa-net --network=vespa-net --env VESPA_CONFIGSERVERS=vespa-master.vespa-net vespaengine/vespa
启动仅运行服务的 Vespa 容器(入口点的服务参数):
docker run --detach --name vespa-searcher --hostname vespa-searcher.vespa-net --network=vespa-net --env VESPA_CONFIGSERVERS=vespa-master.vespa-net vespaengine/vespa services
然后使用 hosts.xml 中的完全限定名称:
<hosts>
<host name="vespa-master.vespa-net">
<alias>admin0</alias>
</host>
<host name="vespa-searcher.vespa-net">
<alias>searcher1</alias>
</host>
</hosts>
通过部署未修改的 services.xml,我得到以下状态:
[root@vespa-master /]# vespa-get-cluster-state
Cluster content:
content/distributor/0: up
content/distributor/1: up
content/storage/0: up
content/storage/1: up
推荐阅读
- excel - 如何通过 VBA 过滤一个项目的切片器?
- excel - 从 Excel VBA-检查访问表是否存在/如果不存在,则创建/复制
- r - 使用 ONE x 变量将 Y 值下降到所需值
- python - 如何在 web 上的 python 烧瓶中从 AWS s3 读取文件
- python - 扁平化 Marshallow / SQLAlchemy Schema 上的数据
- mysql - 恢复 PHPMyAdmin 备份时如何更正“无法从发送到 GEOMETRY 字段的数据中获取几何对象”?
- user-interface - JavaFX:将一些复杂的动画包含到 GUI 中的最佳方式?
- javascript - 画圆 Jimp JavaScript
- ssl - 是否在没有 LDAP 的情况下连接到 ssl
- django - Docker Compose,Django:角色“_”不存在