Cometeu um erro na configuração do fantoche e, inadvertidamente, permitiu que o puppet atualizasse um cluster do Kubernetes para 1.13.0. Uma vez que o k8 quer um processo de atualização um tanto envolvido, a coisa toda foi bastante malfeita.

Depois de executar o processo manualmente e obter todos os nós afetados e o mestre para a mesma versão, parece que o kubelet (e, portanto, o servidor API) será executado por 20-30 minutos e, em seguida, parará de responder.

À medida que começa a ficar infeliz, o log começa a ver mais entradas como estas:

level=error msg="Error running exec in container: rpc error: code = 2 desc = oci runtime error: exec failed: container_linux.go:247: starting container process caused \"process_linux.go:110: decoding init error from pipe caused \\"read parent: connection reset by peer\\"\"\n"

e

file.go:182] Not recursing into manifest path "/etc/kubernetes/manifests/<path>"

com várias entradas de namespace para o caminho . Esse ciclo se repete a cada 20 segundos até que o kubelet pare de responder. Se eu reiniciar manualmente o kubelet, ele funciona por um tempo e começa o ciclo novamente.

Perdi algo no processo de atualização?


Editar:

[[email protected] ~]# rpm -qa | grep docker
docker-client-1.13.1-84.git07f3374.el7.centos.x86_64
docker-1.13.1-84.git07f3374.el7.centos.x86_64
docker-common-1.13.1-84.git07f3374.el7.centos.x86_64
answer

A primeira mensagem de erro parece muito provavelmente esta .

Talvez você possa verificar se esses nós afetados estão executando uma janela de encaixe de versão recente.