Temos um servidor RabbitMQ que funciona corretamente por um tempo até começar a configurar e desativar alarmes de memória para frente e para trás:

380 =INFO REPORT==== 25-Oct-2021::17:46:33 ===
381 vm_memory_high_watermark set. Memory used:3437756080 allowed:3338231808
382 
383 =WARNING REPORT==== 25-Oct-2021::17:46:33 ===
384 memory resource limit alarm set on node '[email protected]'.
385 
386 **********************************************************
387 *** Publishers will be blocked until this alarm clears ***
388 **********************************************************
389 
390 =INFO REPORT==== 25-Oct-2021::17:46:36 ===
391 vm_memory_high_watermark clear. Memory used:1541409584 allowed:3338231808
392 
393 =WARNING REPORT==== 25-Oct-2021::17:46:36 ===
394 memory resource limit alarm cleared on node '[email protected]'
395 
396 =WARNING REPORT==== 25-Oct-2021::17:46:36 ===
397 memory resource limit alarm cleared across the cluster
398 
399 =INFO REPORT==== 25-Oct-2021::17:46:42 ===
400 vm_memory_high_watermark set. Memory used:4035019336 allowed:3338231808
401 
402 =WARNING REPORT==== 25-Oct-2021::17:46:42 ===
403 memory resource limit alarm set on node '[email protected]'.
404 
405 **********************************************************
406 *** Publishers will be blocked until this alarm clears ***
407 **********************************************************
408 
409 =INFO REPORT==== 25-Oct-2021::17:46:45 ===
410 vm_memory_high_watermark clear. Memory used:1786022776 allowed:3338231808

Ele faz isso várias vezes e os saltos são sempre cerca de 2,5 GB ou a memória usada.

Até que comece a fazer o mesmo com o espaço em disco

456 =INFO REPORT==== 25-Oct-2021::18:15:35 ===
457 Free disk space is insufficient. Free bytes: 44498944. Limit: 50000000
458 
459 =WARNING REPORT==== 25-Oct-2021::18:15:35 ===
460 disk resource limit alarm set on node '[email protected]'.
461 
462 **********************************************************
463 *** Publishers will be blocked until this alarm clears ***
464 **********************************************************
465 
466 =INFO REPORT==== 25-Oct-2021::18:16:05 ===
467 Free disk space is sufficient. Free bytes: 8649433088. Limit: 50000000
468 
469 =WARNING REPORT==== 25-Oct-2021::18:16:05 ===
470 disk resource limit alarm cleared on node '[email protected]'
471 
472 =WARNING REPORT==== 25-Oct-2021::18:16:05 ===
473 disk resource limit alarm cleared across the cluster
474 
475 =INFO REPORT==== 25-Oct-2021::18:18:17 ===
476 Free disk space is insufficient. Free bytes: 46092288. Limit: 50000000
477 
478 =WARNING REPORT==== 25-Oct-2021::18:18:17 ===
479 disk resource limit alarm set on node '[email protected]'.
480 
481 **********************************************************
482 *** Publishers will be blocked until this alarm clears ***
483 **********************************************************
484 
485 =INFO REPORT==== 25-Oct-2021::18:19:07 ===
486 Free disk space is sufficient. Free bytes: 2646163456. Limit: 50000000
487 
488 =WARNING REPORT==== 25-Oct-2021::18:19:07 ===
489 disk resource limit alarm cleared on node '[email protected]'
490 
491 =WARNING REPORT==== 25-Oct-2021::18:19:07 ===
492 disk resource limit alarm cleared across the cluster
493 
494 =INFO REPORT==== 25-Oct-2021::18:40:51 ===
495 Free disk space is insufficient. Free bytes: 49758208. Limit: 50000000
496 
497 =WARNING REPORT==== 25-Oct-2021::18:40:51 ===
498 disk resource limit alarm set on node '[email protected]'.
499 
500 **********************************************************
501 *** Publishers will be blocked until this alarm clears ***
502 **********************************************************

E o salto no espaço em disco vai de gigabytes de espaço livre em disco para menos de 50 megabytes

E então ele trava. Tentar reiniciar o banco de dados neste estado fará com que o RabbitMQ tente iniciar e despejará todo o banco de dados no arquivo de log, fazendo com que o arquivo de log vá de cerca de 600 linhas para mais de 19000000 (sim, dezenove milhões).

Estou tendo problemas para descobrir o que está causando esse comportamento, porque quando eu faço

df -h

Durante o comportamento, nenhum dos discos está cheio.

Não sou um especialista em RabbitMQ, portanto, minhas perguntas são:

1 - O RabbitMQ grava no disco se ele tiver muita memória RAM?

2 - Onde o RabbitMQ escreve? É possível que os 50 MB estejam se referindo ao seu espaço gravável?

3 - Se você já encontrou um problema semelhante, o que fez para corrigi-lo?

Por enquanto, adicionei espaço de troca na máquina, conforme mencionado, para habilitá-lo na documentação de memória do RabbitMQ: https://www.rabbitmq.com/memory.html

Eu tive que colocar o servidor de volta no caminho certo por enquanto, mas não tenho como confirmar que isso resolverá o problema até que ele apareça novamente.

Obrigado pelo seu tempo.

no answer