เราเห็นปัญหาแปลกๆ ในการใช้ Azure Loadbancer กับ AKS

เรามีเว็บไซต์ที่ยอมรับการเชื่อมต่อ WebSocket สิ่งนี้เริ่มจากไคลเอนต์ไปยัง AZ Loadbalancer และเข้าสู่เว็บไซต์ภายใน AKS

ในแอปทดสอบความเครียดของเรา เราสร้างการเชื่อมต่อเว็บซ็อกเก็ต 10k พวกเขาทั้งหมดเชื่อมต่อ หากเราหยุดการเชื่อมต่ออย่างไม่สง่างาม เราจะเห็นการเชื่อมต่อระหว่างตัวโหลดบาลานเซอร์และเว็บไซต์ลดลง

แต่.. จากนั้นจะเกาะติดกับหมายเลขการเชื่อมต่อแบบสุ่มประมาณ 15-20 นาทีก่อนที่การเชื่อมต่อทั้งหมดจะหายไป

เช่น: (กราฟคือโฟลว์ขาเข้าของโหลดบาลานเซอร์พร้อมเหตุการณ์แอปทดสอบที่วาดลงไป)

ใส่คำอธิบายภาพที่นี่

หากเราเรียกใช้แอปทดสอบการโหลดกับเว็บไซต์แทน โดยการข้าม AZ Loadbalancer ทั้งหมดจะทำงานตามที่คาดไว้ การฆ่าแอปทดสอบจะลดการเชื่อมต่อทั้งหมดในเว็บไซต์ทันที

Azure Loadbalancer ไม่มีการตั้งค่ามากมายขนาดนั้น เราได้ลองทั้งกับ Sticky-sessions: None และ Client IP ลักษณะการทำงานเหมือนกัน

เราได้ตรวจสอบด้วยว่าไม่มีการเชื่อมต่อไคลเอ็นต์ที่ซ่อนอยู่จากเครื่องแอปทดสอบ ปิดการใช้งานเครือข่ายอย่างสมบูรณ์ ดังนั้นจึงไม่ใช่ปัญหา

เราไม่จำเป็นต้องเชื่อมต่อซ็อกเก็ตใหม่ในแง่นั้น ลูกค้าสามารถทำการเชื่อมต่อใหม่ทั้งหมดได้หากไม่ได้เชื่อมต่อ

ความประทับใจของเราคือตัวโหลดบาลานซ์พยายามที่จะฉลาดในกรณีที่การเชื่อมต่ออาจเชื่อมต่อใหม่ในภายหลัง หากเป็นกรณีนี้ จะสามารถปิดการใช้งานใด ๆ ได้หรือไม่?

ยินดีให้คำปรึกษาทุกคำแนะนำ

no answer