기술지원 문의

Resin Clustering 관련 문의입니다.
고객문의 / 2007-02-28 17:46

온라인메일로 수신된 메일에 대한 답변을 게시판에 이전하여 등록하여 드렸습니다.

 

---------------------

 

저희가 현재 Resin 2.x  사용하고 있습니다.
그리고 모든 웹서버를 Clustering 해서 사용하고 있는데 어느날 갑자기 장애가 생겨서  장애에 대해 궁금한 것이 있습니다
.
어느날  웹서버에 장애가 발생되어 행이 걸렸습니다그런데 다른 서버들까지 영향을 미쳐서 모든 서버가 다운이 되려고 하더라구요
.
그래서 저는 이런 문제가 클러스터링 때문이라고 생각을 하는데어떤 문제이고 어떻게 하면  곳에 장애가 발생해도 다른 서버에는 영향을 주지 않을지 궁금합니다
.
답변 부탁 드리겠습니다.

[답변]Resin Clustering 관련 문의입니다.
고객문의 / 2007-02-28 18:08

안녕하세요 엔지니어팀 권용찬이라고 합니다.

 

말씀하신 클러스터링서버들 간에서 single point fault가 전체에 전파 되는 상황은 두가지 정도 추론해 볼 수 있겠습니다.

 

1. 현 클러스터 노드들이 인가되는 부하를 처리할 수준의 성능만 가진 경우

예를 들어  고객들이 10의 부하를 발생시키고 있고

문의하신 분의 서버팜의 하나의 노드(서버)가 5의 부하를 처리할 수 있다고 할 경우

peak time fault를 대응 하기 위해서는 최소한  15 이상의 부하를 처리할 수 있어야 하므로  3대의 서버가 있어야 합니다.

 

즉 문제가 있어서 3개 노드중에서 1개 노드가 정지하더라도 나머지 2개의 노드가 기존의 부하를 감당할 수 있어야 하는 것입니다. 만약 그러하지 못한 경우 하나의 서버가 문제가 생기는 즉시 다른 서버들이 과부하 상태가 되면서 문제가 전체 시스템으로 전파되는 현상이 나타납니다.

 

그리고 클러스터링 서버팜의 의 경우 하나의 서버가 정지되면 정지된 서버에 있던 세션을 다른 서버에서 접속 유지를 해주기 위해 추가적인 부하가 발생하게 되므로  이러한 문제를 더욱 가속하시킬 수 있습니다.

 

이러한 문제는 비단 Resin의 클러스터링 뿐이 아니라 DB나 LDAP 등의 서비스 서버들의 공통적인 가용성유지를 위해 고려해야 하는 상황이라고 할 수 있습니다.

 

2. Resin Clustering 버젼의 구성방법 또는 제품 자체의 문제점

현 Resin 2.x 버젼은 EOL (End Of License)되어 더이상의 페치 버젼 및 기술적인 지원을 제공해 드리지 못하고 있습니다.

 사용하시는 Resin의 정확한 마이너버젼을 알 수 는 없으나 세부적으로 해당 버젼의 결함일 수 있을 수 있으며 이러한 경우에는 별다른 해결 방안이 없으며 해볼 수 있는것은 현 2.x의 최근 버젼인 2.1.17 버젼으로 올려 보는 방법이 있을 수 있겠습니다.

  다른 문제로 혹시 Clustring 구성이 잘 못되었을 수 있겠습니다. 하지만 문의하신 분의 서버 구성을 알 수 없으므로 뭐라고 말씀드리기는 힘든 점 양해 바랍니다.

 

Q. 어떻게 하면 하나의 서버에서 발생한 장애가 다른 서버로 전파되는 것을 막을 것인가?

A. 정답은 없겠으나  위에서 말씀 드린 1의 상황(서버팜의 부하 수용능력 부족)이라면

   대안 1 -> 서버를 추가하시는 방법이 있을 수 있겠습니다.

     이 경우 Resin 2.x버젼의 라이센스 문제나 서버 신규 도입등의 여러 검토사항이 있을 수 있으므로 제품 구입처 또는 당사에 문의해 보시면 좋을 것 같습니다.

 

   대안 2 ->  또는 제공하시는 서비스가 궂이 세션 클러스터링이 필요하신 서비스이신지 고려해 보시고 반듯이 필요한 사항이 아니라면 세션클러스터링 기능은 비활성화 하는것도 한 방법입니다.

세션 복제는 사용자가 많은 사이트의 경우 그 자체로도 상당히 높은 부하를 발생시킵니다. 그러므로 이러한 부하를 제거하면 좀더 많은 사용자를 수용할 수 있도록 할 수 있겠습니다.

   세션 클러스터링은 쇼핑몰 또는 여타 돈과 관련된 사이트에서 서비스 정지시 기존 세션정보를 유지하는 것으로 서버가 빈번하게 다운되는 문제가 없는 사이트 라면 한대 정도의 서버가 정지된 경우 해당 서버에 접속된 사용자들의 세션에 대해서는 무시하는 정책을 가질 수 있습니다.    물론 이러한 것은 서비스 제공회사의 내부적인 정책이므로 숙고해 보아야 할 부분이겠습니다.

 

  대안 3 -> 만약 2.x 버젼에서 클러스터링 기능의 문제점이 있는 부분이 있다면 현 상태에서 더이상 2.x 버젼에 대한 버그처리는 불가능한 상황이므로 3.x 버젼으로의 업그레이드를 고려해 보실 수 있습니다.

 이 경우에는 3.x로 이전하기 위하여 JDK 버젼 업그레이드 기존 소스의 호환성 문제등을 추가로 검토하셔야 하므로 전문 업체와 상의 하셔서 진행 하셔야 합니다.

   기업 사이트시라면 당사 영업이나 엔지니어팀으로 문의를 주시면 필요한 사항에 대하여 좀더 심도 있는 답변을 드릴 수 있을 것 같내요

 

엔지니어팀장 : 솔인시스템(레진코리아)/801-8884/권용찬 과장

영업대표 : 솔인시스템(레진코리아)/801-8884/이세용 과장

 

보내주신 메일내용으로 추론해 볼 수 있는 사항은 이정도 입니다. 더 궁금하신 사항이 있으시면 문의 주십시요

 

감사합니다.