Failover Cluster Virtual Network Adpater

2014.10.21 15:04 | Posted by 로멘틱가이

Failover Cluster Virtual Network Adapter

 

1. Node Health 모니터링

- Node 들 사이에서 가능하지 않은 노드들을 확인한다.

- Ping이 아닌 안정적이고 보안에 강한 Request-Reply를 사용하는 Unicast를 사용한다.

- 서버들 중에 반응하지 않는 서버가 있는 경우 Recovery Action을 수행함

 

2. Failover Cluster Virtual ADapter(NetFT)

- NetFT는 Cluster에서 노드들 사이에서 모든 가능한 인터페이스를 사용하여 TCP연결을 Fault-Tolerant하는 Adapter이다.

- Cluster들은 Cluster간 통신하기 위해 여러 개의 Cluster가능한 Adapter를 사용하는 구조이다.

- Cluster를 위한 내부 NIC Teaming과 유사하다.

- NetFT는 네트워크가 실패하였을때 우선 순위에 따라 다른 네트워크로 통신 연결을 전환한다.

 

3. NetFT Virtual Adapter

- Ipconfig /all을 사용하여 Microsoft Fialover Cluster Virtual Adapter를 확인할 수 있음

- Cluster Node에서 첫번째 Physical NIC의 Mac 주소의 Hash 값을 기반으로 생성한 MAC 주소를 사용한다.

- User가 해당 설정을 Manual하게 생성할 수 없다.

- Driver는 C:\Windows\System32\Drivers\Netft.sys 이며 장치 관리자의 Network Adapter에서 Microsoft Failover Cluster Virtual Adapter로 확인할 수 있음

 

4. NetFT 아키텍처

- NDIS 6.2 miniport Virtual Adapter를 사용

- RSS 지원

- Route된 네트워크 연결을 통해 TCP와 UDP에 대한 Network Fault Tolerance를 사용

각 링크는 독립적으로 모니터링 되고 있음

- IPv4와 IPv6를 지원함

- Route Failure 감지를 구성

- Physical Adapter와 Virtual Adapter간 터널 구성(UDP / IP 사용)

- 3343 포트 사용

NetFT : UDP 3343

ClusSvc  : TCP 3343

 

5. Network Topology Manager

- Network Topology Manager는 Node 사이에 여러 개의 연결을 Subnet을 바탕으로 구분한다.

- Drive들은 Failure를 감지하고 Failover 함

 

6. NetFT Virtual Adapter Performance Filter

- Cluster 네트워크의 성능 향상

- 향상된 성능을 위해 NetFT Driver로 직접 Packet을 전달함

- Default로 Disable

Hyper-V Cluster가 아닌 경우에 대해 Enable

 

7. Cluster Communication

Cluster는 3가지 타입의 Communication을 사용함

- Network Health Monitoring

Heartbeat은 NIC의 health상태에 대한 모니터링 결과를 보 낸다.

모든 Cluster 가능 Network를 통해 보낸다.

- Intera-Cluster Communication

- Cluster에 있는 노드 사이에 Database Update와 상태 동기화에 대해 보낸다.

ex) Cluster에 새로운 Resource가 생성되면 모든 Node에 업데이트되어진다.

- 하나의 Interface를 통해 진행되어진다.

 

8. Network Bandwidth Planning

- Heartbeat

134 Bytes

Latency에 민감함

Cluster Heartbeat이 NIC 포화로 인해 블록되어지면 Cluster Membership에서 Node가 제거될 수 있다.

Badnwidth는 중요하지 않음

- Intra-Cluster Communication

File/Hyper-V Cluster에서는 안정적이지만 SQL/Exchange Cluster에서는 무거울 수 있음

Latency는 Cluster 상태 변경을 느리게 만들 수 있다.

Bandwidth는 중요하지 않음

- CSV I/O Redirection

종종 발생

Latency와 Network Performance가 Storage I/O 성능에 영향을 미치므로 중요함

QOS가 중요함

Network Bandwidth가 중요함

CSV의 Disk 연결은 SMB를 통해서 진행되어짐

 

9. CSV Networking 고려사항

- CSV 요구사항

SMB

Server, Workstation Service

NTLM

- CSV 성능 Tuning

SMB Multi Channel과 RDMA를 사용하는 경우 CSV Traffice에 이점이 있음

NetBIOS를 Disable하면 성능이 향상되어짐

Jumbo Frame으로 인한 이점은 적지만 구성하는 것을 권고함

- IF SMB Multi Channel을 사용할 수 있는 구성이 아닌 경우 NetFT 로직을 사용한다.

 

10. Cluster Heartbeat 구성

Property 

Default 

Maximum 

Description 

 SameSubnetDelay

1초 

2초 

가장 자주 Heartbeat이 보내짐 

SameSubnetThreshold 

5 heartbeat 

120 heartbeat 

NIC가 다운 되기 전 Heartbeat 누락된 갯수 

CrossSubnetDelay 

1 초 

4 초 

 서로 다른 서브넷을 통해 Heartbeat을 보냄

CrossSubnetThreshold 

5 hearbeat 

120 heartbeat 

NIC가 다운 되기 전 다른 서브넷을 통해 Heartbeat을 보냄 

- Powershell

(Get-Cluster) . SameSubnetThreshold = 10

- Windows 2012 R2의 경우 Hyper-V의 Network Failure가 변경되어짐

SameSubnetThreshold : 10

CrossSubnetThreshold : 20

 

11. Cluster 생성 동안 Heartbeat 갯수 수정

- Network가 느린 경우 Cluster 생성 시 Timeout으로 인한 오류가 발생할 수 있다.

- Registry 값을 통해 해당 값을 변경할 수 있다.

HKLM\SYSTEM\CCS\Services\ClusSvc\Parameters

DWORD

SetHeartbeatThresholdOnClusterCreate

각각의 Node에서 변경해야함

Cluster Log State Code와 Status Code

2014.04.01 20:42 | Posted by 로멘틱가이

Cluster Log 분석 시 State Code 와 Status Code의 의미

1. Status Code

net helpmsg [error_number]

error 번호가 Cluster Log에 있는 경우에 net helpmsg를 사용하여 해당 Code의 내용을 확인할 수 있습니다. 예를들어 다음 내용의 경우를 살펴보겠습니다.

388.4e8::1999/06/09-20:20:57.281 [NM] Received advice that node 2 has

failed with error 5.

5의 경우 cmd창에서 확인 결과 다음과 같습니다.

권한 이슈로 확인되어 지며 권한을 확인할 필요가 있습니다.

2. State Code

Cluster Service는 group, resource, node state, network , net interface를 GUID로 관리합니다. GUID는 registry에서 확인할 수 있으며 Log에 해당 GUID의 Resource Name이 나옵니다.

State Log는 다음과 같습니다.

클러스터 그룹 상태 코드
  • -ClusterGroupStateUnknown 1
  • 0 ClusterGroupOnline
  • 1 ClusterGroupOffline
  • 2 ClusterGroupFailed
  • 3 ClusterGroupPartialOnline
클러스터 노드 상태 코드
  • -ClusterNodeStateUnknown 1
  • 0 ClusterNodeUp
  • 1 ClusterNodeDown
  • 2 ClusterNodePaused
  • 3 ClusterNodeJoining
클러스터 리소스 상태 코드
  • -ClusterResourceStateUnknown 1
  • 0 ClusterResourceInherited
  • 1 ClusterResourceInitializing
  • 2 ClusterResourceOnline
  • 3 ClusterResourceOffline
  • 4 ClusterResourceFailed
  • 128 ClusterResourcePending
  • 129 ClusterResourceOnlinePending
  • 130 ClusterResourceOfflinePending
네트워크 상태 코드
  • -ClusterNetworkStateUnknown 1
  • 0 ClusterNetworkUnavailable
  • 1 ClusterNetworkDown
  • 2 ClusterNetworkPartitioned
  • 3 ClusterNetworkUp
네트워크 인터페이스 상태 코드
  • -ClusterNetInterfaceStateUnknown 1
  • 0 ClusterNetInterfaceUnavailable
  • 1 ClusterNetInterfaceFailed
  • 2 ClusterNetInterfaceUnreachable
  • 3 ClusterNetInterfaceUp

왜 Resource가 다른 Node로 Failover되었나?

2014.04.01 19:47 | Posted by 로멘틱가이

Cluster Cluster 운영 시 고객이 가장 많이 하는 질문은 다음과 같습니다.

“왜 Resource가 다른 node로 Failover된 거죠”

특히 Windows 2003이나 이전 버전의 경우 시간 소모가 많습니다.

그런 경우 가장 많이 처리하는 방법이 여기에 있습니다.

  • Cluster의 MPS Report를 수집합니다. 이 방법은 CSS팀으로 데이터를 보내 일차 분석하는 경우 자주 쓰입니다.
  • 모든 Node에서 Event Log를 확인합니다. 일반적으로 에러가 발생할 때(일반적으로 Event ID 1069) 부근을 바탕으로 System Event Log를 확인합니다. 그 시간과 비교하여 Application Event Log도 같이 확인합니다.(여기서 핵심은 처음에 발생한 오류가 대부분 그 주 원인입니다.)
  • Cluster Log를 확인합니다.(실력이 되면;; )

Note : Cluster Log 분석 시 시간은 GMT 기반 시간이므로 확인 시 반영하여야 합니다. Default Log Size가 8MB이므로 History가 많은 경우 Log Size를 늘려줍니다.(Cluster.exe 를 사용하여 변경 가능)

다음으로 Cluster Log와 관련하여 일반적으로 많이 나타나는 항목에 대해 알아보겠습니다. 이슈가 되는 Log는 일반적으로 ERR / Warn에서 나타납니다.

  • Status 170 : 일반적으로 해당 Resource가 사용중인 경우 발생합니다. 이것은 영구적인 예약 문제일 가능성이 높습니다. MPIO, Fibre/HBA Driver, Lower Level의 File System, Anti Virus, Quota 관리와 같은 Software, Back Program에서 발생하는 경우가 많습니다.

00000c94.000008d4::<date and time>.585 INFO Physical Disk <Disk Q:>: [DiskArb] Issuing Reserve on signature 33af636f. 00000c94.000008d4::<date and time>.616 ERR Physical Disk <Disk Q:>: [DiskArb] Reserve completed, status 170.
00000c94.000008d4::<date and time>.616 INFO Physical Disk <Disk Q:>: [DiskArb] Arbitrate returned status 170.

  • Status 1117 : ERROR_IO_DEVICE(I/O 장치 오류로 인해 요청을 수행할 수 없다.)인 경우에 발생합니다. 일반적으로 Event ID 1123을 함께 발생합니다.

000015a0.000014a8::<date and time>.511 WARN IP Address <IP Address resource name>: IP Interface 4 (address 10.101.160.65) failed LooksAlive check, status 1117, address 0x10119e0, instance 0xf74d6fb8.
000015a0.000014a8::<date and time>.511 WARN IP Address <IP Address resource name>: IP Interface 4 (address 10.101.160.65) failed IsAlive check, status 1117, address 0x10119e0, instance 0xf74d6fb8.

  • Status 5 : 일반적으로 Permission 관련 문제로 발생합니다. 일반적으로 Node간 Cluster Service Account(CSA)의 Username / Password가 맞지 않는 경우에 발생합니다. 또는 CSA 인증을 위해 통신하는 DC와의 Secure Channel이 깨진 경우에도 발생합니다. 또는 Domain GPO or Local Policy 객체 중 하나에 CSA가 적절하게 작동하기 위해 필요한 User Rights Assignment가 누락된 경우에 발생합니다.

(역자 주 : 2008 부터 CNO 개념으로 변경되어 해당 내용은 발생하지 않습니다.)

000014a0.00001460::::<date and time>.629 WARN [JOIN] JoinVersion data for sponsor <Cluster Name> is invalid, status 5.
000014a0.000017d0::::<date and time>.629 WARN [JOIN] Unable to get join version data from sponsor 10.7.47.100 using NTLM package, status 5.
000014a0.000017d0::::<date and time>.629 WARN [JOIN] JoinVersion data for sponsor 10.7.47.100 is invalid, status 5.
000014a0.00000438::::<date and time>.629 WARN [JOIN] Unable to get join version data from sponsor 192.101.2.1 using NTLM package, status 5.
000014a0.00000438::::<date and time>.629 WARN [JOIN] JoinVersion data for sponsor
192.101.2.1 is invalid, status 5.

  • 3rd Party Driver가 있는지 확인합니다. 일반적으로 NIC, Fibre/HBA, MPIO, NIC Teaming Software나 Hardware에서 서명된 Driver가 아닌 경우 문제를 일으킬 수 있습니다.

Cluster Failover와 관련하여 다음과 같은 유용한 Site가 있습니다.

Techniques for Tracking the Source of a Problem
http://www.microsoft.com/technet/prodtechnol/windows2000serv/reskit/distrib/dsdg_icl_lrwh.mspx?mfr=true


Anatomy of a Cluster Log Entry
http://www.microsoft.com/technet/prodtechnol/windows2000serv/reskit/distrib/dsdg_icl_fved.mspx?mfr=true

Interpreting the Cluster log
http://www.microsoft.com/technet/prodtechnol/windows2000serv/reskit/distrib/dsdg_icl_nnti.mspx?mfr=true

다음과 같은 Microsoft Knowledge Base가 있습니다.

286052  The meaning of state codes in the Cluster log


168801 How to turn on cluster logging in Microsoft Cluster Server

892422 Overview of event ID 1123 and event ID 1122 logging in Windows 2000-based and Windows Server 2003-based server clusters

914458 Behavior of the LooksAlive and IsAlive functions for the resources that are included in the Windows Server Clustering component of Windows Server 2003

242450 How to query the Microsoft Knowledge Base by using keywords and query words

926079 Frequently asked questions about the Microsoft Support Diagnostic Tool (MSDT)

 

해당 내용은 다음 Site의 내용을 해석한 내용입니다.

(참고 사이트 : http://blogs.technet.com/b/askcore/archive/2008/02/06/troubleshooting-cluster-logs-101-why-did-the-resources-failover-to-the-other-node.aspx)

CSV 구성방법

2012.12.06 21:54 | Posted by 로멘틱가이

이번에 소개드릴 내용은

Windows 2008 R2의 CSV 구성 방법입니다.

 

감사합니다.

TAG csv, hyper-v

Cluster 설치 필요사항 및 권한 설정

2012.08.26 03:39 | Posted by 로멘틱가이

Windows 2008 R2에 클러스터를 설치하기 위해 필요사항입니다.

 

1. Hardware, Software

- 동일한 하드웨어 버전(32bit, 64bit, Itanium)에 설치

- 동일한 OS Version

- 동일한 Service Pack과 Windows Patch

 

2. Network

- 동일한 네트워크 어댑터를 사용할 경우 동일한 통신설정(속도, 이중모드, 흐름 제어 및 미디어 유형)을 사용

- 스위치 간의 설정을 비교하여 설정에 충돌이 없는지 확인

- 클러스터 서버에서 이름 확인을 위해 DNS가 필요합니다.

- 같은 Domain에 모든 서버가 있어야 합니다. 추천하는 구성은 Member 서버 입니다.

 

3. Account

-클러스터를 처음 만들거나 클러스터에 서버를 추가할 때 해당 클러스터의 모든 서버에 대해 관리자 권한이나 사용 권한이 있는 계정으로 도메인에 로그인해야 합니다.

- 계정이 Domain Admins 계정일 필요는 없으며 각 Cluster 서버의 Administrators 그룹에 속하는 Domain Users면 됩니다. Domain Admins 계정이 아닌 경우 해당 계정은 도메인에서 컴퓨터 개체 만들기 및 모든 속성 읽기 권한을 가지고 있어야합니다.

 

권한을 추가하는 방법은 다음과 같습니다.

1. DC 서버에 접속하여 시작 -> 관리도구 -> Active Directory 사용자 및 컴퓨터를 수행합니다.

2. 보기 -> 고급 기능을 체크합니다.

3. Computers에서 마우스 오른쪽을 클릭합니다.

4. 고급을 클릭합니다.

    해당 화면에서 추가 버튼을 누릅니다.

5. 추가 화면에서 개체 유형을 클릭합니다.

6. 컴퓨터를 체크 합니다.

7. 검색 창에 Cluster Computer를 선택합니다.

8. 해당 추가 후 Computers 권항 항목에서 컴퓨터 개체 만들기를 추가합니다.

9. 모든 속성 읽기를 체크합니다.

위와 같이 해당 권한과 관련하여 두개의 권한이 반드시 필요합니다.

Cluster 생성 시 Windows 2008 R2의 경우 CNO와 VCO가 추가되어 각 서비스 객체가 Active Directory의 컴퓨터 객체에 추가되어 집니다.

위의 그림을 보면 MSCS2008FS(File System Service)에 대해 Computers에 VCO로 추가되어 있음을 확인할 수 있습니다.

 

해당 VCO에서 등록정보 -> 보안을 선택하면 위와 같이 Cluster Name이 등록되어 있음을 알 수 있습니다.

각 VCO안에는 CNO가 추가되어 기존 2003에서 사용되어 지던 AD Cluster 계정을 대신하여 서비스에 접속하게 됩니다.

 

Domain Admins 권한이 없는 경우 위와 같이 권한 관련하여 복잡한 내용을 확인해야 하므로 Cluster 계정에는 Domain Admins 권한을 주어 관리할 수 있도록 하는 것이 관리의 효율성을 높히는 일입니다.

Cluster Log

2012.08.26 02:25 | Posted by 로멘틱가이

오늘은 Cluster Log에 대해 알아보겠습니다.

 

로그위치

Windows 2003

- %SystemRoot%\Cluster Folder에 cluster.log로 생성

Windows 2008 R2

- %SystemRoot%\system32\winevt\logs Folder에 etl 파일로 생성

 

Failover Cluster Reports

- %SystemRoot%\cluster\Reports Folders에 MHTML 파일로 생성

 

Log File Copy

- Cluster /cluster:Cluster명 log /generate /copy:대상위치

- Cluster /cluster:joonCL log /generate /copy:C:\temp

 

Windows 2008 R2 Cluster Log 변경된점

- 총 3개의 etl 파일이 생성되며 Default로 100MB의 크기를 가진다.

- 한개의 etl 파일이 Full이 되면 해당 파일에 덮어쓰게 된다.

- Rebooting 시 다음 etl 파일을 사용하게 된다.

- 기본 이름은 ClusterLog.etl.001 002 003의 3개의 파일로 생성된다.

- Default Setting의 경우 100MB밖에 되지 않기 때문에 장애 시 해당 시점의 로그 내용이 덮어 써진 경우가 발생하게 된다.

 

다음과 같이 Log Size를 늘려준다.

1. 관리자 권한으로 cmd 창을 수행한다.

2. Cluster . /prop | findstr ClusterLogSize

     위와 같이 해당 로그가 100인것을 확인할 수 있습니다.(단위는 MB)

3. cluster log size를 변경합니다.

- cluster log /size:크기(단위 MB)

  cluster log /size:1024 (1GB로 Size 변경)

 

Cluster Binding 이슈

2012.07.03 15:39 | Posted by 로멘틱가이

오늘은 Cluster 설치 시 Binding 이슈 발생에 대한 내용입니다.

 

clustering 설치 시 Network Binding 관련하여 위와 같은 오류가 발생할 수 있습니다.

해당 오류는 네트워크 환경에서 Binding 순서를 정상적으로 정해놓았어도 숨김이나 Disable 네트워크가 Binding 순서에 영향을 미치기 때문에 발생합니다.

 

해결책은 다음과 같습니다.

1) set devmgt_Show_nonPersistent_devices=1

2) 네트워크 어댑터 목록을 확인하여 네트워크 설정에 표시되는 어뎁터 목록과 같은지 확인합니다.

3) 설치 전 비활성화된 어댑터를 제거합니다.

4) 설치 후 어댑터를 재설치 한 후 Disable 시킵니다.

 

참고 사이트 : http://technet.microsoft.com/ko-kr/library/ms189910(v=sql.105).aspx

Windows 2003 Quorum 오류 해결

2012.04.26 03:23 | Posted by 로멘틱가이

오늘은 Windows 2003 Quorum 오류 해결 중 물리 Disk Fault에 대해 알아보도록 하겠습니다.

 

논리적으로 깨진 경우에 대해서는 다음에 설명하도록 하겠습니다.

물리 Disk가 Fault난 경우에는 해당 Disk를 교체 해야합니다.

하지만 Quorum 정족수가 부족한 경우에는 Cluster Service 자체가 실행되지 않기 때문에 교체 후에도 Cluster Service가 올라오지 않습니다.

 

Quorum없이 강제로 실행하는 명령어를 수행하여 우선 Quorum 없이 Service를 기동시킵니다.

net start clussvc /Fixquorum

 

해당 명령어를 수행하면 쿼럼 디스크 없이도 Service가 올라옵니다.

우선 서비스가 올라온 경우 Master Node를 제외한 Node는 Node 제거를 수행합니다.

 

해당 Node 삭제 후 신규 Quorum Disk에 Local Quorum Data를 copy합니다.

(Local Quorum은 C:\Windows\Cluster의 MSCS 폴더입니다.)

 

 

해당 MSCS 폴더를 Q(witness Quorum Disk)에 Copy한 후 해당 Q 디스크를 리소스에 추가해 줍니다.

(기존 Q디스크가 Disk Q라고 등록되어 있기 때문에 Imsi Q라고 명명합니다.)

 

Imsi Q를 생성하기 전에는 Disk Q는 주 노드의 리소스이기 때문에 삭제가 되지 않지만 Imsi Q를 생성한 후에는 해당 리소스가 삭제되어짐을 확인할 수 있습니다.

해당 리소스 삭제 후 Imsi Q의 이름을 Disk Q로 변경한후 해당 서버를 리부팅 하면 서비스가 정상적으로 기동됨을 확인할 수 있습니다.

Windows 2003 쿼럼

2012.02.01 18:32 | Posted by 로멘틱가이
Windows 2003 기준의 쿼럼에 대해 설명하도록 하겠습니다.

1. 쿼럼 디스크 구성 방법
(1) 로컬 쿼럼
     - 테스트용으로 사용하며 노드의 로컬 디스크에 쿼럼 정보를 저장하는 방식이다.
     - 다른 노드의 쿼럼과 동기화를 할 수 없기 때문에 일관성을 유지할 수 없다.
     - 단일 노드 구성에 사용하는 방법이다.
(2) Node Majority(주노드)
     - 각 노드의 로컬 디스크에 쿼럼 정보를 저장하는 방식이다.
     - 다른 노드와 동기화가 되는 점이 로컬 쿼럼과 다른점이다.
     - 클러스터 서비스가 유지 되기 위해서는 과반수의 노드가 살아 있어야한다.
 노드 갯수 주 노드 집합 허용 가능 오류 노드 수 
 1  1
 2  2 0
 3  2
 4  3 1
 5  3
 6  4 2
 7  4 3
 8  5 3

(3) 표준 쿼럼
     - 2003에서 권장하는 쿼럼 방식으로 외장디스크의 한 개의 드라이브를 사용하여 쿼럼을 
       구성하는 방식이다.
     - 해당 쿼럼이 Down 되는 경우 클러스터 서비스가 다운된다.

2. 쿼럼디스크 구성파일
쿼럼 디스크는 아래 설명할 파일들로 구성되어 있으며 해당 구성을 통해 쿼럼 정보를 동기화 하며 일관성을 유지한다.

1) MSCS\chkxxx.tmp
     - 클러스터 서비스가 구동되기 위해 필요한 모든 레지스트리 정보를 가지고 있는 클러스터
       레지스트리 스냅샷 복사본 파일
2) MSCS\quolog.log
     - 클러스터의 구성정보가 변경된 순서대로 저장되어 있는 아카이브 파일
3) MSCS\<리소스의 GUID>\*.CPT
     - 응용프로그램 리소스의 GUID 값으로 폴더가 생성되며 응용프로그램 리소스가 사용하는 
       레지스트리의 일관성을 유지한다.

3. 클러스터 시작 시 구성정보 동기화 진행 과정
(1) %Windir%\Cluster\ClusDB를 기반으로 HKEY_LOCAL_MACHINE\Cluster
     레지스트리 하이브를 생성한다.
(2) 생성된 클러스터를 기반으로 다른 노드에 접속을 시도한다.
(3) 다른 노드가 기동중인 경우 기동중인 노드의 최슨 클러스터 구성 정보를 동기화 후
     클러스터 서비스를 시작한다.
     만일 기동중이 아닌 경우 
     HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\ClusDisk\
     Parameters\Signatures에 있는 정보를 기반으로 쿼럼 디스크를 Scsi Reserve 명령어로 
    가져온다.
(4) 쿼럼 디스크에 있는 Quolog.log를 바탕으로 변경된 내역을
     HKEY_LOCAL_MACHINE\Cluster 하이브에 순차적으로 적용한 후 클러스터 서비스를 
     시작한다.
(5) 노드는 3초 마다 Scsi Reserve 명령어를 소유하고 있는 쿼럼디스크와 클러스터 디스크로
     전송하여 소유권을 유지한다.

위와 같으 클러스터에서 쿼럼 디스크를 구성하는 방법과 구성요소 그리고 동기화 방법에 대해 알아보았다.

"Look Alive" "Is Alive"

2012.02.01 14:24 | Posted by 로멘틱가이

Cluster에는 각 리소스를 체크하는 두 가지 방법이 있습니다.
"Look-Alive", "Is-Alive"

두가지 방식에 대해 알아보겠습니다.
1. Look Alive
네트워크로 치면 ping과 같은 방식입니다.
해당 Resource의 로직 오류의 상황에 대해서는 알 수 없으며 단지 Resource가 살아있는지 죽었는지만 체크하는 방식입니다.

2. Is Alive
적절한 Query를 통해 해당 Resource가 정상적으로 반응하는지 체크하는 방식입니다.
예를들어 Sql Server Rsource같은 경우 Sql을 Query(Select @@Version)하여 해당 Sql Service가 정상적으로 반응하는지 체크하는 방식입니다.
Look Alive와 다르게 Query를 날리기 때문에 로직 오류에 대해서도 검출할 수 있습니다.

위와 같이 2가지 방식이 있으며 해당 검색 시간은 리소스의 속성에서 바꿀 수 있습니다.
해당 방법으로 조회 시 문제가 발견되면 해당 Resource를 재시작하며 (900초 안에 3회) 해당 재시작으로 오류가 해결되지 않으면 Group을 이동하게 됩니다.

이전 1 2 다음