SQL서버 성능카운터 활용을 위한 팁

 


원문링크 : http://www.sql-server-performance.com/performance_monitor_counters_sql_server.asp

번역 : 종균 (jkkim@techdata.co.kr)

 
 


SQL서버에서 과도한 I/O의 원인 중 하나는 페이지 분할 입니다페이지 split은 인덱스나 데이터 페이지가 꽉 찰 경우에 발생하며현재 페이지와 새로이 할당되는 페이지 사이에서 분할이 이루어 집니다.  가끔 발생하는 페이지 분할은 정상입니다만과도한 페이지 분할은 과도한 디스크 I/O를 유발하게 되며이는 느린 성능을 야기합니다.

SQL서버가 과도한 페이지 분할을 일으키고 있는지를 찾기 원한다면 성능카운터에서 SQL Server Access Methods 개체의 Page Splits/Sec 항목을 모니터 하십시오만일 과도한 페이지 분할이 발생하고 있다면인덱스의 채우기 비율을 높게 설정하시는걸 고려하십시오채우기 비율을 높게 설정하시면 데이터가 가득 차거나페이지 분할이 발생하기 전에 데이터 페이지에 보다 더 많은 여유 공간이 있으므로페이지 분할을 감소시킬 수 있습니다

높은 Page Splits/sec 은 무얼 의미하는가이것은 운영하는 시스템의 I/O하부 시스템에 따라 다르므로 이에 대한 간단이 답을 할 수 없습니다그러나 만일 당신이 평상시에 디스크 I/O의 성능 문제가 발생하고이 카운터 값이 100을 초과한다면채우기 비율을 높여서 성능이 호전 되는지 그렇지 않은지 실험해 보는 것도 좋을 것 입니다.

 

*****

물리적인 메모리를 SQL서버 Data캐시에 얼마나 할당되었는지 알고 싶다면SQL Server Buffer Manager Object: Cache Size (pages) 항목을 모니터링 하십시오이 수치는 페이지 수로 표시되므로이 값에 8K(8192 bytes)를 곱하면, Data캐시로 사용되고 있는 총 메모리의 사용량을 알 수 있습니다.

일반적으로이 수치는 서버의 총 메모리 량에 근접해야 합니다. SQL서버로 운영하는 시스템에서 OS커널이나, SQL서버 그리고 기타 유틸리티 프로그램이 사용하는 메모리 량을 최소화 하십시오.

만일 Data캐시 용도로 할당된 메모리 양이 여러분이 생각하는 것 보다 훨씬 작다면왜 그런지 원인을 찾으셔야 합니다아마도, SQL서버가 메모리를 동적으로 할당하도록 설정하지 않고대신에 뜻하지 않게 SQL서버가 적은 메모리를 사용하게 구성 하셨을 겁니다. SQL서버가 가용할 수 있는 Data캐시의 총량은 SQL서버 성능에 아주 큰 영향을 미치기 때문에 원인이 무엇이든 간에 여러분은 해결방안을 찾아야 합니다.

실제로는, SQL서버가 메모리가 부족한지 아닌지를 알기 위해 보다 많은 카운터들이 존재하고더 효율적이기 때문에 저는 이러한 카운터(SQL Server Buffer Manager Object: Cache Size (pages))를 모니터 하는데 많은 시간을 사용하지 않습니다.  (그래서 어쩌라고.ㅜㅜ)

 

*****

SQL서버가 얼마나 바쁜지 알기 위해서SQLServer: SQL Statistics: Batch Requests/Sec 카운터를 모니터 하십시오이 카운터는 초당 SQL서버가 받는 배치 요청 수를 측정하고일반적으로 서버의 CPU들이 얼마나 바쁜지 나타냅니다말하자면초당 1000배치가 넘어서면, SQL서버가 매우 바쁘다는 것을 나타내며, CPU병목 현상이 아직 나타나지 않고 있다면조만간 CPU병목 현상이 나타날 것임을 알 수 있습니다물론 이 수치는 상대적인 것이며여러분의 하드웨어가 고 사양이라면보다 더 많은 초당 배치요청 수를 커버할 수 있을 것입니다.

네트워크 병목의 관점에서 보자면, 100Mbps 네트워크 카드는 초당 3000 배치 요청을 처리 할 수 있습니다만일 네트워크 병목이 심한 서버를 운영하고 계시다면네트워크 카드를 2개이상 늘리거나, 1Gbps 네트워크 카드로 교체 할 필요가 있을 것입니다.

몇몇 DBA들은 전체 SQL서버활동량을 측정하기 위해서 SQLServer: Databases: Transaction/Sec: _Total 카운터를 모니터 하는데이는 좋은 방법이 아닙니다. Transaction/Sec 카운터는 전체 활동량이 아닌 한 트랜잭션의 내부활동을 측정하며왜곡된 값을 나타냅니다대신에, SQL서버의 전체 활동량을 측정하는 SQLServer: SQL Statistics: Batch Requests/Sec 카운터를 사용하시기 바랍니다

 

*****

TSQL코드의 컴파일은 SQL서버의 일반적인 동작입니다그러나이 컴파일이 CPU와 다른 리소스들을 많이 잡아 먹기 때문에, SQL서버는 가능한 많은 실행계획을 캐시에 저장해서 실행계획이 컴파일 되지 않고 재사용되도록 시도합니다(실행계획은 컴파일이 발생할 때 생성됩니다). 보다 더 많은 실행계획이 재 사용 되어지면서버에 대한 부담은 더 적어지게 되며전체적인 성능은 더욱 더 향상 됩니다.

SQL서버가 얼마나 많은 컴파일을 하고 있는지 확인 하려면SQLServer: SQL Statistics: SQL Compilations/Sec 카운터를 모니터 하십시오여러분이 기대하시는 것처럼이 카운터는 초당 얼마나 많은 컴파일이 SQL서버에 의해서 실행되었는지를 측정합니다.

말하자면이 카운터의 수치가 초당 100을 넘어서면불필요한 컴파일 오버헤드를 경험하고 계신 것 입니다이러한 높은 수치는 여러분의 서버가 매우 바쁨을 나타내거나불필요한 컴파일들이 실행되고 있다고 볼 수 있겠습니다예를 들어오브젝트의 스키마가 변경되거나병렬로 실행계획이 잡혀있던 것이 직렬로 실행되어야 하거나통계가 다시 계산되었다거나 하는 등의 이유로 SQL서버로부터 재 컴파일 하라는 지시를 받았을 수도 있습니다어떤 경우에는불필요한 컴파일을 줄이기 위해서 여러분의 노력이 필요할 수 도 있습니다. (역주잘 아시듯이, adhoc 쿼리를 저장프로시져로 만들면 컴파일 이슈가 없어지죠)

만약여러분의 서버가 초당 100회 이상의 컴파일을 수행한다면이 원인이 여러분이 조절할 수 있는 것인지 아닌지 찾기 위해 애 쓰셔야 합니다너무 많은 컴파일은 SQL서버의 성능에 악영향을 끼칩니다.

 

*****

SQLServer: Databases: Log Flushes/sec 카운터는 초당 플러쉬 된 로그 수를 나타냅니다이 카운터는 데이터베이스 별로 측정되거나단일 SQL서버의 전체 데이터베이스에 대한 값으로 측정 될 수 있습니다.

로그 플러쉬란 무엇일까요이해를 쉽게 하기 위해서 예를 들어 설명 하는 게  좋을 것 같습니다. 10개의 INSERT명령이 있는 트랜잭션을 시작한다고 가정하겠습니다트랜잭션이 시작되고그리고첫 번째 INSERT가 실행되고새 데이터가 데이터 페이지로 삽입 되어질 때필수적으로 동시에 두 가지의 일이 발생합니다버퍼캐시의 데이터페이지는 새로이 삽입된 데이터로 변경됩니다그리고 이 단일 INSERT명령에 대한 적당한 로그용 데이터가 로그캐시에 쓰여집니다이 과정은 트랜잭션이 완료 될 때까지 계속 됩니다이때로그캐시에 기록된 트랜잭션을 위한 로그 데이터는 즉시 로그파일에 기록됩니다그러나 버퍼캐시에 있는 데이터는 다음 체크포인트 프로세스가 실행되기 전까지 버퍼캐시에 머무르게 됩니다그리고그때 데이터베이스는 새로이 삽입된 행으로 업데이트 됩니다.

여러분은 로그캐시에 대해서 한번도 들어보지 못했을지도 모릅니다이것은 SQL서버가 로그파일에 쓰여질 데이터를 기록하는 메모리의 한 영역입니다.  로그캐시의 목적은 트랜잭션이 커밋 되기 전에 특정상황이 발생하여 롤백 해야 하는 상황에서 트랜잭션을 롤백 하는 용도로 사용되기 때문에 매우 중요합니다그러나트랜잭션이 완료되면 (완료되면 절대 롤백 되지 않음), 로그 캐시는 즉시 물리적인 로그파일로 플러시 됩니다이것이 정상적인 절차입니다. SELECT쿼리는 데이터를 수정하지도 않고 트랜잭션을 생성하지도 않고로그 플러시를 발생하게 하지도 않음을 명심 하십시오.

본질적으로로그캐시에 있는 데이터가 물리적인 로그파일로 쓰여질 때 하나의 로그 플러시가 발생합니다따라서하나의 트랜잭션이 완료될 때마다로그 플러시는 발생하며많은 수의 로그 플러시 발생은 SQL서버로부터 수행되는 많은 수의 트랜잭션과 관련이 있습니다그리고짐작하시는 것처럼 로그 플러시(얼마나 많은 데이터가 로크 캐시로부터 디스크에 기록 되어졌는가의 크기는 트랜잭션에 따라 다릅니다이 내용이 도움이 되었나요?

우리가 디스크 I/O 병목현상을 격 고 있고그 원인을 확신하지 못하고 있다고 가정합시다디스크 I/O에 대한 병목을 해결하기 위한 하나의 방법은 Log Flushes/sec 카운터 데이터를 수집하고이 과정을 처리하는데 얼마나 바쁜지 보는 것입니다여러분의 서버에 많은 트랜잭션이 발생하고 있다며로그 플러시 양은 당연히 많을 것입니다따라서 이 카운터 항목으로 보는 값은 트랜잭션을 발생하는 활동 형 쿼리가 얼마나 바쁜가에 따라 서버마다 다양할 것입니다이 카운터 정보로써 여러분은 초당 발생하는 로그 플러시 수가 운영하는 서버에서 예상되는 트랜잭션의 수 보다 확연하게 높은가에 대한 상황 판단에 도움을 줄 것이다.

예를 들어매일 1,000,000행을 한 테이블로 삽입하는 작업을 한다고 가정합시다이 행들이 삽입되어질 수 있는 방법은 다양합니다첫째각 행은 따로따로 삽입되어 질 수 있습니다각 INSERT는 단일 트랜잭션 내부에 감싸집니다둘째모든 INSERTS는 단일 트랜잭션 내에서 수행되어 질 수 있습니다마지막으로, INSERTs 1 1,000,000사이의 어딘가에 여러 개의 트랜잭션으로 나누어 질 수 있습니다각 형태의 처리는 다르며, SQL서버와 초당 플러시 되는 로그 수에 매우 다른 영향을 미칩니다더구나프로세스가 멀티 트랜잭션으로 처리되고 있는데단일 트랜잭션으로 처리되고 있다고 착각할 수 도 있다많은 사람들이 단일 프로세스를 단일 트랜잭션으로 생각하고 있는 경향이 있습니다.

첫째의 경우에서만일 1,000,000행이 1,000,000개의 트랜잭션으로 삽입되어진다면, 1,000,000번의 로그 플러시가 발생할 것입니다그러나두 번째 경우에는단일 트랜잭션에서 1,000,000행이 삽입되어 질 것이고단지 하나의 로그 플러시가 발생할 것입니다그리고세 번째  경우 에는 플러시 되는 로그의 수는 트랜잭션의 수와 같을 것입니다명백히로그 플러시의 크기는 1,000,000트랜잭션이 1트랜잭션보다 훨씬 클 것입니다그러나대개의 경우 성능의 관점에서 여기서 언급한 내용은 그다지 중요하지 않습니다.

어떤 옵션이 가장 좋은가요모든 경우에서많은 디스크 I/O를 유발할 것입니다. 1,000,000행을 핸들링 할 경우에는 I/O양을 줄일 묘안이 없습니다그러나하나 혹은 적은 수의 트랜잭션을 사용함으로써 로그 플러시 양을 많이 줄일 수 있을 것이고이는 디스크 I/O양을 줄이게 되어, I/O병목 감소와 성능을 높여줄 것입니다.

우리는 두 가지 포인트를 배웠습니다첫째는여러분이 플러시 되는 로그 양을 가능한 많이 줄이길 원할 것이라는 것과둘째여러분의 서버에서 발생하는 트랜잭션의 수를 줄이는 것입니다.

 

*****

SQL서버를 사용하는 많은 수의 사용자는 성능에 영향을 미치기 때문에여러분은 SQL Server General Statistics Object: User Connections 카운터에 관심을 가질것입니다이 카운터는 사용자 수가 아닌, SQL서버에 현재 연결된 사용자 연결 수를 나타냅니다

이 수치를 해석할 때하나의 단일 사용자는 여러 개의 연결들로 열릴 수 있음을 유념하십시오그리고 또한여러 명의 사람이 하나의 단일 사용자 연결을 공유할 수 도 있습니다이 수가 실제 사용자수를 나타낸다고 가정하지 마십시오대신에서버가 얼마나 바쁜가에 대한 상대적 척도로 사용하십시오여러 시간에 걸쳐서 이 수치를 모니터 해보시면서버가 많이 사용되고 있는지적게 사용되고 있는지 느낄 수 있을 것 입니다.

 

*****

만약 여러분들의 데이터베이스들이 데드락 문제로 괴로워하고 있다면SQL Server Locks Object: Number of Deadlocks/sec 카운터를 통해서 추적할 수 있습니다그러나이 값이 상대적으로 높지 않다면이 값은 초단위로 측정되기 때문에 여러분은 더 많이 보기 원할 것입니다그리고눈에 띄게 보여지기 위해서는 다량의 데드락이 있어야 합니다. (ㅜㅜ)

그러나여전히 이 카운터는 여러분이 데드락 문제를 가지고 있는지 확인하기 위해서 가치있는 항목입니다차라리데드락을 추적하기 위해서 프로필러를 이용하십시오이는 보다 상세한 정보를 제공할 것입니다데드락 문제를 발견하기 위해서 Number of Deadlocks/sec 카운터를 활용하시고좀 더 세부적인 분석을 위해서 프로필러를 사용하십시오.

 

*****

만약에사용자들이 트랜잭션의 완료를 위한 대기시간 때문에 불만을 나타낸다면여러분은 개체 잠금이 이 문제가 되고 있는지 찾고 싶을 것 입니다문제점을 찾기 위해서SQL Server Locks Object: Average Wait Time (ms) 카운터를 사용하십시오이 카운터는 database, extent, key, page, RID, table의 다양한 잠금에 대한 평균 대기 시간 정보를 측정합니다.

DBA로써여러분은 평균 대기 시간이 얼마 정도까지 허용될 수 있는지 결정해야 합니다한가지 방법으로써개별 잠금 종류에 대해서 장시간 동안 이 카운터 항목을 모니터 하시고각 잠금 별 평균을 파악하시는 겁니다그리고 그 평균값을 참고 자료로 활용 하시는 거죠예를 들어, RID의 평균 잠금 대기시간이 500ms 라면, 500보다 큰 대기시간을 가지는 개체들은 , 잠재적인 문제점을 가지고 있다고 판단할 수 있을 것입니다특히 500보다 훨씬 크거나장시간 동안 연장되는 개체들은 더 쉽게 판단할 수 있습니다.

여러분이 트랜잭션 지연에 의한 단일 혹은 다양한 종류의 잠금을 확인 할 수 있다면어떤 트랜잭션들이 잠금의 원인이 되었는지 확인할 수 있는지 알기 위해서 조사하길 원할 것 입니다.

 

*****

그런데 가끔 인덱스 탐색보다 테이블 스캔이 빠른 경우에일반적으로 적은 테이블 스캔이 보다 많은 테이블 스캔 보다 좋다여러분의 서버에서 얼마나 많은 테이블 스캔이 발생하는지 알아보기 위해서SQL Server Access Methods Object: Full Scans/sec 카운터를 사용하십시오.이 카운터는 단일 데이터베이스가 아닌 전체 서버에 대한 값이라는 사실을 염두에 두셔야 합니다이 카운터 값으로 알게 될 사실 하나는 가끔씩 예측이 가능한 스캔 형태를 나타낸다는 것 입니다대부분의 경우에 이 값들은 SQL서버가 내부적으로 사용하는 것 들입니다.

여러분의 응용프로그램에서 나타나는 불규칙적인 테이블 스캔들을 파악하길 원하실 것입니다과도한 테이블 스캔이 발생될지를 고려하기 위해서 프로필러 데이터를 수집하고 인덱스 튜닝 마법사를 통해서어떤 것이 원인이 되는지 결정 할 수 있게 도움을 받을 수 있습니다그리고 몇몇 인덱스를 추가함으로써 테이블 스캔을 줄일 수 있을 것 입니다물론 SQL서버는 이 작업을 훌륭하게 수행할 것이고더 효율적이라면인덱스를 사용하는 것 대신에 테이블 스캔을 수행 할 것입니다그러나 내부적으로 어떤 일이 발생하는지 찾아 보지 않는 한 여러분은 알지 못 할 것입니다.

*****

만일 백업 및 복원 명령이 최적이 아닌 속도로 수행된다면SQL Server Backup Device Object: Device Throughput Bytes/sec 카운터를 이용해서이 문제를 확인 할 수 있습니다이 카운터는 여러분의 백업이 얼마나 빨리 수행되는지 알려 줄 것입니다또한 문제에 대한 의구심을 해결하기 위해서 Physical Disk Object: Avg. Disk Queue Length 카운터를 같이 조사해 볼 수 도 있습니다대부분의 경우에 백업과 복원의 성능 문제가 있다면, I/O 병목에 의한 것들입니다.

DBA로써 경험하고 다루게 되는 I/O병목에 대한 판단의 작업 또한 수행할 것입니다예를 들면느린 백업 또는 복원의 원인이 같은 시점에 수행되는 단순한 DTS작업 때문일 수 있으며작업에 대한 일정의 재조정으로 문제를 해결 할 수 있습니다.

 

*****

여러분이 트랜잭션 복제를 사용하고 계신다면로그 리더가 트랜잭션들을 데이터베이스의 트랜잭션 로그로부터 배포 데이터베이스로 옮겨질 때까지의 지연시간을 모니터하길 원하실 것입니다.

또한 배포 에이젼트가 트랜잭션들을 배포데이터베이스에서 구독자 데이터베이스로 옮기는데 소요되는 시간을 모니터 하길 원할 것입니다.이 두 지연시간의 합은 하나의 트랜잭션이 게시 데이터베이스에서 구독 데이터베이스로 전달되는 총 소요시간입니다.

이 두 카운터는 SQL Server Replication LogReader: Delivery Latency  SQL Server Replication Dist.: Delivery Latency 입니다.

만약둘 중의 하나의 과정중에 과도한 지연시간 증가를 발견한다면이것은 어떤 새로운 변화가 발생하여 지연 시간을 증가 시켰는지 살펴봐야 한다는 신호입니다.

 

*****

관찰하여야 할 주요한 카운터는 SQL Server Buffer Manager Object: Buffer Cache Hit Ratio 입니다이것은 SQL서버가 데이터를 액세스 하기 위해 하드디스크가 아닌 버퍼를 얼마나 자주 참조하는가를 나타냅니다보다 높은 이 수치는, SQL서버가 데이터를 가져오기 위해서 하드디스크에 아주 가끔 액세스한다는 것이며이는 SQL서버의 성능을 극대화 시킵니다.

SQL서버를 모니터하는 다른 카운터들과는 달리이 카운터는 SQL서버가 다시 시작한 시점 이후부터의 버퍼 캐시 히트율의 평균 값입니다다른 말로이 카운터는 현재 시점의 측정 값이 아니라 SQL서버가 시작된 이후의 모든 날들의 평균값입니다현재 시점의 버퍼캐시에서 어떤일이 발생하고 있는지 정확한 자료를 얻기 원한다면여러분은 SQL서버를 중지 했다가 다시 시작해야만 하고정확한 버퍼 캐시 히트율을 확인하기 위해 SQL서버를 여러 시간 동안 일반적인 활동을 하게 내버려 둬야 합니다.

만약 최근에 SQL서버를 재 시작 하지 않았다면여러분이 보고 있는 버퍼 캐시 히트율은 아마도 현재 발생하는 버퍼 캐시 히트율을 위해서는 정확한 정보가 아닐 것 입니다또한 버퍼 캐시 히트율이 좋아 보일지라도오랜 시간의 평균값으로 계산되었기 때문에 실제로는 좋지 않을 지도 모릅니다.

OLTP 응용프로그램 환경에서이 수치는 90~95% 이상이어야 합니다그렇지 않다면여러분은 성능 향상을 위해서 서버에 RAM을 추가할 필요가 있습니다.

OLAP 응용프로그램 환경에서는, OLAP작동하는 기본특성 때문에 이 수치는 OLTP 보다 더 작을 수 있습니다어떤 경우라도더 많은 RAM SQL서버의 OLAP 활동의 성능을 증가 시킬것입니다.

 

*****

이 두 카운터를 관측하는걸 고려하십시요. SQLServer:Memory Manager: Total Server Memory (KB) and SQLServer:Memory Manager: Target Server Memory (KB)첫번째 카운터 SQLServer:Memory Manager: Total Server Memory (KB)  mssqlserver서비스가 메모리를 얼마나 사용하고 있는가를 말해줍니다이것은 SQL서버 Bpool영역으로 커밋된 전체 버퍼수를 포함하고, ‘OS in Use’ 로 표시되는 OS버퍼들도 포함합니다.

두번째 카운터, SQLServer:Memory Manager: Target Server Memory (KB) SQL서버가 얼마나 많은 메모리를 가용할 수 있는가를 나타냅니다이는 SQL서버가 시작시에 예약한 버퍼수에 기초합니다.

만약, Total Server Memory (KB)이 Target Server Memory (KB)보다 작다면이는 SQL서버가 충분한 메모리를 가졌고효율적으로 사용하고 있다는 것을 의미합니다반면에 Total Server Memory (KB)이 Target Server Memory (KB)보다 크거나 같다면이는 SQL서버가 메모리 압박을 받고 있고더 많은 물리적 메모리에 액세스 하고 있음을 나타냅니다.

 

*****

디스크로부터 데이터를 읽는 대신에 버퍼 캐시로부터 데이터를 가져온다면 SQL서버는 보다 적은 자원으로 보다 훨씬 더 빠르게 수행합니다몇몇 경우에메모리 집중적인 명령들로 인해 데이터 페이지들이 이상적으로 플러시 되기 전에 캐시 밖으로 밀려 나가기도 한다이는 버퍼 캐시가 충분히 크지 않거나 메모리 집중적인 명령의 작업을 위한 더 많은 버퍼 공간 요구에 의해  발생할 수 있습니다이런 경우에는 버퍼에 추가 적인 공간을 만들기 위해서 플러시 된 데이터 페이지들은 디스크로부터 읽혀지게 되며성능에 안 좋은 영향을 미치게 됩니다.

여러분들의 SQL서버가 이러한 문제를 가지고 있는지 확인 하기 위한 3개의 SQL 서버 카운터가 있습니다.

·  SQL Server Buffer Mgr: Page Life Expectancy 이 성능 카운터는 데이터 페이지가 얼마나 오랫동안 버퍼공간에 머무르는지를 평균적으로 나타내 줍니다만약 이 값이 300초 보다 작은 값을 보인다면여러분의 SQL서버는 성능의 극대화를 위해서 추가적인 메모리가 필요함을 잠재적으로 나타내는 것입니다.

·  SQL Server Buffer Mgr: Lazy Writes/Sec 이 카운터는 버퍼 공간을 비우기 위해서 지연기록기 프로세스가 더티 페이지들을 버퍼공간에서 디스크로 초당 얼마나 많이 옮겼는지 나타냅니다일반적으로 말하자면이 항목은 높은 값(초당 20정도)이어서는 안됩니다이상적으로, 0에 가까워야 합니다만약 이 값이 0이라면여러분의 SQL서버는 아주 큰 버퍼 공간을 가지고 있고일정한 체크 포인트가 발생하여 더티페이지가 반환되기를 기다리는 대신에더티페이지 반환을 하지 않아도 됨을 나타냅니다만약 이 값이 높다면보다 더 많은 메모리가 필요함을 나타냅니다.

·  SQL Server Buffer Mgr: Checkpoint Pages/Sec체크포인트가 발생할 때모든 더티 페이지들은 디스크에 쓰여 집니다이것은 일반적인 절차이며체크포인트가 처리되는 동안에 이 카운터가 발생하는 근원이 됩니다시간에 걸쳐서 이 카운터의 높은 값을 보길 원치 않으실 것입니다이는 SQL서버의 귀중한 자원을 많이 사용할 수 있는 체크포인트 프로세스가 보다 더 자주 실행됨을 나타냅니다만약 이 값이 높은 값을 가진다면빈번한 체크 포인트 발생을 줄이기 위해서 더 많은 RAM을 추가할 것을 고려하시거나, SQL서버의 구성옵션 중에 복구 간격(recovery interval)’ 옵션 값을 늘려주십시오.

이러한 성능 모니터 카운터들은 메모리 부족의 잠재적인 진단을 위해서 고려되거나고도화하거나정제하기 위해 사용되어야 합니다.

 

*****

래치는 본질적으로 경량 잠금” 입니다기술적인 관점에서래치는 가볍고짧은 동기화 개체입니다래치는 마치 잠금 처럼 동작하고예상치 않은 변화로부터 데이터를 보호하기 위한 목적을 가지고 있습니다예를 들면하나의 행이 버퍼로부터 SQL서버의 저장소 엔진으로 이동될 때이 매우 짧은 시간 동안의 이동 중에 행 내부의 데이터 변형을 방지하기 위해서 SQL서버에 의해서 래치가 사용되어 집니다.

마치 잠금과 같이래치는 데이터베이스의 행들에 대해 접근하지 못하게 SQL서버를 방해 할 수 있고이는 성능에 안 좋은 영향을 줍니다이러한 이유 때문에 여러분은 래치 시간을 최소화하길 원하실 것입니다.

SQL서버는 래치의 활동을 측정하기 위한 3가지 다른 방법을 제공합니다.

·  Average Latch Wait Time (ms)래치 요청들을 위해 대기해야 하는 시간입니다이는 오직 대기해야 하는 래치 요청들에 대한 측정값입니다대부분의 경우에 대기가 없습니다따라서이 값은 모든 래치에 대한 것이 아니라대기 해야 하는 래치에 대해서만 적용된 값임을 유념하십시오.

·  Latch Waits/sec이 값은 즉시 승인 받지 못한 래치 요청수입니다다시 말해서, 1초 동안에 대기 해야 했던 총 래치의 수입니다따라서이는 Average Latch Wait Time으로 부터 측정된 래치들 입니다.

·  Total Latch Wait Time (ms)이는 지난 초 동안의 총 래치 대기 시간 (ms) 입니다.

이 값을 읽을 때성능카운터에서 배율을 정확히 읽었는지 확인하십시오배율은 카운터 값마다 다르게 표시될 수 있습니다.

제 경험에 비추어 볼 때, Average Latch Wait Rime 카운터는 거의 변함이 없습니다반면에 다른 두 개의 카운터(Latch Waits/sec , Total Latch Wait Time (ms) SQL서버가 뭘 하느냐에 따라서 큰 변동폭을 보일 수 있습니다.

각각의 서버가 약간씩 다르기 때문에래치 활동도 각 서버마다 다릅니다전형적인 작업부하가 있을 때이 카운터에 대한 기준 값을 확보해 두시는 것은 아주 좋은 생각입니다이는 현재 어떤 일이 발생하고 있는가에 대해서 래치 활동이 평상시 보다 많은지 적은지에 대한 비교자료가 될 것입니다.

래치 활동이 기대치 보다 높다면이는 종종 하나 혹은 두 개의 잠재적인 문제점들을 나타냅니다첫째여러분의 SQL서버가 보다 많은 메모리를 사용할 수 있음을 의미할지도 모릅니다래치 활동이 높다면버퍼 캐시 히트 비율이 어떤지 확인하십시오이 값이 99% 이하라면보다 더 많은 양의 메모리가 서버의 성능에 도움을 줄 것입니다만약 99% 이상이라면문제를 유발하는 것은 IO시스템일수도 있습니다빠른 IO시스템은 서버 성능에 유리합니다.

래칭에 대해서 보다 더 많이 배우고실험해보고 싶으시면여기 두 개의 명령이 있습니다.

SELECT * FROM SYSPROCESSES WHERE waittime>0 and spid>50

이 쿼리는 현재 대기상태에 있는 waittype, waittime, lastwaittype, waitresource, SPID들을 표시해 줍니다. lastwaittype은 래치 종류를, waitresource SPID가 어떤 개체를 위해 대기 중인지를 알려줍니다이 쿼리를 실행하게 되면실행 시점에 대기가 발생하고 있지 않다면아무런 결과도 얻지 못 할 지도 모릅니다그러나 계속해서 실행하다 보면결국 몇몇 결과를 얻게 될 것입니다.

DBCC SQLPerf (waitstats, clear)      --대기 통계초기화 
DBCC SQLPerf (waitstats)      -- SQL
서버 재시작(대기 통계 초기화이후의 대기 통계정보

이 쿼리는 대기유형대기시간과 함께 현재의 래치들을 나타내줍니다여러분은 아마도 통계정보를 초기화하길 원할 겁니다그런 다음에는 어떤 래치가 가장 많은 시간을 차지하는지 알기 위하여, DBCC SQLPerf(waitstats)명령을 짧은 시간에 걸쳐서 정기적으로 실행하십시오.

Posted by Sumin Family


티스토리 툴바