일번적으로 컴퓨터의 속도를 결정 짓는 이론적인 요인에는 여러가지가 있습니다. HPC에서 주로 사용되는 측도는 Flops (Floating-point operation per second: 부동 소수점연산) 란 용어를 사용을 하게 됩니다. Flops는 단위시간에 프로세가가 할 수 있는 부동소수점 연산의 수를 말합니다. 프로세서는 딘위 클럭 마다 2진수의 더하기, 배기 연산을 하게 됩니다. 정수연산과 달리, 부동 소수 연산의 경우, 부동 소수 숫자를 정수로 변환을 하는 단계를 거치게 됩니다. 이에, 정수 연산과 부동 소수 성능은 비례하지는 않습니다.
공학 및 그래픽, 3D 등의 작업에는 부동 소수 연산이 컴퓨터 성능에 중요한 기준이 되므로, HPC에서 컴퓨터의 성능을 이야기 할때는 이 부동 소수 연산 처리를 얼마나 할 수 있는냐가 그 성능의 중요한 척도가 되는 것입니다,
CPU 의 성능을 결정 짓는 요인은 두 가지가 있습니다. 컴퓨터의 Clock 속도(CPU 의 Clock 은 Hz로 표시를 합니다 )와 단위 Clock 당 수행 할 수 있는 Instruction 의 갯수 입니다. 예를 들어. 즉, 1Hz 동안 CPU 가 있고, 1Hz 동안 1개의 Floating-point operation Instruction 을 가진다면, 이를 1Flops 라 명 합니다.
부동 소수 연산 성능 척도 : FLOPS
CPU Clock * Floating-point operation Instruction = FLOPS
1GFLOPS = 초당 10억번의 실수 연산 능력 |
예전 Intel Pentium III 의 경우, 단위 Clock 당 1개의 Floating-point operation Instruction 처리를 하였으며, 초창기 Intel Xeon 의 경우는 2개의 Floating-point operation Instruction 처리를 하였습니다.
최근 Intel Xeon 의 경우는 1개의 Processor 안에 Core 를 여러개를 넣어 만든 멀티 코어 프로세서 입니다.
이 경우 , 각각의 Core 에도 Floating-point operation Instruction 가 있는데, 최근 Intel Xeon 5600 개열의 경우는 코아당 4개의 Floating-point operation Instruction 를 처리가 가능 합니다.
즉,
Pentium III 1GHz 의 이론 성능은 1GHz * 1 CPU * 1 Floating-point operation Instruction = 1GFlops 가 되며,
Intel Xeon 5100 시리즈 2.4 GHz 의 이론 성능은
2.4 GHz * 1CPU * 2 Floating-point operation Instruction = 4.8GFlops
Intel Xeon L5638 2.0 GHz 는
2.0 GHz * 1 CPU * 6 Core * 4 Floating-point operation Instruction = 48GFlops
가 되는 것입니다.
여기서 보듯, 과거 Intel Xeon 5100 시리즈 2.4 GHz 가 최근 CPU 인 Intel Xeon L5638 시리즈 2.0 GHz 보다Clock 이 높지만, 실제 성능은 Xeon L5638 이 무려 10배 이상이나 높음을 보실 수 있습니다.