UUID – ssup2 Blog / Software

UUID

1. UUID (Universally Unique IDentifier)

UUID는 의미 그대로 어느곳에서도 고유한 ID를 의미한다. [Figure 1]은 UUID의 Format을 나타내고 있다. 8,4,4,4,12 총 32개의 문자를 포함하고 있으며 각 문자는 16진수로 구성되며, Dash까지 포함한다면 36개의 문자로 구성된다. UUID를 Bit로 나타내면 “32*4=128” 개수의 Bit로 구성된다.

수많은 문자로 구성되어 있는 만큼 임의의 값으로 각 Server에서 UUID를 생성하더라도 생성된 UUID끼리 서로 충돌이 발생할 확률이 매우 낮다. 따라서 App이 UUID를 이용할 경우 APP은 UUID의 중복 검사를 진행하지 않고 이용하는 경우가 많다.

UUID는 UUID의 생성 방법에 따라서 Version이 존재하며 UUID에 Version 정보가 저장되어 있는 4 Bit의 Version Field가 존재한다. Version은 현재 1~5까지 존재하며 [Figure 1]의 경우에는 Version 4를 나타내고 있다. UUID에는 UUID의 Foramt 정보를 포함하고 있는 Variant가 존재하며 UUID에 3 Bit의 Varient Field가 존재한다.

1.1. Version

UUID는 생성 방법에 따라서 Version이 존재한다. TimeStamp 기반의 v1/v2, 완전 Random 기반의 v4, Hashing 기반의 v3/v5가 존재한다. 다만 실제로 v1/v4/v5가 주로 이용된다. Random한 UUID를 생성하기 위해서는 v1/v4를 이용하면되고 고정된 UUID를 생성하기 위해서는 v5를 이용하면 된다.

1.1. v1

v1 UUID는 Timestamp를 기반으로 UUID를 생성한다. [Figure 2]는 v1 UUID의 생성 과정을 나타내고 있다. 앞 부분에는 Timestamp가 쪼개져 UUID에 포함되는 것을 확인할 수 있다. Timestamp는 1582년 10월 15일 자정을 기준으로 100ns마다 1씩 증가하는 값이다. 뒷 부분에는 UUID를 생성하는 Computer의 MAC Address가 저장된다.

이러한 v1 UUID 생성 방법으로 인해서 동일한 Computer에서 동작하는 App이 100ns 동안에 UUID를 여러개 생성하는 경우, 모든 UUID가 동일하게 된다. 따라서 짧은 시간동안 많은 UUID가 생성되는 App은 v1 UUID 사용을 피해야 한다. v1 UUID 뒷 부분에는 Mac Address가 저장되기 때문에 v1 UUID를 통해서 해당 v1 UUID가 어느 Computer에서 생성되었는지 추적할 수 있다.

1.2. v4

v4 UUID는 완전 Random을 기반으로 UUID를 생성한다. UUID의 Version, Variant Field를 제외한 나머지 Field는 완전하게 Random으로 생성되어 v4 UUID가 구성된다.

1.3. v5

v5 UUID는 SHA-1 Hashing을 기반으로 UUID를 생성한다. v5 UUID를 생성하기 위해서는 Namespace와 Name값이 필요하다. Namespace와 Name값이 동일하다면 동일한 UUID가 생성된다. Namespace 값은 아래와 같이 정의되어 있으며, 정의된 값 말고 다른 값도 이용할 수 있다.

NAMESPACE-DNS : Name이 Domain 이름이다.
NAMESPACE-URL : Name이 URL이다.
NAMESPACE-OID : Name이 OID (Object Identitfier)이다.
NAMESPACE-X500 : Name이 LDAP Protocol의 Directory Name이다.

1.4. v2

v2 UUID는 v1 UUID와 동일하게 Timestamp 기반이지만 Timestamp Filed가 줄어들고 Domain/Identifier Field가 추가되었다. v2 UUID의 Timestamp 값은 약 7분 정도 지나야 1씩 증가한다. v2 UUID는 일반적인 UUID가 아닌 DCE (Distributed Computing Environment) 환경을 위한 UUID이기 때문에 잘 이용되지 않는다.

1.5. v3

v5 UUID는 v3 UUID와 동일하지만 MD5 Hahsing Algorithm을 이용하여 Hashing을 수행한다는 점이 다르다. MD5 Hashing Algorithm은 현재 보안적 취약점을 이용해서 Reverse Hashing이 쉽게 가능한 상태이다. 따라서 현재 v3 UUID 보다는 v5 UUID를 이용하는 것을 권장하고 있다.

2. with DB

v1/v4 UUID는 DB Table의 PK(Primary Key)로도 많이 이용된다. 일반적인 Interger Type ID를 이용할 경우와 비교하여 장단점이 존재한다. 일반적인 Interger Type ID를 이용할 경우와 비교하여 다음과 같은 장점을 갖는다.

UUID는 모든 환경에서 Unique 하다는 특징을 갖고 있기 때문에 Table 통합시 UUID 충돌을 걱정할 필요가 없다. 따라서 자유로운 Table 통합이 가능하다. 반대로 하나의 Table을 자유롭게 다수의 Table로 분리하기도 쉽다.
UUID의 내용만으로 Data 관련 내용을 추측할 수 없다. 예를들어 Integer Type ID의 값이 100인 User가 있다면 해당 User는 100번째로 생성된 User라는 것을 추측할 수 있지만, UUID는 이러한 추측이 불가능하다.
UUID는 반드시 Database에서 생성될 필요가 없다. App에서 생성한 UUID를 DB에서 이용할 수 있다.

일반적인 Interger Type ID를 이용할 경우와 비교하여 다음과 같은 단점을 갖는다.

UUID의 길이가 긴 많큼 더 많은 저장 공간이 필요하다. Interger Type의 ID는 4Byte 크기를 이용하지만 UUID는 4배더 큰 16Byte의 크기가 필요하다.
v1/v4 UUID의 생성이 랜덤하기 때문에 DB에 Insert시 Indexing에 더 많은 시간이 소요된다. DB 관점에서 ID(PK)는 단조증가하는 값이 이상적이다. v1 UUID는 Timestamp 기반이기 때문에 v4 UUID에 비하면 낫지만, v1 UUID도 완전한 단조증가 형태가 아니기 때문에 Integer Type ID에 비해서는 DB Indexing 시간이 더 오래 걸린다.

3. 참조

URI, URL, URN Virtual Machine, Linux Container