리뷰 | 진정한 혜자 그래픽카드, 지포스 RTX 3080 FE 성능 테스트

조회수 2020. 9. 16. 22:10 수정
번역beta Translated by kaka i
번역중 Now in translation
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 다양한 분야의 재밌고 유익한 콘텐츠를 카카오 플랫폼 곳곳에서 발견하고, 공감하고, 공유해보세요.

지포스 RTX 3080 FE 성능 테스트
오늘은 게이머들이 가장 기다려 온 지포스 RTX 3080 성능을 공개하는 날이다.

원래 예정 됐던 일정 보다 이틀이나 지나 답답한 게이머들이 많았을 텐데 그 만큼 많은 데이터를 정리하고 보다 심도 있는 리뷰를 준비 했다. 이를 위해서 하나로 모든 내용을 정리 했던 기존 형식에서 벗어나 게이밍 성능과 쿨링, 미디어 처리 성능을 개별 기사로 분리 했으며 보다 자세한 설명을 추가했다.

지금 보는 기사는 지포스 RTX 3080의 게이밍 성능을 소개하는 기사이며 쿨링, 미디어 처리 성능은 뒤를 이어 올라 갈 예정이다.

그럼 지금부터 지포스 RTX 3080의 간단한 소개와 함께 게이밍 성능에 대한 본격적인 이야기를 진행해 보도록 하겠다.
■ 지포스 RTX 3080, 어떻게 변했나?
지포스 RTX 3080을 소개하는 것은 암페어 아키텍처를 소개하는 것이나 마찬가지다.

이미 암페어 아키텍처와 RTX 30 시리즈의 특징(오직 성능! 초격차 전략이 만들어낸 지포스 RTX 30 시리즈와 암페어의 비밀)을 소개한 바 있기에 다시 이를 정리할 필요는 없다고 생각되지만 최근 암페어 아키텍처에 대한 백서가 공개되며 앞선 기사에서 다루지 못한 내용이 있어 이에 대한 보충 설명을 먼저 정리해 볼까 한다.

일단, 암페어 아키텍처의 핵심이 듀얼 FP32 프로세싱과 2배로 증가한 FP32 유닛, 즉 쿠다 코어인 것은 변함이 없다. 이를 위해 L1 캐쉬 용량을 33% 키웠고 대역폭도 2배로 증가시킨 것도 사실이다. 하지만 앞선 기사에서 다루지 않은 ROP 구조에도 변화가 있는 것으로 확인됐다.

ROP는 원래 메모리 컨트롤러와 L2 캐쉬에 묶여있었다. 메모리 버스 구성에 따라 ROP 구성도 달라지는 것이 지금까지의 엔비디아 GPU 아키텍처였는데 그걸 변경한 것이 암페어 아키텍처다.

엔비디아는 ROP를 GPC 안으로 흡수시켰다. 메모리 컨트롤러 블럭에서 분리해 실제 랜더링 작업이 처리 되는 GPC 단위로 ROP의 증감을 결정할 수 있게 만든 것이다. 이렇게 하면 프론트 앤드 작업과 백앤드 작업 사이의 밸런스를 적절하게 조합하는 것이 가능해 진다. 덕분에 384비트 버스를 사용하고도 ROP 유닛이 96개 였던 튜링 보다 16개 많은 ROP 유닛이 암페어에 적용될 수 있게 됐다.
병행 처리 엔진에도 변화가 확인됐다.

RT 코어 작업과 텐서 코어 작업을 동시에 처리할 수 없던 튜링과 달리 암페어에는 쿠다 코어를 이용한 세이더 연산과 RT 코어를 이용한 컴퓨팅 연산, 텐서 코어를 이용한 컴퓨팅 연산을 한번에 처리할 수 있는 2세대 병행 처리 엔진이 적용됐다.

이 구조는 레이트레이싱 연산과 DLSS를 동시에 처리하게 만들기 때문에 이전 세대 보다 빠른 랜더링 타임을 가능하게 만드는데 엔비디아가 공개한 백서에는 1세대와 2세대 병행 처리 엔진의 성능 차이를 가늠할 수 있는 자료가 없었지만 앞서 제공된 에디터스 데이 프리젠테이션 자료에서 0.8 ms 정도의 랜더링 시간 단축 효과가 있는 것으로 확인 됐다.

참고로 0.8ms의 차이는 15.9 fps가 증가하거나 줄었다는 것을 의미하며 이 결과는 암페어 아키텍처에 최적화 된 울펜슈타인 영블러드, 베타 빌드를 통해 확인된 것으로 소개됐다.

지금까지 소개한 두 가지 변화 외에 암페어 아키텍처의 특징들은 앞선 기사에서 정리한 내용과 다르지 않다.
지포스 RTX 3080은 암페어 아키텍처가 적용된 가장 큰 칩, GA102에서 필요한 영역만 활성화 시킨 컷다운 버전이 사용됐다. 자이언트 암페어로 소개된 풀 칩 버전은 지포스 RTX 3090에 들어간다. 사실, 지포스 RTX 3090도 완벽하게 풀 칩은 아니고 풀 칩 구성에서 쿠다 코어가 256개가 부족한 버전이다. 진정한 풀 칩 버전은 쿠다 코어가 10752개여야 한다.

지포스 RTX 3080이 풀 칩은 아니지만 튜링 세대, 즉 지포스 RTX 20 시리즈와는 비교가 불가능할 만큼 스펙 차이가 엄청나다. 이미 공개된 자료 대로 지포스 RTX 2080이나 RTX 2080 슈퍼 보다 쿠다 코어가 2배 이상 많고 연산 성능은 거의 3배나 차이 나는 것이 지포스 RTX 3080이다.

좀 더 자세한 비교를 위해 암페어 기술 백서에 포함된 세대간 비교표를 가지고 와 봤는데 보면 알겠지만 지포스 RTX 3080은 거의 모든 항목에서 지포스 RTX 2080과 RTX 2080 슈퍼를 압도하는 스펙을 가지고 있다.

쿠다 코어가 2배 이상이고 메모리 대역폭도 1.5배 이상이니 더 이상의 설명은 불필요할 것으로 본다.
■ 벤치마크 테스트 시스템 소개
지포스 RTX 3080과 비교 데이터에 사용한 그래픽카드를 테스트 한 시스템은 인텔 코어 i7-10700K와 DDR4 3200 16GB x 2 (CL15) 그리고 ASUS Maximus XII APEX 메인보드를 사용했다.

엔비디아의 권장 시스템 사양인 코어 i9-10900K 보다는 한 등급 낮지만 코어 i7-10700K를 정규 클럭 보다 높은 5GHz(올코어 기준)으로 동작시켜 CPU 성능으로 문제가 될 수 있는 부분을 최소화 했다.

파워는 시소닉에서 1000W 모델을 사용 했는데 이 파워는 엔비디아가 제공한 듀얼 8핀 to 12핀 변환 케이블 없이 자체 제작한 12핀 케이블을 사용할 수 있다. 12핀 케이블 및 소비전력 관련 내용은 이어지는 기사에서 다루었으니 관련 내용은 해당 기사를 참고하기 바란다.

드라이버는 엔비디아에서 제공한 456.16 버전을 사용 했으며 RTX 20 시리즈는 정식 공개 버전 중 가장 최신 버전인 452.22 핫픽스 버전을 사용했다. 윈도우10은 올 봄에 배포된 2004 버전을 사용 했으며 가장 최근 업데이트까지 모두 적용 후 테스트 했다.

테스트에 사용된 지포스 RTX 3080은 엔비디아가 제품을 지원한 파운더스 에디션, 즉 FE 모델이다.
■ 지포스 RTX 3080 성능 테스트 - 3DMARK
지포스 RTX 3080 성능 중 가장 먼저 확인할 것이 3DMARK다.

3DMARK 점수는 제품 간 성능 차이를 확인하는 가장 쉽고 정확한 벤치마크 툴이며 그 중 그래픽 점수를 확인하면 자신이 사용 중인 그래픽카드와 지포스 RTX 3080의 성능 차이를 쉽게 확인할 수 있다.

필자가 테스트 한 결과는 위 표에 정리한 그대로다. 모든 결과는 총점이 아닌 그래픽 점수이며 결과에서 보듯 지포스 RTX 3080은 모든 항목에서 지포스 RTX 20 시리즈를 압도했다.

일단, 파이어스트라이크 점수가 4만점을 넘었다는 것도 꽤 충격적이지만 29000점도 넘지 못한 RTX 2080과 2080 슈퍼와의 점수 차이가 더 크게 와 닿았는데 이 점수만 해도 1.5배 이상인 것이 지포스 RTX 3080이다.

점수 차이가 가장 크게 벌어진 것은 포트 로얄이다. 이 테스트 항목은 레이트레이싱으로 그래픽이 랜더링 된 것으로, 지포스 RTX 3080과 지포스 RTX 2080의 차이가 무려 1.75배에 달했다. 아무래도 기본적인 랜더링 성능이 업그레이드 된 것도 있겠지만 RT 코어 개수가 1.5배 가까이 증가했고 2세대 RT 코어가 적용 되면서 작업 속도 자체가 2배로 개선된 것에 따른 영향으로 판단된다.
■ 지포스 RTX 3080 성능 테스트 - 게임
■ 지포스 RTX 3080 성능 테스트 - 레이트레이싱 게임
레이트레이싱으로 처리된 게임에서도 지포스 RTX 3080은 급이 다른 성능을 보여줬다.

앞서 확인한 3DMARK 포트 로열 처럼 많은 게임에서 더 많은 프레임 차이가 확인 됐다. FHD는 1.5배나 1.6배 정도가 대부분 이었으나 해상도가 높아질 수록 프레임 차이가 더 벌어졌고 4K 해상도에선 거의 모든 게임이 1.8배 이상였다.

아직 정식 출시된 게임은 아니지만 벤치마크 버전으로 제공된 Boundary는 2.1배에 달해 2세대 RT코어와 증가된 RT 코어 개수의 차이를 확실하게 입증했다.

지포스 RTX 3080 결과 자체도 상당히 긍정적이다.

튜링 세대에서는 엄두도 못 낸 4K 60FPS를 울펜슈타인:영블러드에서 실현 했고 쉐도우 오브 더 툼레이더는 52FPS나 기록했다.

다른 게임 보다 사양이 높은 Control과 메트로 엑소더스는 여전히 4K가 한계로 남았지만 QHD 해상도에서 57 FPS와 75 FPS를 기록한 걸 보면 DLSS 도움 없이 모든 해상도에서 레이트레이싱으로 게임을 플레이 하게 될 날이 머지 않은 것 같다.

결과를 아직 알 순 없으나 지포스 RTX 3090이 그 한계를 이미 넘었을지도 모를 일이다.
■ 지포스 RTX 3080 성능 테스트 - DLSS
지포스 RTX 3080, 즉 암페어 아키텍처에 적용된 DLSS 기술은 튜링 세대와 다르지 않다.

DLSS 2.1로 소개된 버전업도 8K 게이밍을 실현하기 위한 9배 업스케일 기능이 추가된 것 뿐이라서 지포스 RTX 3080와 RTX 20 시리즈의 DLSS는 사실 상 같은 기술이나 마찬가지다. 차이가 있다면 DLSS로 처리해야 할 프레임이 증가했고 그 만큼 증가된 텐서 코어 성능이 지포스 RTX 3080과 암페어 아키텍처에 적용 됐다는 것 뿐이다.

이 때문에 DLSS 적용 전후 프레임 증가 폭, 즉 비율은 RTX 20 시리즈와 크게 다르지 않다. 적게는 1.5배에서 많게는 1.8배 정도가 그대로 유지됐다. 아쉽지만 어쩔 수 없는 결과다.

그래도 지포스 RTX 3080으로 경험할 수 있는 절대 프레임이 꽤 증가했다는 점에서 게이머들의 만족도는 높을 것으로 생각된다. 4K 60 FPS는 근처도 못 갔던 Control이 54 FPS까지 증가했고 메트로 엑소더스는 60 FPS를 넘기기도 했으니 말이다.

참고로, 이번 결과는 QHD로 랜더링한 후 4K로 업스케일 하는 품질 모드로 테스트 한 것이라서 FHD로 랜더링 하는 성능 모드를 사용하면 이보다 훨씬 높은 FPS를 경험할 수 있다. 4K 60FPS도 어렵지 않게 달성할 수 있을 것이다.
■ 2세대 병행 처리 엔진의 효율과 성능
암페어에 적용된 2세대 병행 처리 엔진이 프레임 증가를 가져오는 건 사실이다. 엔비디아가 제시한 데이터에도 나와 있고 최적의 조건에서 그 정도 차이를 가져올 수 있다. 하지만, 모든 게임과 작업에서 최적의 조건이 실현되는 건 아니라서 예상 보다 효과가 크지 않을 수 있다.

이상과 현실의 차이라고 할까.. 그래서 그 차이를 확인해 보고자 엔비디아가 제시한 울펜슈타인 영블러드를 테스트 했다. 테스트에 사용한 울펜슈타인 영블러드는 2세대 병행 처리 엔진을 지원하는 미공개 베타 버전으로, 일반 게이머들에게 배포된 리테일 버전과 다른 것이다.

결과는 필자의 예상을 뒤집었다.
엔비디아가 제시한 수치는 최적의 조건에서만 얻을 수 있는 것이 아니었다. 2세대 병행 처리 엔진은 조건에 관계 없이 프레임 증가를 가져 왔고 그 차이가 상당했다. 비율로 따지면 12~18% 정도고 프레임으로 계산하면 15~27 FPS 정도가 증가했다.

2세대 병행 처리 엔진은 레이트레이싱만 처리하는 작업에도 효과가 있는 것으로 확인됐다.

세이더와 레이트레이싱도 병행 처리가 기본이라 작업 시간 단축에 도움이 된 것으로 생각 되는데 DLSS까지 모두 처리하는 작업 만큼은 아니지만 그래도 6~7% 정도의 프레임 증가를 기대할 수 있다.
■ PCI Express 4.0, 프레임도 높아질까?
암페어는 PCI Express 4.0을 지원한다.

튜링이 지원하는 PCI Express 3.0 보다 대역폭이 2배나 높은 최신 인터페이스라서 이 부분에 대한 기대가 높을 수도 있는데 그래픽카드는 자체 로컬 메모리로 많은 양의 데이터를 처리하는 것이 일반적이라서 PCI Express 버스 대역폭이 프레임에 영향을 주는 경우가 거의 없다.

암페어 아키텍처의 특징으로 소개된 RTX IO가 도입되고 이런 환경을 적극 활용하는 게임이 등장하는 시대가 되면 PCI Express 4.0이 더 나은 조건을 제공할 수 있지만 지금 당장은 그런 기대는 하지 않는 것이 좋다.
위 결과는 PCI Express 4.0을 지원하는 라이젠 9 3900X와 X570 메인보드에서 PCI Express 버전을 변경하며 테스트 한 것으로, 대역폭 자체를 평가하기 위한 PCI Express feature test만 점수 차이가 있었을 뿐 나머지 항목에선 의미 있는 차이를 발견하지 못했다.
■ 8K 게이밍 시대를 준비하는 지포스 RTX 3080 성능은?
결과는 위에 나온 그대로다. 생각 보다 프레임이 좋았고 수냉 쿨러가 적용된 RTX 2080 Ti 보다 훨씬 여유 있는 플레이가 가능했다. 영상은 각각의 그래픽카드에서 쉐도우 플레이를 이용해 녹화 후 편집한 것이라서 테스트 결과 표 보다 FPS가 낮게 측정됐다.

참고로, 8K 게이밍 테스트에서 포르자 호라이즌4만 사용한 이유는 다른 게임 보다 FPS가 높고 최고 옵션에서 메모리 부족으로 문제가 발생하지 않았기 때문이다. 원래는 울펜슈타인:영블러드도 추가하려 했으나 메모리 부족 현상으로 옵션 조절이 필요해 정확한 비교가 어려웠다.
■ 진정한 혜자 그래픽카드, 지포스 RTX 3080
지금까지의 결과를 종합하면 지포스 RTX 3080의 게이밍 성능은 지포스 RTX 2080 대비 평균 1.5에서 1.6배로 판단된다.

일부 게임과 4K 해상도, 레이트레이싱 처럼 작업 로드가 큰 환경에선 1.8배 이상도 가능하다. 모든 게임에 적용되는 건 아니지만 2세대 병행 처리 엔진으로 DLSS 작업 시 증가폭을 최고 18%까지 더할 수도 있다.

이 정도 성능 향상이면 일반적인 세대 교체를 넘어 전혀 다른 제품이라 해도 믿지 않을 수 없을 텐데 그 만큼 지포스 RTX 3080의 성능은 역대급이고 그 누구도 예상하지 못한 파격이라 할 수 있다.

더욱이 성능 향상은 곧 돈이라는 전례에서 벗어나 기존 가격 그대로 699달러에 공급한다는 또 한번의 파격이 더해지면서 진정한 혜자 그래픽카드가 탄생하게 됐다.

가격은 그대로, 성능은 1.5배, 많게는 1.8배 이상인 지포스 RTX 3080 말이다.
이 콘텐츠에 대해 어떻게 생각하시나요?