본문 바로가기

댓글0
번역beta

Translated by kakao i

번역할 언어 선택

뷰 본문

보드나라/케이벤치

PC 게임 시장 평정하러 등장, 기가바이트 지포스 RTX 3080 이글 OC

성능은 올리고 가격은 동결한 지포스 RTX 30 시리즈 본격 출시

1,716 읽음
댓글0
번역beta

Translated by kakao i

번역할 언어 선택

1세대 RTX 그래픽 카드인 지포스 RTX 20 시리즈 대비 최대 두 배의 성능과 1.9배에 달하는 전성비를 갖춘 지포스 RTX 3080이 마침내 일반 판매를 시작하였다.

엔비디아에서는 이미 9월 초 행사를 통해 암페어 아키텍처와 RTX 30 시리즈에 대한 세부 내용을 공개하였고, 보드나라에서도 주요 내용을 다룬 바 있지만, 실제 제품 리뷰에 앞서 엔비디아의 암페어 아키텍처와 RTX 30 시리즈는 어떤 제품인지 간단히 정리했다.

엔비디아 RTX 30 시리즈, 최대 2배에 달하는 전성비와 성능

엔비디아는 RTX 30 시리즈의 효율과 절대 성능 개선을 위해 부동소수점과 정수 연산 병행 수행이 가능한 코어와 부동소수점 연산 전용 코어 블록의 2중 데이터 패스 기반으로 SM을 설계하고, 두 배로 늘어난 코어에 맞춰 L1 캐시 용량을 튜링의 96KB에서 128KB로 33% 늘려 전체적인 처리 성능을 높였다.

텐서 코어와 RT 코어도 성능이 올라갔다. 레이트레이싱과 딥러닝을 처리하는 이 두 프로세서는 2세대와 3세대로 업그레이드 되면서 튜링 대비 2배에 달하는 성능을 제공할 수 있게 되었다.

암페어에 탑재된 2세대 RT 코어는 시간 차이에 따른 모션 블러 현상을 계산하고 표현할 수 있도록 구조가 개선되어 기존 방식보다 레이트레이싱 모션 가속을 통해 처리속도가 최대 8배 빨라졌다.

엔비디아의 설명에 따르면, 블랜더를 이용한 모션 블러 효과를 더한 랜더링시 추가 작업 속도가 RTX 2080 Super는 약 5분인 반면 RTX 3080은 1분으로, 다섯 배 가까이 빨라졌다.

암페어의 SM당 텐서 코어는 튜링 대비 절반으로 줄었지만 정밀도를 낮춰 성능을 크게 높이는 기술이 적용됐다. 기존 테슬라 계열의 뒤를 잇는 '엔비디아 A100 텐서코어 GPU'보다 처리량은 절반으로 줄었지만,그럼에도 튜링에 비해서는 최소 2배에서 4배까지 처리량이 증가했다.

아키텍처 개선 결과로 튜링 대비 암페어는 쉐이더 성능과 RT 코어 성능, 텐서 코어 성능은 각각 2.7배, 1.7배, 2.7배 상승했으며, 이에 따라 DLSS를 결합한 암페어의 레이트레이싱(RTX ON) 성능은 최대 1.7배 높아졌고, 비동기 컴퓨팅(Async)이 더해진다면 거의 두 배에 달하는 성능 향상을 이끌어 낼 수 있다는 것이 엔비디아의 주장이다.

한편, 울펜슈타인 영 블러드를 기준으로 셰이더와 RT 코어, 텐서 코어를 활용한(RTX On) 레이트레이싱 처리시 튜링 아키텍처의 지포스 RTX 2080 Super는 13ms의 시간이 소요된다. 반면, 암페어 아키텍처의 RTX 3080은 그 절반 수준인 7.5ms의 시간이 소요되며, 셰이더와 RT, 텐서 코어의 동시 처리를 통해 RTX On 시간을 더욱 단축 시킬 수 있다.

결과적으로, 암페어 아키텍처의 지포스 RTX 3080은 RTX 2080 Super 대비 최대 두 배 가까운 레이트레이싱 성능을 발휘하며, RT 코어만 활용할 때나 텐서 코어가 조합될 때는 그보다 낮지만 170% 수준의 성능을 내준다.

한편, GPU의 대대적인 성능 개선을 뒷받침하기 위해 현재 발표된 지포스 RTX 30 시리즈 중에는 RTX 3080과 RTX 3090에는, 마이크론과 협력해 개발한 GDDR6X 메모리가 사용되었다.

이해하기 쉽게 비유하자면, GDDR6 메모리는 한 번에 1bit(0 or 1 표시)의 데이터만 전송 가능하지만, GDDR6X 메모리는 PAM4 신호 구조를 도입해 한 번에 2bit(00 or 01 or 10 or 11) 자료를 전송할 수 있게 된 것.

GDDR6X는 이러한 신호를 250mV 차이로 구분되며, 미세한 전압 차이로 인한 신호 간섭을 배재하고 신호 품질을 유지하기 위한 처리가 필요한 만큼, 결과적으로 동일한 데이터를 전송하는데 GDDR6 메모리는 500피코초가 걸리는데 비해 GDDR6X 메모리는 380피코초가 소요된다.

한편, 엔비디아는 전성비 개선을 위해 그래픽 코어와 메모리 전력 공급 레일을 분리 설계해 튜링 아키텍처 대비 전성비를 90% 더 높였으며, HDMI 2.1을 지원해 단일 케이블로 8K HDR 60Hz 출력이 가능해졌다.

또한, 타이거 레이크의 Xe 아키텍처 기반 GPU가 내장 그래픽 최초로 AV1 코덱을 지원한데 이어, 엔비디아 암페어 GPU는 외장 그래픽 최초로 AV1 코덱을 지원한다. 한가지 아쉬운 점을 꼽자면, 인텔과 엔비디아 모두 AV1의 인코딩 가속은 미지원 상태라는 점을 들 수 있겠다.

시스템의 레이턴시를 줄여주는 엔비디아 Reflex, 마이크로소프트가 엑스박스 시리즈 X/ S 콘솔에서 PC로 이식을 준비 중인 다이렉트스토리지(DirectStorage) 기반의 RTX I/O도 지원한다.

다이렉트스토리지 기술은 2021년내 개발자 프리뷰 공개를 목표로 하고 있으며, 실제 게임의 지원도 필요한 만큼 PC에서 RTX I/O 기술을 실제 활용하기까지는 아마도 상당한 시간을 기다려야할 것으로 판단된다.

기가바이트 지포스 RTX 3080 이글 OC

지포스 GTX 10 시리즈와 RTX 20 시리즈 때와 마찬가지로 RTX 30 시리즈 역시 파운더스 에디션은 엔비디아 공식 홈페이지를 통해서만 구매할 수 있다.

즉, 일반적으로 국내에서는 각 제조사들의 커스텀 모델만 구할 수 있는데, 이에 보드나라는 제이씨현에서 국내 유통하는 기가바이트의 지포스 RTX 3080 이글 OC 모델을 이용해 RTX 3080의 성능을 테스트했다.

본 모델은 RTX 3080의 레퍼런스 부스트 클럭인 1710MHz보다 소폭 오버클럭되어 부스트 클럭이 1755MHz로 동작하며, 최대 전력 한계 340W로 설정되었고, 파운더스 에디션과 비교해 쿨링 솔루션이 차이가 있는 만큼, 테스트 결과 확인에 참고하기 바란다.

윈드포스 3X 쿨링 시스템으로 준수한 방열성능

기가바이트 지포스 RTX 3080 이글 OC는 기가바이트 고유의 윈드포스 3X 쿨러가 장착되었다. 흔히 0Fan이라 불리며, 아이들 시 쿨링팬의 동작을 멈춰 소음과 팬 수명의 균형을 맞추는 3D 액티브 팬 기술과, 중앙 쿨링팬의 회전 방향을 양측면 팬과 반대로 설정, 경계면의 공기 흐름을 개선한 대체 회전(ALTERNATE SPINNING)이 적용된 것이 특징이다.

쿨링팬이 배치된 면의 우측 상단에는 제품 브랜드인 이글로고가 스모크 스크린 아크릴과 결합되어 멋을 내고 있으며, 중앙팬 상단쪽에 건담의 뿔을 연상케하는 디자인의 RGB Fusion 2.0 RGB LED 튜닝도 지원한다.

퍼마크 4K 부하 테스트를 이용해 소비전력과 발열을 체크했다.

RTX 3080의 소비전력은 RTX 2080과 비교해 약 40% 높은 450W로 측정되었고, RTX 2080 Ti와 비교하면 약 8% 높은 수치다. RTX 3080의 온도는 아이들시 다른 RTX 20 시리즈 제품들보다 약 20℃ 높게 측정되었는데, 이는 테스트에 사용된 제품에 0Fan 기술이 적용된 영향을 판단된다.

풀로드 상태에서는 RTX 2080과 비교해 약 9도 낮은 67℃를 기록했는데, 이번 발열과 온도 측정에 사용된 RTX 3080은 기가바이트 커스텀 모델인 점을 감안하기 바란다.

참고로, 테스트에 사용된 RTX 2080과 RTX 2070 Super는 엔비디아 파운더스 에디션이며, RTX 2080 Ti는 팩토리 오버클럭된 제조사 커스텀 모델이다.

다섯개의 출력 포트로 4개의 디스플레이 동시 지원

파운더스 에디션의 출력 포트는 DP포트 3개와 HDMI 포트 1개인 것과 비교해 기가바이트 지포스 RTX 3080 이글 OC는 HDMI 포트를 1개 더 추가해 총 다섯개의 출력 포트를 지원한다. 동시 출력은 4개만 가능하지만, HDMI 포트가 1개 더 추가되면서 파운더스 에디션이나 RTX 20 시리즈 제품에 비해 보다 유연한 디스플레이 환경에 대응할 수 있게 되었다.

기가바이트 지포스 RTX 3080 이글 OC는 제품군에 어울리는 백플레이트를 갖췄다. 단지, 지금까지의 일반적인 백플레이트와 달리 케이스 안쪽 경계면이 뚫려있어 RTX 3080 파운더스 에디션을 떠올리는 구조다.

참고로, 엔비디아 코리아서 진행한 RTX 3080 국내 미디어 브리핑에서, 엔비디아측은 유사한 쿨링 구조인 RTX 3080 파운더스 에디션 테스트 결과 공기 흐름을 개선해 메모리와 CPU 쿨링에 도움을 주는 것을 확인했다고 전했다.

물론 시스템 구성에 따라 차이가 있을 수 있고, 본 제품은 RTX 3080 파운더스 에디션과 쿨링 디자인이 차이가 있으므로, 엔비디아 코리아측의 발표 내용은 참고만 하기 바란다.

아쉽게도 백플레이트는 추가 방열판 역할은 없이 순수하게 제품 변형 및 손상 방지를 위한 보호 패널의 역할이며, 듀얼 8핀 보조전원 커넥터 고정 역할도 수행한다.

쿨링 솔루션은 구리 베이스의 GPU 쿨링부, 전원부를 구성한 DrMOS와 초크, 메모리 발열 대응을 위한 알루미늄 방열판이 7개의 히트파이프로 결합된 구조다.

기가바이트 지포스 RTX 3080 이글 OC의 핵심 부품인 RTX 3080 GPU의 코드는 GA102-200-KD-A1이며, PCB 구조상 주변 12개의 메모리 장착부에는 10개의 마이크론 GDDR6X 메모리가 배치되었고, 총 17페이즈 구성이 가능한 전원부에는 실제 16페이즈만 구성되어 있다.

이러한 구성은 제품에 쓰인 PCB를 공유한 고성능 RTX 3080 모델 출시 가능성을 점칠 수 있겠다.

RTX 2080 Ti보다 높은 성능, RTX 효율은 글쎄

그럼 성능은 어떨까? 기가바이트 지포스 RTX 3080 이글 OC와 3DMark를 통해 암페어 아키텍처의 기본적인 셰이더 성능과 레이트레이싱(RT 코어), 인공지능(텐서 코어) 성능을 우선 알아보자.

앞서 이야기했듯, 기가바이트 지포스 RTX 3080 이글 OC는 부스트 클럭이 공식 스펙인 1710MHz에 비해 소폭 오른 1755MHz로 세팅된 점은 테스트 결과 확인시 참고하기 바란다.

테스트는 인텔 코어 i9-10900K/ DDR4 2933MHz 8GB*2/ 윈도우 10 2004 64bit 환경에서 진행되었고, RTX 20 시리즈 테스트에는 게임 레디 드라이버 452.06 버전이, RTX 3080 테스트에는 리뷰용 드라이버 456.16 버전이 사용되었다.



우선, 가장 기본적인 셰이더 성능이다. 파이어스트라이크(DX11)와 타임 스파이(DX12) 테스트에서 RTX 3080은 모델명상 전세대 동급 모델인 RTX 2080과 비교해 약 30%(Fire Strike)에서 최대 65%까지 높은 성능을 내준다.

엔비디아가 언급한 최대 2배에 달하는 성능 차이는 말 그대로 '최대'인 점을 감안하면 나쁘지 않은 성능 향상폭이다. 전세대 최고 성능 게이밍 그래픽 카드인 RTX 2080 Ti와 비교해도 평균 30%에 달하는 성능 향상이며, RTX 2080과는 평균적으로 50% 더 높은 성능이다.

3DMark에서 전통적인 방식의 반사효과와 RT 코어를 활용한 레이트레이싱 적용했을 때의 성능을 비교했다. 실제 게임에서는 약 절반 가까이 성능이 하락하는 것과 달리 본 테스트에서는 두 테스트간의 성능 차이가 크지 않지만, RTX 20 시리즈가 약 8%가량 성능 하락이 발생하는 것과 달리 RTX 3080의 성능 하락폭은 6%로, 레이트레이싱 효율이 향상되었음을 알 수 있다.

텐서 코어를 이용한 인공지능(DLSS) 성능은 오히려 조금 낮아진 모습을 보인다. RTX 2080의 성능 향상폭이 약 44%인 것과 비교해 RTX 3080의 향상폭은 40%에 그쳤다.

암페어 아키텍처에 적용된 3세대 텐서 코어가 튜링에 적용된 2세대 텐서 코어에 비해 효율이 높아져 더 적은 코어로도 비슷한 효율을 내주는 것은 주목할만 하지만, 게이머 입장에서는 결과적으로 효율이 낮게 측정된 것은 아쉬운 부분이다.

RTX 3080, 실제 게임에서의 RT / 텐서 코어 효율은?

3DMark 테스트 결과를 보면, RTX 3080은 RTX 2080과 비교해 레이트레이싱 효율은 소폭 증가, 텐서 코어 효율은 소폭 감소한 것으로 나타났는데, 실제 게임에서는 어떤 식으로 반영될지, 컨트롤과 율펜슈타인 영블러드를 이용해 점검했다.

컨트롤과 울펜슈타인의 게임 그래픽 옵션과 레이트레이싱, DLSS 옵션은 모두 최상의 품질을 낼 수 있도록 세팅했으며, 아래 테스트 결과는 모두 4K 해상도에서 진행된 내용이다.

결과만 보면 컨트롤과 울펜슈타인 영블러드 모두에서 RTX 3080은 RTX On(RTX + DLSS) 상태와 RTX/ DLSS 개별 적용 성능 모두 RTX 2080은 물론이고 RTX 2080 Ti까지도 뛰어넘는 성능을 보여준다.

동일 시간에 더 많은 추가 작업을 수행하면서도 더 높은 성능을 보인다는 결과를 보면 암페어의 높아진 셰이더/ RT 코어/ 텐서 코어의 성능이 제대로 성능을 발휘되는 것을 알 수 있다.

그러나, 4K일 때의 셰이더 성능을 100%로 두고 레이트레이싱과 DLSS를 적용한 각 경우의 성능 비율을 보면 제품 자체로서는 조금 다른 모습을 볼 수 있다.

우선, 3DMark 테스트에서 RTX 3080의 효율이 RTX 2080보다 낮게 측정되었던 DLSS 효율은 컨트롤과 울펜슈타인 역시 마찬가지였다. 반면 레이트레이싱만 적용했을 때는 다른 RTX 20 시리즈보다 높은 효율을 보였고, DLSS와 결합된 RTX On 조건에서도 탁월한 효율을 보였다.

RTX 20 시리즈에서 실시간 레이트레이싱이 지적받았던 대표적인 이유가 바로 큰 폭의 성능 하락이 발생한다는 것이다. RTX 30 시리즈 역시 절대 성능과 RTX 효율이 높아지긴 했지만, 실제 제품 차원에서 RTX 효율 개선이 게이머들의 기대를 충족할 수준인지에 대해서는 의문이 남는다.

RTX 2080보다 평균 60% 높은 성능

지포스 RTX 3080의 기본적인 게임 성능(3DMark)과 레이트레이싱(RT 코어)/ 인공지능(텐서 코어, DLSS) 성능을 체크한데 이어, 이번에는 일반적인 게임 성능을 체크했다.

고전과 최신작들을 포함해 총 12종의 게임들을 체크했으며, 게임에 따라 성능 차이는 있지만 RTX 3080이 절대적인 성능 우위를 점한 가운데 RTX 20 시리즈가 라인업 순서대로 성능 상위권을 차지하였다.



일단, RTX 2080을 기준으로 보면 엔비디아가 이야기한 RTX 3080의 성능이 최대 두 배에 달하는 결과는 나오지 않았지만, 디비전 2 4K 해상도에서 최대 185%에 달하는 성능 차이를 보여주었고, 가장 적은 성능 차이도 FF14 칠흑의 반역역자 Full HD 해상도에서 28%에 달했다.

RTX 2080 Ti와 비교하면 레드 데드 리뎀션 2 4K에서 동급 성능으로 측정된 것을 제외하면, 최소 13%에서 최대 36%까지 높은 성능을 보여주었고, 파운더스 에디션 기준 두 제품의 런칭 가격 차이가 500달러에 달하는 것을 감안하면 확실한 세대 교체를 알리는 신호탄이다.

RTX 3080, 전세대 동급 대비 평균 60% 달하는 성능 향상

앞서 12종 각각의 게임 성능을 측정해 각각의 결과를 정리했다.

물론 각 게임별 성능 차이도 중요하지만, 세상 모든 게임을 테스트할 수 없는 것이 현실이고, 앞으로 출시될 게임에서의 성능 차이를 짐작키 위해서 대략적인 성능 차이가 어느 정도인지 아는 것도 중요하다.

이에 RTX 2080을 기준으로 각 해상도별 그래픽 카드의 평균적인 게임 성능 차이를 정리했는데, RTX 3080 타겟층인 UHD에서는 평균 170%에 달하는 성능 향상이, QHD와 Full HD에는 그보다 조금 낮지만 평균 150% 대의 성능 개선이 기대되며, 전 해상도 평균적으로는 약 160% 가까운 성능을 경험할 수 있다

RTX 3080을 RTX 2080 Ti와 비교하면 각 해상도와 전체 평균적으로 약 20% 가량 높은 성능을 내준다.

지포스 RTX 3080, 괜찮은 세대교체

지금까지 RTX 3080에 대해 알아봤다.

엔비디아가 발표한 최대 두 배에 달하는 성능은 말 그대로 '최대'치인 만큼 이번 기사에서는 두 배에 달하는 성능을 경험하지는 못했지만 RTX 2080 대비 평균적으로 60%, 최대 85%에 달하는 성능 향상을 경험할 수 있었다.

무엇보다 파운더스 에디션 가격이 전세대 MSRP와 동일하게 책정되어 실제로는 소폭의 가격 인하가 이뤄졌고, 이에 RTX 3080의 특성을 확인하기 위해 이번 기사에서 샘플로 선정된 기가바이트 지포스 RTX 3080 이글 OC 같은 커스텀 모델들의 가격도 전세대와 동급 가격이 예상된다.

RTX 20 시리즈에서 RTX 30 시리즈로의 세대 교체는 매우 모범적인 형태라 평가할 수 있겠다.

한가지 아쉬운 점을 꼽자면, 2세대 RTX GPU로서의 정체성을 강조한 RT 코어 기반의 레이트레이싱이나 텐서 코어를 활용한 DLSS의 성능이 강화된 것은 사실이지만, 실제 제품 단위에서 소비자가 체험하는 효율 개선 정도는 약간의 아쉬움을 남겼다.

한편, 엔비디아의 암페어 시리즈는 그동안 전담 파운드리라 해도 좋을 TSMC 대신 삼성 파운드리에서 위탁생산하게 되는데, 이에 생산 수율에 대한 의구심이 계속 제기되고 있다. 소비자 입장에서는 수요/ 공급에 따라 그래픽 카드 가격이 폭등하는 사례를 수차례 지켜본 만큼 불안감을 느낄 수 있는데, 부디 수요에 충분히 대응할 만큼 원활한 공급이 이뤄지길 한 사람의 게이머로서 기대하며 기사를 마친다.

작성자 정보

보드나라/케이벤치

    실시간 인기

      번역중 Now in translation
      잠시 후 다시 시도해 주세요 Please try again in a moment