지포스 40 시리즈

(4070 SUPER에서 넘어옴)

지포스 40 시리즈(GeForce 40 series)는 지포스 30 시리즈의 뒤를 잇는, 엔비디아가 개발한 그래픽 처리 장치 계열이다. 이 시리즈는 2022년 9월 20일 GTC 이벤트의 GTC 2022 GeForce Beyond A Special Broadcast에서 발표되었으며 2022년 10월 12일 선적을 시작할 것으로 예상된다.[1] 에이다 러브레이스(Ada Lovelace) 아키텍처에 기반을 두며 엔비디아 3세대 RT 코어와 4세대 텐서 코어를 갖춘 하드웨어 가속 광선 추적(RTX) 기능을 지원한다.

지포스 40 시리즈
2022년 출시된 엔비디아 지포스 4090 파운데이션 에디션
출시일2022년 10월 12일(2년 전)(2022-10-12)
코드명AD10x
아키텍처에이다 러브레이스(Ada Lovelace)
모델지포스 RTX 시리즈
트랜지스터
  • 76.3B (AD102)
제조 공정TSMC 4N[1]
카드
하이엔드지포스 RTX 4080 (12 GB)
인튜지에스트
  • 지포스RTX 4080 (16 GB)
  • 지포스 RTX 4090
API 지원
Direct3DDirect3D 12.0 Ultimate (피처 레벨 12_2)
OpenCLOpenCL 3.0
OpenGLOpenGL 4.6
벌칸Vulkan 1.3
역사
이전지포스 30 시리즈

상세 내용

편집

에이다 러브레이스 아키텍처의 아키텍처의 강조점은 다음을 포함한다:[2]

  • CUDA 컴퓨트 캐퍼빌리티 8.9[3]
  • TSMC 4N 공정 (엔비디아를 위해 커스텀 설계)[1] - N4와 구별
  • 4세대 텐서 코어(FP8, FP16, bfloat16, TensorFloat-32 (TF32), sparsity 가속)
  • 3세대 레이 트레이싱 코어 (동시 레이 트레이싱, 셰이딩, 연산과 함께)
  • 8K 10비트 60FPS AV1 고정 함수 하드웨어 인코딩 기능을 갖춘 NVENC[4][5]
  • NVLink 지원 제거[6]
모델 시작일 시작
MSRP
(USD)
암호명 트랜지스터 (10억) 다이 크기 (mm2) 코어 구성[a] SM
[b]
L2
캐시

(MB)
클럭 속도[c] 필레이트[d][e] 메모리 처리 전력 (TFLOPS) TDP
(와트)
코어
클럭
(MHz)
메모리 (GT/s) 화소
(Gpx/s)
텍스처
(Gtex/s)
크기
(GB)
대역폭
(GB/s)
유형 버스폭
(비트)
Half
precision

(부스트)
Single
precision

(부스트)
Double
precision

(부스트)
텐서
연산
(non-sparse)
GeForce RTX
4080 (12 GB)[7][8][9]
2022년 11월 $899 AD104-400 35.8 294.5[10] 7680:?:?:60:240 60 48 2310
(2610)
21 12 504 GDDR6X 192 35.482
(40.090)
285
GeForce RTX
4080 (16 GB)[7][8][11]
2022년 11월 $1199 AD103-300 45.9 378.6 9728:?:?:76:304 76 64 2210
(2510)
23 16 736 256 42.998
(48.835)
320
GeForce RTX
4090[7][12][13]
2022년 10월 12일 $1599 AD102-300 76.3 608.4 16384:512:192:128:512 128 96 2230
(2520)
21 428.16
(483.84)
1141.76
(1290.24)
24 1008 384 73.073
(82.575)
450
  1. Shader Processors : Texture mapping units : Render output units : Ray tracing cores : Tensor Cores
  2. The number of Streaming multi-processors on the GPU.
  3. Core boost values (if available) are stated below the base value inside (brackets).
  4. Pixel fillrate is calculated as the lowest of three numbers: number of ROPs multiplied by the base core clock speed, number of rasterizers multiplied by the number of fragments they can generate per rasterizer multiplied by the base core clock speed, and the number of streaming multiprocessors multiplied by the number of fragments per clock that they can output multiplied by the base clock rate.
  5. Texture fillrate is calculated as the number of TMUs multiplied by the base core clock speed.

같이 보기

편집

각주

편집
  1. “NVIDIA Delivers Quantum Leap in Performance, Introduces New Era of Neural Rendering With GeForce RTX 40 Series”. 《NVIDIA Newsroom》. 
  2. “NVIDIA Ada Lovelace Architecture”. 《NVIDIA》. 
  3. “I.7. Compute Capability 9.x”. 《docs.nvidia.com》 (미국 영어). 
  4. “Creativity At The Speed of Light: GeForce RTX 40 Series Graphics Cards Unleash Up To 2X Performance in 3D Rendering, AI, and Video Exports For Gamers and Creators”. 《NVIDIA》. 
  5. “Nvidia Video Codec SDK”. 2013년 8월 23일. 
  6. “Jensen Confirms: NVLink Support in Ada Lovelace is Gone”. 《TechPowerUp》. 2022년 9월 21일. 
  7. “GeForce RTX 40 Series”. 《NVIDIA》. 2022년 9월 21일에 확인함. 
  8. “GeForce RTX 4080”. 《NVIDIA》. 2022년 9월 21일에 확인함. 
  9. “NVIDIA GeForce RTX 4080 12 GB Specs”. 《TechPowerUp》. 2022년 9월 21일에 확인함. 
  10. “NVIDIA confirms Ada 102/103/104 GPU specs, AD104 has more transistors than GA102”. 《VideoCardz.com》 (미국 영어). 2022년 9월 23일에 확인함. 
  11. “NVIDIA GeForce RTX 4080 16 GB Specs”. 《TechPowerUp》. 2022년 9월 21일에 확인함. 
  12. “GeForce RTX 4090”. 《NVIDIA》. 2022년 9월 21일에 확인함. 
  13. “NVIDIA GeForce RTX 4090 Specs”. 《TechPowerUp》. 2022년 9월 21일에 확인함. 

외부 링크

편집