암페어 (마이크로아키텍처)

엔비디아가 디자인한 GPU 마이크로아키텍처

암페어(Ampere)는 엔비디아에서 개발한 볼타튜링의 후속 그래픽 처리 장치 마이크로아키텍처의 코드네임으로, 2020년 5월 14일 공식적으로 발표되었다. 프랑스의 수학자이자 물리학자인 앙드레마리 앙페르의 이름을 따서 명명되었다.[1][2] 엔비디아는 2020년 9월 1일 지포스 스페셜 이벤트에서 차세대 지포스 30 시리즈 소비자 GPU를 발표하였다.[3][4] 엔비디아는 2020년 11월 16일 SC20에서 A100 80GB GPU를 발표하였다.[5] 모바일 RTX 그래픽 카드와 RTX 3060은 2021년 1월 12일에 공개되었다.[6] 엔비디아는 또한 2021년 GPU 기술 콘퍼런스에서 2022년 릴리스를 위한 "암페어 넥스트"와 2024년 릴리스를 위한 "암페어 넥스트 넥스트"를 발표하였다.

엔비디아 암페어
출시일2020년 5월 14일 (2020-05-14)
제조 공정
역사
이전
다음

자세히 편집

암페어 아키텍처의 구조적 개선은 다음을 포함한다.

  • A100의 CUDA 연산 능력 8.0 및 지포스 30 시리즈의 8.6[7]
  • A100의 TSMC7 nm FinFET 공정
  • 지포스 30 시리즈의 삼성전자8 nm 공정 (8N) 커스텀 버전[8]
  • FP16, bfloat16, TensorFloat-32(TF32) 및 FP64가 지원되는 3세대 텐서 코어 및 희소성 가속 지원.[9] 개별 텐서 코어는 이전 텐서 코어 세대에 비해 초당 256 FP16 FMA 연산 4배(GA100만 해당, GA10x에 2배)를 가지고 있다. 텐서 코어 카운트는 SM 당 1회로 감소한다.
  • 지포스 30 시리즈의 2세대 광선 추적 코어, 동시 광선 추적, 음영 처리 및 컴퓨팅
  • A100 40GB 및 A100 80GB의 HBM2
  • 지포스 RTX 3090, RTX 3080 Ti, RTX 3080, RTX 3070 Ti의 GDDR6X 메모리
  • GA10x GPU에서 SM당 FP32 코어 2개
  • 쌍당 50Gbit/s 처리량을 지원하는 NVLink 3.0
  • SR-IOV를 지원하는 PCI 익스프레스 4.0 (SR-IOV는 A100에만 예약됨)
  • 최대 7개의 인스턴스를 지원하는 A100의 다중 인스턴스 GPU 가상화 및 GPU 파티셔닝 기능
  • AV1 하드웨어 디코딩이 포함된 지포스 30 시리즈의 퓨어비디오 하드웨어 비디오 디코딩 기능 세트 K 및 A100의 기능 세트 J
  • A100용 5 NVDEC
  • YUV420, YUV422, YUV444, YUV400, RGBA와 함께 새로운 하드웨어 기반 5코어 JPEG 디코딩 (NVJPG)을 추가. 엔비디아 NVJPEG(JPEG 인코딩/디코딩을 위한 GPU 가속 라이브러리)가 아님

편집

  • GA100
  • GA102
  • GA104
  • GA106
  • GA107

연산 능력 비교: GP100 vs GV100 vs GA100[10]

GPU 기능 NVIDIA Tesla P100 NVIDIA Tesla V100 NVIDIA A100
GPU 코드네임 GP100 GV100 GA100
GPU 아키텍처 NVIDIA 파스칼 NVIDIA 볼타 NVIDIA 암페어
계산 능력 6.0 7.0 8.0
스레드 / 워프 32 32 32
최대 워프 / SM 64 64 64
최대 스레드 / SM 2048 2048 2048
최대 스레드 블록 / SM 32 32 32
최대 32비트 레지스터 / SM 65536 65536 65536
최대 레지스터 / block 65536 65536 65536
최대 레지스터 / 스레드 255 255 255
최대 스레드 블록 크기 1024 1024 1024
FP32 코어 / SM 64 64 64 (+64 혼합 INT/FP32 코어)
SM 레지스터 대 FP32 코어 비율 1024 1024 1024
공유 메모리 크기 / SM 64 KB 최대 96 KB까지 설정 가능 최대 164 KB까지 설정 가능

디코딩 성능 비교

동시 스트림 H.264 디코딩 (1080p30) H.265 (HEVC) 디코딩 (1080p30) VP9 디코딩 (1080p30)
V100 16 22 22
A100 75 157 108

A100 가속기와 DGX A100 편집

암페어 기반 A100 가속기는 2020년 5월 14일 발표 및 출시되었다.[9] A100은 19.5 테라플롭의 FP32 성능, 6912개의 CUDA 코어, 40GB의 그래픽 메모리, 1.6TB/s의 그래픽 메모리 대역폭을 가지고 있다.[11] A100 가속기는 처음에 8대의 A100을 포함한 3세대 DGX 서버에서만 사용할 수 있었다.[9] 또한 DGX A100에는 15TB의 PCIe Gen 4 NVMe 스토리지,[11] 2개의 64코어 AMD Rome 7742 CPU, 1TB의 RAM 및 멜라녹스 기반 HDR InfiniBand 인터커넥트가 포함되어 있다. DGX A100의 최초 가격은 19만 9천 달러였다.[9]

암페어를 사용하는 제품 편집

  • 지포스 30 시리즈
    • 지포스 RTX 3050 모바일 (GA107)
    • 지포스 RTX 3050 Ti 모바일 (GA107)
    • 지포스 RTX 3050 (GA106 또는 GA107)[12]
    • 지포스 RTX 3060 (GA106)
    • 지포스 RTX 3060 Ti (GA104)
    • 지포스 RTX 3070 (GA104)
    • 지포스 RTX 3070 Ti (GA104)
    • 지포스 RTX 3080 (GA102)
    • 지포스 RTX 3080 12GB (GA102)
    • 지포스 RTX 3080 Ti (GA102)
    • 지포스 RTX 3090 (GA102)
    • 지포스 RTX 3090 Ti (GA102)
  • 엔비디아 워크스테이션 GPU (이전의 쿼드로)
    • RTX A2000 (모바일) (GA10?)
    • RTX A3000 (모바일) (GA104)
    • RTX A4000 (모바일) (GA104)
    • RTX A5000 (모바일) (GA104)
    • RTX A2000 (GA106)
    • RTX A4000 (GA104)
    • RTX A4500 (GA102)
    • RTX A5000 (GA102)
    • RTX A6000 (GA102)
  • 엔비디아 데이터센터 GPU (이전의 테슬라)
    • Nvidia A2 (GA107)
    • Nvidia A10 (GA102)
    • Nvidia A16 (4 × GA107)
    • Nvidia A30 (GA100)
    • Nvidia A40 (GA102)
    • Nvidia A100 (GA100)
    • Nvidia A100 80GB (GA100)

같이 보기 편집

각주 편집

  1. Newsroom, NVIDIA. “NVIDIA's New Ampere Data Center GPU in Full Production”. 《NVIDIA Newsroom Newsroom》. 
  2. “NVIDIA Ampere Architecture In-Depth”. 《NVIDIA Developer Blog》. 2020년 5월 14일. 
  3. Newsroom, NVIDIA. “NVIDIA Delivers Greatest-Ever Generational Leap with GeForce RTX 30 Series GPUs”. 《NVIDIA Newsroom Newsroom》. 
  4. “NVIDIA GeForce Ultimate Countdown”. 《NVIDIA》. 
  5. “NVIDIA Doubles Down: Announces A100 80GB GPU, Supercharging World's Most Powerful GPU for AI Supercomputing”. 
  6. “Join us for an NVIDIA GeForce RTX: Game on Special Broadcast Event”. 
  7. “I.7. Compute Capability 8.x”. 《docs.nvidia.com》 (미국 영어). 2020년 9월 23일에 확인함. 
  8. B., Dominik. “Samsung's old 8nm tech at the heart of NVIDIA's monstrous Ampere cards”. 《SamMobile》 (미국 영어). 2020년 9월 19일에 확인함. 
  9. Smith, Ryan (2020년 5월 14일). “NVIDIA Ampere Unleashed: NVIDIA Announces New GPU Architecture, A100 GPU, and Accelerator”. AnandTech. 
  10. “NVIDIA A100 Tensor Core GPU Architecture” (PDF). 《www.nvidia.com》. 2020년 9월 18일에 확인함. 
  11. Tom Warren; James Vincent (2020년 5월 14일). “Nvidia's first Ampere GPU is designed for data centers and AI, not your PC”. The Verge. 
  12. Igor, Wallossek. “The two faces of the geforce RTX 3050 8GB”. 《Igor's Lab》. 2022년 2월 23일에 확인함. 

외부 링크 편집