RNGD (Renegade)는 퓨리오사AI가 개발한 2세대 AI 추론용 칩으로, 차세대 AI 연산 환경을 고려한 고성능·저전력 반도체입니다. 이 칩은 특히 대형 언어 모델(LLM) 및 데이터센터 배포에 최적화된 설계가 특징입니다.
1. 텐서 연산 특화 아키텍처
- TCP 기반 구조: Tensor Contraction Processor를 채택하여, 기존의 행렬 곱셈(matmul)을 넘어선 고차원 텐서 연산에 특화
- 연산 효율성 극대화: AI 추론에 최적화된 병렬처리 구조
2. 뛰어난 연산 성능
- FP8 연산: 512 TFLOPS
- INT8 연산: 512 TOPS
- 전력 소모: 18W에 불과
- 메모리: HBM3 48GB 탑재, 1.5TB/s 대역폭
이러한 수치는 동일 전력 대비 엔비디아 H100보다 3배 이상 효율적이라는 평가를 받습니다.
3. LLM과 AI 추론에 최적화
- 지원 모델: Llama 2, Llama 3, GPT 계열 등
- PyTorch 2.x 통합: 개발자 친화적인 API 제공
- 클라우드 네이티브 환경 호환: 컨테이너 및 가상화 지원 (Kubernetes, SR-IOV 등)
4. 데이터센터용 유연한 확장성
- 저전력 설계로 냉각 및 운영 비용 절감 가능
- 모듈화된 아키텍처로 대규모 배포에 용이
결론
퓨리오사AI의 RNGD 칩은 고성능 AI 추론 시장에서 에너지 효율성과 연산 능력, LLM 호환성을 모두 갖춘 차세대 반도체입니다. 이는 국내 팹리스 기술의 경쟁력을 상징하는 대표 사례로 자리매김하고 있습니다.
📌 태그:
#퓨리오사AI
#RNGD칩
#TCP아키텍처
#AI추론
#LLM최적화