PT 파일 (PyTorch 파일)
- 확장자: .pt, .pth
- 용도: PyTorch 프레임워크에서 사용하는 모델 파일
- 특징:
- Python과 PyTorch에 종속적
- 모델의 가중치(weights)와 구조를 저장
- 주로 학습된 모델을 저장할 때 사용
ONNX (Open Neural Network Exchange)
- 확장자: .onnx
- 용도: 서로 다른 AI 프레임워크 간에 모델을 공유하기 위한 표준 형식
- 특징:
- PyTorch, TensorFlow, Keras 등 다양한 프레임워크에서 사용 가능
- 플랫폼 독립적 (Windows, Linux, Mac 모두 지원)
- 배포할 때 많이 사용
Plan 파일 (TensorRT Engine)
- 확장자: .plan, .engine
- 용도: NVIDIA TensorRT에서 사용하는 최적화된 모델 파일
- 특징:
- NVIDIA GPU에서 매우 빠른 추론 속도
- 특정 GPU 하드웨어에 최적화됨
- 상용 서비스에서 성능이 중요할 때 사용
간단한 변환 순서: PT → ONNX → Plan (각 단계마다 최적화와 호환성이 향상됨)