본문 바로가기
카테고리 없음

AI 모델 파일 형식

by 디비디비딥러닝 2025. 8. 25.

PT 파일 (PyTorch 파일)

  • 확장자: .pt, .pth
  • 용도: PyTorch 프레임워크에서 사용하는 모델 파일
  • 특징:
    • Python과 PyTorch에 종속적
    • 모델의 가중치(weights)와 구조를 저장
    • 주로 학습된 모델을 저장할 때 사용

ONNX (Open Neural Network Exchange)

  • 확장자: .onnx
  • 용도: 서로 다른 AI 프레임워크 간에 모델을 공유하기 위한 표준 형식
  • 특징:
    • PyTorch, TensorFlow, Keras 등 다양한 프레임워크에서 사용 가능
    • 플랫폼 독립적 (Windows, Linux, Mac 모두 지원)
    • 배포할 때 많이 사용

Plan 파일 (TensorRT Engine)

  • 확장자: .plan, .engine
  • 용도: NVIDIA TensorRT에서 사용하는 최적화된 모델 파일
  • 특징:
    • NVIDIA GPU에서 매우 빠른 추론 속도
    • 특정 GPU 하드웨어에 최적화됨
    • 상용 서비스에서 성능이 중요할 때 사용

간단한 변환 순서: PT → ONNX → Plan (각 단계마다 최적화와 호환성이 향상됨)