""" Configuration settings for the inpainting server """ import os import platform from typing import Dict, Any, Optional, ClassVar from pydantic_settings import BaseSettings from pathlib import Path import logging logger = logging.getLogger(__name__) class Settings(BaseSettings): # System detection IS_JETSON: ClassVar[bool] = "aarch64" in platform.machine().lower() and "tegra" in platform.release().lower() PROJECT_ROOT: ClassVar[str] = os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(__file__)))) # --- 동적 세션 풀 및 메모리 관리 설정 --- # 각 모델별 최소/최대 세션 수. 서버 시작 시 min 만큼 생성되고, VRAM 여유 시 max까지 확장됨. SIMPLE_LAMA_MIN_SESSIONS: int = 2 if IS_JETSON else 2 SIMPLE_LAMA_MAX_SESSIONS: int = 4 if IS_JETSON else 4 MIGAN_MIN_SESSIONS: int = 2 if IS_JETSON else 1 # x86에서는 Migan을 기본으로 로드하지 않음 MIGAN_MAX_SESSIONS: int = 4 if IS_JETSON else 4 REMBG_MIN_SESSIONS: int = 2 if IS_JETSON else 1 REMBG_MAX_SESSIONS: int = 4 if IS_JETSON else 3 # 세션 추가 생성 VRAM 임계값 (%). 남은 VRAM이 이 값보다 커야 새 세션 생성. # 예: 12GB VRAM에 0.3이면, 3.6GB 이상 여유가 있어야 함. SESSION_VRAM_THRESHOLD: float = 0.3 if IS_JETSON else 0.3 # Jetson에서는 통합 메모리이므로 좀 더 여유롭게 설정 # 유휴 세션 자동 제거 시간 (초). 0이면 비활성화. SESSION_IDLE_TIMEOUT: int = 1800 # 30분 # --- 마이크로 배치 설정 --- USE_MICRO_BATCHING: bool = True # SimpleLama에 대한 배치 처리 활성화 MICRO_BATCH_SIZE: int = 4 # 최대 배치 크기 MICRO_BATCH_TIMEOUT_MS: int = 100 # 배치 생성을 위한 최대 대기 시간 (밀리초) # --- 서버 환경 설정 (클래스 내부로 이동) --- APP_VERSION: str = "3.0.0-dynamic-pool" APP_NAME: str = "Inpaint & RemoveBG Server" API_PREFIX: str = "/api/v1" HOST: str = "0.0.0.0" PORT: int = 8008 WORKERS: int = 1 # 개발 모드에서는 1로 고정, 프로덕션에서는 gunicorn으로 관리 # GPU settings (Jetson Xavier 최적화) CUDA_DEVICE: int = 0 USE_CUDA: bool = True # CUDA 사용 여부 (Jetson에서 항상 True) USE_FP16: bool = True # FP16 사용 여부 (Jetson 최적화) FP16_ENABLED: bool = True # 기존 호환성 # ONNX Runtime 최적화 설정 USE_TENSORRT: bool = True # TensorRT 사용 여부 (최고 성능) TENSORRT_FP16: bool = True # TensorRT FP16 사용 TENSORRT_WORKSPACE_SIZE: int = 2 * 1024 * 1024 * 1024 # 2GB # Jetson specific settings JETSON_MODE: bool = IS_JETSON JETSON_POWER_MODE: str = "MAXN" # MAXN, 5W, 10W, 15W JETSON_FAN_CONTROL: bool = True JETSON_TEMP_THRESHOLD: int = 75 # Celsius # Session pool settings (Jetson Xavier는 32GB 통합 메모리로 더 많은 세션 가능) SIMPLE_LAMA_SESSIONS: int = 4 if IS_JETSON else 4 # Jetson: 통합 32GB vs 데스크톱: VRAM 제한 MIGAN_SESSIONS: int = 4 if IS_JETSON else 4 # Jetson이 더 많은 세션 운영 가능 REMBG_SESSIONS: int = 3 if IS_JETSON else 2 # 메모리 공유 방식의 이점 활용 # Worker settings (Jetson은 통합 메모리로 더 효율적) MAX_WORKERS: int = 10 if IS_JETSON else 8 MIN_WORKERS: int = 10 if IS_JETSON else 4 WORKER_TIMEOUT: int = 120 # 2 minutes # 메모리 관리 (Jetson은 32GB 통합 메모리로 여유로움) VRAM_THRESHOLD_HIGH: float = 0.85 if IS_JETSON else 0.80 # 워커 추가 생성 중단 VRAM_THRESHOLD_LOW: float = 0.4 if IS_JETSON else 0.40 # 워커 제거 시작 VRAM_CHECK_INTERVAL: int = 30 if IS_JETSON else 15 # Jetson은 덜 자주 체크 # Model paths SIMPLE_LAMA_MODEL_PATH: str = "app/models/pt/big-lama.pt" MIGAN_MODEL_PATH: str = "app/models/onnx/migan_pipeline_v2.onnx" REMBG_MODEL_PATH: str = "app/models/onnx/birefnet-general-lite.onnx" # MIGAN ONNX settings MIGAN_ONNX_PATH: Optional[str] = "app/models/onnx/migan_pipeline_v2.onnx" # 커스텀 ONNX 파일 경로 MIGAN_INTRA_THREADS: int = 0 MIGAN_INTER_THREADS: int = 0 # REMBG settings (자동 다운로드 방식) REMBG_MODEL_NAME: str = "birefnet-general-lite" # 고품질 경량 모델 LOCAL_REMBG_MODEL_PATH: Optional[str] = None # 로컬 파일 사용 안함 # Upload settings (Jetson Xavier는 32GB 메모리로 대용량 처리 가능) MAX_FILE_SIZE: int = 100 * 1024 * 1024 if IS_JETSON else 50 * 1024 * 1024 # Jetson: 100MB, 데스크톱: 50MB MAX_IMAGE_SIZE: int = 4096 if IS_JETSON else 3072 # Jetson: 4K, 데스크톱: 3K (VRAM 고려) ALLOWED_EXTENSIONS: set = {".jpg", ".jpeg", ".png", ".bmp", ".tiff"} # Monitoring ENABLE_MONITORING: bool = True MONITORING_PORT: int = 8888 # Discord 웹훅 알림 설정 DISCORD_WEBHOOK_URL: Optional[str] = None # Jetson performance settings JETSON_GPU_FREQ: int = 1200 # MHz JETSON_CPU_FREQ: int = 1900 # MHz JETSON_MEMORY_FREQ: int = 1600 # MHz class Config: env_file = ".env" env_file_encoding = 'utf-8' settings = Settings() # 파일에서 웹훅 URL 로드 (환경 변수보다 우선순위 낮음) if not settings.DISCORD_WEBHOOK_URL: try: webhook_file = Path(settings.PROJECT_ROOT) / "webhook_url.txt" if webhook_file.exists(): url = webhook_file.read_text().strip() if url: settings.DISCORD_WEBHOOK_URL = url logger.info(f"파일에서 Discord 웹훅 URL을 로드했습니다: {url[:30]}...") except Exception as e: logger.warning(f"webhook_url.txt 파일 로드 실패: {e}")