ONNX 모델 진단 기능 추가 및 TensorRT 세션 생성 로직 개선. 이미지 경로 변경 및 관련 설정 업데이트. 전체적인 코드 정리 및 주석 보강.

2025-08-24 03:49:24 +09:00 · 2025-08-24 03:49:24 +09:00 · baf63e2a02
parent e3bd4bb50b
commit baf63e2a02
3 changed files with 172 additions and 55 deletions
--- a/test1/translated_result.png
+++ b/test1/translated_result.png
--- a/test1/worker_test.py
+++ b/test1/worker_test.py
@ -16,7 +16,7 @@ import requests
 API_ROOT = "http://localhost:7890"          # 메인 서버 주소
-IMAGE_PATH = pathlib.Path("6.jpg")
+IMAGE_PATH = pathlib.Path("8.jpg")
 TIMEOUT = 120                               # 초
 unwanted_texts = {
--- a/worker/migan_inpainting_module.py
+++ b/worker/migan_inpainting_module.py
@ -19,6 +19,12 @@ import cv2
 import numpy as np
 import onnxruntime as ort
 try:
    import onnx
    ONNX_AVAILABLE = True
 except ImportError:
    ONNX_AVAILABLE = False
 # OpenCV 내부 최적화 off (호환성)
 cv2.setUseOptimized(False)
@ -146,6 +152,52 @@ class MIGANInpaintingModule:
            self._TRT_ENGINE_CACHE_DIR = cache_dir
            self.logger.log(f"TensorRT 엔진 캐시 디렉토리: {cache_dir}", level=logging.INFO)
    def _diagnose_onnx_model(self, onnx_path: str) -> Dict[str, Any]:
        """ONNX 모델 TensorRT 호환성 진단"""
        diagnosis = {
            'compatible': True,
            'issues': [],
            'dynamic_axes': [],
            'has_shape_info': False
        }
        if not ONNX_AVAILABLE:
            diagnosis['issues'].append("ONNX 패키지 미설치 - 진단 불가")
            return diagnosis
        try:
            model = onnx.load(onnx_path)
            # 동적 축 확인
            for input_info in model.graph.input:
                for dim in input_info.type.tensor_type.shape.dim:
                    if dim.HasField('dim_param'):
                        diagnosis['dynamic_axes'].append(f"{input_info.name}:{dim.dim_param}")
            # Shape inference 상태 확인
            try:
                onnx.checker.check_model(model)
                inferred_model = onnx.shape_inference.infer_shapes(model)
                if inferred_model.graph.value_info:
                    diagnosis['has_shape_info'] = True
                else:
                    diagnosis['issues'].append("Shape inference 정보 부족")
                    diagnosis['compatible'] = False
            except Exception as e:
                diagnosis['issues'].append(f"Shape inference 실패: {str(e)}")
                diagnosis['compatible'] = False
            # Pad 연산 확인 (TensorRT 문제 원인)
            for node in model.graph.node:
                if node.op_type == 'Pad':
                    diagnosis['issues'].append(f"Pad 연산 발견: {node.name} - TensorRT 문제 가능성")
        except Exception as e:
            diagnosis['issues'].append(f"ONNX 모델 로드 실패: {str(e)}")
            diagnosis['compatible'] = False
        return diagnosis
    def _get_session_key(self, config: Dict[str, Any]) -> tuple:
        """세션 캐시 키 생성"""
        return (
@ -158,7 +210,7 @@ class MIGANInpaintingModule:
        )
    def _create_session(self, config: Dict[str, Any]) -> ort.InferenceSession:
-        """ONNX Runtime 세션 생성"""
+        """ONNX Runtime 세션 생성 - TensorRT → CUDA → CPU 순서로 폴백"""
        onnx_path = config['onnx_path']
        if not os.path.exists(onnx_path):
@ -174,72 +226,137 @@ class MIGANInpaintingModule:
        # 최적화 레벨 설정
        session_options.graph_optimization_level = ort.GraphOptimizationLevel.ORT_ENABLE_ALL
-        # Provider 설정
+        # 1차 시도: TensorRT (단계적 접근)
-        providers = []
+        if config.get('use_cuda', True) and config.get('use_tensorrt', True):
-        provider_options = []
+            # ONNX 모델 TensorRT 호환성 사전 진단
-        
+            diagnosis = self._diagnose_onnx_model(onnx_path)
-        if config['use_cuda']:
+            if diagnosis['issues']:
-            if config['use_tensorrt']:
+                self.logger.log(f"ONNX 모델 진단 결과 - 문제점 {len(diagnosis['issues'])}개 발견:", level=logging.WARNING)
-                # TensorRT Provider 설정
+                for issue in diagnosis['issues']:
-                trt_options = {
+                    self.logger.log(f"  - {issue}", level=logging.WARNING)
            # 호환성 문제가 심각한 경우 TensorRT 건너뛰기
            if not diagnosis.get('compatible', True):
                self.logger.log("TensorRT 호환성 문제로 CUDA로 직접 폴백", level=logging.WARNING)
            else:
                if not diagnosis['issues']:
                    self.logger.log("ONNX 모델 TensorRT 호환성 진단 통과", level=logging.INFO)
                else:
                    self.logger.log("경고가 있지만 TensorRT 시도 계속", level=logging.INFO)
                # 1-1. 기본 TensorRT 시도 (최소 옵션)
                try:
                    trt_basic_options = {
                        'device_id': 0,
                        'trt_fp16_enable': config['trt_fp16_enable'],
                        'trt_engine_cache_enable': config['trt_engine_cache_enable'],
                    }
                    if config['trt_engine_cache_enable'] and self._TRT_ENGINE_CACHE_DIR:
                        trt_basic_options['trt_engine_cache_path'] = self._TRT_ENGINE_CACHE_DIR
                    self.logger.log(f"TensorRT 기본 세션 생성 시도: FP16={config['trt_fp16_enable']}", level=logging.INFO)
                    session = ort.InferenceSession(
                        onnx_path, 
                        sess_options=session_options, 
                        providers=['TensorrtExecutionProvider'],
                        provider_options=[trt_basic_options]
                    )
                    actual_providers = session.get_providers()
                    self.logger.log(f"TensorRT 기본 세션 생성 성공: {actual_providers}", level=logging.INFO)
                    return session
                except Exception as e:
                    self.logger.log(f"TensorRT 기본 세션 실패: {e}", level=logging.WARNING)
                    # 1-2. 고급 TensorRT 시도 (상세 옵션)
                    try:
                        trt_advanced_options = {
                            'device_id': 0,
                            'trt_fp16_enable': config['trt_fp16_enable'],
                            'trt_engine_cache_enable': config['trt_engine_cache_enable'],
                            'trt_max_workspace_size': 2 * 1024 * 1024 * 1024,  # 2GB
                            'trt_max_partition_iterations': 1000,
                            'trt_min_subgraph_size': 5,
                            'trt_dla_enable': False,
                            'trt_int8_enable': False,
                            'trt_builder_optimization_level': 3,
                            # MIGAN 실제 사용 패턴에 맞춤
                            'trt_profile_min_shapes': 'image:1x3x256x256,mask:1x1x256x256',
                            'trt_profile_max_shapes': 'image:1x3x1600x1600,mask:1x1x1600x1600', 
                            'trt_profile_opt_shapes': 'image:1x3x816x1200,mask:1x1x816x1200',
                        }
                        if config['trt_engine_cache_enable'] and self._TRT_ENGINE_CACHE_DIR:
                            trt_advanced_options['trt_engine_cache_path'] = self._TRT_ENGINE_CACHE_DIR
                        self.logger.log("TensorRT 고급 세션 생성 시도 (동적 shape 프로파일 포함)", level=logging.INFO)
                        session = ort.InferenceSession(
                            onnx_path, 
                            sess_options=session_options, 
                            providers=['TensorrtExecutionProvider'],
                            provider_options=[trt_advanced_options]
                        )
                        actual_providers = session.get_providers()
                        self.logger.log(f"TensorRT 고급 세션 생성 성공: {actual_providers}", level=logging.INFO)
                        return session
                    except Exception as e2:
                        self.logger.log(f"TensorRT 고급 세션도 실패: {e2}", level=logging.WARNING)
                        # TensorRT 실패 시 자세한 오류 정보 로깅
                        if "shape inference" in str(e2).lower():
                            self.logger.log("TensorRT shape inference 오류 - ONNX 모델 재생성 필요할 수 있음", level=logging.WARNING)
                        elif "pad_output" in str(e2).lower():
                            self.logger.log("Pad_output 오류 - 동적 축 문제, CUDA로 폴백", level=logging.WARNING)
        # 2차 시도: CUDA
        if config.get('use_cuda', True):
            try:
                cuda_options = {
                    'device_id': 0,
-                    'trt_fp16_enable': config['trt_fp16_enable'],
+                    'arena_extend_strategy': 'kNextPowerOfTwo',
-                    'trt_engine_cache_enable': config['trt_engine_cache_enable'],
+                    'gpu_mem_limit': 2 * 1024 * 1024 * 1024,  # 2GB
                    'cudnn_conv_algo_search': 'EXHAUSTIVE',
                    'do_copy_in_default_stream': True,
                }
-                if config['trt_engine_cache_enable'] and self._TRT_ENGINE_CACHE_DIR:
+                self.logger.log("CUDA 세션 생성 시도", level=logging.INFO)
                    trt_options['trt_engine_cache_path'] = self._TRT_ENGINE_CACHE_DIR
-                providers.append('TensorrtExecutionProvider')
+                session = ort.InferenceSession(
-                provider_options.append(trt_options)
+                    onnx_path, 
                    sess_options=session_options, 
                    providers=['CUDAExecutionProvider'],
                    provider_options=[cuda_options]
                )
-                self.logger.log(f"TensorRT 설정: FP16={config['trt_fp16_enable']}, 캐시={config['trt_engine_cache_enable']}", level=logging.INFO)
+                actual_providers = session.get_providers()
-            
+                self.logger.log(f"CUDA 세션 생성 성공: {actual_providers}", level=logging.INFO)
-            # CUDA Provider
+                return session
-            cuda_options = {
+                
-                'device_id': 0,
+            except Exception as e:
-                'arena_extend_strategy': 'kNextPowerOfTwo',
+                self.logger.log(f"CUDA 세션 생성 실패: {e}", level=logging.WARNING)
                'gpu_mem_limit': 2 * 1024 * 1024 * 1024,  # 2GB
                'cudnn_conv_algo_search': 'EXHAUSTIVE',
                'do_copy_in_default_stream': True,
            }
            providers.append('CUDAExecutionProvider')
            provider_options.append(cuda_options)
        # CPU Provider (폴백)
        providers.append('CPUExecutionProvider')
        provider_options.append({})
        # 3차 시도: CPU (최종 폴백)
        try:
-            if provider_options:
+            self.logger.log("CPU 세션 생성 시도 (최종 폴백)", level=logging.INFO)
                session = ort.InferenceSession(
                    onnx_path, 
                    sess_options=session_options, 
                    providers=providers,
                    provider_options=provider_options
                )
            else:
                session = ort.InferenceSession(
                    onnx_path, 
                    sess_options=session_options, 
                    providers=providers
                )
            actual_providers = session.get_providers()
            self.logger.log(f"ONNX Runtime 세션 생성 완료: {actual_providers}", level=logging.INFO)
            return session
        except Exception as e:
            self.logger.log(f"GPU 세션 생성 실패, CPU로 폴백: {e}", level=logging.WARNING)
            # CPU 전용 폴백
            session = ort.InferenceSession(
                onnx_path, 
                sess_options=session_options, 
                providers=['CPUExecutionProvider']
            )
-            self.logger.log("CPU 세션으로 폴백 완료", level=logging.INFO)
+            
            actual_providers = session.get_providers()
            self.logger.log(f"CPU 세션 생성 성공: {actual_providers}", level=logging.INFO)
            return session
        except Exception as e:
            self.logger.log(f"모든 provider에서 세션 생성 실패: {e}", level=logging.ERROR)
            raise RuntimeError(f"ONNX 세션을 생성할 수 없습니다: {e}")
    def _get_or_create_session(self, config: Dict[str, Any]) -> ort.InferenceSession:
        """세션 가져오기 또는 생성 (캐시 활용)"""
@ -563,7 +680,7 @@ def build_migan_from_toggle(toggle_states: Dict[str, Any], logger=None) -> MIGAN
    config = {
        'onnx_path': toggle_states.get('migan_onnx_path', '/app/worker/models/migan_pipeline_v2.onnx'),
        'use_cuda': toggle_states.get('migan_use_cuda', True),
-        'use_tensorrt': toggle_states.get('migan_use_tensorrt', True),
+        'use_tensorrt': toggle_states.get('migan_use_tensorrt', False),
        'trt_fp16_enable': toggle_states.get('migan_trt_fp16_enable', True),
        'trt_engine_cache_enable': toggle_states.get('migan_trt_engine_cache_enable', True),
        'intra_threads': int(toggle_states.get('migan_intra_threads', 0) or 0),