Deep Learning 7

딥러닝 배포 가이드: TensorRT vs OpenVINO 핵심 비교 요약

1. TensorRT (NVIDIA)TensorRT는 NVIDIA GPU에서 딥러닝 추론을 가속화하기 위한 SDK입니다. 모델의 네트워크 구조를 분석하고, 사용 중인 GPU 하드웨어에 맞춰 연산을 최적화하여 실행 파일을 생성합니다.주요 특징:Layer & Tensor Fusion: 중복되는 연산 노드를 하나로 합쳐 메모리 대역폭을 절약합니다.Precision Calibration: FP32 모델을 FP16이나 INT8로 양자화(Quantization)하여 속도를 비약적으로 높입니다.적합한 환경: 서버급 GPU(A100, RTX 시리즈)나 임베디드 보드(Jetson 시리즈) 환경.2. OpenVINO (Intel)OpenVINO(Open Visual Inference and Neural network Op..

Deep Learning 2026.05.04

NMS(Non-Maximum Suppression)와 최신 트렌드

머신비전이나 객체 검출(Object Detection) 분야를 공부하다 보면 반드시 마주치게 되는 NMS(Non-Maximum Suppression, 비최대 억제)는 쉽게 말해 "중복된 정답 후보들 중 가장 확실한 하나만 남기는 필터링 기술"입니다. 1. 왜 NMS가 필요한가요? (The Problem)딥러닝 모델(YOLO, SSD 등)이 이미지에서 물체를 찾을 때, 하나의 물체에 대해 "여기에 물체가 있다!"라고 주장하는 수많은 사각형 박스(Bounding Box)를 만들어냅니다.예를 들어, 사진 속 사과 하나를 보고 모델이 살짝씩 위치가 다른 10개의 박스를 그릴 수 있습니다.우리는 결과물로 딱 하나의 박스만 보고 싶기 때문에, 나머지 9개를 지워주는 과정이 필요합니다.2. 어떻게 작동하나요? (Th..

Deep Learning 2026.04.30

Segmentation:: 최신 트렌드 동향 파악

현재 머신비전 업계에서 Semantic Segmentation은 이미 안정화된 기술로 자리 잡았으며, 2026년 기준 딥러닝 트렌드는 이를 넘어 더 정교하고 효율적인 방향으로 빠르게 이동하고 있습니다. ###주요 동향1. "Universal Segmentation"의 등장 (Mask2Former)과거에는 Semantic, Instance, Panoptic을 처리하는 모델이 각각 달랐으나, 최근에는 하나의 모델로 모든 세그멘테이션 작업을 수행하는 방식이 주류가 되고 있습니다.Mask2Former: 2026년 현재 가장 주목받는 범용 모델로, 트랜스포머(Transformer) 기반 구조를 통해 세그멘테이션의 종류와 상관없이 최고의 성능을 보여줍니다.효율성: 여러 모델을 따로 관리할 필요가 없어 MLOps 관..

Deep Learning 2026.04.30

[딥러닝] Segmentation 기법

1. Semantic Segmentation (의미 분할)"모든 픽셀에 이름표를 붙여주기"정의: 이미지 내의 모든 픽셀을 미리 정해진 범주(Class)로 분류하는 기법입니다.특징: 같은 카테고리에 속한다면 하나의 덩어리로 인식합니다. 예를 들어, 길 위에 사람 3명이 서 있어도 시맨틱 세그멘테이션은 이들을 개별 존재로 나누지 않고 통째로 '사람 영역'이라고 표시합니다.비유: 색칠 공부를 할 때 '사람'은 무조건 파란색, '자동차'는 무조건 빨간색으로 칠하는 것과 같습니다.주요 용도: 자율주행(도로와 인도의 구분), 의료 영상(종양 부위 확인).2. Instance Segmentation (인스턴스 분할)"같은 종류라도 '너'와 '나'는 다르다"정의: 시맨틱 세그멘테이션에서 한 단계 나아가, 같은 클래스 ..

Deep Learning 2026.04.30

NCHW vs NHWC

Channel first/last 데이터 구조에 따른 추론 속도 차이 딥러닝에서 이미지 데이터는 가로 × 세로 × 채널의 세 축으로 구성되며, 메모리에 나열하는 순서(Channel First / Last)에 따라 GPU 연산 효율과 프레임워크 지원 방식이 달라집니다.→ "동일한 모델 연산량을 처리할 때, 입력 데이터의 배열 방식이 GPU 추론 속도에 실질적인 영향을 주는가?" Channel First / Last 개념 구조메모리 배치주요 프레임 워크Channel First (NCHW)(Batch, Channel, Height, Width)[R,R,R…] [G,G,G…] [B,B,B…]채널 전체가 하나의 블록으로 묶임PyTorch,cuDNN,TensorRTChannel Last(CHWC)(Batch, ..

Deep Learning 2026.04.29