백채윤 l Visual Intelligence Lab
RGB 영상 기반의 중앙대학교 서울캠퍼스 디지털화본 프로젝트는 보행자 시점의 RGB 카메라 영상만으로 대규모 실세계 공간을 3차원으로 재구성하는 저비용·고접근성 디지털 트윈 파이프라인을 제안합니다. 대상 공간은 중앙대학교 서울캠퍼스 정문 일대이며, 4K 30fps DSLR 영상(총 135,360 프레임)에서 0.5fps로 샘플링한 2,367장을 학습 데이터로 사용했다. 동적 객체로 인한 학습 교란을 줄이기 위해 YOLOv8 탐지와 SAM 마스킹을 결합해 보행자·차량·오토바이를 제거하는 전처리를 수행하였습니다. 구조 복원 단계에서는 COLMAP 기반 SfM으로 카메라 포즈와 희소점군을 확보하고, 이를 CityGaussian 학습으로 연계하여 분할정복 전략 및 LoD 렌더링을 적용함으로써 효율적 학습과 실시간 렌더링을 구현하였습니다. 성능 평가는 PSNR·SSIM·LPIPS의 정량 지표와 원본 대비 시각적 유사성·기하 구조 일관성·메시 품질의 정성 분석을 병행하였습니다. 실험 결과, 정문과 주변 정적 구조물은 안정적으로 복원되었으며, RGB 단일 센서 기반에서도 활용 가능한 수준의 디지털 트윈을 달성하였습니다. 다만 다운스케일링과 하늘 영역 처리의 한계로 일부 해상도 저하와 메시 잡음이 관찰되었고, 이는 하늘 분리·노이즈 억제 및 고해상 학습 스케줄로 개선 가능함을 확인하였습니다. 제안 파이프라인은 합성·항공·특수 센서 의존도를 낮추면서 현장 적용성과 재현성을 갖춘 실무형 절차를 정립하였고, 스마트 시티·스마트 캠퍼스 등 다양한 디지털 트윈 응용의 기반 기술로서 의의를 가집니다.