프로젝트 소개
AI 기술을 활용하여 뷰티 및 패션 제품을 가상 모델에 피팅하고, 다양한 컨셉의 이미지와 숏폼 영상을 생성하는 플랫폼을 구축합니다. 물리적 스튜디오 촬영 없이 제품 사진만으로 고퀄리티 콘텐츠를 생성하여, 셀러의 비용과 시간을 절감합니다.
프로젝트 개요
| 항목 | 내용 |
|---|---|
| 프로젝트명 | AI 기반 뷰티/패션 가상 피팅(VTO) 및 숏폼 영상 생성 플랫폼 구축 |
| 카테고리 | AI / Gen AI / Virtual Try-On |
| 제안 금액 | 63,000,000원 (VAT 별도) |
| 제안 기간 | 120일 (4개월) |
| 핵심 기술 | SDXL, ControlNet, IP-Adapter, VTO, SVD, FastAPI, Next.js |
핵심 요구사항 분석
- AI 모델 생성 엔진 — 성별/연령/인종별 프리셋 모델 + 커스텀 프롬프트 기반 생성 + Face Swap
- 뷰티(Beauty) VTO — 파운데이션, 립스틱 등 카테고리별 피팅, Hex 색상 코드 반영, 비포/애프터 컨셉컷
- 패션(Fashion) VTO — 상의~액세서리 가상 착장, 코디 매칭, 6종 앵글(전신/상하반신/거울셀카/디테일)
- Image-to-Video — 5~7초 숏폼 영상 생성 (런웨이 워킹, 360도 회전, 제품 사용 등)
- 배경/편집 도구 — 텍스트/레퍼런스 기반 배경 합성, 누끼(Remove BG), 업스케일링
- 웹 플랫폼 — 사용자 UI(PC Web 반응형) + 관리자 페이지
- 성능 목표 — 이미지 15초 이내, 영상 2분 이내 생성
- 품질 기준 — 제품 로고, 패턴, 색감 원본 유지 (Identity Preservation)
제안 포인트
본 프로젝트는 Stable Diffusion 계열의 최신 생성 AI 모델을 기반으로 VTO 파이프라인을 구축하는 것이 핵심입니다. 다음과 같은 접근법으로 최적의 결과물을 제공하겠습니다:
- 검증된 오픈소스 AI 모델 활용 — SDXL, ControlNet, IP-Adapter, IDM-VTON 등 학계/산업계에서 검증된 모델을 기반으로 커스텀 파이프라인 구축
- Identity Preservation 최적화 — IP-Adapter + ControlNet 조합으로 제품의 로고, 패턴, 색감을 최대한 보존하는 파이프라인 설계
- GPU 비용 최적화 아키텍처 — Celery 기반 비동기 작업 큐 + 모델 캐싱 + 배치 처리로 GPU 사용률 최적화
- 단계별 검증 접근 — 1개월차 PoC로 핵심 이미지 품질 검증 후, VTO → I2V 순차 구현으로 리스크 관리
- 유사 AI 프로젝트 경험 — AI 파이프라인 오케스트레이션, OpenAI API 연동, ML 기반 서비스 구축 경험 보유