프로젝트 제안서

프로젝트 제안서

AI 기반 뷰티/패션 가상 피팅(VTO) 및 숏폼 영상 생성 플랫폼

제품 사진만으로 고퀄리티 모델 착용 컷과 마케팅용 숏폼 영상을 생성하는 AI 플랫폼을 구축합니다. Stable Diffusion 기반 VTO 파이프라인과 Image-to-Video 기술을 결합하여, 셀러의 콘텐츠 제작 비용과 시간을 획기적으로 절감합니다.

63,000,000원 120일 AI / Gen AI / VTO 원본 공고

10+

완료 프로젝트

5+

AI 프로젝트 경험

133K+

코드 라인

100%

참여율

함께 만들어 가겠습니다

각 메뉴를 클릭하시면 상세 내용을 확인하실 수 있습니다.

프로젝트 소개

AI 기술을 활용하여 뷰티 및 패션 제품을 가상 모델에 피팅하고, 다양한 컨셉의 이미지와 숏폼 영상을 생성하는 플랫폼을 구축합니다. 물리적 스튜디오 촬영 없이 제품 사진만으로 고퀄리티 콘텐츠를 생성하여, 셀러의 비용과 시간을 절감합니다.

프로젝트 개요

항목내용
프로젝트명AI 기반 뷰티/패션 가상 피팅(VTO) 및 숏폼 영상 생성 플랫폼 구축
카테고리AI / Gen AI / Virtual Try-On
제안 금액63,000,000원 (VAT 별도)
제안 기간120일 (4개월)
핵심 기술SDXL, ControlNet, IP-Adapter, VTO, SVD, FastAPI, Next.js

핵심 요구사항 분석

  • AI 모델 생성 엔진 — 성별/연령/인종별 프리셋 모델 + 커스텀 프롬프트 기반 생성 + Face Swap
  • 뷰티(Beauty) VTO — 파운데이션, 립스틱 등 카테고리별 피팅, Hex 색상 코드 반영, 비포/애프터 컨셉컷
  • 패션(Fashion) VTO — 상의~액세서리 가상 착장, 코디 매칭, 6종 앵글(전신/상하반신/거울셀카/디테일)
  • Image-to-Video — 5~7초 숏폼 영상 생성 (런웨이 워킹, 360도 회전, 제품 사용 등)
  • 배경/편집 도구 — 텍스트/레퍼런스 기반 배경 합성, 누끼(Remove BG), 업스케일링
  • 웹 플랫폼 — 사용자 UI(PC Web 반응형) + 관리자 페이지
  • 성능 목표 — 이미지 15초 이내, 영상 2분 이내 생성
  • 품질 기준 — 제품 로고, 패턴, 색감 원본 유지 (Identity Preservation)

제안 포인트

본 프로젝트는 Stable Diffusion 계열의 최신 생성 AI 모델을 기반으로 VTO 파이프라인을 구축하는 것이 핵심입니다. 다음과 같은 접근법으로 최적의 결과물을 제공하겠습니다:

  • 검증된 오픈소스 AI 모델 활용 — SDXL, ControlNet, IP-Adapter, IDM-VTON 등 학계/산업계에서 검증된 모델을 기반으로 커스텀 파이프라인 구축
  • Identity Preservation 최적화 — IP-Adapter + ControlNet 조합으로 제품의 로고, 패턴, 색감을 최대한 보존하는 파이프라인 설계
  • GPU 비용 최적화 아키텍처 — Celery 기반 비동기 작업 큐 + 모델 캐싱 + 배치 처리로 GPU 사용률 최적화
  • 단계별 검증 접근 — 1개월차 PoC로 핵심 이미지 품질 검증 후, VTO → I2V 순차 구현으로 리스크 관리
  • 유사 AI 프로젝트 경험 — AI 파이프라인 오케스트레이션, OpenAI API 연동, ML 기반 서비스 구축 경험 보유

사용 기술 및 툴

AI 엔진

Stable Diffusion XL ControlNet IP-Adapter IDM-VTON InsightFace Stable Video Diffusion ComfyUI PyTorch Python

Backend

FastAPI Celery Redis PostgreSQL AWS S3

Frontend

Next.js 14 TypeScript TailwindCSS React Query

인프라

AWS GPU (g5.xlarge) RunPod Docker Nginx

협업 및 커뮤니케이션

Slack / 카카오톡 Zoom / Google Meet Notion GitHub Issues

견적서

본 견적서는 프로젝트 요구사항 분석을 기반으로 산출되었습니다.

견적 요약

항목내용
프로젝트명AI 기반 뷰티/패션 가상 피팅(VTO) 및 숏폼 영상 생성 플랫폼
제안 금액63,000,000원 (VAT 별도)
제안 기간120일 (4개월)
견적 유효기간제안일로부터 30일

상세 견적 내역

구분항목수량단가금액
기획/설계요구사항 분석, AI 파이프라인 아키텍처 설계, 기능 명세서1식-6,300,000원
UI/UX 디자인사용자 웹 UI + 관리자 페이지 디자인1식-7,500,000원
AI 엔진 개발VTO 파이프라인(뷰티+패션), Face Swap, I2V, AI 모델 생성 엔진1식-24,000,000원
프론트엔드사용자 웹 인터페이스, 관리자 페이지, 반응형 UI1식-9,500,000원
백엔드API 서버, 비동기 작업 큐, GPU 오케스트레이션, 스토리지1식-10,700,000원
QA/배포통합 테스트, GPU 인프라 배포 및 최적화, 문서화1식-5,000,000원
합계 (VAT 별도)63,000,000원

산정 근거

  • AI 엔진 개발이 전체 비용의 38%로 가장 큰 비중 — VTO(뷰티+패션), Face Swap, Image-to-Video, 모델 생성 등 복수의 AI 파이프라인 구축 필요
  • GPU 서버 비용은 클라이언트 부담 (견적 미포함) — 최적화된 인프라 아키텍처 제안 포함
  • 유사 AI 프로젝트 수행 경험 기반 효율적 개발로 합리적 비용 산출

포함 사항

  • 소스 코드 전체 이관 (AI 모델 가중치 파일 포함)
  • 개발 문서 (API 명세서, DB 스키마, AI 파이프라인 가이드, 배포 가이드)
  • 시스템 운영 및 관리자 매뉴얼
  • 테스트 결과 보고서
  • 1개월 무상 하자 보수
  • GPU 인프라 배포 세팅 (1회)

불포함 사항

  • GPU 서버 호스팅 비용 (AWS GPU, RunPod 등)
  • 도메인 구매 비용
  • 외부 유료 API 사용 비용
  • 하자 보수 기간 이후 유지보수 (별도 월 단위 유지보수 계약 협의 가능)

공수계산서

기능별 개발 공수(Man-Day)를 산출하여 일정과 비용의 근거를 제시합니다.

공수 요약

구분공수 (M/D)비율
기획/설계10 M/D12%
UI/UX 디자인10 M/D12%
AI 엔진 개발33 M/D40%
FE 개발9 M/D11%
BE 개발13 M/D16%
QA/배포7 M/D9%
합계82 M/D100%

기능별 상세 공수

기능세부 작업담당공수 (M/D)
기획/설계요구사항 분석 및 기능 명세서기획3
AI 파이프라인 아키텍처 설계설계4
DB 스키마 및 API 설계설계3
UI/UX 디자인사용자 화면 디자인 (피팅 UI, 갤러리)디자인6
관리자 페이지 디자인디자인3
디자인 시스템 및 컴포넌트디자인1
AI 엔진AI 모델 선택/생성 엔진 (프리셋 + 커스텀)AI5
Face Swap 파이프라인 (InsightFace)AI4
뷰티 VTO 파이프라인 (메이크업 피팅, Hex 색상)AI6
패션 VTO 파이프라인 (의류 착장, 코디 매칭)AI7
Image-to-Video 영상 생성 (SVD)AI5
배경 생성 (프롬프트/레퍼런스 기반)AI3
편집 도구 (누끼, 업스케일링)AI3
프론트엔드사용자 웹 인터페이스 (피팅 UI, 결과 갤러리)FE5
관리자 페이지FE3
반응형 및 인터랙션FE1
백엔드인증/사용자 관리 APIBE2
이미지/영상 업로드 및 S3 스토리지BE2
AI 작업 큐 관리 (Celery + Redis)BE3
GPU 오케스트레이션 및 모니터링BE3
API Gateway, 라우팅, 결과물 관리BE3
QA/배포통합 테스트 (이미지/영상 품질 검수)QA3
GPU 인프라 배포 및 최적화DevOps3
문서화 및 매뉴얼문서1

산정 기준

  • 1 M/D = 8시간 기준 (1인 1일 작업량)
  • 주 5일 근무 기준
  • 버퍼 10~15% 포함
  • 유사 프로젝트 수행 경험 기반 효율적 개발

PRD (Product Requirements Document)

프로젝트 요구사항을 정의하고 기능 범위를 명확히 합니다.

1. 프로젝트 배경 및 목적

물리적 스튜디오 촬영 없이 제품 사진만으로 고퀄리티 모델 착용 컷과 마케팅용 숏폼 영상을 생성하여, 셀러들의 콘텐츠 제작 비용과 시간을 절감하는 것이 핵심 목적입니다.

  • 뷰티/패션 셀러 대상 AI 기반 콘텐츠 자동 생성 플랫폼
  • 가상 모델 피팅(VTO) + 숏폼 영상으로 마케팅 소재 원스톱 제작
  • 스튜디오 촬영 대비 90% 이상 비용 절감 목표

2. 사용자 정의

사용자 유형설명주요 기능
셀러 (일반 사용자)뷰티/패션 제품 판매자제품 업로드, AI 모델 선택, VTO 피팅, 영상 생성, 결과물 다운로드
관리자플랫폼 운영 관리사용자 관리, AI 모델 프리셋 관리, 사용량 모니터링, GPU 리소스 관리

3. 기능 요구사항

3.1 AI 모델 선택 및 생성

  • [필수] 기본 프리셋 모델 제공 — 한국인(다수), 외국인, 키즈, 시니어 등 성별/연령/인종별
  • [필수] 커스텀 프롬프트 모델 생성 — 인종, 나이, 얼굴형, 헤어스타일, 피부톤, 체형 텍스트 입력
  • [필수] Face Swap — 사용자 업로드 얼굴 사진 기반 AI 모델 얼굴 교체

3.2 뷰티(Beauty) 서비스

  • [필수] 제품 피팅 — 파운데이션, 립스틱, 스킨케어, 아이브로우 등 카테고리별 적용
  • [필수] 색상 지정 — Hex 색상 코드 입력 및 텍스처 반영
  • [필수] 컨셉/포즈 — 프롬프트 및 레퍼런스 이미지 반영
  • [필수] 출력물 — 컨셉컷(비포/애프터), 제품컷/누끼, 디테일컷
  • [필수] 비디오 생성 — 제품 바르기/정면 응시 5~7초 영상

3.3 패션(Fashion) 서비스

  • [필수] 가상 착장(VTO) — 상의, 아우터, 바지, 양말, 신발, 액세서리
  • [필수] 코디 매칭 — 상의 입력 시 어울리는 하의/신발 자동 생성
  • [필수] 촬영 각도 — 전신(6종 앵글), 상/하반신, 거울 셀카, 디테일컷
  • [필수] 비디오 생성 — 런웨이 워킹, 앉았다 일어나기, 360도 회전 5~7초

3.4 공통 기능

  • [필수] 배경 생성 — 텍스트 프롬프트 및 레퍼런스 이미지 기반 배경 합성
  • [필수] 편집 도구 — 누끼 따기(Remove BG), 업스케일링(고화질 변환)
  • [필수] 사용자 인증 및 프로젝트/히스토리 관리

3.5 관리자 기능

  • [필수] 사용자/구독 관리
  • [필수] AI 모델 프리셋 관리 (추가/수정/삭제)
  • [필수] GPU 리소스 및 작업 큐 모니터링
  • [선택] 사용량 통계 대시보드

4. 비기능 요구사항

항목요구사항
성능이미지 생성 15초 이내, 영상 생성 2분 이내 (GPU 사양 협의)
품질제품 로고/패턴/색감 원본 유사도 최대화 (Identity Preservation)
확장성GPU 인스턴스 수평 확장 가능한 큐 기반 아키텍처
보안HTTPS, JWT 인증, 업로드 파일 검증
지원 디바이스PC Web (반응형)
디자인전문적인 스튜디오 느낌의 직관적이고 모던한 UI/UX

5. 기술 제약사항

  • GPU 서버 필수 — NVIDIA A100/A10G 이상 권장 (VRAM 24GB+)
  • 모델 가중치 파일 용량 — SDXL 기준 약 7GB, 전체 파이프라인 약 30-50GB
  • 이미지/영상 생성은 비동기 처리 필수 (동기 처리 시 타임아웃 발생)
  • Identity Preservation 품질은 입력 제품 이미지 해상도에 의존

6. 범위 외 사항 (Out of Scope)

  • 모바일 앱 (Android/iOS) — PC Web만 지원
  • 결제/과금 시스템
  • 다국어 지원 (한국어 기본)
  • 자체 AI 모델 학습/훈련 (사전 훈련된 모델 기반 커스터마이징만 포함)

일정 제안

총 120일 (4개월) 기준 단계별 마일스톤 및 산출물을 제안합니다.

전체 일정 요약

단계기간주요 산출물
Phase 1: 기획 및 AI 파이프라인 검증Day 1~30기획서, 와이어프레임, AI PoC 결과, DB/API 설계
Phase 2: 뷰티/패션 VTO 기능 구현Day 31~60뷰티 VTO, 패션 VTO, Face Swap, AI 모델 생성 엔진
Phase 3: 영상 생성 및 프론트엔드 연동Day 61~90I2V 영상 생성, 배경/편집 도구, 관리자 페이지, 통합 연동
Phase 4: 통합 테스트 및 안정화Day 91~120품질 검수, 성능 최적화, 매뉴얼, 인수인계

상세 타임라인

PHASE 1

기획 및 AI 파이프라인 검증

Day 1~30 (1개월)

요구사항 분석, UI/UX 디자인, AI 핵심 모델 PoC 검증

  • 기능 상세 정의서, 스토리보드
  • UI/UX 와이어프레임 및 Figma 디자인
  • SDXL + ControlNet + IP-Adapter 기반 이미지 생성 PoC
  • VTO 핵심 파이프라인 검증 (뷰티 1종 + 패션 1종)
  • DB 스키마 설계, API 명세서

PHASE 2

뷰티/패션 VTO 기능 구현

Day 31~60 (2개월차)

핵심 AI 파이프라인 전체 구현 및 FE 기본 UI 개발

  • 뷰티 VTO 전체 구현 (메이크업 피팅, Hex 색상, 비포/애프터)
  • 패션 VTO 전체 구현 (의류 착장, 6종 앵글)
  • Face Swap 기능 (InsightFace)
  • AI 모델 선택/생성 엔진 (프리셋 + 커스텀 프롬프트)
  • 사용자 웹 UI 기본 구현

PHASE 3

영상 생성 및 웹 프론트엔드 연동

Day 61~90 (3개월차)

Image-to-Video 구현, 부가 기능, FE-BE-AI 통합

  • Image-to-Video 숏폼 영상 생성 (SVD, 5~7초)
  • 배경 생성 기능 (프롬프트/레퍼런스 기반)
  • 편집 도구 (누끼, 업스케일링)
  • 코디 매칭 기능
  • 관리자 페이지 개발
  • FE-BE-AI 파이프라인 통합 연동

PHASE 4

통합 테스트 및 안정화

Day 91~120 (4개월차)

품질 검수, 성능 최적화, 문서화 및 인수인계

  • 통합 테스트 (이미지/영상 품질 검수)
  • Identity Preservation 검수 (로고, 패턴, 색감)
  • 성능 최적화 (이미지 15초, 영상 2분 목표)
  • GPU 인프라 최적화 (모델 캐싱, 배치 처리)
  • 시스템 운영 매뉴얼, 테스트 결과 보고서
  • 소스 코드 및 가중치 파일 인수인계

마일스톤 체크포인트

마일스톤시점검수 기준
M1: 기획 완료 + AI PoCDay 30기획서 승인, VTO PoC 이미지 품질 확인
M2: VTO 핵심 기능 완료Day 60뷰티/패션 VTO 데모, Face Swap 동작 확인
M3: 전체 기능 통합Day 90I2V 영상 생성, 웹 UI 통합 데모
M4: 최종 오픈Day 120품질 검수 완료, 성능 목표 달성, 인수인계

커뮤니케이션 계획

항목방식주기
일일 진행 공유Slack / 카카오톡매일
주간 미팅Zoom / Google Meet주 1회
마일스톤 리뷰화면 공유 + AI 결과물 데모단계 완료 시
이슈 트래킹GitHub Issues상시

유사 프로젝트 경험

본 프로젝트와 유사한 기능/기술 스택을 활용한 수행 경험을 소개합니다.

10+

완료 프로젝트

5+

AI 프로젝트 경험

133K+

코드 라인

100%

참여율

AI / 자동화

AI-Native 개발 프레임워크

AI / 자동화 · 2025~

프로젝트 개요

멀티 AI 에이전트 오케스트레이션 플랫폼. 134+ 스킬 모듈, 12 품질 게이트, 페르소나 기반 개발 워크플로우를 제공하는 AI-Native 프레임워크를 설계·구축했습니다.

핵심 기능

  • 멀티 AI 프로바이더 오케스트레이션 (Claude, Gemini, Codex 등)
  • 134+ 재사용 가능 스킬 모듈 및 12 자동화 품질 게이트
  • 48 API 엔드포인트, WebSocket 실시간 스트리밍
  • Knowledge-as-Code 기반 839 지식 문서 체계

본 프로젝트와의 유사점

AI 파이프라인 오케스트레이션 설계 경험이 VTO/I2V 복수 AI 모델 파이프라인 관리에 직접 적용됩니다. 비동기 작업 큐, 모델 간 연쇄 처리, 결과물 품질 게이트 등 핵심 아키텍처 패턴이 동일합니다.

기술 스택

TypeScript React Hono Claude SDK PostgreSQL MCP
핀테크 / B2B SaaS

VC 펀드 관리 플랫폼 (Series-B)

핀테크 / VC / SaaS · 2023.11~2024.12 (14개월)

프로젝트 개요

한국 VC 산업을 위한 올인원 SaaS 플랫폼. 투자 포트폴리오 관리, 전자결재, 규제 보고, AI 보고서 생성을 통합한 대규모 웹 애플리케이션을 구축했습니다.

핵심 기능

  • PR 1,652건, 50+ 페이지, 200-300+ API 엔드포인트 규모
  • ChatGPT API 연동 AI 투자 보고서 자동 생성
  • Lexical + Yjs(CRDT) 실시간 공동 편집
  • Next.js 13 + NestJS 10 풀스택 아키텍처

본 프로젝트와의 유사점

대규모 웹 플랫폼 구축 경험과 AI API 연동(ChatGPT) 경험이 VTO 플랫폼의 웹 UI/관리자 페이지 개발 및 AI 서비스 통합에 직접 활용됩니다. 비동기 처리, 파일 관리, 사용자 관리 패턴이 동일합니다.

기술 스택

Next.js NestJS TypeScript MySQL ChatGPT API AWS
B2B SaaS / 헬스케어

시니어 주간보호 관리 플랫폼 (Harmony Link)

헬스케어 / SaaS · 2025 (약 6개월)

프로젝트 개요

시니어 주간보호센터를 위한 디지털 케어 관리 SaaS 플랫폼. 133K+ LOC, 140+ API 엔드포인트 규모로 6 플랫폼 동시 지원하는 멀티테넌트 아키텍처를 구축했습니다.

핵심 기능

  • 133K+ LOC, 330+ PR, 140+ API 엔드포인트
  • OpenAI API 연동 AI 건강 분석 기능
  • Flutter 6 플랫폼 + Next.js 관리자 + NestJS 백엔드
  • AWS CDK IaC 기반 인프라 자동화

본 프로젝트와의 유사점

OpenAI API 기반 AI 분석 서비스 구축 경험이 Diffusion 모델 기반 AI 서비스 아키텍처에 활용됩니다. 대용량 파일(이미지) 처리, 비동기 작업 관리, 관리자 페이지 패턴이 VTO 플랫폼과 직접적으로 유사합니다.

기술 스택

Flutter NestJS Next.js OpenAI API AWS CDK Docker

함께 만들어 가겠습니다

프로젝트에 대해 더 자세한 논의를 원하시면 미팅을 신청해 주세요.