3회차: [창의성] 이미지 생성 AI (Midjourney, DALL-E) 시작하기와 저작권 가이드 라인

 

이미지 생성 AI 도구 비교 미드저니 달리 스테이블디퓨전

그림을 못 그려도 괜찮아요, 텍스트만으로 작품 만드는 시대 입니다.

한 달 전쯤 친구의 카페 인테리어 컨설팅을 도와준 적이 있습니다. 친구는 빈티지 느낌의 벽화를 원했는데 디자이너에게 견적을 받아보니 300만 원이 넘더군요. 그래서 제가 이미지 생성 AI를 추천했습니다. "1950년대 뉴욕 재즈바 느낌의 빈티지 벽화, 색소폰 연주자 실루엣, 따뜻한 세피아 톤"이라고 입력했더니 10초 만에 완벽한 시안이 나왔습니다.

물론 그대로 쓴 건 아닙니다. AI가 만든 이미지를 바탕으로 실제 디자이너와 협업했는데, 덕분에 비용을 절반으로 줄이고 작업 시간도 일주일 단축됐습니다. 그때 깨달았습니다. 이미지 생성 AI는 디자이너를 대체하는 게 아니라 창작의 시작점을 낮춰주는 도구구나.

미술 전공자가 아니어도, 포토샵을 못 다뤄도, 심지어 그림을 못 그려도 상관없습니다. 머릿속 상상을 글로 표현할 수 있다면 누구나 이미지 크리에이터가 될 수 있는 시대입니다. 하지만 막상 시작하려니 어떤 툴을 써야 할지, 프롬프트는 어떻게 작성해야 할지, 저작권 문제는 없는건지 궁금한 점이 한두 가지가 아닙니다.

오늘은 제가 지난 1년간 실제로 사용하면서 터득한 이미지 생성 AI의 모든 것을 공유하겠습니다. 실패 사례도 포함해서 정직하게 말씀드릴게요. 초보자도 바로 따라 할 수 있도록 구체적인 예시 위주로 설명하겠습니다.

1.주요 이미지 생성 AI 도구, 어떤 걸 써야 할까?

이미지 생성 AI 시장은 정말 빠르게 변하고 있습니다. 6개월 전만 해도 미드저니가 압도적이었는데, 요즘은 DALL-E, 스테이블 디퓨전, 플럭스 등 선택지가 정말 많아졌습니다. 제가 직접 써본 주요 도구 3개를 비교해보겠습니다.

구분미드저니 (Midjourney)DALL-E 3 (OpenAI)스테이블 디퓨전
장점압도적인 예술적 퀄리티프롬프트 이해력, 사용 편의성무료, 무제한 커스터마이징
단점유료 결제 필수, 디스코드 사용예술적 디테일 부족높은 기술적 진입 장벽

추천 대상
     
프로 크리에이터, 마케터입문자, ChatGPT 유료 사용자개발자, 연구가

첫 번째, 미드저니 (Midjourney): 예술적 감성이 필요할 때

제가 가장 먼저 접한 도구이자 지금도 가장 자주 쓰는 서비스입니다. 미드저니의 가장 큰 장점은 예술성입니다. 같은 프롬프트를 입력해도 다른 도구들보다 훨씬 감각적이고 세련된 결과물이 나옵니다.

실제 사용 경험을 말씀드리면, 저는 블로그 썸네일을 만들 때 주로 미드저니를 씁니다. "미래적인 AI 칩 디자인, 네온 불빛, 사이버펑크 스타일"이라고 입력했더니 SF 영화 포스터 같은 이미지가 나왔습니다. 클릭률이 이전보다 30% 넘게 올랐어요.

장점은 품질이 압도적이고, 커뮤니티가 활발해서 다른 사람들의 프롬프트를 참고하기 좋다는 점입니다. 디스코드 서버에 들어가면 실시간으로 다른 사람들이 만든 이미지를 볼 수 있어서 영감을 얻기 좋습니다.

단점은 가격입니다. 무료 체험은 이제 제공하지 않고, 월 10달러(약 1만 3천 원)부터 시작합니다. 또 디스코드를 통해서만 사용할 수 있어서 처음에는 인터페이스가 좀 불편할 수 있습니다. 저도 처음엔 명령어 입력하는 게 헷갈려서 유튜브 튜토리얼을 세 번이나 봤습니다.

추천 대상: 상업적 용도로 고품질 이미지가 필요한 프리랜서, 마케터, 콘텐츠 크리에이터 등

두 번째, DALL-E 3 (오픈AI): 초보자에게 가장 친절한 선택

ChatGPT를 만든 오픈AI에서 만든 서비스라 ChatGPT Plus 구독자라면 추가 비용 없이 사용할 수 있습니다. 저는 ChatGPT Plus를 원래 쓰고 있어서 DALL-E 3을 자주 활용합니다.

가장 큰 장점은 프롬프트 이해력입니다. 복잡한 문장을 입력해도 의도를 정확히 파악합니다. "출근길에 커피를 들고 서둘러 가는 30대 여성, 배경은 흐린 서울 거리, 따뜻한 색감"이라고 입력하니 정말 한국 느낌 나는 이미지가 나왔습니다. 미드저니는 가끔 동양인 얼굴을 잘 못 그리는데 DALL-E는 이 부분이 좋았어요.

장점은 ChatGPT와 연동되어 대화하면서 이미지를 수정할 수 있다는 점입니다. "좀 더 밝게 해줘", "배경을 바다로 바꿔줘" 하면 즉시 반영됩니다. 별도 프로그램 설치 없이 웹에서 바로 사용 가능한 점도 편합니다.

단점은 미드저니에 비해 예술적 완성도가 살짝 떨어집니다. 그리고 OpenAI의 콘텐츠 정책이 엄격해서 폭력적이거나 선정적인 내용은 아예 생성이 안 됩니다. 할로윈 좀비 이미지를 만들려다가 거절당한 적도 있습니다.

추천 대상: AI 초보자, ChatGPT Plus 구독자, 빠른 시안 작업이 필요한 사람들

세 번째 스테이블 디퓨전 (Stable Diffusion): 무료로 무제한 사용하고 싶다면

오픈소스 프로젝트라 완전 무료로 사용할 수 있습니다. 하지만 무료인 대신 설치와 설정이 복잡합니다. 저도 처음 설치할 때 파이썬 환경 설정부터 막혀서 반나절을 날렸습니다.

컴퓨터 사양도 중요합니다. 그래픽카드(GPU) 성능이 좋아야 이미지 생성 속도가 빠릅니다. 제 노트북은 GPU가 약해서 한 장 만드는 데 5분 넘게 걸렸어요. 결국 구글 코랩(Google Colab)이라는 클라우드 서비스를 통해 사용하고 있습니다.

장점은 무제한 무료 사용과 높은 커스터마이징입니다. 모델을 직접 학습시키거나 다른 사람이 만든 모델을 다운받아 특정 스타일로 고정할 수 있습니다. 예를 들어 '스튜디오 지브리 스타일 전문 모델'을 설치하면 모든 이미지가 지브리 애니메이션처럼 나옵니다.

단점은 진입 장벽이 높다는 점입니다. 프로그래밍 지식이 없으면 시작조차 어렵습니다. 인터페이스도 직관적이지 않아서 유튜브 강의 없이는 사용이 거의 불가능합니다.

추천 대상: 기술적 지식이 있는 개발자, 예산이 없는 학생, 실험적인 작업을 즐기는 크리에이터들

개인적인 결론은

제 작업 스타일로는 70% 미드저니 + 30% DALL-E 3 조합이 최적입니다. 중요한 상업 프로젝트는 미드저니로, 블로그 일러스트나 빠른 시안은 DALL-E로 해결합니다. 예산이 부족하다면 DALL-E 3으로 시작하시고, 본격적으로 수익화를 생각한다면 미드저니를 추천합니다.

프롬프트 작성의 기술, 상상을 현실로 만드는 법

 이미지 생성 AI에서 가장 중요한 건 프롬프트입니다. 같은 도구를 써도 프롬프트를 어떻게 쓰느냐에 따라 결과물이 천지차이입니다. 저도 처음에는 "예쁜 고양이"라고만 입력했다가 엉뚱한 이미지만 받았습니다. 수백 번의 시행착오 끝에 깨달은 프롬프트 작성 공식을 공유합니다.

((프롬프트 작성의 기초가 궁금하다면? 👉 [2회차 글 보기]))

핵심 구성 요소 1: 주제 (무엇을 그릴 것인가)

가장 기본이자 가장 중요한 부분입니다. 명확하고 구체적일수록 좋습니다.

- 나쁜 예: "고양이"

- 좋은 예: "창가에 앉아 밖을 바라보는 흰색 페르시안 고양이"

여기서 팁 하나 드리면, 형용사를 3개 이상 넣으세요. "젊은 여성"보다는 "긴 머리의 우아한 20대 여성"이 훨씬 좋은 결과를 냅니다. 제가 실제로 "행복한 표정의 귀여운 골든 리트리버 강아지"라고 입력했을 때와 그냥 "강아지"라고 입력했을 때 퀄리티 차이가 엄청났습니다.

핵심 구성 요소 2: 스타일 (어떤 느낌으로)

이게 진짜 마법입니다. 스타일 키워드 하나로 이미지 분위기가 완전히 바뀝니다.

자주 쓰는 스타일 키워드 목록을 정리해봤습니다:

- 사진 스타일: "프로페셔널 사진", "다큐멘터리 사진", "필름 카메라 느낌"

- 그림 스타일: "수채화", "유화", "디지털 아트", "만화 스타일"

- 시대/장르: "빈티지", "레트로", "사이버펑크", "판타지", "미니멀"

- 예술가 참조: "고흐 스타일", "피카소풍", "스튜디오 지브리 느낌"

저는 블로그 썸네일 만들 때 "미니멀리스트 디지털 아트 스타일"을 자주 씁니다. 깔끔하고 전문적으로 보여서 클릭률이 높더라고요. 반대로 SNS 게시물용으로는 "생동감 넘치는 일러스트 스타일"을 선호합니다.

핵심 구성 요소 3: 조명 (분위기의 핵심)

조명 설정만 잘해도 이미지가 확 살아납니다. 사진 찍을 때 빛이 중요한 것처럼 AI 이미지도 마찬가지입니다.

실전 예시를 들어보겠습니다.

- "황금시간대의 부드러운 빛(Golden hour soft lighting)": 따뜻하고 로맨틱한 느낌. 제품 사진이나 인물 사진에 최적

- "극적인 측면 조명(Dramatic side lighting)": 그림자가 강조되어 긴장감 있는 분위기

- "네온 불빛(Neon lighting)": 사이버펑크나 나이트클럽 느낌

- "은은한 스튜디오 조명(Soft studio lighting)": 전문 제품 촬영 같은 느낌

제가 카페 인테리어 시안 만들 때 "따뜻한 백열등 조명, 어두운 모서리"라고 넣었더니 정말 아늑한 카페 분위기가 났습니다. 조명 키워드 하나로 전혀 다른 이미지가 나오니 꼭 활용하세요.

핵심 구성 요소 4: 구도 (앵글과 시점)

카메라 앵글을 지정하면 훨씬 전문적인 결과물이 나옵니다.

자주 쓰는 구도 표현:

- "클로즈업(Close-up)": 얼굴이나 제품을 크게

- "와이드 앵글(Wide angle)": 전체 풍경을 담을 때

- "조감도(Bird's eye view)": 위에서 내려다보는 시점

- "아이레벨(Eye level)": 눈높이에서 바라본 시점

- "로우 앵글(Low angle)": 아래에서 위를 올려다보는 웅장한 느낌

저는 제품 홍보 이미지 만들 때 "45도 앵글, 제품 중심 배치, 흐린 배경"을 자주 씁니다. 아마존이나 쿠팡 제품 사진처럼 전문적으로 나옵니다.

실전 프롬프트 예시 (Before & After)

Before (초보)

"커피 한 잔"

After (개선)

"김이 모락모락 나는 아메리카노 한 잔, 원목 테이블 위, 아침 햇살이 비치는 카페 창가, 따뜻한 톤의 프로페셔널 사진, 클로즈업 구도, 부드러운 자연광"

둘의 차이는 말 그대로 하늘과 땅입니다. 첫 번째는 그냥 컵 하나 덩그러니 나오는데, 두 번째는 인스타그램 인기 게시물 같은 느낌이 납니다.

프롬프트 작성 시 피해야 할 실수

제가 직접 겪은 실패 사례입니다:

1.너무 많은 요소 넣기: "고양이, 강아지, 새, 물고기가 함께 노는" 같은 건 AI가 혼란스러워합니다

2.애매한 표현: "좀 예쁘게", "느낌 있게" 같은 건 의미가 없습니다

3.부정문 사용: "배경에 사람 없이"보다는 "빈 배경"이 더 효과적입니다

프롬프트는 짧으면서도 구체적이어야 합니다. 저는 보통 한 문장 안에 주제-스타일-조명-구도를 모두 담으려고 노력합니다.

반드시 알아야 할 저작권 이야기

이미지 생성 AI를 쓰면서 가장 조심해야 하는 부분이 바로 저작권입니다. 저도 이 부분 때문에 변호사 친구에게 여러 번 자문을 구했고, 관련 판례도 찾아봤습니다. 결론부터 말하면 "상황에 따라 다르다"입니다. 명확한 법적 기준이 아직 확립되지 않았기 때문입니다.

현재 저작권 상황 정리 (2025년 기준)

AI가 만든 이미지의 저작권은 누구에게 있을까? 이게 핵심 질문입니다. 

미국 저작권청(US Copyright Office)은 2023년에 중요한 결정을 내렸습니다. "AI가 자동으로 생성한 이미지에는 저작권이 인정되지 않는다"는 겁니다. 이유는 간단합니다. 저작권은 '인간의 창작'에만 부여되는데, AI는 인간이 아니니까요.

하지만 여기서 중요한 점이 있습니다. "인간의 창의적 개입이 충분히 있었다면" 저작권이 인정될 수 있다는 겁니다. 예를 들어 프롬프트를 정교하게 작성하고, 여러 번 수정하고, 포토샵으로 후보정까지 했다면 이건 '창작'으로 볼 수 있다는 논리입니다.

한국도 비슷한 입장입니다. 저는 한국저작권위원회에 직접 문의해봤는데, "케이스 바이 케이스로 판단하되, 인간의 창작적 기여도가 중요하다"는 답변을 받았습니다.

각 플랫폼별 이용 약관 차이

플랫폼마다 정책이 다르니 꼭 확인하세요. 제가 정리한 내용입니다.

미드저니

- 유료 플랜 사용자: 상업적 사용 가능 (단, 연 매출 100만 달러 이하 기업)

- 무료 사용자: 비상업적 용도만 가능 (근데 무료 플랜 자체가 없어졌습니다)

- 생성한 이미지를 자유롭게 사용, 수정, 재배포 가능

DALL-E 3

- 생성한 이미지에 대한 권리는 사용자에게 있음

- 상업적 사용 가능 (책 표지, 광고 등)

- 단, 오픈AI 로고를 달거나 "AI로 만들었다"고 명시할 필요 없음

스테이블 디퓨전

- 오픈소스라 가장 자유로움

- 상업적 사용 제한 없음

- 단, 사용한 모델에 따라 라이선스가 다를 수 있으니 확인 필요

실제로 문제가 될 수 있는 경우

제 지인이 겪은 실제 사례입니다. 온라인 쇼핑몰을 운영하는 친구가 AI로 제품 상세페이지 이미지를 만들었는데, 경쟁사에서 "우리 제품 사진을 학습한 거 아니냐"며 클레임을 걸었습니다. 다행히 프롬프트 기록과 생성 과정을 증명해서 문제없이 넘어갔지만, 아찔한 순간이었다고 합니다.

주의해야 할 상황들

1. 유명인의 얼굴이나 목소리: "아이유 스타일", "BTS 지민 닮은" 같은 프롬프트는 초상권 침해 가능성이 있습니다. 저는 절대 실명을 넣지 않고 "20대 여성 가수", "젊은 남성 아이돌" 같은 일반 명사를 씁니다.

2. 유명 캐릭터: "미키마우스", "포켓몬" 같은 건 명백한 저작권 침해입니다. 디즈니는 특히 저작권에 민감해서 소송으로 유명합니다.

3. 유명 예술 작품 모방: "모나리자 패러디", "게르니카 스타일" 같은 것도 조심해야 합니다. 고전 예술 작품은 저작권이 만료됐지만, 현대 예술가 작품은 위험합니다.

4. 타인의 사진을 AI에 학습: 다른 사람 인스타그램 사진을 캡처해서 AI에 넣고 "이런 스타일로 만들어줘"라고 하면 초상권과 저작권 둘 다 침해입니다.

안전하게 사용하는 방법

제가 실천하는 원칙들입니다:

원칙 1: 생성 기록 보관

저는 모든 프롬프트와 생성 날짜를 엑셀에 기록합니다. 나중에 "이거 어디서 가져온 거냐"는 질문을 받았을 때 증명할 수 있습니다.

원칙 2: 후 보정 필수

AI가 만든 이미지를 그대로 쓰지 않고 포토샵이나 캔바로 텍스트를 추가하거나 색감을 조정합니다. 이러면 '창작적 기여'가 인정됩니다.

원칙 3: 민감한 프로젝트는 전문가 상담

책 출판이나 대형 광고 같은 상업적 프로젝트는 저작권 변호사에게 검토를 받습니다. 10만 원 정도 들지만 나중에 소송 리스크 생각하면 싼 투자입니다.

원칙 4: 공개 시 출처 표기

"AI 이미지 생성 도구로 제작"이라고 명시합니다. 법적 의무는 아니지만 윤리적으로 옳고, 나중에 문제 생겼을 때 선의의 사용자임을 증명할 수 있습니다.

원칙 5: 기업 로고나 제품은 절대 금지

"나이키 로고가 있는 운동화", "애플 아이폰 광고" 같은 건 명백한 상표권 침해입니다. 이건 변명의 여지가 없습니다.

앞으로의 전망

지금은 과도기입니다. 2~3년 내로 명확한 법적 기준이 나올 거라고 전문가들은 예상합니다. 유럽연합(EU)은 이미 AI 규제법을 통과시켰고, 한국도 관련 법안을 준비 중입니다.

제 생각에는 "AI 사용 여부를 의무적으로 표기하게 하는 방향"으로 갈 것 같습니다. 식품에 성분 표시하듯이 "이 이미지는 AI로 생성되었습니다" 같은 워터마크를 넣는 식으로요. 실제로 어도비는 이미 '콘텐츠 인증' 기능을 도입했습니다.

AI가 바꿀 창작의 미래

1년 전만 해도 "AI가 예술가를 대체할까?" 같은 걱정이 많았습니다. 하지만 직접 써보니 답은 명확합니다. 대체가 아니라 확장입니다.

피카소가 사진기가 발명됐을 때 "이제 화가는 필요 없다"는 말을 들었다고 합니다. 하지만 오히려 사진 덕분에 인상파, 초현실주의 같은 새로운 미술 사조가 탄생했습니다. AI도 마찬가지입니다. 기술적 장벽이 낮아지니 더 많은 사람이 창작에 참여하고, 그 과정에서 새로운 예술 형식이 나오고 있습니다.

저는 요즘 AI를 '창작 파트너'라고 부릅니다. 제가 아이디어를 내면 AI가 시각화해주고, 그걸 보고 또 새로운 영감을 받고, 다시 수정하는 과정이 마치 협업하는 것 같습니다. 디자이너 친구는 "예전에는 시안 만드는 데 이틀 걸렸는데 이제는 10분이면 된다. 남은 시간에 더 창의적인 고민을 할 수 있다"고 말합니다.

교육 현장에서도 변화가 일어나고 있습니다. 미술 학원에서 AI 도구를 커리큘럼에 포함시키고, 기업들은 'AI 아트 디렉터' 같은 신규 직무를 만들고 있습니다. 제가 아는 한 스타트업은 프롬프트 엔지니어링 전문가를 연봉 7천만 원에 채용했습니다.

물론 우려도 있습니다. 저작권 문제, 일자리 감소, AI 의존도 증가 같은 것들이죠. 하지만 기술의 발전을 막을 수는 없습니다. 중요한 건 어떻게 윤리적으로, 창의적으로 활용하느냐입니다.

제 개인적인 바람은 AI가 '창작의 민주화'를 가져왔으면 하는 겁니다.

댓글

이 블로그의 인기 게시물

1회차: [입문 가이드] 인공지능(AI)이란 무엇인가? 기초 개념 정리

2회차: [도구 활용] 챗GPT(ChatGPT) 효율적으로 사용하는 프롬프트 작성법

8회차: [멀티미디어] 영상 제작 AI 도구 소개 (Sora, Runway 등 최신 동향)