요즘 AI의 활용 범위가 날이 갈수록 높아지고 있습니다. 스테이블 디퓨전이라는 것이 무엇인지 알고 있으신가요? 이에 대하여 알아보고 어떻게 이런 것이 가능한지 또 우리가 사용할 수는 있는지 알아보도록 하겠습니다.
디퓨전 모델(Diffusion model)의 간단 원리
요즘 그림 그리는 AI, 만화 그리는 AI 등 많은 이야기가 나오고 있습니다. 이런 것이 AI(인공지능)의 디퓨전 모델(Diffusion model)이라는 것을 말합니다.
아래의 이미지는 AI의 학습방식을 표현한 그림입니다.
AI에게 원본 이미지와 프롬프트를 주고 노이즈가 추가되는 과정을 입력시킵니다. 그리고 다시 노이즈를 해독(Denoising)하면서 원본 이미지로 돌아가는 과정을 학습시킵니다. 이러한 과정이 계속되면 데이터가 쌓이게 되고 이제는 원본 이미지를 주지 않고 프롬프트만으로도 원본 이미지를 출력할 수 있게 됩니다.
간단하게 말해서 단어나 문장 등으로 원하는 이미지를 출력할 수 있게 됩니다.
스테이블 디퓨전(Stable Diffusion)이란?
앞서 언급한 디퓨전 모델의 방식으로 stability.ai라는 곳에서 스테이블 디퓨전이라는 프로그램을 만들어 무료로 공개하면서 많은 일들이 생기게 됩니다.
무료로 공개된 이 프로그램은 많은 이들이 다운을 받게 되었고 이것을 발전시켜 변형된 프로그램으로 재배포하게 됩니다. 만화, 가구, 3D애니메이션등 수많은 모델들이 탄생하게 되었고 이 과정에서 일반인들도 쓰기 쉽게 UI를 입힌 버전까지 공개하게 됩니다.
Automatic111이라는 ID로 Stable Diffusion wed UI의 이름으로 오픈소스로 무료 공개 되었는데 이 모델이 최근에 가장 많이 쓰이게 되었습니다.
위의 이미지는 실제로 존재하거나 실존하는 인물이 아닌 스테이블 디퓨전의 프롬프트로 생성된 이미지입니다. 이토록 높은 퀄리티의 이미지까지 생성이 가능한 것이 스테이블 디퓨전입니다.
스테이블 디퓨전(Stable Diffusion) 코랩(Colab)
스테이블 디퓨전은 여러 가지 OS(운영체제)에서 작동을 합니다. 하지만 구글에서 제공하는 코랩에서도 설치하여 사용을 할 수가 있는데 이렇게 되면 스테이블 디퓨전을 어디서든 작동시킬 수 있게 됩니다. 심지어 스마트 폰에서 까지 간단한 조작으로 운영을 할 수 있게 됩니다.
이 코랩(Colab)이라는 것은 구글에서 Web에서 쓸 수 있는 컴퓨터라고 생각하시면 이해가 편하리라 생각됩니다. 이 서비스를 무료로 제공하고 있다는 점에서 상당한 이점이 있습니다. 스테이블 디퓨전을 운영하기에는 고성능의 GPU를 필요로 합니다.
GPU는 그래픽 처리장치를 말하는데 우리가 쓰는 컴퓨터의 그래픽카드가 이에 해당하며 이 그래픽카드의 성능이 따라 주지 못한다면 스테이블 디퓨전을 사용하기에 상당한 불편함이 있습니다.
스테이블 디퓨전을 이용하기에 좋은 선택지라고 생각합니다.
이상으로 마치면서 앞으로 계속해서 스테이블 디퓨전의 활용법에 대해 포스팅하려 합니다. 유익한 시간 되셨기를 바라면서 이상 마칩니다.
같이 보면 좋은 글↓↓↓
댓글