그림 그려주는 AI Dalle 어도비 파이어플라이
챗GPT나 구글 바드등 AI에 대한 관심이 폭증하고 있는 요즘입니다. 여러 가지 오류나 잘못된 정보, 최신정보의 부족이나 질문 방식에 따라 답이 다르기도 하지만 그래도 꽤 쓸모가 좋습니다. 10년 안에 지금의 휴대폰처럼 우리 일상에서 없으면 안 되는 요소가 곧 될 것이라고 생각합니다만. 오늘은 그림이 그려주는 AI에 대하여 알아보려고 합니다.
그림 그려주는 AI MS의 Dalle 과 어도비 파이어플라이, adobe firefly
각각 다르지만 MS의 Dalle-E, 어도비 firefly, GAN, Neutral Style Transfer에 대하여 간단히 확인해 보도록 하겠습니다.
1. DALL-E 는 어떻게 그림을 그려주나?
1) OpenAI에서 개발한 이미지 생성 AI로, 주어진 텍스트 설명을 토대로 이미지를 생성합니다. DALL-E는 이미지에 대한 인식과 창의성을 모두 갖추고 있는데 텍스트는 챗 GPT처럼 구체적인 것이 좋고 영어로 하는 것이 훨씬 더 효과적입니다. chatGPT는 요즘 한글로 물어도 꽤 빠른 속도로 자세히 잘 따라옵니다. 하지만 DALL-E는 영어로 하는 것이 훨씬 나으니 꼭 영어로 해 주시면 좋을 것 같습니다.
2) DALL-E은 창의성이 뛰어나며, 기존의 이미지와 다른 창의적인 이미지를 생성합니다. 고품질의 이미지 생성을 가능하게 하는데 아래 링크에서 더 자세한 정보를 확인할 수 있습니다.
3) 그림의 스타일을 정확히 짚어주면 더 좋습니다. 데생이라던지 수채화풍, 고호풍, 모네풍등 이런 내용을 넣고 좀 더 자세한 내용을 넣어주면 네 개 정도의 그림을 띄워 줍니다. 예를 들면 30대에 키가 160cm에 몸무게 44kg으로 금발에 녹색눈을 가졌고 푸른 자켓을 입고 흰색 스커트를 입은 여자를 수채화풍으로 그려줘. 이런 걸 얘기합니다.
저의 요구 조건은 Draw a 30-years-old woman 160cm, 44kg with blonde, green eyes, blue jacket and white pants of water painting 이었습니다.
제가 얘기한 대로 4개의 그림을 그려 주었습니다. 약간의 차이는 있지만 제가 그리는 것보다 시간적인 부분에서도 퀄러티 면에서도 나은 듯합니다. 물론 크레디트가 줄었다는 내용도 함께 떴습니다.
4) 최근에 OpenAI에서 DALL-E를 상용화했습니다. 이를 이용한 API를 제공하기 시작했는데 이 API는 기업용으로 제공되며, 누구나 이용할 수 있는 공개 API와는 달리 상업적 용도로만 사용이 가능합니다.
DALL-E API는 일련의 제한된 환경에서만 사용 가능하며, 사용료도 상당히 높기 때문에 대부분의 개인 사용자자가 사용하기에는 가격이 좀 된다고 알려졌습니다만 제가 느끼기엔 그렇지는 않습니다. 또한, 이미지 생성을 위한 요청 제한이 있기 때문에 대량의 이미지 생성이 필요한 경우에는 이용이 제한될 수 있습니다.
5) 개인에게는 일정 기간동안 무료로 일정량만 작업을 할 수 있는 것 같습니다. 처음에 한 달간 무료 15개로 시작했습니다. 한 달 후에 다시 15개의 크레디트가 생긴다는 메시지가 계속 뜨고 더 사용하려면 크레디트를 구매하라는 메시지가 뜨고 있습니다.
가격을 보면 1회에 120원 정도가 소요 됩니다. 이 서비스가 필요한 사람이라면 생각보다 비싸지는 않은 듯합니다. 유료 사진을 사용해 보신 분들은 이미 경험이 있으실 텐데 유료 사진이 이 보다 훨씬 비쌉니다.
5) DALL-E API를 이용하면, 텍스트 설명을 제공하면 그에 맞는 이미지를 생성할 수 있으며, 이를 커스터마이징하여 원하는 크기, 비율, 배경 등을 설정할 수 있습니다. 또한, 이미지 생성 결과는 API를 통해 반환되기 때문에, 해당 이미지를 바로 다운로드하거나, 다른 애플리케이션에 적용할 수도 있습니다.
2. GAN(Generative Adversarial Network)은 어떻게 이미지를 생성할까?
1) GAN은 대표적인 이미지 생성 AI 기술 중 하나입니다. 생성자(generator)와 판별자(discriminator)를 대립시키면서 학습을 진행하여 이미지를 생성합니다.
2) GAN(Generative Adversarial Network): 생성자와 판별자를 대립시키는 학습 방식으로 이미지를 생성합니다. 이미지 분류, 합성, 생성 등 다양한 분야에서 활용됩니다. 적대적 학습(adversarial training) 기법을 사용하여 높은 품질의 이미지 생성이 가능합니다. GAN은 많은 연구자들이 사용하고 있는 AI이며, 아래 링크에서 더 자세한 정보를 확인할 수 있습니다.
3. Neural Style Transfer은 어떻게 사용할까?
1) 이미지의 스타일과 내용을 분리해 스타일 이미지와 내용 이미지를 합성하는 방식입니다. 예를 들어, 유명 화가의 그림 스타일을 따와서 내용을 바꾸는 것이 가능합니다. Dalle-e 와 같다고 볼 수 있습니다.
https://arxiv.org/abs/1406.2661
2) 이미지의 스타일과 내용을 분리해 합성하는 방식으로 이미지를 생성합니다. 유명 화가의 그림 스타일을 따와서 이미지를 생성할 수 있습니다. 이미지에 대한 텍스트 설명이 필요하지 않습니다. Neural Style Transfer는 Gatys et al. 에 의해 개발된 AI 기술입니다.
4. Adobe firefly은 어떨까?
1) Adobe에서는 인공지능을 활용한 그림 그리기 도구인 "Adobe Sensei-powered Neural Filters"를 출시했습니다. 이 도구는 Adobe Photoshop에서 사용할 수 있으며, 이미지를 변환하고 보정할 수 있는 다양한 기능을 제공합니다.
2) 이미지를 보정하거나, 스타일을 변경하는 다양한 필터 기능을 제공합니다. 실제 그림이 아닌 사진을 이용하여 자동으로 그림을 생성할 수 있는 AI 기술을 적용하고 있습니다. 사용자가 직접 설정한 이미지 스타일을 기반으로, 다른 이미지를 일관된 스타일로 변환하는 기능도 제공합니다.
3) 유료화된 기능으로는 AI가 자동으로 그린 이미지를 보다 섬세하고 정교하게 만들어주는 기능과 보다 다양한 이미지 필터 및 스타일 제공 이미지를 변환하거나 보정할 때, 보다 높은 해상도를 제공하여 이미지의 퀄리티를 향상시키는 기능은 유료화되어있습니다. 다른 프로그램을 사용하다 보면 특정 툴에서 유료화되는 경우를 많이 보셨을 테니 친숙하실 거라 생각합니다.
Adobe Sensei-powered Neural Filters에 대한 더 자세한 내용은 아래 URL에서 확인할 수 있습니다.
https://www.adobe.com/products/photoshop/neural-filters.html
5. adobe 의 firefly beta는 더 나을까요?
1) 개발중인 새로운 디자인 도구로, 사용자 인터페이스 및 웹 디자인을 위한 설루션으로 개발 중입니다. 현재는 베타 버전이 출시되어 있으며, Adobe MAX 2021에서 공개되었습니다. Adobe Firefly의 목표는 디자이너와 개발자가 함께 일할 수 있는 새로운 작업 환경을 제공하는 것입니다. 디자이너는 Firefly에서 디자인을 하면서 디자인 요소를 레이어로 구성할 수 있으며, 이를 개발자들이 코드로 변환하여 사용할 수 있습니다.
2) 또한, Adobe Firefly는 "Live Components"라는 새로운 개념을 도입하여 디자인 요소를 실시간으로 업데이트하고 적용할 수 있습니다. 디자인 요소를 업데이트하면, 이를 사용하는 모든 컴포넌트가 자동으로 변경되며, 디자인 요소의 상호작용에 따라서 컴포넌트의 동작도 자동으로 업데이트됩니다.
3) 현재 Adobe Firefly는 베타 버전이 출시되어 있으며, 무료로 다운로드 및 사용할 수 있습니다. 아래 링크에서 Adobe Firefly에 대해 더 자세히 알아볼 수 있습니다.
https://www.adobe.com/products/firefly.html
이러한 인공지능 기술을 사용하여 원하는 그림을 그릴 수 있지만, 이러한 기술들은 아직까지도 한계와 한계점이 존재합니다. 따라서 완전한 예술작품을 생성하는 것은 아직 어려운 과제입니다. 또한 adobe을 제외하고는 저작권 문제가 어디로 튈지 아직 알 수가 없습니다. 이 기술 또한 더욱 발전되고 여러 가지 법리적인 문제가 해결되면서 이 프로그램을 사용할 인구가 점점 늘어날 것으로 보입니다.