180일간의 AI 이미지 생성툴 CBT를 통해 배운점 3가지
AI 이미지 생성툴 클로즈 베타 테스트를 180일 간 진행하며 배운점을 통해 플라멜이 탄생했다.
May 16, 2024
팀 스모어톡은 19개월 간 이미지 생성 외길 인생(?)을 걸어오고 있다. 텍스트로 이미지를 생성한다는 것은 완전히 새로운 경험이었다. 시작할 당시 우리는 사람들이 이미지 생성 AI를 어떻게 사용할지 몰랐다. 제일 처음 우리가 알았던 건, 혹은 우리가 직접 느꼈기에 굳게 믿었던 건 오로지 이것이었다.
“사람들이 이미지 생성을 위한 복잡한 프롬프트 엔지니어링을 열심히 학습할 리 없다“
이에 자동 프롬프트 튜닝 엔진을 자체 개발했고, 또한 이전 노코드툴 기반의 MVP인 스모어데이에서 꽤 괜찮은 지표를 보았기에 작년 7월, “복잡한 프롬프트 엔지니어링이 필요없는 AI 이미지 생성툴, 플라멜 v0.1” 클로즈 베타 테스트를 오픈했다.
최소한의 유연한 개발로 몇가지 가짜 문도 함께 만들어둔 뒤, 다양한 방식의 데이터 분석과 사용자 인터뷰에 힘썼다. 여기서 3가지 중요한 포인트를 알게 되었고, 이를 기반으로 프로덕트 개발에만 매달려, 드디어 5월 13일 Flamel 플라멜 v0.9, 오픈 베타를 디스콰이엇에 정식으로 공개했다.
이 3가지 중요한 포인트는 무엇인지,이것이 우리 프로덕트에 어떻게 반영 되었는지 자세히 공유하고자 한다.
1 무에서 탄생하는 창조는 없다. "레퍼런스"가 중요하다.
디자인 프로세스, 특히 비주얼 콘텐츠를 창조해내는 데에 있어서 “영감을 받는다” 라는 과정이 무조건 존재 했다. 디자인 비전문가건, 숙련된 오랜 경력의 디자이너건 마찬가지다. 어디선가 보았던 멋진 이미지, 기존 브랜드 아이덴티티 이미지, 내가 이전에 만들었던 이미지 등 분명 레퍼런스가 존재한다. 그렇기에 이 레퍼런스 이미지를 입력으로 받아주는 것이 중요했다.
그런데, 이 레퍼런스 이미지를 "잘 반영해주는 것"은 완전히 다른 문제다. 예를 들어,
- “어떤 요소를 가져올 것인가?” - 스타일을 가져올 것인가, 구도를 가져올 것인가, 특정 오브젝트를 가져올 것인가?
- “반영해준다면 얼마나 반영해줄 것인가?” - 100% 정확히 가져와야하는가, 일부만 반영해주어야 하는가?
- “어떻게 반영해줄 수 있나?” - 이건 기술적인 문제로 이어진다.
이에 대한 우리의 1차적인 연구의 집합체가 현재의 플라멜 v0.9이다. 다양한 요소 중 우리가 집중한 것은 스타일, 분위기, 톤앤매너이다. 이또한 “스타일”이란 무엇인가? 라는 의문으로 이어지는데, 클로즈 베타 테스트 유저 분들의 use case들을 스터디하여 자체적으로 구축한 데이터셋으로 평가 후 적용을 완료했다. 이에 다음과 같은 방식으로 나만의 톤앤매너를 유지하는 이미지를 만들 수 있게 되었다.
2 빠른 성공 경험이 매우 중요하다.
비단 플라멜 만이 아니라 모든 프로덕트에서 그렇겠지만 “유저가 최대한 빠르게 성공 경험을 할 수 있는가?” 가 매우 중요한 요소였다. 특히나 이미지 생성 AI는 쉽게 원하는 이미지를 만들 수 없다는 인식이 컸기 때문에 이것이 더욱 중요했다.
초기에 플라멜은 기존 익숙한 워크 플로우에 녹아들고자 검색툴을 모방하여 아무것도 없는 홈화면에, 텍스트 입력창만 있던 매우 단순한 구조였다. 그러다보니 유저가 들어왔을 때 여기서 어떤 걸 할 수 있고, 어떻게 해야하는지를 알기 어려웠다. 이렇게 처음 시도에서 이미지가 잘 만들어지지 않으면 바로 이탈하게 되었다. 한편 한 번 성공경험을 하면 지속적으로 돌아와서 동일한 방법으로 툴을 사용하는 것을 볼 수 있었다.
이에 이러한 성공 경험을 빠르게 주는 방법이 필요했는데, 모순되게도 우리는 유저가 레퍼런스 이미지를 직접 올려서 생성을 하는 것이 메인 기능이었기 때문에 이를 컨트롤 하기가 어려웠다. 여기에 나온 해결책이
바로 플라멜의 포트폴리오 역할을 하는 “플라멜 이미지”
이다. 이는 2가지 역할을 한다.
- 플라멜로 만들어 직접 큐레이션한 이미지를 홈화면에 배치함으로써 플라멜에서 어떤 이미지들을 만들 수 있는지 보여준다. 해당 툴로 만든 이미지를 홈 화면에 보여주는 것은 AI 이미지 생성툴에서 익숙한 플로우이지만, 유저들이 만든 이미지가 모두 포스팅되는 다른 AI 이미지 생성툴 서비스에 대비하여 우리는 큐레이션 된 이미지들만 볼 수 있도록 배치했다. 초기에 유저가 적을 때 유저의 이미지가 모두 포스팅 된다면 소수의 목적에 의해 프로덕트의 이미지가 결정되어 버릴 수 있기 때문이다.
- 이 부분이 중요한데, 여기 포스팅되는 이미지는 단순히 플라멜에서 생성한 이미지가 아닌, 해당 이미지를 클릭해서 동일한 스타일로 직접 이미지를 만들면 높은 확률로 성공적인 경험을 얻을 수 있는 이미지들이다. 마치 직접 내 이미지로 바로 만들어볼 수 있는 핀터레스트 같달까?
해당 기능을 업로드하자 유저들은 빠르게 성공 경험을 해볼 수 있었고, 프로덕트에 오래 남게 되는 효과로 이어졌다.
3 이미지 내의 요소들을 쉽게 배경제거 하는 것이 중요하다.
클로즈 베타 테스트에서 인터뷰한 디자이너 분들은 하나같이 반복적인 누끼 작업의 수고로움에 대해 이야기했다. 나는 디자이너가 아니기에 전혀 몰랐던 부분이었는데, 스톡 이미지 사이트에서 가져온 이미지를 요소별로 누끼를 따서 사용하고 있었다. 우리는 기존에 존재하는 배경 제거 모델을 사용하려 했지만, 가장 잘 되는 서비스는 API로 연결하여 사용하기에는 너무 비쌌고, 무료로 사용할 수 있는 모델은 성능이 너무 떨어졌다. 이에 자체 배경 제거 모델을 개발했다.
우리의 배경제거 AI 모델은 글로벌 AI API 1위 서비스, Replicate의 대문을 약 열흘간 장식하기도 했다 🎉 Tiktok 개발사인 Bytedance, 오픈소스 진영에서의 막강한 LLM 개발사 MistralAI와 어깨를 나란히 할 수 있어 영광이었다.
해당 배경제거 모델은 플라멜에서 만든 이미지를 바로 배경제거하여 사용하는 데에 활용
되며, 특히 플라멜 Top3 스타일 중 하나인 3D ICON을 생성 후 배경 제거 하면 나만의 아이콘으로 사용할 수 있다!
(
위의 캡쳐에 들어간 트로피 아이콘도 플라멜로 만든 뒤 배경제거 하여 사용한 아이콘이다 ㅎㅎ
🏆)
이러한 고민들을 꾹꾹 눌러담은 Flamel 플라멜 v0.9 오픈베타가 시작되었다. 정식 오픈하기 전 부터 개인 유료 고객들이 생겨나고 있어 기쁜 마음이다. 나만의, 우리 기업만의 톤앤매너를 유지하는 비주얼 콘텐츠를 만드는 데에 적극적으로 활용될 수 있기를 바란다.
Share article
Write your description body here.