플레이스의 이중생활
article thumbnail
반응형

최근 인공지능 이미지 생성 분야에서 가장 주목받고 있는 모델 중 하나가 나노바나나(Nano-Banana) 이다.
이 모델이 인기를 끌고 있는 가장 큰 이유는 바로 캐릭터 일관성과 배경 보존 능력 덕분이다.

GPT 같은 기존 이미지 생성 모델들은 
특정 장면에서는 꽤 괜찮은 결과를 보여주다가도, 다음 장면으로 넘어가면 캐릭터의 얼굴이 달라지거나 의상이 바뀌는 문제가 흔했다. 
배경 역시 원본 느낌을 유지하지 못하고 깨지거나 왜곡되는 경우가 많았다. 
그러나 나노바나나는 이러한 문제를 상당 부분 해결하면서 주목을 받고 있다.

특히 "이 그림을 현실의 피규어처럼 만들어줘"라는 요청을 넣었을 때, 
원본 이미지를 굉장히 충실히 반영하면서 마치 3D 피규어 같은 결과물을 뽑아준다. 
GPT 기반 이미지 생성과 비교하면 이 차이가 확연하게 드러난다.
 


나노바나나(Nano-Banana)의 주요 특징

  1. 캐릭터 일관성 유지
    • 같은 캐릭터를 여러 장 그려도 얼굴과 체형, 디테일이 유지된다.
    • 기존 모델에서 흔히 발생하던 ‘캐릭터 변형 문제’를 안정적으로 해결했다.
  2. 이미지 보존 능력
    • 이미지가 크게 변하지 않고 원본과 유사하게 유지된다.
    • 특히 인물 중심 사진에서 객체를 자연스럽게 처리해 준다.
  3. 레퍼런스 충실도
    • 주어진 그림을 피규어화 시킬 때 원본 이미지의 구도와 분위기를 충실히 따라간다.
    • 디테일, 재질, 명암 표현이 기존 모델보다 확실히 뛰어나다.

이런 점에서 나노바나나는 단순히 스타일 변환 수준을 넘어서, 원본 충실도와 일관성을 동시에 잡은 모델이라고 할 수 있다.


 

LM Arena란 무엇인가?

현재 나노바나나는 LM Arena 라는 플랫폼에서만 체험할 수 있다. LM Arena 바로가기

LM Arena는 여러 최신 AI 모델들을 한곳에서 비교하고 체험할 수 있는 일종의 AI 실험실 같은 사이트이다.

별도의 프로그램 설치 없이 웹 브라우저만 있으면 바로 이용 가능하며, 다음과 같은 특징이 있다.

  • 텍스트 생성, 이미지 생성, 오디오 처리 등 다양한 모델을 제공함
  • 같은 프롬프트를 입력했을 때 모델마다 어떤 차이가 있는지 비교 가능함
  • 일반 사용자도 쉽게 접근할 수 있고, 연구자 입장에서도 성능 테스트에 유용함
  • 모델 순위 탭을 통해 어떤 모델이 사용자들에게 좋은 평가를 받았는지 확인 가능함

즉, LM Arena는 단순히 모델을 체험하는 곳이 아니라, 모델 간 성능을 객관적으로 비교할 수 있는 플랫폼이다.

 

이렇게 각 llm 모델들의 순위를 확인 할 수 있다.

 
 

그럼 이제 본론으로 넘어가서 nano-banana(나노바나나) 모델을 활용해 실제로 피규어 그림을 만들어보자.
먼저 위에서 소개한 링크를 통해 LM Arena 사이트에 접속한다.
사이트에 들어가면 첫 화면에서 여러 메뉴와 검색창이 보일 텐데, 조금 복잡해 보일 수도 있지만 크게 어렵지 않다.

이 화면에서 우리가 해야 할 일은 이미지 생성 모드로 들어가는 것이다.
화면을 잘 보면 검색창 하단에 여러 아이콘이 줄지어 있는데, 그중에서 작은 사진 모양 아이콘이 있다.
이 버튼이 바로 이미지 생성을 시작하는 기능이다. (+ 아이콘의 오른쪽 두 번째 버튼)
그 버튼을 눌러주도록 하자.

 
 

검색창 내 + 아이콘 우측 두번째 버튼이다.

 

그럼 아래와 같은 화면이 나오는데, 여기서 + 아이콘을 눌러 피규어로 만들고 싶은 그림을 선택해 주자.
필자는 예시로 메구밍 사진을 넣어보았다.
 
그 다음 프롬프트에 "이 사진을 현실의 피규어처럼 그려줘"라고 입력한다.
사실 영어로 입력하면 조금 더 좋은 결과가 나오긴 하지만, 이번에는 그냥 한글로 작성했다.
 
잠시 기다리면 아래와 같이 두 개의 그림이 생성된다. 여기서 한 가지 주의할 점이 있는데,
LM Arena는 두 모델의 성능을 비교하기 위해 랜덤으로 선택된 모델의 결과를 보여준다.
 
그래서 두 그림 모두 반드시 nano-banana 모델이 나오는 것은 아니다.
다행히 필자는 운이 좋게 한 번에 nano-banana 모델을 확인할 수 있었다.
 

왼쪽이 블라인드 오른쪽이 나은 모델을 선택했을때 나온 모델 결과이다.

 
그럼 이제 한번 원본 이미지와 나노바나나로 생성된 이미지를 비교해 보자.
 


캬...


 
 

두 사진을 비교해 보면 알 수 있듯, 구도와 전체적인 형태, 이목구비 모두 원본과 거의 흡사하게 모방된 것을 확인할 수 있다.
원본의 특징을 그대로 살리면서 캐릭터가 가진 느낌까지 잃지 않고 재현한 점이 신기하다.
세부적인 디테일 역시 눈에 띄는데, 명암에 따른 빛 번짐과 재질 표현이 피규어 느낌 그대로 살아 있다. 손 모양이나 작은 장식까지 세밀하게 구현되어 있다.
 
이 정도로 깔끔하게 나오는 걸 보면, 나노바나나 모델의 이미지 생성 능력이 상당히 뛰어나다는 것을 실감할 수 있다. 아까 두 모델을 비교한 그림을 보면 다른 모델에 비해 원본 구현력이 압도적으로 높은 것도 한눈에 들어온다.
필자도 솔직히 이렇게까지 원본 재현율이 높을 줄은 예상하지 못했다.
 
참고로 아래 이미지는 GPT 기반 모델로 그려본 메구밍 피규어이다. 비교해 보면 재질은 나쁘지 않지만 구도와 얼굴 구현률에서는 확실히 차이가 난다.
 
후담을 덧붙이자면, 이 나노바나나 모델이 구글에서 제작되었고, 향후 Gemini 시리즈에 포함될 수 있다는 루머가 돌고 있다. 만약 공식적으로 서비스가 시작된다면, 예전처럼 “지브리풍으로 그려줘”라고 요청하던 시절과 달리 이제는 “피규어처럼 그려줘”라는 프롬프트가 새로운 트렌드로 자리 잡을 가능성이 높아 보인다. 실제로 이렇게까지 원본 재현율이 높은 모델이 나오면서, 앞으로 AI 이미지 생성의 방향성이 달라질 것으로 예상된다.

 
 


재질은 나쁘진 않은데.. 구도나 얼굴구현률을 보면 많이 아쉽다.

 


 

총평

 
이번 시간을 통해 단순한 이미지 생성 AI를 넘어서, LLM과 결합된 복합 모델의 완성도가 상당히 높아졌다는 것을 새삼 느낄 수 있었다. 단순히 그림을 잘 그리는 수준을 넘어, 캐릭터의 일관성을 유지하고 배경과 세부 요소까지 자연스럽게 처리하는 모습을 보면 기술이 얼마나 빠르게 진화하고 있는지 실감할 수 있다. 앞으로 이런 모델이 계속 발전하면, 단순한 창작 도구를 넘어 실제 게임, 애니메이션, 피규어 제작 등 다양한 분야에서 활용될 가능성이 높아 보인다.
또, 이미지 생성 모델이 나온 지 얼마 되지도 않았는데, 이렇게 짧은 시간 만에 이 정도로 발전한 걸 보면 솔직히 조금 무섭기도 하고 동시에 굉장히 흥미롭다는 생각이 든다. 기술이 이렇게 빠르게 진화하다 보면 앞으로 10년 후에는 AI가 지금 상상하는 것보다 훨씬 더 많은 걸 할 수 있을 것 같다.
과연 그때쯤 되면 AI가 어떤 모습으로 우리 일상 속에 자리 잡고, 또 어느 정도 규모까지 성장해 있을지 궁금하다.
그리고 솔직히 말하면, 우리는 그 속도를 과연 따라잡을 수 있을까 하는 생각도 든다. 그냥 기술을 바라보는 관찰자가 되는 걸로 끝날지, 아니면 그 발전 속도를 실제로 활용하고 이해하면서 나만의 방식으로 받아들일 수 있을지는 아직 모르는 일이니까 말이다.

반응형
profile

플레이스의 이중생활

@플레이스의 이중생활

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!