IT/AI

생성형 AI 종류별 정리

멘탈오브스틸 2025. 4. 5. 13:10
반응형

생성형 AI는 텍스트, 이미지, 오디오, 비디오 등 다양한 콘텐츠를 새롭게 만들어내는 인공지능 기술입니다. 대표적인 서비스들을 중심으로 종류, 용도, 설명, 장점, URL, 가격 정보를 정리했습니다.

주의: AI 기술은 매우 빠르게 발전하고 있으며, 가격 정책 등은 수시로 변경될 수 있습니다. 아래 정보는 현재 시점(2024년 5월)을 기준으로 하며, 실제 이용 시에는 해당 사이트에서 최신 정보를 확인하시는 것이 좋습니다. 가격은 대부분 미국 달러 기준이며, 월별 구독 기준입니다 (연간 구독 시 할인되는 경우가 많습니다).

 

종류 (대표 서비스) 주요 용도 간단한 설명 주요 장점 해당 사이트 URL 유료 구독 가격 (월 기준, 약)
텍스트 생성 (LLM)          
ChatGPT (OpenAI) 대화, 글쓰기(기사, 이메일 등), 요약, 번역, 코딩 지원, 아이디어 구상 사용자의 질문과 요청에 대해 인간과 유사한 텍스트를 생성하는 대화형 AI 모델 뛰어난 범용성, 자연스러운 대화 능력, 방대한 지식, 다양한 플러그인/GPTs 연동 가능 https://chat.openai.com/ 무료 버전 O<br>Plus: $20
Claude (Anthropic) 대화, 긴 글 요약/분석, 창의적 글쓰기, 코딩 지원 안전성과 윤리성을 강조하며 개발된 대화형 AI. 긴 컨텍스트 처리 능력 우수 긴 문서 처리 유리, 안전성 강조, 자연스러운 문장 생성 https://claude.ai/ 무료 버전 O<br>Pro: $20
Gemini (Google) 대화, 정보 검색, 글쓰기, 번역, 코딩 지원, 구글 서비스 연동 구글이 개발한 멀티모달(텍스트, 이미지 등 이해) 기반 AI 모델 구글 검색 및 서비스 연동성, 최신 정보 반영 우수, 멀티모달 능력 https://gemini.google.com/ 무료 버전 O<br>Advanced: $19.99
이미지 생성          
Midjourney 예술적인 이미지, 일러스트, 콘셉트 아트 제작 텍스트 설명을 기반으로 독창적이고 예술적인 고품질 이미지를 생성 (주로 Discord 사용) 매우 높은 이미지 품질, 독특한 예술적 스타일, 활발한 커뮤니티 https://www.midjourney.com/ 무료 체험 종료<br>Basic: $10 <br>Standard: $30<br>Pro: $60
DALL·E 3 (OpenAI) 텍스트 기반 이미지 생성, 아이디어 시각화 ChatGPT Plus/Team/Enterprise 내에서 텍스트 설명을 통해 이미지 생성 ChatGPT와 통합되어 사용 편리, 문맥 이해도 기반의 정확한 이미지 생성 시도 ChatGPT Plus 내 통합 ChatGPT Plus ($20) 등에 포함
Stable Diffusion 텍스트/이미지 기반 이미지 생성, 이미지 편집 오픈 소스 기반의 이미지 생성 모델. 다양한 파인튜닝 모델과 인터페이스 존재 오픈 소스로 무료 사용 가능(로컬 설치 시), 높은 자유도 및 확장성, 다양한 모델 활용 (다양한 웹 UI/로컬 설치 필요) 모델 자체는 무료 (웹 서비스는 유료)
비디오 생성          
Runway (Gen-2) 텍스트/이미지 기반 짧은 영상 생성, 영상 편집 도구 텍스트 설명이나 이미지를 기반으로 짧은 비디오 클립을 생성하는 웹 기반 플랫폼 다양한 AI 영상 편집 기능(배경 제거, 인페인팅 등), 비교적 쉬운 사용법 https://runwayml.com/ 무료 버전(크레딧 제한) O<br>Standard: $15<br>Pro: $35<br>Unlimited: $95
Pika 텍스트/이미지 기반 짧은 영상 생성, 영상 스타일 변환 간결한 인터페이스로 텍스트나 이미지를 입력하여 애니메이션 스타일 등의 영상을 생성 사용 편의성, 다양한 스타일 변환 기능, 빠른 영상 생성 속도 https://pika.art/ 무료 버전(워터마크, 크레딧 제한) O<br>Standard: $10<br>Pro: $60
Sora (OpenAI) 텍스트 기반 고품질 영상 생성 (현재 제한적 접근) 텍스트 설명을 바탕으로 매우 현실적이고 긴 비디오 클립 생성 가능 (개발 중) (예상) 뛰어난 영상 품질과 일관성, 복잡한 장면 구현 능력 (정식 출시 전, 정보 공개 수준) (미정)
오디오/음악 생성          
Suno AI 텍스트 기반 음악 생성 (보컬 포함) 장르, 분위기, 가사 등을 텍스트로 입력하면 보컬 포함된 완성된 곡 생성 사용 편의성, 보컬 포함된 완성곡 생성, 다양한 스타일 지원 https://suno.ai/ 무료 버전(크레딧 제한) O<br>Pro: $10<br>Premier: $30
ElevenLabs AI 음성 합성 (TTS), 목소리 복제 매우 자연스러운 AI 음성을 생성하거나, 자신의 목소리를 복제하여 사용하는 서비스 높은 수준의 자연스러운 음성 품질, 다양한 언어 및 목소리 지원, 목소리 복제 기능 https://elevenlabs.io/ 무료 버전(크레딧 제한) O<br>Starter: $5<br>Creator: $22
코드 생성          
GitHub Copilot 코드 자동 완성, 함수/클래스 생성, 주석 기반 코드 작성 개발자의 코드 작성을 돕는 AI 페어 프로그래머 (주로 코드 편집기에 통합) 개발 생산성 향상, 반복 코드 감소, 새로운 언어/프레임워크 학습 도움 https://github.com/features/copilot 학생/오픈소스 무료<br>Individual: $10<br>Business: $19/user
  • 위 목록은 대표적인 예시이며, 이 외에도 수많은 생성형 AI 서비스들이 존재합니다.
  • 멀티모달 AI: 최근에는 텍스트, 이미지, 오디오 등을 동시에 이해하고 생성하는 멀티모달 AI(예: Google Gemini)가 중요해지고 있습니다.
  • 오픈 소스 모델: Stable Diffusion처럼 오픈 소스로 공개되어 사용자가 직접 모델을 활용하거나 개선할 수 있는 경우도 많습니다.
  • 가격: 표기된 가격은 일반적인 개인 사용자 기준이며, 기업용 플랜 등은 별도 문의가 필요할 수 있습니다.
반응형