본문 바로가기
  • 휴식같은 여행으로의 초대 ♪♩♬~
요리.IT.일상 이야기

[생성형 AI] 생성형 AI 종류와 특징, 비교하기

by 휴식같은 친구 2024. 7. 27.
반응형

[생성형 AI] 생성형 AI 종류와 특징, 비교하기

 

 

생성형 AI란 무엇인가?

 

생성형 AI(Generative AI)는 데이터를 기반으로 새로운 콘텐츠를 생성하는 인공지능 기술을 말하는데요.

이러한 AI(인공지능)는 텍스트, 이미지, 오디오, 비디오 등의 다양한 형식의 데이터를 생성할 수 있습니다.

 

생성형 AI는 기존의 책, 신문, 웹페이지, 영화 등의 데이터를 학습하여 새로운 데이터를 만들어내는 능력을 가지고 있으며, 최근 몇 년 동안 놀라운 기술 발전으로 인해 매우 높은 수준의 창의적인 결과물을 생성할 수 있게 되었습니다.

 

대표적인 생성형 AI로 chatGPT가 있는데, 2022년 11월에 탄생했죠.

기계와 인간처럼 소통할 수 있는 대화형 인터페이스를 촉발하며 누구나 쉽게 인공지능을 활용할 수 있게 되었습니다.

 

이런 생성형 AI는 chat_GPT 외에도 여러 기업에서 출시하고 있는데요.

생성형 AI의 작동원리, 활용분야, 발전수준, 국내외 생성형 AI 종류 및 특징 등을 비교해 봤습니다.

 

(여기에 적은 글이나 이미지 80% 이상은 chat_GPT, Copilot, Jemini 등의 생성형 AI의 도움으로 작성되었습니다.)

 

생성형 AI의 작동 방법

 

생성형 AI의 작동 원리는 주로 심층 학습(deep learning)과 신경망(neural network)에 기반합니다. 

그중에서도 가장 많이 사용되는 모델은 변형자(Transformer)와 생성적 적대 신경망(GANs, Generative Adversarial Networks)입니다.

 

변형자 모델은 주어진 입력 시퀀스(예: 텍스트)를 기반으로 다음 시퀀스를 예측하는 방식으로 작동하는데요

예를 들어, 텍스트 생성 AI는 문장을 입력받아 다음에 올 문장을 예측하고, 이를 반복하여 자연스러운 글을 생성하며, 대표적인 모델에 GPT(Generative Pre-trained Transformer) 시리즈가 있습니다.

 

 

 

생성적 적대 신경망(GANs)은 두 개의 신경망(생성자와 판별자)으로 구성되며, 생성자는 무작위로 데이터를 생성하고, 판별자는 이 데이터가 실제 데이터인지 가짜 데이터인지를 구분합니다.

생성자는 판별자를 속이기 위해 점점 더 진짜 같은 데이터를 생성하게 되며, 판별자는 더 정확하게 구분하기 위해 학습합니다.

이 과정이 반복되면서 생성자는 매우 현실적인 데이터를 생성할 수 있게 되는데, 주로 이미지 생성, 스타일 변환, 해상도 증가 등의 작업에 사용됩니다.

 

생성형 AI의 활용 범위

생성형 AI는 다양한 분야에서 혁신적인 활용 사례를 만들어내고 있습니다.

 

콘텐츠 작성

문서 작성 : 블로그 포스트, 기사, 소설 등의 텍스트를 자동으로 생성합니다.

이미지 및 예술 작품 생성 : 새로운 이미지, 그림, 디자인을 만들어내며, 예술가들이 영감을 얻는 데 도움을 줍니다.

음악 및 오디오 생성 : 새로운 곡을 작곡하거나, 특정 스타일의 음악을 생성합니다.


개인화된 서비스
챗봇 및 가상 비서 : 자연스러운 대화를 통해 사용자와 상호작용하며, 고객 서비스나 개인 비서 역할을 합니다.
추천 시스템 : 사용자 취향에 맞춘 맞춤형 추천을 제공합니다.


비즈니스 및 산업
마케팅 및 광고 : 개인화된 광고 콘텐츠를 생성하여 마케팅 효율을 극대화합니다.
디자인 및 프로토타이핑 : 제품 디자인, 건축 설계 등의 초기 단계에서 다양한 시안을 신속하게 생성합니다.


의료 및 과학 연구
신약 개발 : 새로운 화합물이나 약물을 설계하고 예측합니다.
유전자 데이터 분석 : 유전자 데이터에서 유의미한 패턴을 찾아내고, 새로운 가설을 생성합니다.

 

 

생성형 AI의 미래 전망

생성형 AI는 계속해서 발전하며 다양한 분야에 혁신을 가져올 것으로 기대됩니다. 

더욱 자연스러운 생성 : 생성형 AI의 성능이 향상되면서, 생성되는 텍스트, 이미지, 오디오 등이 더욱 자연스럽고 현실에 가까워질 것입니다.

실시간 생성 : 고성능 컴퓨팅과 최적화된 알고리즘을 통해 실시간으로 콘텐츠를 생성하고, 이를 다양한 애플리케이션에 적용할 수 있게 될 것입니다.

맞춤형 AI : 사용자 개인의 취향과 필요에 맞춘 맞춤형 AI 솔루션이 증가할 것입니다. 이는 개인화된 교육, 헬스케어, 엔터테인먼트 등에 큰 영향을 미칠 것입니다.

윤리적 고려 : 생성형 AI의 발전과 함께, 그 사용에 따른 윤리적 문제들도 중요하게 다뤄질 것입니다. AI가 생성하는 콘텐츠의 저작권, 데이터 사용의 투명성, 허위 정보 생성 방지 등의 이슈가 지속적으로 논의되고 해결되어야 합니다.

융합 기술 발전 : 생성형 AI는 다른 기술들과 융합하여 더욱 강력한 도구로 발전할 것입니다. 예를 들어, 가상현실(VR), 증강 현실(AR), 블록체인 등의 기술과 결합하여 새로운 형태의 응용 프로그램과 서비스가 등장할 것입니다.

 

생성형 AI 종류

 

현재 시중에 나와 있는 주요 생성형 AI 솔루션들은 다양한 응용 분야에서 활용되고 있는데요.

종류가 워낙 많아서 주로 사용하는 생성형 AI에 대해서 말씀드리겠습니다.

 

아직까지 생성형 AI에 질문을 하면 할루시네이션(Hallucination : 틀리거나 검증되지 않은 정보를 전달하는 것) 현상이 나타나며, 이를 방지하기 위해 질문할 때 '신뢰할 수 있는 데이터만 가져와라'라고 말할 필요가 있습니다.

 

실제 chatGPT가 알려준 판례를 믿었다가 가짜로 판명돼 벌금형에 처한 사례도 있고, 트럼프 전 대통령이 수갑차고 경찰에 연행되는 가짜사진도 유포된 적이 있었습니다.

 

[생성형 AI] 할루미네이션(Hallucination) 뜻과 의미, 그리고 블레츨리 선언

 

1. chat GPT

 

ChatGPT는 자연스러운 대화와 다양한 응용 분야에서의 활용 가능성으로 많은 주목을 받고 가장 많이 사용하는 AI 모델입니다.

대화형은 물론 이미지 생성(유료버전)도 가능하고, 파일과 웹사이트, 회계자료 등을 재무분석도 할 수 있습니다.

 

ChatGPT는 OpenAI에서 개발한 대화형 인공지능 모델로, 주로 자연어 처리(NLP) 기술을 활용하여 사용자의 질문에 답변하고 대화를 나눌 수 있습니다. 

긴 문맥을 이해하고 유지하며 인간과 유사한 수준의 자연스러운 대화를 생성할 수 있습니다.


ChatGPT의 버전에는 초기 상업용 버전으로 다양한 자연어 처리 작업을 수행하며 문서 작성, 요약, 번역 등에서 높은 성능을 보여준 GPT-3과, 더 큰 데이터셋과 더 많은 매개변수를 통해 더욱 정교한 언어 이해 및 생성 능력을 갖추며 더 뛰어난 성능을 제공하는 GPT-4, 가장 최근에 출시한 이미지까지 처리하는 유료버전인 chatGPT-4o 등이 있으며, 이는 언제까지 학습한 결과를 반영하느냐에 차이가 있습니다.

 

 

 

chatGPT는 2017년에 일론머스크는 Open AI에 투자하면서 샘알트만과 같이 구글에 대항하기 위해 개발을 시작했으나, 더딘 개발속도에 테슬라의 자율주행을 위한 자회사 편입을 요청했습니다.

하지만 샘 알트만 등에 의해 반대에 부딪치자 2018년 결별했죠.

 

이후 마이크로소프트(빌게이츠)가 130억 달러(약 17조)를 투자하면서 가대자본의 힘으로 빠르게 성장했고, chatGPT를 통해 단숨에 AI의 최강자에 올랐으며 마이크로소프트 역시 시가총액 1위에 오르기도 했습니다.

 

무료와 유료버전이 있는데요.
무료버전은 GPT-4에서 10회를 무료로 사용하면 자동으로 GPT-3.5로 넘어가 정확도가 떨어집니다.

아울러 하루나 월간 사용량에 제한이 있을 수 있고, 혼잡 시간대에는 접근이 제한될 수 있습니다.

 

chatGPT(GPT-3.5)는 2022년 1월까지의 데이터를 학습했기 때문에 그 이후의 정보에 대해서는 알지 못합니다.

 

이에 비해 최신 모델인 GPT-4o 등 우선 접근 권한을 제공하여 혼잡 시간대에도 원활하게 서비스를 이용할 수 있고, 더 빠른 응답 시간과 향상된 성능을 제공합니다.

chatGPT-4는 음성입출력, 이미지 생성, 웹브라우징까지 가능해졌습니다.

 

웹브라우저와 모바일 앱 모두에서 사용할 수 있습니다.

언어를 번역할 수 있는 DeepL, 유튜브 영상 스크립트를 작성하는 YouTube & article Summary powered by Chat GPT 등 확장프로그램을 추가 설치하여 사용하면 활용성이 더욱 높아집니다.

 

(생성형 AI) chatGPT 활용, 효율적인 프롬프트 활용방법

 

2. 코파일럿(Copilot)

 

Copilot은 Microsoft에서 개발한 생성형 AI로 원래는 Bing이었는데요.

텍스트, 음성, 이미지를 이용한 대화형 검색이 가능하며, GPT-4 모델을 기반으로 답변을 생성합니다.

이미지 생성까지 가능해서 chatGPT 유료사용자가 아니라면 코파일럿이 매우 유용합니다.

 

Copilot은 무료와 유료 버전이 있지만, 개인은 큰 제한없이 무제한 무료로 사용한 생성형 AI입니다.
무료버전은 Designer를 이용해 15개의 AI 이미지를 생성할 수 있고, 유료 버전은 Designer를 이용해 100개의 AI 이미지 생성이 가능합니다.

물론 유료인 Copilot Pro는 더 많은 기능을 제공하며, Microsoft 365 구독자에게도 AI 기술을 제공합니다. 

 

신뢰성있는 답변은 chatGPT보다 우수한 것 같고, 이미지 생성은 DALL.E 3(OpenAI에서 개발한 생성형 이미지 생성형 인공지능)을 통해서 생성해 줍니다.

 

3. 네이버 Clova X

 

CLOVA X는 네이버에서 개발한 한국형 대화형 인공지능 서비스로 한글기반이라 이해도가 높은 편입니다.

간단한 채팅 형식으로 누구나 쉽게 활용할 수 있고 습니다.
다만, 이미지 생성은 하지 않습니다.

ClovaX 무료 버전은 3시간에 30회의 질문 횟수 제한이 있고, 유료 버전(개인용 월 5,000원, 기업용 월 10,000원)은 횟수 제한없이 사용할 수 있습니다.
2023년 8월 24일에 한국어 버전으로 출시되었으며, 일본어, 아랍어, 동남아시아 언어 등을 추가할 예정입니다.

 

4. 제미나이(Jemini)

 

Google Gemini는 Google의 최신 AI 언어 모델로, ChatGPT와 같은 대화형 AI 기술을 기반으로 합니다. 
Gemini는 Google DeepMind 팀이 개발한 모델로 이전에 Google AI를 통해 개발된 언어 모델들의 업그레이드 버전입니다.

 

이미지 생성도 가능하나 2024년 2월 역사적 인물을 잘못표현하면서 일시 중단된 상태인데요.

조만간 개선된 버전을 출시하면서 다시 재개될 것으로 보입니다.

 

생성형 AI에서 나름 결과가 좋게 나오고 있는데요.

무료버전과 유료버전(2개월 무료 후 월 29,000원)이 있으며, 개인들은 매우 전문적으로 사용하지 않는 한 무료버전을 사용해도 무방해 보입니다.

 

5. 아숙업(AskUp)

 

AskUp은 국내 대표 인공지능 (AI) 스타트업인 업스테이지가 개발한 챗봇 기반 인공지능입니다. 

이는 챗GPT에 광학문자인식 (OCR) 기술을 추가한 것으로, 눈에 띄는 챗GPT라고도 불립니다.

 

AskUp은 이미지 생성 기능도 제공하지만, 현재는 일시 중단된 상태입니다.

2024년 2월, AskUp 이미지 생성 기능에서 역사적 인물을 잘못 표현하는 등 일부 오류가 발생하면서 논란이 일어났으며, 문제점을 개선하기 위한 조치를 취한 후 개선된 버전을 곧 다시 출시할 예정이라고 발표했습니다. 

AskUp 버전에는 일반 사용자들을 위한 기본 버전으로 핵심 기능들을 무료로 제공 AskUp Basic, 추가 기능과 고급 성능을 제공하는 유료 버전인 전문가 및 비즈니스 사용자들을 위한 버전인 AskUp Pro, 대규모 조직과 기업을 위한 버전인 맞춤형 솔루션과 확장된 지원, 보안 기능을 포함한 AskUp Enterprise 등이 있습니다.

 

6. 뤼튼(;wrtn)

 

뤼튼은 한국 AI 기업인 바른인공지능에서 개발한 멀티모달 인공지능 플랫폼입니다. 

텍스트 생성, 번역, 요약, 질의응답, 코드 생성, 이미지 생성 등 다양한 기능을 제공하며, 한국어를 포함한 26개 언어를 지원합니다.


뤼튼은 텍스트 기반으로  이미지 생성 기능도 제공하지만 아직 개발 초기 단계이기 때문에 이미지 생성 품질은 다른 모델에 비해 다소 떨어질 수 있습니다.

이용자는 무료, 무제한으로 웹과 모바일에서 뤼튼 AI에게 질문해 답을 받을 수 있습니다.

 

7. Designer Image Creater

 

Microsoft Designer는 무료로 이미지를 생성하고 편집할 수 있는 AI 기반 그래픽 디자인 앱입니다. 

이전에는 Bing Image Creator로 알려져 있었으며, 현재는 Microsoft Designer로 이름이 변경되었습니다. 

 

텍스트를 기반으로 이미지를 생성하며 다양한 디자인 요소를 조합하여 이미지를 생성하며 사용자가 원하는 스타일의 이미지를 쉽게 만들 수 있습니다.

 

무료 버전에서도 기본 기능을 사용할 수 있으며, 매일 15 크레딧이 제공됩니다.

유료 버전인 Copilot Pro 구독 시 매일 100 크레딧이 충전됩니다. 

 

8. Blue willow

 

Blue Willow는 이미지 생성을 위한 인공지능 서비스로 프롬프트를 입력하면 해당 프롬프트에 맞는 이미지를 생성해 줍니다. 

무료 버전은 V2 및 V3 버전을 사용하여 하루에 최대 10개의 프롬프트를 생성할 수 있고, 동시 요청은 5개로 제한됩니다.
Willower(한 달에 5달러)는 하루에 최대 50개의 프롬프트와 5개의 요청 대기열 제한이 있고, 최신 V4 모델에 조기 액세스할 수 있으며, 더 높은 해상도의 이미지를 생성할 수 있습니다.
Blue Angel(한 달에 10달러)는 하루에 최대 100개의 프롬프트를 생성할 수 있으며 라이브 이벤트 채팅, 프리미엄 Gen 채널, VIP 콘테스트/뉴스레터 액세스도 가능합니다.
Sapphire(한 달에 20달러)는 하루에 최대 200개의 프롬프트를 생성할 수 있습니다.

 

9. 미드저니( Midjourney)

 

미드저니는 OpenAI에서 개발한 텍스트 기반 이미지 생성 AI 모델입니다. 

2022년에 출시된 이후, 사실적이고 아름다운 이미지를 생성하는 능력으로 이미지 생성에 강력함을 발휘하고 있습니다.

텍스트 기반으로 현실 세계와 거의 구분할 수 없는 사실적인 이미지(최대 1000MP의 고해상도 이미지)를 생성할 수 있습니다.

무료버전은 서비스가 종료되어 유료버전만 있고, 한국어지원이 되지 않기 때문에 영어로 질문해야 합니다.

Hobbyist: 월 $10(3.3시간), Basic: 월 $30(15시간), Standard: 월 $60(30시간) 등입니다.

 

인공지능(AI) 이미지편집 도구, 클립드롭(Clipdrop)과 미드저니(midjourney)

 

 

 

생성형 AI에 대한 사용에 대해서 결론을 먼저 이야기하면 생성형 AI의 대표주자는 역시 chat-GPT입니다.

다만, chat-GPT를 유료로 사용한다면 다른 생성형 AI를 사용할 필요는 없을 것 같고, 무료로 사용한다면 Copilot이나 Jemini, ClovaX 등 다른 생성형 AI로 검색해서 보면 좋을 것 같습니다.

 

아울러 이미지나 사진의 경우에는 chatGPT유료를 사용한다면 상관이 없겠지만, 무료로 사용한다면 Copilot이 적당해 보이고요.

퀄리티 있는 이미지를 사용한다면 Midjourney(미드저니)를 유료로 사용하면 기대이상의 결과물을 받아 볼 수 있겠습니다.

실제 사용해 보니 실물 촬영한 것보다 더 리얼감이 살아 있고 디테일했습니다.

 

 

이 외에도 다음과 같은 생성형 AI 종류 있으니 참고하세요.

 

Vrew

Vrew는 인공지능(AI)이 도와주는 문서 편집기처럼 쉽고 빠르게 영상을 편집할 수 있는 소프트웨어입니다.
다양한 기능을 제공하여 영상 제작을 간편하게 할 수 있어서 인기가 좋은 인공지능 툴입니다:

 

인공지능(AI)로 만드는 초간단 유튜브 숏츠 동영상, Vrew 사용법

 

 

Suno.com

간단한 주문사항만 입력하면 AI가 작사와 작곡, 노래까지 만들어 줍니다.

 

[생성형 AI] 노래와 음악을 무료로 만들어 주는 Suno.com

 

 

Clipdrop

AI가 사진편집을 해 주는 유익한 툴입니다.

 

인공지능(AI) 이미지편집 도구, 클립드롭(Clipdrop)과 미드저니(midjourney)

 

 

 

 

이상으로 주요 생성형 AI 종류를 살펴봤는데요.

이런 생성형 AI는 2030년 정도 됐을 땐 어쩐 상황이 올까 궁금해집니다.

 

전문작가보다 나은 텍스트 기반의 작품들, 개발자보다 나은 코딩, 전문 아티스트나 사진작가보다 나은 사진, 개인화된 비디오 게임과 영화 등이 나올 것으로 예상되어 관련 분야의 직업에 대한 불안은 가중될 것으로 보입니다.

 

일자리 감소에 대한 내용은 산술적으로 충분히 가능한 결과로 도출되고 있습니다.

대졸자 444명을 두 그룹으로 나누어 보도자료, 이메일, 짧은 보고서, 분석계획서 등의 과제를 수행케 했는데요.

chatGPT를 사용한 참가자는 시간은 절반, 평가점수도 일반 그룹의 4점보다 높은 4.7점으로 나타났습니다.

728x90
반응형

댓글