카테고리 보관물: Generative AI

“만들면서 배우는 생성 AI 2판”, “머신 러닝 교과서 3판” 사이킷런 1.2.2와 텐서플로 2.14.0에서 재실행 완료

<만들면서 배우는 생성 AI 2판>의 깃허브에 있는 주피터 노트북을 코랩, 텐서플로 2.14.0버전에서 다시 테스트했습니다. 그리고 <머신 러닝 교과서 3판>의 주피터 노트북도 코랩, 사이킷런 1.2.2, 텐서플로 2.14.0에서 모두 재실행 완료했습니다. <머신 러닝 교과서 3판>에는 몇 개의 에러타가 추가되었으니 참고하세요!

“생성 AI”가 출간되었습니다!

<미술관에 GAN 딥러닝>의 2판 <만들면서 배우는 생성 AI>가 출간되었습니다!

2023년 인공지능 분야를 뜨겁게 달구고 있는 생성 AI를 본격적으로 해부하는 유일한 도서입니다. 딥러닝 기초부터 시작해서 오토인코더, GAN, 트랜스포머, 확산 모델, GPT 등 최신 생성 모델을 모두 다룹니다. 다양한 생성 AI 모델 이면의 이론과 훈련 방법을 배울 수 있습니다.

1판에 이어 2판을 작업할 수 있어 너무 기뻤습니다. 특별히 요즘 생성 AI가 화두라 번역이 늦어지지 않도록 각별히 신경써서 작업했습니다. 덕분에 원서가 출간된지 채 몇 달이 지나지 않았는데 번역서를 선보일 수 있었네요. 도와주신 한빛미디어와 편집자 님에게 감사드립니다.

지금 온라인/오프라인 서점에서 판매 중입니다! [교보문고], [Yes24], [알라딘], [한빛미디어]

GPT-3.5 미세 튜닝 서비스가 론칭되었습니다.

OpenAI에서 GPT-3.5 터보 모델을 자신의 데이터로 미세 튜닝(fine-tuning)할 수 있는 서비스를 론칭했습니다. 회사에서 가지고 있는 데이터를 사용해 GPT-3.5 터보 모델을 미세 튜닝하면 특정 작업에서 GPT-4에 필적하는 성능을 낼 수 있다고 하네요. 이렇게 미세 튜닝된 모델은 OpenAI API를 사용해 사용할 수 있으므로 스케일 확장과 운영 노하우에 대해 추가로 고민할 필요가 없습니다. 미세 튜닝과 API 서비스 가격은 아래와 같습니다.

  • 훈련: $0.008 / 1K Tokens
  • 입력: $0.012 / 1K Tokens
  • 출력: $0.016 / 1K Tokens

스테이블 디퓨전 XL 1.0 릴리스

스태빌리티Stability AI에서 스테이블 디퓨전 XL(SDXL) 1.0 버전을 드디어 릴리스했습니다. SDXL 1.0은 기본적으로 1024×1024 해성도를 지원하며 고품질의 사실적인 이미지를 생성합니다. 또한 공간적인 구성을 설명하는 프롬프트를 잘 따른다고 합니다. 35억개의 파라미터를 가진 베이스 모델과 66억개의 파라미터를 가진 정제 모델refiner로 구성됩니다.

T2I와 콘트롤넷ControlNet을 사용하여 이미지를 조작할 수 있는 기능은 추후 선보인다고 합니다. 클립드롭Clipdrop에서 SDXL 1.0 버전을 사용해 볼 수 있습니다. SDXL의 가중치와 소스코드는 깃허브허깅페이스에 공개되어 있습니다!

미드저니 Zoom Out!

며칠 전 미드저니 v5.2를 릴리스하면서 Zoom Out 기능을 선보였습니다. 마치 카메라를 줌 아웃하여 스크린에 더 많은 콘텐츠를 담을 수 있는 것처럼 이 기능을 사용하면 이미지에 담길 영역을 넓혀 더 많은 디테일을 채워 줍니다. 이때 원본 이미지는 변경되지 않으면 줌 아웃하여 채워지는 내용은 원본 이미지와 텍스트 프롬프트를 바탕으로 생성됩니다.

Zoom Out 버튼은 미드저니에서 텍스트 프롬프트로 생성한 네 개의 이미지 중 하나를 업스케일 한 후 나타나며 2배, 1.5배, 커스텀 줌을 선택할 수 있습니다. 커스텀 줌은 줌 아웃하기 전에 텍스트 프롬프트를 변경할 수 있는 기회를 제공합니다.

예를 들어 “dogfighting, a lot of balloon ships, steampunk, high quality, realistic”이란 텍스트 프롬프트로 이미지를 생성한 후 2배 줌을 두 번 연속 실행하면 다음과 같은 이미지를 만들어 줍니다. 와우 놀랍네요! 🙂

스테이블 디퓨전 XL 0.9 버전 론칭

얼마전 스테이블 디퓨전 XL(Stable Diffusion XL, SDXL) 베타를 출시한 스태빌리티 AI(Stability AI)가 SDXL 0.9버전을 론칭했습니다. 블로그에 담긴 사진 중에서 아래 사진이 눈에 띄네요. 이미지 생성 분야에서 유독 손가락은 그리기 까다로운 것으로 유명하기 때문입니다.

SDXL 0.9버전은 ClipDrop에서 바로 사용해 볼 수 있어 블로그에 나와 있는 프롬프트로 테스트해 보았습니다.

블로그에 나와 있는 (체리피킹된) 이미지만큼은 아니지만 확실히 손을 조금 더 자연스럽게 표현하는 것 같습니다.

SDXL 0.9버전은 35억개 파라미터 모델과 66억개 파라미터 모델의 앙상블로 구성되었다고 합니다. 두 번째 모델이 첫 번째 모델의 출력에 디테일을 추가하는데 사용됩니다. 더 자세한 기술 사양이 곧 공개될 예정이며 7월 중순에 1.0 버전이 릴리스된다고 하니 기대가 되네요! 🙂

생성 AI와 소프트웨어 엔지니어링

최근 생성 AI는 텍스트, 코드, 이미지 등에 대해 창의적인 콘텐츠를 생성할 수 있음을 보여 주고 있습니다. 얼마전 맥킨지에서 생성 AI에 대한 보고서를 발표했습니다. 이 보고서의 내용 중 생성 AI가 미칠 산업 분야로 고객 관리, 마케팅, 세일즈, 소프트웨어 엔지니어링을 꼽았습니다.

이 보고서에 화답하려는듯 최근 만들어진 gpt-engineer 깃허브 저장소가 큰 인기를 얻고 있습니다. 이 저장소는 프롬프트를 기반으로 작은 프로젝트 규모의 소스 코드를 생성하는 것이 목표입니다. gpt-engineer는 프롬프트 기반으로 소스 코드 빌드에 필요한 내용을 사용자와 채팅으로 구체화해 가며 임무를 완수하는 것이 특징입니다.

아직 완벽한 소프트웨어를 만들 것이라 기대하긴 어렵지만 처음 프로젝트를 시작할 때 들여야할 수고를 어느정도 덜어줄 수 있을 것입니다. 이는 시작일 뿐입니다. 앞으로 무엇이 나올지 기대가 되네요.