논문 의 내용을 정리한 글입니다.논문 출처: 아카이브, Code이 논문은 Facebook Research(현 Meta AI)에서 공개한 논문이며, 저자 중 William Peebles는 OpenAI에서 Research Scientist로 일하고 있으며, 영상 생성 AI Sora의 개발을 공동으로 리드하고 있다고 한다.DiT 아키텍처에 관한 관심은 OpenAI의 Sora 공개 이후 뜨거워진 것 같으며, 최근에 공개된 이미지 생성 모델인 Stable Diffusion 3, PixArt 계열의 모델에도 적용되어 더욱 각광받고 있다고 생각한다.개괄적인 논문 요약개요이 연구는 이미지 생성을 위한 새로운 접근 방식으로 트랜스포머 기반 확산 모델을 제안한다. 기존의 U-Net 구조를 대체하는 트랜스포머 아키텍처를 사..
Dev in Seoul
학교에서 제공하는 클라우드 스토리지가 구글 드라이브 무제한 -> 5GB 제한이 생겼을 때, 학교 원드라이브 계정으로 마이그레이션을 진행했다. 원드라이브 또한 이용자 수가 많아지고, 비용 최적화를 위해서인지 5TB 제공에서 1GB 제공으로 바뀐다고 한다. 그래서 MS 365 Office Family 계정을 결제해서 사람들과 공유하기로 마음먹고 이전을 진행했다. 6명이서 2만원 가량씩 나눠서 내면, 시중에 판매되고 있는 클라우드 스토리지 서비스 중 제일 착한 가격이라고 생각한다. 결제가 진행될 때, 해외 원화결제가 이루어지므로 미리 차단을 해제해두는 것이 좋다. 해외결제이기 때문에 결제 수수료가 2000원 가량 발생한다. 하지만, 토스 카드로 결제할 경우 해외수수료보다 더 많은 캐시백이 있어서, 이 부분은 ..
최근 회사에서 허깅페이스 디퓨저를 많이 활용하고 있습니다. 허깅페이스의 디퓨저란 스테이블 디퓨전을 webui로 사용하지 않고, 파이프라인 형식으로 조립할 수 있는 오픈소스 라이브러리인데요. sdxl, sd1.5, sd2.1, sdxl-turbo 등의 새로운 기술을 손쉽게 코드 몇 줄로 사용할 수 있게 해주는 아주 편리한 툴(개발자 기준) 입니다. 로컬 우분투 데스크탑에서, 도커 컴포즈를 통하여, 컨테이너 환경내에, CUDA를 이용하는 이미지를 실행하려는게 목표였습니다. 우분투 포맷 및 재설치 우분투 20.04 버전을 쓰던 컴퓨터를 우분투 22.04 버전으로 업데이트하기로 결정하고, 맥북에서 우분투 설치용 USB 이미지를 만들었습니다. Mac의 디스크 유틸리티를 통해 USB를 포맷한다.(MS DOS, FA..
리액트 네이티브 채팅방 구현하기 요즘 리액트 네이티브를 활용해서 채팅 기능을 구현하고 있다. 그 중에서도 Android와는 달리 iOS에서 키보드가 입력창을 가리는 현상 때문에 고생이 많았다. 그 문제를 해결하던 과정을 기록하였다. KeyboardAvoidingView 이 이슈에 대해 검색을 해보면 먼저 이 KeyboardAvoidingView가 가장 먼저 결과로 나올 것이다. 그래서 처음에는 이 View를 활용해서 구현했다. 하지만, 문제점이 있었다. 입력창은 키보드 위로 잘 밀려올라가지만, 채팅 내용은 그대로 있다는 점이다. 다시 원래 보고 있던 채팅을 보려면 스크롤을 다시 해야한다는 단점이 느껴져서 해결하고자 노력했다. 링크 import React from 'react'; import { Keybo..
Chapter 10: FastAPI 프로젝트 배포하기 이 단원에서는 FastAPI 프로젝트를 배포하는 Best Practice에 대해 배운다. 먼저 환경 변수를 사용해서 configuration을 진행하고, dependency들을 pip로 잘 관리될 수 있게 한다. 그 후 세 가지 방법으로 배포를 진행해 본다. 서버리스 클라우드 플랫폼 이용해서 배포 도커 컨테이너를 이용한 배포 리눅스 서버를 이용한 배포 또 다른 주제들은 아래와 같다 환경변수를 설정하고 사용하는 방법 파이썬 종속성 관리하기 환경변수를 설정하고 사용하기 배포에 대한 방법을 배우기 전에, 먼저 우리가 구현한 앱을 신뢰할 수 있고, 빠르고, 안전하게 배포할 수 있도록 만들어야 한다. 그 과정에 있어서 핵심적인 것이 configuration 관..
Chapter 9: API를 비동기적으로 테스트하기(with pytest, HTTPX) 실전 프로젝트를 시작하기 전 마지막 단원으로 테스트에 대해서 배워보자. 유닛 테스트 작성은 고품질의 소프트웨어 제작에 필수적인 요소이다. 파이썬에서는 기본적으로 unittest라는 모듈을 제공한다. 하지만 많은 파이썬 개발자들은 더욱 가벼운 문법을 제공하기도 하고 advanced use case를 위한 강력한 툴들을 제공하기 때문에 pytest를 더 선호한다. pytest를 이용한 unit test unittest를 이용하는 경우 import unittest from chapter9.chapter9_introduction import add class TestChapter9Introduction(unittest.Tes..
Chapter 8: 양방향 통신을 위한 웹소켓 in FastAPI | “Building Data Science Applications with FastAPI”의 챕터 8을 공부하며 정리한 내용입니다. HyperText Transfer Protocol (HTTP)는 서버에 데이터를 보내고 받기에 간편하지만 강력한 기술이다. 하지만 채팅과 같은 양방향 소통이 중요한 경우 HTTP로 구현한다면 상당히 불편함이 따른다. 짧은 시간 내에 많은 요청과 응답을 만들어야 하기에, 자원 낭비가 심할 것이다. 이러한 HTTP 단점 때문에 새로운 프로토콜 웹소켓(WebSocket)이 인기를 끌고 있다. 이 프로토콜의 목표는 client와 server 사이에 communication channel을 열어서 그들이 실시간으로 ..
Chapter 7: FastAPI에서의 인증과 보안 “Building Data Science Applications with FastAPI”의 챕터 7을 공부하며 정리한 내용입니다. API에는 모든 이가 접근할 수 있는 Public API도 있지만, 인증된 사용자들만 접근 가능한 API가 대부분이다. 따라서 private token으로 접근성을 낮추거나, 적절한 인증 시스템을 구축해야 한다. 이 챕터에서는 FastAPI가 제공하는 보안과 관련된 의존성에 대해 다룬다. 또한 웹 브라우저에서 발생하는 CORS와 CSRF 공격에 대해서도 다룬다. 세부적인 내용들은 아래와 같다. Security dependencies in FastAPI Retrieving a user and generating an acces..