데이터 엔지니어링
데이터 엔지니어링과 관련된 기술 스택, 프로젝트 내용을 정리한 페이지입니다! 피드백은 언제든지 환영입니다!

-
[PostgreSQL] 안쓰는 노트북으로 데이터베이스 서버 만들기! TODO ListLVM포트포워딩방화벽설정Postgresql 설정 파일 수정 (postgresql.conf, pg_hba.conf)이전 포스팅에서는 AWS에서 클라우드 서버로 Postgresql 서버를 만들고, 크롤러와 연동하는 내용을 다뤘었다.하지만 프리티어, 즉 무료로 사용할 수 있는 데이터베이스 용량은 매우 매우 매우 부족하다.뭐 간단한 유저 정보 관리 용으로 만든 데이터베이스라면 가능하겠다만,필자는 매일 항공권 데이터를 수집하기 때문에 이정도의 용량으로는 터무니 없이 부족했다. (기억상 20기가정도가 max였던거로 기억함)그래서 지금은 클라우드에서 VPC, 방화벽 설정해본 경험을 토대로, 직접 홈서버를 구현해 약 2테라 정도까지 사..
[PostgreSQL] 안쓰는 노트북으로 데이터베이스 서버 만들기![PostgreSQL] 안쓰는 노트북으로 데이터베이스 서버 만들기! TODO ListLVM포트포워딩방화벽설정Postgresql 설정 파일 수정 (postgresql.conf, pg_hba.conf)이전 포스팅에서는 AWS에서 클라우드 서버로 Postgresql 서버를 만들고, 크롤러와 연동하는 내용을 다뤘었다.하지만 프리티어, 즉 무료로 사용할 수 있는 데이터베이스 용량은 매우 매우 매우 부족하다.뭐 간단한 유저 정보 관리 용으로 만든 데이터베이스라면 가능하겠다만,필자는 매일 항공권 데이터를 수집하기 때문에 이정도의 용량으로는 터무니 없이 부족했다. (기억상 20기가정도가 max였던거로 기억함)그래서 지금은 클라우드에서 VPC, 방화벽 설정해본 경험을 토대로, 직접 홈서버를 구현해 약 2테라 정도까지 사..
2025.03.26 -
TODO LISTEC2 가상 머신 생성RDS와 보안 그룹 공유 설정크롤러 배포1. EC2 가상 머신 생성→ 내 컴퓨터 (가상머신) 이름 (별명) 내 컴퓨터에서 사용할 os (운영체제)다양한 os를 선택할 수 있지만, 가상 머신(서버)에서 주로 사용되는 운영체제는 ubuntu(리눅스)임오픈 소스 → 오류 및 예외 상황에 대한 커뮤니티 활성화 (높음)터미널 기반 조작에 매우 친화적 (CLI)이미지는 os의 버전을 선택할 수 있음 (가장 최신 버전보다는 바로 이전 버전을 선호 → 최신버전은 아직 버그에 대한 내용이 밝혀지지 않은 경우가 많음)아키텍처는 프로세서 종류 x86, ARM 프로세서 ⇒ 이건 자신의 개발 상황에 맞춰서 진행하는걸 추천 (프로세서 및 os 불일치로 인해 내 노트북에서는 돌아가던게 가상머신..
[AWS EC2] 가상 머신 인스턴스 생성 (외부 IP, 내부 IP 설정)TODO LISTEC2 가상 머신 생성RDS와 보안 그룹 공유 설정크롤러 배포1. EC2 가상 머신 생성→ 내 컴퓨터 (가상머신) 이름 (별명) 내 컴퓨터에서 사용할 os (운영체제)다양한 os를 선택할 수 있지만, 가상 머신(서버)에서 주로 사용되는 운영체제는 ubuntu(리눅스)임오픈 소스 → 오류 및 예외 상황에 대한 커뮤니티 활성화 (높음)터미널 기반 조작에 매우 친화적 (CLI)이미지는 os의 버전을 선택할 수 있음 (가장 최신 버전보다는 바로 이전 버전을 선호 → 최신버전은 아직 버그에 대한 내용이 밝혀지지 않은 경우가 많음)아키텍처는 프로세서 종류 x86, ARM 프로세서 ⇒ 이건 자신의 개발 상황에 맞춰서 진행하는걸 추천 (프로세서 및 os 불일치로 인해 내 노트북에서는 돌아가던게 가상머신..
2025.02.18 -
TODO LIST아마존 클라우드 서비스 가입아마존 RDS 인스턴스 생성로컬 크롤러 연동1. 아마존 클라우드 프리티어 가입링크 : https://aws.amazon.com/ko/free 무료 클라우드 컴퓨팅 서비스 - AWS 프리 티어이러한 프리 티어 혜택은 AWS 신규 고객에게만 제공되며 AWS 가입일로부터 12개월 동안 유효합니다. 12개월의 무료 사용 기간이 만료되거나 애플리케이션 사용량이 프리 티어 범위를 초과할 경우aws.amazon.com 회원 가입 절차는 설명 생략! (이메일, 카드 등록, 주소... 착실히 입력하면 된다!) 회원 가입 완료!2. RDS 인스턴스 생성콘솔 홈 접속 : https://ap-northeast-2.console.aws.amazon.com/console/home h..
[AWS RDS] 서버 DB 인스턴스 생성 및 로컬 크롤러 연동TODO LIST아마존 클라우드 서비스 가입아마존 RDS 인스턴스 생성로컬 크롤러 연동1. 아마존 클라우드 프리티어 가입링크 : https://aws.amazon.com/ko/free 무료 클라우드 컴퓨팅 서비스 - AWS 프리 티어이러한 프리 티어 혜택은 AWS 신규 고객에게만 제공되며 AWS 가입일로부터 12개월 동안 유효합니다. 12개월의 무료 사용 기간이 만료되거나 애플리케이션 사용량이 프리 티어 범위를 초과할 경우aws.amazon.com 회원 가입 절차는 설명 생략! (이메일, 카드 등록, 주소... 착실히 입력하면 된다!) 회원 가입 완료!2. RDS 인스턴스 생성콘솔 홈 접속 : https://ap-northeast-2.console.aws.amazon.com/console/home h..
2025.02.17 -
TODO LIST학교 이메일로 Tableau 무료 설치로컬 DB 연동대시보드 구현1. Tableau Desktop 설치설치 링크 : https://www.tableau.com/ko-kr/academic/students 학생용 Tableau끊임없이 변화하는 AI와 기술의 세계에서 새로운 도구를 습득하는 일이 엄청난 부담감으로 작용할 수 있다는 점을 잘 알고 있습니다. 바로 시작해 Tableau 역량을 쌓고 커뮤니티에 대해 알아보려www.tableau.com 2. 자기가 선택한 DB 서버에 연결그 전에 DB 연결시에 필요한 드라이버 설치가 필요함(mac os 기준)드라이버 설치 경로 : https://www.tableau.com/ko-kr/support/drivers?edition=pro&lang=ko-kr..
[Tableau]Tableau Desktop 설치 및 대시보드 구현TODO LIST학교 이메일로 Tableau 무료 설치로컬 DB 연동대시보드 구현1. Tableau Desktop 설치설치 링크 : https://www.tableau.com/ko-kr/academic/students 학생용 Tableau끊임없이 변화하는 AI와 기술의 세계에서 새로운 도구를 습득하는 일이 엄청난 부담감으로 작용할 수 있다는 점을 잘 알고 있습니다. 바로 시작해 Tableau 역량을 쌓고 커뮤니티에 대해 알아보려www.tableau.com 2. 자기가 선택한 DB 서버에 연결그 전에 DB 연결시에 필요한 드라이버 설치가 필요함(mac os 기준)드라이버 설치 경로 : https://www.tableau.com/ko-kr/support/drivers?edition=pro&lang=ko-kr..
2025.02.17 -
TODO LIST데이터 베이스 툴 선택PostgreSQL 설치데이터 베이스 설정 (데이터 베이스, 테이블, 유저 생성)크롤러와 DB 연동1. 데이터 베이스 툴 선택ORACLE, MySQL, PostgreSQL 등 다양한 데이터 베이스가 존재하고, 저마다의 장단점 또한 존재함. 따라서, 가장 좋은 데이터베이스는 없음. 상황에 따라 다름. 필자는 PostgreSQL이 익숙하고 GUI도 편해서 선택함. (표준 SQL 쿼리를 따르기 때문도 있음)특히 DB 점유율 1위임 (아닐수도)2. 로컬 PostgreSQL 설치 (mac 기준)설치 사이트 접속 후 자신의 운영체제에 맞는 버전을 설치 (필자는 macOS 사용중)(https://www.postgresql.org/download/) 오픈 소스인 경우 최신 버전..
[Postgres, Crawler] part 1. 로컬 DB 생성 및 크롤러 연동TODO LIST데이터 베이스 툴 선택PostgreSQL 설치데이터 베이스 설정 (데이터 베이스, 테이블, 유저 생성)크롤러와 DB 연동1. 데이터 베이스 툴 선택ORACLE, MySQL, PostgreSQL 등 다양한 데이터 베이스가 존재하고, 저마다의 장단점 또한 존재함. 따라서, 가장 좋은 데이터베이스는 없음. 상황에 따라 다름. 필자는 PostgreSQL이 익숙하고 GUI도 편해서 선택함. (표준 SQL 쿼리를 따르기 때문도 있음)특히 DB 점유율 1위임 (아닐수도)2. 로컬 PostgreSQL 설치 (mac 기준)설치 사이트 접속 후 자신의 운영체제에 맞는 버전을 설치 (필자는 macOS 사용중)(https://www.postgresql.org/download/) 오픈 소스인 경우 최신 버전..
2025.02.17 -
내가 데이터 분석 -> AI 개발자 -> 데이터엔지니어, PM으로 커리어 방향성을 수정하는데에 가장 큰 영향을 줬던 프로젝트이다. 학부 2학년에 수강했던 웹파이썬 프로그래밍에서 쿠팡 웹사이트를 켜놓고 엑셀에 하나하나 제품명, 구매수, 등의 데이터를 손수 입력하고 판다스로 간단하게 시각화하는 텀프로젝트를 시작으로,HCI 연구실에서 학부연구생 생활을 하며 작성했던 학부생 논문 장려상,경기도 자율주행센터 데이터 활용 경진대회 금상,소프트웨어중심대학 SW 페스티벌 우수상까지 나름 이것 저것 많이 도전했고, 운이 좋게도 거의 모든 도전에서 좋은 결과가 있었다. 문제라면, 너무 이것 저것이었다? 정도...과거 데이터 분석 직무 면접시에 "AI 관련 경험이 많은데 데이터 분석 직무도 괜찮나?"라는 질문을 들었다.그때..
[Tableau, AWS] 클라우드 활용 대시보드 제작 스터디 운영 회고록내가 데이터 분석 -> AI 개발자 -> 데이터엔지니어, PM으로 커리어 방향성을 수정하는데에 가장 큰 영향을 줬던 프로젝트이다. 학부 2학년에 수강했던 웹파이썬 프로그래밍에서 쿠팡 웹사이트를 켜놓고 엑셀에 하나하나 제품명, 구매수, 등의 데이터를 손수 입력하고 판다스로 간단하게 시각화하는 텀프로젝트를 시작으로,HCI 연구실에서 학부연구생 생활을 하며 작성했던 학부생 논문 장려상,경기도 자율주행센터 데이터 활용 경진대회 금상,소프트웨어중심대학 SW 페스티벌 우수상까지 나름 이것 저것 많이 도전했고, 운이 좋게도 거의 모든 도전에서 좋은 결과가 있었다. 문제라면, 너무 이것 저것이었다? 정도...과거 데이터 분석 직무 면접시에 "AI 관련 경험이 많은데 데이터 분석 직무도 괜찮나?"라는 질문을 들었다.그때..
2025.02.17