한국에 왜 시집 왔나 또는 데이터 파이프라인 핵심 가이드 > NEW도서

본문 바로가기

NEW도서

한국에 왜 시집 왔나 또는 데이터 파이프라인 핵심 가이드

땅끝
2024-12-25 10:41 125 0

본문




한국에 왜 시집 왔나
9788931816365.jpg


도서명 : 한국에 왜 시집 왔나
저자/출판사 : 김트루디, 나침반
쪽수 : 176쪽
출판일 : 2022-02-25
ISBN : 9788931816365
정가 : 10000

머리말
출간을 기뻐하며
시작하면서

제1장 미스 트루디

잊을 수 없는 나의 어린 시절
정겨운 나의 고향, 레이크뷰(Lakeview)
하나님, 당신은 누구신가요?
어머니, 천국에 먼저 가 계세요
영적 리더십을 키워준 밥 존스(Bob Jones) 학교
거부할 수 없는 데이트 원칙
키 작은 동양인 남학생 빌리
‘김장환’은 어려워
거절당한 첫 번째 프러포즈
빌리의 신부가 되다

제2장 아내 트루디

빌리의 결심, 나의 결심
멀고도 낯선 땅 한국
한국에서의 며느리 수업
미국인 며느리의 한국 음식 적응기
한국 살림이란 이런 것
혼자서 도둑과 맞닥뜨리다
빌리가 병원에 입원한 사연

제3장 선교사 트루디

24살 때 다시 중학생이 되다
청와대 경호원의 믿음

제4장 사모 트루디

침례교세계연맹 총회장의 사모
사모라는 감투 대신 섬김의 기쁨을
남편에게 용돈을 타서 쓴 나

제5장 엄마 트루디

삼 남매의 유학 이야기
남편을 닮은 요셉
집은 엄마가 있는 곳
내가 꾸미는 나만의 스위트 홈
진짜 트루디를 아시나요?

제6장 교육자 트루디

기독교 교육의 원칙
장애 아이들도 하나님의 자녀
통합교육의 중요성

제7장 파이샵 트루디

교인들을 위한 쉼터를 만들다
사모님에게 배웠어요

돌이켜보면 갈라디아서 2장 20절




데이터 파이프라인 핵심 가이드
9791158393045.jpg


도서명 : 데이터 파이프라인 핵심 가이드
저자/출판사 : 제임스 댄스모어, 위키북스
쪽수 : 236쪽
출판일 : 2022-02-18
ISBN : 9791158393045
정가 : 20000

▣ 01장: 데이터 파이프라인 소개
데이터 파이프라인이란?
누가 파이프라인을 구축할까?
___SQL과 데이터 웨어하우징 기초
___파이썬 그리고/또는 자바
___분산 컴퓨팅
___기본 시스템 관리
___목표 지향적 사고방식
왜 데이터 파이프라인을 구축할까?
어떻게 데이터 파이프라인을 구축할까?

▣ 02장: 최신 데이터 인프라
데이터 소스의 다양성
___소스 시스템 소유권
___수집 인터페이스 및 데이터 구조
___데이터 사이즈
___데이터 클렌징 작업과 유효성 검사
___소스 시스템의 지연 시간 및 대역폭
클라우드 데이터 웨어하우스 및 데이터 레이크
데이터 수집 도구
데이터 변환 및 모델링 도구
워크플로 오케스트레이션 플랫폼
___방향성 비순환 그래프
데이터 인프라 커스터마이징

▣ 03장: 일반적인 데이터 파이프라인 패턴
ETL과 ELT
ETL을 넘어선 ELT의 등장
EtLT 하위 패턴
데이터 분석을 위한 ELT
데이터 과학을 위한 ELT
데이터 제품 및 머신러닝을 위한 ELT
___머신러닝 파이프라인의 단계
___파이프라인에 피드백 통합
___ML 파이프라인에 대한 추가 자료

▣ 04장: 데이터 수집: 데이터 추출
파이썬 환경 설정
클라우드 파일 스토리지 설정
MySQL 데이터베이스에서 데이터 추출
___전체 또는 증분 MySQL 테이블 추출
___MySQL 데이터의 이진 로그 복제
PostgreSQL 데이터베이스에서 데이터 추출
___전체 또는 증분 Postgres 테이블 추출
___Write-Ahead 로그를 사용한 데이터 복제
MongoDB에서 데이터 추출
REST API에서 데이터 추출
카프카 및 Debezium을 통한 스트리밍 데이터 수집

▣ 05장: 데이터 수집: 데이터 로드
Amazon Redshift 웨어하우스를 대상으로 구성
Redshift 웨어하우스에 데이터 로드
___증분 및 전체 로드
___CDC 로그에서 추출한 데이터 로드
Snowflake 웨어하우스를 대상으로 구성3
Snowflake 데이터 웨어하우스에 데이터 로드
파일 스토리지를 데이터 레이크로 사용
오픈 소스 프레임워크
상업적 대안

▣ 06장: 데이터 변환하기
비문맥적 변환
___테이블에서 레코드 중복 제거
___URL 파싱
언제 변환할 것인가, 수집 중 혹은 수집 후?
데이터 모델링 기초
___주요 데이터 모델링 용어
___완전히 새로 고침 된 데이터 모델링
___완전히 새로 고침 된 데이터의 차원을 천천히 변경
___증분 수집된 데이터 모델링
___추가 전용(Append-only) 데이터 모델링
___변경 캡처 데이터 모델링

▣ 07장: 파이프라인 오케스트레이션
___방향성 비순환 그래프
아파치 에어플로우 설정 및 개요
___설치 및 구성
___에어플로우 데이터베이스
___웹 서버 및 UI
___스케줄러
___실행기(Executors)
___연산자(Operators)
에어플로우 DAG 구축
___간단한 DAG
___ELT 파이프라인 DAG
추가 파이프라인 작업
___경고 및 알림
___데이터 유효성 검사
고급 오케스트레이션 구성
___결합된 파이프라인 작업 대 결합되지 않은 파이프라인 작업
___DAG를 분할해야 하는 경우
___센서로 여러 DAG 조정
관리형 에어플로우 옵션
기타 오케스트레이션 프레임워크
일찍 그리고 자주 검증할 것

▣ 08장: 파이프라인의 데이터 검증
___소스 시스템 데이터 품질
___데이터 수집 위험
___데이터 분석가 검증 활성화
간단한 검증 프레임워크
___유효성 검사기 프레임워크 코드
___검증 테스트의 구조
___검증 테스트 실행
___에어플로우 DAG에서의 사용
___파이프라인을 중단해야 할 때와 경고하고 계속해야 할 때
___프레임워크의 확장
검증 테스트 예제
___수집 후 중복된 레코드
___수집 후의 예기치 않은 행 개수
___지표 값 변동
상용 및 오픈 소스 데이터 검증 프레임워크
소스 시스템의 변경 사항 처리

▣ 09장: 파이프라인 유지 관리 모범 사례
___추상화 도입
___데이터 계약 유지 관리
___Schema-on-Read의 고려사항
확장 복잡성
___데이터 수집 표준화
___데이터 모델링 로직의 재사용
___종속성 무결성 보장
중요 파이프라인 지표

▣ 10장: 파이프라인 성능 측정 및 모니터링
데이터 웨어하우스 준비
___데이터 인프라 스키마
성능 데이터 로깅 및 수집
___에어플로우에서 DAG 실행 기록 수집
___데이터 유효성 검사기에 로깅 추가
성능 데이터 변환
___DAG 성공률
___시간 경과에 따른 DAG 런타임 변경
___검증 테스트 볼륨 및 성공률
성능 파이프라인 조정
___DAG의 성능
성능 투명성

댓글목록0

등록된 댓글이 없습니다.
게시판 전체검색