수학으로 풀어보는 강화학습 원리와 알고리즘 또는 시경 속 동물
땅끝
2025-01-04 07:51
134
0
본문
수학으로 풀어보는 강화학습 원리와 알고리즘

도서명 : 수학으로 풀어보는 강화학습 원리와 알고리즘
저자/출판사 : 박성수, 위키북스
쪽수 : 436쪽
출판일 : 2021-09-17
ISBN : 9791158392734
정가 : 30000
▣ 01장: 강화학습 수학
1.1 확률과 랜덤 변수
___1.1.1 확률
___1.1.2 랜덤 변수
___1.1.3 누적분포함수와 확률밀도함수
___1.1.4 결합 확률함수
___1.1.5 조건부 확률함수
___1.1.6 독립 랜덤 변수
___1.1.7 랜덤 변수의 함수
___1.1.8 베이즈 정리
___1.1.9 샘플링
1.2 기댓값과 분산
___1.2.1 기댓값
___1.2.2 분산
___1.2.3 조건부 기댓값과 분산
1.3 랜덤벡터
___1.3.1 정의
___1.3.2 기댓값과 공분산 행렬
___1.3.3 샘플 평균
1.4 가우시안 분포
1.5 랜덤 시퀀스
___1.5.1 정의
___1.5.2 평균함수와 자기 상관함수
___1.5.3 마르코프 시퀀스
1.6 선형 확률 차분방정식
1.7 표기법
1.8 중요 샘플링
1.9 엔트로피
1.10 KL 발산
1.11 추정기
___1.11.1 최대사후 추정기
___1.11.2 최대빈도 추정기
1.12 벡터와 행렬의 미분
___1.12.1 벡터로 미분
___1.12.2 행렬로 미분
1.13 촐레스키 분해
1.14 경사하강법
___1.14.1 배치 경사하강법
___1.14.2 확률적 경사하강법
1.15 경사하강법의 개선
___1.15.1 모멘텀
___1.15.2 RMSprop
___1.15.3 아담
1.16 손실함수의 확률론적 해석
___1.16.1 가우시안 오차 분포
___1.16.2 베르누이 오차 분포
▣ 02장: 강화학습 개념
2.1 강화학습 개요
2.2 강화학습 프로세스와 표기법
2.3 마르코프 결정 프로세스
___2.3.1 정의
___2.3.2 가치함수
___2.3.3 벨만 방정식
___2.3.4 벨만 최적 방정식
2.4 강화학습 방법
▣ 03장: 정책 그래디언트
3.1 배경
3.2 목적함수
3.3 정책 그래디언트
3.4 REINFORCE 알고리즘
▣ 04장: A2C
4.1 배경
4.2 그래디언트의 재구성
4.3 분산을 감소시키기 위한 방법
4.4 A2C 알고리즘
4.5 A2C 알고리즘 구현
___4.5.1 테스트 환경
___4.5.2 코드 개요
___4.5.3 액터 클래스
___4.5.4 크리틱 클래스
___4.5.5 에이전트 클래스
___4.5.6 학습 결과
___4.5.7 전체 코드
▣ 05장: A3C
5.1 배경
5.2 그래디언트 계산의 문제
___5.2.1 샘플의 상관관계
___5.2.2 n-스텝 가치 추정
5.3 비동기 액터-크리틱(A3C) 알고리즘
5.4 그래디언트 병렬화 방식의 A3C 알고리즘 구현
___5.4.1 테스트 환경
___5.4.2 코드 개요
___5.4.3 액터 클래스
___5.4.4 크리틱 클래스
___5.4.5 에이전트 클래스
___5.4.6 학습 결과
___5.4.7 전체 코드
5.5 데이터 병렬화 방식의 A3C 알고리즘 구현
___5.5.1 코드 개요
___5.5.2 전체 코드
▣ 06장: PPO
6.1 배경
6.2 그래디언트의 재구성
6.3 정책 업데이트와 성능
6.4 PPO 알고리즘
6.5 어드밴티지 추정의 일반화 (GAE)
6.6 PPO 알고리즘 구현
___6.6.1 테스트 환경
___6.6.2 코드 개요
___6.6.3 액터 클래스
___6.6.4 크리틱 클래스
___6.6.5 에이전트 클래스
___6.6.6 학습 결과
___6.6.7 전체 코드
▣ 07장: DDPG
7.1 배경 240
7.2 그래디언트의 재구성
7.3 DDPG 알고리즘
7.4 DDPG 알고리즘 구현
___7.4.1 테스트 환경
___7.4.2 코드 개요
___7.4.3 액터 클래스
___7.4.4 크리틱 클래스
___7.4.5 액터-크리틱 에이전트 클래스
___7.4.6 학습 결과
___7.4.7 전체 코드
▣ 08장: SAC
8.1 배경
8.2 소프트 벨만 방정식
8.3 소프트 정책 개선
8.4 SAC 알고리즘
8.5 SAC 알고리즘 구현
___8.5.1 테스트 환경
___8.5.2 코드 개요
___8.5.3 액터 클래스
___8.5.4 크리틱 클래스
___8.5.5 에이전트 클래스
___8.5.6 학습 결과
___8.5.7 전체 코드
▣ 09장: 모델 기반 강화학습 기초
9.1 배경
9.2 최적제어
___9.2.1 LQR
___9.2.2 확률적 LQR
___9.2.3 가우시안 LQR
___9.2.4 반복적 LQR
9.3 모델 학습 방법
▣ 10장: 로컬 모델 기반 강화학습
10.1 배경
10.2 로컬 모델 피팅 기반 LQR
10.3 로컬 모델 피팅
___10.3.1 조건부 가우시안 방법
___10.3.2 GMM 사전분포를 이용한 로컬 모델 업데이트
10.4 로컬 제어 법칙 업데이트
___10.4.1 대체 비용함수 계산
___10.4.2 KL 발산 계산
___10.4.3 h 조정
___10.4.4 e 조정
10.5 가우시안 LQR을 이용한 강화학습 알고리즘
10.6 가우시안 LQR을 이용한 강화학습 알고리즘 구현
___10.6.1 테스트 환경
___10.6.2 코드 개요
___10.6.3 궤적 생성
___10.6.4 로컬 모델 피팅
___10.6.5 가우시안 LQR
___10.6.6 가우시안 혼합 모델
___10.6.7 LQR-FLM 에이전트 클래스
___10.6.8 학습 결과
___10.6.9 전체 코드
10.7 GPS로의 발전
▣ 참고문헌
시경 속 동물

도서명 : 시경 속 동물
저자/출판사 : 장샤오스, 도서출판 선
쪽수 : 664쪽
출판일 : 2021-05-10
ISBN : 9788963126029
정가 : 38000
길짐승
풍수를 지키고、 백성을 보호하는 상서롭고 어진 동물 기린 | 麒麟 016
늑대 떼쯤이야、 가뿐히 무리 지어 싸우는 짐승 승냥이 | 豺 024
인간이 피운 봉화 연기 속으로 사라진 늑대 늑대 | 狼 032
오만 가지 상념을 한 번에 날리는 포효 호랑이 | 虎 040
구태여 세상을 시끄럽게 할 필요가 있는가? 표범 | 豹 048
서리가 내리니 큰곰자리는 나무 끝에 걸리고 곰 | 熊 056
인간이 똑똑해질수록 여우는 악독해진다네 여우 | 狐 064
세상에 낭만을 더하는 그윽한 눈빛 고양이 | 猫 072
외로운 사람을 더 외롭게 만드는 동물 개 | 犬 082
투우사는 영웅이 아니다 소 | 牛 092
여성스러운 느낌을 풍기는 평평한 눈동자 새끼 양 | 羔羊 102
인간과 함께 보호동물 목록을 만드는 동물 노루 | ? 110
필요한 것은 먹을 것이 아니라 낭만 말 | 馬 116
속된 것과는 함께하지 않는다 코끼리 | 象 126
쥐는 미키마우스가 아니라 쥐다 쥐 | 鼠 134
너구리를 업신여기지 말라 너구리 | ? 142
우리 삶 속의 작은 신(神) 사슴 | 鹿 150
재능도 있고、 기여도 많이 한 당신은 오소리 같은 사람 오소리 | ? 160
돼지는 내 생각에 반대할지도 모른다 암퇘지 | ? 168
삼백 수의 시를 탄생시킨 양고기 양 | 羊 174
옛사람들의 생활을 체험해 보자 토끼 | ? 184
인간과 어울리다 보면 악당이 될 수밖에 외뿔들소 | ? 192
황산의 지게꾼은 인간 세상의 원숭이로다 원숭이 | ? 200
곤충
청산가리 같은 독성을 가졌을까? 물여우 | ? 210
아름다운 나비의 보잘것없던 전생 이야기 나비 애벌레 | ? 216
귀한 손님께 올리는 값비싼 식재료 전갈 | ? 222
무슨 낯짝으로 《시경》에 돌아오려 하는가? 여치 | ?斯 228
황제가 꿀꺽 삼킨 메뚜기 메뚜기 애벌레 | 阜? 236
평생 해충으로 살아도 귀염받는 벌레 나무굼벵이 | ?? 244
반려동물로는 탈락、 미인의 대명사로는 합격 나방 | 蛾 252
단순하고 순결한 자에게는 적이 없다 파리 | 蒼蠅 260
우연히 얻은 심오한 깨달음 귀뚜라미 | ?? 266
정말 사람보다 짧게 살까? 하루살이 | ?? 274
치통을 낫게 하는 신통한 곤충 공벌레 | 伊威 280
역사와 문화를 자랑하는 거미 갈거미 | ?? 286
닷새만 사는 삶이니 얼른 결혼해야지 반딧불이 | 宵行 294
뷰티 아이템이라고? 이제 난리 나겠네! 나나니 | ?? 302
아무리 우아한 사람이라도 튀김은 거부할 수 없다 매미 | ?? 308
간과 눈에 좋은 분비물을 만드는 벌레 누에 | 蠶 318
새
언젠가 다시 찬란히 날아오르리 봉황 | 鳳凰 330
달을 스쳐 날아가는 신비로운 새 기러기 | 雁 338
2천 년 동안 사랑을 노래한 새 저구 | 雎鳩 348
깍깍、 얼음을 깨뜨리는 울음소리 까치 | 鵲 356
삼천 년 늦은 군자의 복수 참새 | 雀 364
작년에 왔던 그 제비일까? 제비 | 燕 372
벼랑 끝에 몰린 평판 꿩 | 雉 382
사람이 많아질수록 광야가 그립다 까마귀 | 烏 390
그 조그만 새에 먹을 게 뭐 있다고 메추리 | ? 400
모두 대붕(大鵬)이 될 필요는 없다 산비둘기 | 鳩 408
아침을 여는 덕망 높은 새 닭 | 鷄 416
연못과 시를 장식하는 새 청둥오리 | 鳧 424
행운의 상징에서 불행의 아이콘으로 사다새 | ? 432
덩치 큰 소방대원 황새 | ? 440
어슴푸레한 하늘을 헤치고 날아가는 새 때까치 | ? 448
길조이자 흉조인 색맹 예언가 올빼미 | ?? 456
새와 인간、 우리의 영혼은 하늘의 것 꾀꼬리 | 倉庚 464
태금(胎禽)이라 불렸던 신선의 새 두루미 | 鶴 472
한때 형제애를 상징했던 새 원앙 | 鴛鴦 480
세상에서 가장 불행한 새 매 | 鷹 490
한가로이 함께 시간을 보내고 싶은 새 갈매기 | ? 500
거대한 우주 속 작은 존재 백로 | 鷺 508
미천한들 어떠하리? 행복하기만 한걸! 뱁새 | 桃蟲 518
차갑게 돌아선 사람 마음이 새랑 무슨 상관인가? 할미새 | ?? 526
자바섬의 참새가 당 태종 아들이 되기까지 콩새 | 桑扈 534
물고기와 여러 동물
시를 읽다 보니 군침이 도네 모래무지 | ? 544
물고기 꼬리질에 무너진 왕실 모샘치| ? 550
아들 이름을 잉어라 지은 공자님 잉어| 鯉 558
넘치는 물에 빠져 익사한 물고기 가물치| ? 566
몸에 좋다는 말은 하지 말지 줄철갑상어| ? 574
반찬으로도 좋지만、 술안주로는 더 좋은 물고기 피라미| ? 582
초보 엄마에게 안성맞춤인 보양식 메기| ? 590
새롭게 재평가 된 물고기 자가사리| ? 598
도마뱀이 아닌 진짜 뱀 살무사| ? 604
사족(蛇足)을 달아야 하는 이유 도마뱀| ? 612
선사시대의 흔적 악어| ? 620
법사님을 모시고 강을 건넌 동물 자라| 鱉 628
인간과 신 사이의 매개자 거북이| 龜 636
백조와 함께 하늘 높이 날아간 두꺼비 두꺼비| 戚施 646
여름밤을 환히 빛내주는 조개 조개| 貝 654
댓글목록0