본문 바로가기

ML study3

epoch, batch size, iteration 초간단 설명 주말동안 열심히 놀아 버렸습니다... 하지만 오늘은 이걸 깨우쳤습니다!!! 와 이 그림 하나로 다 이해 되시지 않나요? 미쳤습니다! 오늘은 이만...... 2020. 7. 13.
핸즈온 머신러닝 유의사항!(ft. housing.csv) 53pg~100pg 저랑 같이 방학때 머신러닝해요 https://github.com/samuel0325/ML 2일차! 머신러닝 할 때 주의 사항 나쁜 알고리즘과 나쁜 데이터를 조심하자! 나쁜 데이터! 1. 훈련 데이터 많아야 한다~ 보통은 다다익선이다! 2. 대표성이 없는 편향된(biased) 데이터 전세계를 대상으로 조사하는데 한국인만 조사하면 안된다~ 3. 낮은 품질의 데이터 이상치(outlier)가 많은 것, 특성이 일부 빠져 있는 데이터 4. 관련 없는 특성 데이터의 학습 나쁜 알고리즘! 1. 과대적합 : 훈련데이터에 너무 잘 맞지만 일반성 떨어질때 과대적합 피하는 법 : 파라미터 수가 적은 모델을 선택, 훈련 데이터의 특성 수를 줄임, 모델에 제약을 가해 단순화, 훈련 데이터를 많이 모아, 훈련 데이터의 잡음을 제.. 2020. 7. 9.
핸즈온 머신러닝 개론!(예제 링크) https://github.com/samuel0325/handson-ml2 이곳에 핸즈온 머신러닝 예제가 다 있습니다! https://nbviewer.jupyter.org/github/rickiepark/handson-ml2/blob/master/index.ipynb 이곳이 정말 좋네요! 머신러닝의 공학적 정의 : 작업 T에 대한 성능을 P로 측정했을 때 경험 E로 인해 성능이 향상됐다면, 프로그램은 작업 T와 성능 측정 P에 대해 경험 E로 학습한 것이다! 데이터 마이닝 : 머신러닝 기술을 적용해서 대용량의 데이터를 분석하면 겉으로는 보이지 않던 패턴을 발견할 수 있다! 머신러닝은 언제 쓰이느냐! 1. 기존 솔루션으로는 많은 수동 조정과 규칙이 필요한 문제! 2. 전통적인 방식으로는 해결 방법이 없는 .. 2020. 7. 8.