본문 바로가기

전체 글82

support와 confidence(지지도와 신뢰도) 지지도 support : and 로 일어날 확률 : 우유와 빵을 동시에 사는 사람이 우리 매장 전체 고객 중 25%야! buy(milk & bread) / total customer = 0.25 신뢰도 confidence : 조건부 확률 : 빵을 산 고객 중 우유를 산 고객은 50%야! P(milk & bread) / P(bread) OLAP : 온라인 분석 처리(Online Analytical Processing, OLAP)는 의사결정 지원 시스템 가운데 대표적인 예로, 사용자가 동일한 데이터를 여러 기준을 이용하는 다양한 방식으로 바라보면서 다차원 데이터 분석을 할 수 있도록 도와준다. 2020. 9. 24.
메타 데이터 메타 데이터란 정보들을 위한 정보를 의미한다 ex) 책의 목차 및 요약(책의 내용을 정리하여 서술하고 있다) 목차에서 말한 내용이 특정 페이지에 자세히 나와있다. 각종 카탈로그(각 종 제품에 관련한 정보를 담고 있다) 2020. 9. 23.
epoch, batch size, iteration 초간단 설명 주말동안 열심히 놀아 버렸습니다... 하지만 오늘은 이걸 깨우쳤습니다!!! 와 이 그림 하나로 다 이해 되시지 않나요? 미쳤습니다! 오늘은 이만...... 2020. 7. 13.
핸즈온 머신러닝 유의사항!(ft. housing.csv) 53pg~100pg 저랑 같이 방학때 머신러닝해요 https://github.com/samuel0325/ML 2일차! 머신러닝 할 때 주의 사항 나쁜 알고리즘과 나쁜 데이터를 조심하자! 나쁜 데이터! 1. 훈련 데이터 많아야 한다~ 보통은 다다익선이다! 2. 대표성이 없는 편향된(biased) 데이터 전세계를 대상으로 조사하는데 한국인만 조사하면 안된다~ 3. 낮은 품질의 데이터 이상치(outlier)가 많은 것, 특성이 일부 빠져 있는 데이터 4. 관련 없는 특성 데이터의 학습 나쁜 알고리즘! 1. 과대적합 : 훈련데이터에 너무 잘 맞지만 일반성 떨어질때 과대적합 피하는 법 : 파라미터 수가 적은 모델을 선택, 훈련 데이터의 특성 수를 줄임, 모델에 제약을 가해 단순화, 훈련 데이터를 많이 모아, 훈련 데이터의 잡음을 제.. 2020. 7. 9.