멋쟁이사자처럼1 Day 20~23 Day 20~23 데이터 샘플링 더 큰 데이터 세트에서 의미있는 정보를 찾아내기 위해 모든 데이터의 일부를 분석하는 방법구글 애널리틱스 참고 1. numpy로 샘플링 (1) 랜덤 선택 sample_no = np.random.default_rng(42).choice(raw['가입자 일련번호'].unique(), 10000) # 가입자 일련번호 고윳값 개수(=숫자 형태, 랜덤선택할 범위) 중에서 1만 개를 랜덤선택한다 # np.random.seed(42) 값을 고정하는 역할, numpy 공식 문서는 별로 추천하지 않는다 (2) 랜덤 선택한 데이터 추출 df = raw[raw['가입자 일련번호'].isin(sample_no)] # isin으로 샘플링한 가입자 일련번호 데이터만 추출.. 2024. 1. 25. 이전 1 다음