Python14 Day 09 Day 09 기술통계값을 한 번에 생성해주는 EDA 도구 EDA 파일을 생성해주는 도구가 많지만 문서를 보고 어떤 식으로 내 데이터에 적용해야 하는지 해결해야 한다 Pandas Profiling 관찰할 수 있는 기본 기술통계: number of variables(변수의 개수), number of observations(관측값), missing cells(결측치 개수), missing cells %(결측치 비율), duplicate rows(중복행), duplicate rows %(중복행 비율), total size in memory(총 메모리 사용량), average record size in memory(평균 메모리 사용량) --> 전체 데이터셋 정보를 확인할 수 있게 된다. 수치형(numerical).. 2022. 9. 27. Day 06 Day06 github issues 제기된 이슈 확인 가능 pull requests 레포지토리에 있는 브랜치에 푸시한 내역, 변경 사항 등을 다른 사람들에게 알리는 것 https://github.com/pandas-dev/pandas/pulls Pandas 기초(이어서) 데이터 가져오기 df["약품명"] #컬럼명으로 데이터 가져오기 df[["약품명","가격"]] #2개 이상의 컬럼명 가져오기 df.loc[0] #행을 기준으로 데이터 가져오기 df.loc[[0,1,2]] #위에서 3개 행 데이터 가져오기 약품명을 인덱스로 설정하고 가져오기 df.set_index("약품명") #설정 df.set_index("약품명").loc["소화제"] #가져오기 설정한 인덱스 삭제하기 df = df.reset_index(.. 2022. 9. 22. Day 05 Day 05 PEP8 컨벤션 들여쓰기 4공간 라인 당 최대 79자 연산자 전에 줄 바꿈 함수끼리 2줄 공백 UTF-8 인코딩 파이린트: 오류, 버그 등을 찾아 표준을 적용시켜주는 도구 f문자열 포맷팅 for page_no in range(10,0,-1): print(f"https://naver.com/?page={page_no}") for문에서 .items() 아이템 값으로 순회 enumerate() == range(len(a)) 인덱스 번호와 값을 함께 가져온다 형식 문자열 %.d 정수로 %.s 문자열로 %.c 문자 1개 parameter(매개변수) args(전달인자 == 인수, *별한개) kargs(키워드인자, **별2개) .replace(찾을값, 바꿀값, 바꿀횟수) #문자열변경 ex) replace.. 2022. 9. 21. Day 04 Day04 파이썬 개요 EDA(Exploratory Data Analysis) 탐색적 데이터 분석: 데이터를 다양한 각도에서 관찰하고 이해하는 모든 과정초기 분석단계에서 사용되며 데이터의 탐색과 이해가 기본 ETL: 내외부에서 다수의 데이터를 추출하고 필요에 맞게 변환 후 저장하는 절차. 데이터 웨어하우스 구축 ELT: 최근 방식. 데이터 레이크를 더 많이 구축. 일단 데이터를 적재하고 필요한 데이터를 추출해서 분석 데이터 허브 파이썬/딥러닝 관련 도서 import this Now is better than never. bool True == 1 False == 0 True == '1' #False 1 == '1' #False 숫자 type(1) #int type(1.0) #float 사칙연산 + - *.. 2022. 9. 20. Day 01~03 Day01 import random random.choice() random.sample(range(1,101), 6) for문 for i in range(n) for food in foods for x,y in information.items() Dictionary {'key' : 'value'} information.get("이름") information["취미"] = "음악감상" key와 value 추가 혹은 변경 del information["취미"] information.clear() 내용 전체 삭제 List [ ] foods[0] foods[-1] while문 while True break continue ctrl + C 무한루프 탈출 set() 집합 출력시마다 원소들의 순서가 달라진다 set.. 2022. 9. 19. 이전 1 2 다음