Day 05
- PEP8 컨벤션
- 들여쓰기 4공간
- 라인 당 최대 79자
- 연산자 전에 줄 바꿈
- 함수끼리 2줄 공백
- UTF-8 인코딩
- 파이린트: 오류, 버그 등을 찾아 표준을 적용시켜주는 도구
- f문자열 포맷팅
- for page_no in range(10,0,-1):
print(f"https://naver.com/?page={page_no}")
- for page_no in range(10,0,-1):
- for문에서 .items() 아이템 값으로 순회
- enumerate() == range(len(a)) 인덱스 번호와 값을 함께 가져온다
- 형식 문자열
- %.d 정수로
- %.s 문자열로
- %.c 문자 1개
parameter(매개변수)
args(전달인자 == 인수, *별한개)
kargs(키워드인자, **별2개)
.replace(찾을값, 바꿀값, 바꿀횟수) #문자열변경
ex) replace("월","")
- 암기★
- 대소문자변환 lower() upper()
- 문자열나누기, 합치기 split() join()
- 함수 도움말?, 소스코드?? -> ipynb파일에만 작동
- 판다스pandas
- import pandas as pd
import numpy as np - 데이터 프레임
- df = pd.DataFrame()
- 컬럼 추가
- df["약품명"] = ["소화제", "감기약", "비타민"]
- df["가격"] = 3500 #일률적으로 가격이 3500원인 열이 생성 #시리즈 형태
- list(df["가격"]) #리스트 형태로 변경
- df["가격"].tolist() #리스트 형태로 변경
- 컬럼값 변경
- df["가격"] = [2500, 4000, np.nan]
- 결측치 np.nan
- df값에서 값이 하나라도 바뀌면 전체 데이터 타입이 해당 데이터 타입으로 바뀜
- df["종류"] = "전문의약품" #값이 모두 전문의약품인 칼럼 생성됨
- df.drop("종류2",axis=1) #컬럼값을 기준으로 값 삭제
- axis=0 행 값을 기준으로 값을 삭제하겠다
- 삭제한 결과를 저장하고 싶으면 변수에 다시 할당해야
- 데이터 요약
- df.info() #전체 데이터 요약
- df.shape #데이터프레임 크기 출력 (행, 열)
- df.dtypes #컬럼별 데이터 타입
- df.describe() #수치 데이터의 기술통계 값
- count빈도수, mean평균, std표준편차, min최소값, 25%1사분위수, 50%중앙값, 75%3사분위수, max최대값
- df.describe(include="object") #범주형 데이터의 기술통계 값
- count빈도수, unique고유값, top최빈값, freq최빈값의 빈도수
- import pandas as pd
출처) 멋쟁이 사자처럼 AI스쿨 7기 박조은 강사님 강의자료