[Pandas] Part 4. Duplicate, SettingWithCopyWarnings, Display options, Apply fuction, MultiIndex
26. Find and Remove Duplicate Rows user_cols = ['user_id', 'age', 'gender', 'occupation', 'zip_code'] users = pd.read_table('http://bit.ly/movieusers', sep='|', header=None, names=user_cols, index_col='user_id') users.shape users.zip_code.duplicated() # 이전 열에 같은 값이 있으면 False users.zip_code.duplicated().sum() # zip_code가 같은 148개의 dup..
2019. 10. 12.
[Pandas] Part 1. DataFrame, Series, Rename, Remove, Sort, Filter
1. Data Analysis Using a pandas library in python language 2. Pandas data_table = read_table('파일명') tsv, csv. 등등 다양한 파일을 불러올 수 있음. read_table안의 추가 인수를 소개합니다. 추가 인수 내용 sep='|' |기준으로 데이터를 나눈다, seperate header=None 데이터 양식에 헤더가 없을 때, 맨 첫번째 행이 헤더가 되는 것을 막는다. name=user_cols 각 열(column)의 이름을 리스트로 구성해 대입시키면, 헤더 이름을 만들 수 있다. skiprows=None, skipfooter=None 데이터 안에 note같은 것이 들어있을 때, skip할수 있..
2019. 10. 12.