scikit-learn2 [Pandas] Part 3. Dataframe smaller and faster, Dummy, Dates and times, 21. Make Dataframe smaller, faster object 타입 대신, category 타입 사용은 메모리 usage를 효율적으로 활용할 수 있게할 뿐만 아니라 시간도 빨라질 수 있습니다. string(object)을 탐색하는 것보다, integer(category)탐색이 시간이 빠르기 때문입니다. drinks.info() # + 의미: object가 무엇을 참조하느냐에 따라 9.2KB를 초과할 수 있다. >> RangeIndex: 193 entries, 0 to 192 Data columns (total 6 columns): country 193 non-null object beer_servings 193 non-null int64 spirit_servings 193 non-null i.. 2019. 10. 12. [Tutorial] scikit-learn과 pandas사용해서 kaggle submission 파일 만들기 pandas, scikit-learn 을 이용해 캐글 과제물 submission.csv 을 제작해보겠습니다. 데이터셋은 다음과 같습니다. import pandas as pd train = pd.read_csv('http://bit.ly/kaggletrain') train.head() FIELD1 PassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked 0 1 0 3 Braund, Mr. Owen Harris male 22.0 1 0 A/5 21171 7.25 S 1 2 1 1 Cumings, Mrs. John Bradley (Florence Briggs Thayer) female 38.0 1 0 PC 17.. 2019. 10. 11. 728x90 이전 1 다음