pandas dataframe 예제

예를 들어 위의 예에서 아래 목록에서 DataFrame을 만드는 경우 두 행이 동일한 레이블 0을 포함하기 때문에 두 행이 삭제되었습니다. 이제 예제를 통해 열 선택, 추가 및 삭제를 이해합시다. 예를 들어, 팬더 DataFrame에 잘 맞는 다음 데이터 집합: pivot_table 메서드에 전달 되는 추가 인수 aggfunc 참고. 이 인수는 여러 값을 결합하는 데 사용되는 집계 함수를 사용했음을 나타냅니다. 이 예제에서는 평균 함수가 사용되는 지 명확하게 확인할 수 있습니다. 다음으로 위의 DataCamp 라이트 청크에서 데이터의 작은 선택을 인쇄한 것을 볼 수 있습니다. 이는 2D NumPy 배열을 하위설정하는 것과 동일하게 작동합니다. 지수는 0에서 시작한다는 것을 잊지 마세요! 위의 예제의 데이터에 대 한 인덱스 1에서 끝까지 행을 보고 인덱스 1 다음에 오는 모든 요소를 선택 합니다. 결과적으로 1, 2, 3 및 4를 선택하게 됩니다. 열 또는 여러 열을 삭제하려면 열의 이름을 사용하고 “축”을 1로 지정합니다. 또는 아래 예제에서와 같이 `축`에 대한 필요성을 줄이는 팬더에 `열` 매개 변수가 추가되었습니다.

드롭 함수는 열을 제거한 새 DataFrame을 반환합니다. 실제로 원래 DataFrame을 편집하려면 “인플레이스” 매개 변수를 True로 설정할 수 있으며 반환된 값이 없습니다. 팬더는 넓은 데이터 프레임에 대해 기본적으로 20개의 열만 표시하고 중간 섹션을 잘린 60개 정도의 행만 표시합니다. 이러한 제한을 변경하려는 경우 팬더 디스플레이에 대한 몇 가지 내부 옵션 (간단한 사용 pd.display.options.XX = 값을 설정하는 값)을 사용하여 기본값을 편집 할 수 있습니다 : 파이썬에서 팬더 DataFrame을 만들려면이 일반 템플릿을 따르십시오 . 간단한 예제를 사용하여 위의 템플릿을 적용합니다. 팬더에서 열을 선택하는 세 가지 주요 방법이 있습니다 : 팬더의 데이터 선택 방법은 매우 유연합니다. 이 사이트의 또 다른 게시물에서, 나는 팬더의 핵심 선택 방법에 대해 광범위하게 작성했습니다 – 즉 iloc 및 loc. 자세한 정보와 마스터 선택을 위해, 그 게시물을 읽어 보시기 만.

이 예제에서는 열 및 행 선택에 대한 기본 방법을 살펴보겠습니다. 이 작업은 전달된 값이 일치하는 위치를 나타내기 위해 부울 데이터 프레임을 반환하는 .isin() 메서드를 사용하여 수행됩니다. 이 예제에서 데이터 프레임의 `.dtype` 속성을 사용하여 각 열의 형식을 확인할 수 있습니다. 규칙은 팬더 라이브러리를 `pd`(팬더를 PD로 가져오기)로 로드하는 것입니다. 이 표기는 온라인과 Kaggle 커널에서 자주 사용되는 것을 볼 수 있습니다. 목록(zip()) 함수를 사용하여 두 목록을 병합할 수 있습니다. 이제 PD를 호출하여 팬더 DataFrame을 만듭니다. DataFrame() 함수입니다.

고유 → 중복을 제거하여 열에서 고유한 요소를 제공합니다. 예를 들어 “제목” 및 “개요” 열이 있는 영화 데이터 프레임이 있고 중복 된 제목으로 모든 동영상을 삭제하려는 경우를 예로 들 수 있습니다. 일반적으로 가장 일반적으로 사용되는 팬더 개체입니다. 이 경우 차이점을 쉽게 이해할 수 있도록 정수 기반이 아닌 DataFrame의 예제를 사용했습니다.

Geplaatst in Geen categorie