파이썬 통계 예제

Python은 데이터 분석을위한 인기있는 프로그래밍 언어이기 때문에 통계 모듈과 함께 제공되는 것이 합리적입니다. 슬프게도, 이것은 파이썬 2.7에서 사용할 수 없지만 파이썬 3에 있기 때문에 괜찮습니다! 하조평균(하위 반대평균이라고도 함)은 데이터의 상호산술()의 상호값입니다. 예를 들어, 3개의 값 a, b 및 c의 고조파 평균은 3/(1/a + 1/b + 1/c)과 동일합니다. 다음 함수는 Python의 통계 모듈의 일부입니다 : 파이썬의 표준 라이브러리는 중앙값 함수를 지원하지 않지만 설명한 프로세스를 사용하여 중앙값을 찾을 수 있습니다. 와인 가격의 중간 값을 찾아보자. 통계 방정식의 방정식과 세부 사항에 익숙해지는 것은 쉽지만 이러한 개념이 무엇을 나타내는지 이해하는 것이 중요합니다. 이 문서에서는 몇 가지 기본 설명 통계 뒤에 세부 사항 중 일부를 탐색, 우리의 개념을 접지 하는 몇 가지 와인 데이터를 보고 하는 동안. 다음 부분에서는 통계와 확률 간의 관계에 대해 설명합니다. 여기에서 배운 설명 통계는 이러한 연결을 이해하는 데 중요한 역할을 하므로 앞으로 나아가기 전에 이러한 개념이 무엇을 나타내는지 기억하는 것이 중요합니다. 통계 모듈에는 평균, 중앙값, 모드, 표준 편차 및 분산과 같은 다양한 구색이 함께 제공됩니다.

또는, 우리는 라인을 사용하여 한 번에 전체 통계 모듈 (정적 모듈의 모든 기능)을 가져올 수 있습니다 : 파이썬 기계 학습 자습서 : 에어 비앤비 가격 CPython 구현 세부 사항 예측 : 어떤 상황에서는, 중앙값_ grouped() 데이터 포인트를 부동 부동 으로 강제할 수 있습니다. 이 동작은 미래에 변경 될 가능성이 높습니다. 이것은 자연스럽게 우리에게 물어 이끈다 : 그러나 데이터는 무엇인가? 다행히도 데이터를 정의하는 것이 더 간단합니다. 데이터는 세계의 관측의 일반적인 컬렉션이며, 정성적에서 정량에 이르기까지, 자연에서 널리 변화 할 수있다. 연구원은 실험에서 데이터를 수집하고, 기업가는 사용자로부터 데이터를 수집하고, 게임 회사는 플레이어 행동에 대한 데이터를 수집합니다. 이러한 예는 데이터의 또 다른 중요한 측면을 지적합니다: 관측은 일반적으로 관심 있는 인구와 관련이 있습니다. 이전 예를 다시 참조, 연구원은 특정 조건을 가진 환자의 그룹을 보고 있을 수 있습니다. 시험 점수의 표준 편차 또는 스프레드를 계산하려면 통계 모듈의 stdev() 함수를 사용합니다.

큰 표준 편차는 데이터가 분산되어 있음을 나타냅니다. 작은 표준 편차는 데이터가 함께 가까이 클러스터되어 있음을 나타냅니다. 파이썬을 사용하여 기본 통계 작업을 수행하는 방법에 대해 알아봅니다. 팬더는 데이터 프레임에서 데이터의 통계를 표시하는 몇 가지 플로팅 도구 (pandas.tools.plotting, 장면 뒤에 matplotlib를 사용하여)와 함께 제공 : 다음 모듈의 함수를 사용하려면, 우리는 이름 통계를 호출해야합니다 통계.mean(), 통계.median(), 통계.모드() 및 통계.stdev()를 클릭합니다. 아래 참조: 이 모듈에서는 숫자(실제 값) 데이터의 수학적 통계를 계산하는 함수를 제공합니다. 파이썬과 이러한 종속성을 설치하려면 아나콘다 파이썬 또는 Enthought Canopy를 다운로드하거나 우분투 또는 다른 리눅스 아래에있는 경우 패키지 관리자를 사용하는 것이 좋습니다.