Statystyka - to lubię

Wykres pudełkowy

Na początku rozdziału- przedstawiliśmy różne wykresy rozkładu empirycznego. Do ich sporządzenia potrzebna była tylko znajomość liczebności (częstości) rozkładu empirycznego. Obecnie przedstawimy pewien schematyczny i bardzo wygodny sposób graficznej prezentacji rozkładu, którego konstrukcja opiera się na pozycyjnych miarach położenia rozkładu. Jest to tzw. wykres pudełkowy (w anglosaskiej terminologii box-plot lub box--and-whisker plot). Do jego sporządzenia potrzebna jest jedna oś liczbowa, na której odmierza się wartości badanej cechy. Wzdłuż niej umieszcza się prostokąt (pudełko), którego lewy bok wyznaczony jest przez wartość pierwszego kwartyla, prawy zaś - przez wartość trzeciego kwartyla. Długość prostokąta reprezentuje zatem rozstęp ćwiartkowy, obejmujący, jak wiadomo, 50% "środkowych" obserwacji. "Pudełko" przedzielone jest pionową linią wskazującą wartość mediany. Dzieli ona cały przedział ćwiartkowy na dwa obszary, w których znajduje się po 25% obserwacji.

Uzupełnieniem wykresu są dwa odcinki znajdujące się na zewnątrz prostokątów. Z lewej strony pudełka występuje odcinek (od najmniejszej wartości cechy w zbiorze do lewego boku prostokąta), obejmujący obszar, w którym znajduje się 25% obserwacji o wartościach niższych od pierwszego kwartyla. Z prawej strony pudełka końce odcinka wyznacza kwartyl trzeci i maksymalna wartość cechy w zbiorze, odcinek ten odpowiada zatem obszarowi zmienności dla 25% najwyższych wartości w zbiorze. Wykres pudełkowy może eksponować także nietypowe obserwacje w zbiorze (wartości izolowane). Za takie uważa się, przy konstrukcji pudełka, wartości mniejsze od kwartyla pierwszego i większe od kwartyla trzeciego o więcej niż półtora przedziału ćwiartkowego (inaczej: półtora długości pudełka). Jeśli w zbiorze danych wartości takie występują, to są one zaznaczane jako swobodne punkty (nie jest prowadzona do nich linia ciągła).

Warto zwrócić uwagę na to, jak na podstawie wykresu pudełkowego można opisać różne aspekty rozkładu empirycznego. Położenie pudełka względem osi liczbowej określa oczywiście położenie rozkładu, pionowa linia dzieląca pudełko wskazuje na tendencję centralną rozkładu, długość prostokąta oraz całego wykresu wskazuje na dyspersję cechy w zbiorze i wreszcie proporcje elementów wykresu po obu stronach pionowej linii wyznaczonej przez wartość mediany informują o charakterze skośności rozkładu.

wierszyki urodzinowe - gry dla dziewczyn - opony Audi - Torrent - p2p - Świadectwo pracy - kompresory - płyta gazowa - resory - telewizor led - cukrzyca - Klub malucha Warszawa - bioinformatyk - angielski Pabianice