438822DOC STATYSTYKA OPISOWA WSGN WYKŁAD 1 TRZY PODSTAWOWE ZNACZENIA

438822DOC STATYSTYKA OPISOWA WSGN WYKŁAD 1 TRZY PODSTAWOWE ZNACZENIA






438822.doc Statystyka opisowa WSGN

Wykład 1


Trzy podstawowe znaczenia terminu statystyka za „Słownikiem języka polskiego” PWN:

  1. Nauka zajmująca się metodami badania przedmiotów i zjawisk masowych w przestrzeni lub w czasie polegająca na systematyzowaniu obserwowanych cech ilościowych i jakościowych oraz przedstawianiu wyników w postaci zestawień tabelarycznych, wykresów itp.

Zajmować się statystyką.

Prowadzić statystykę czegoś.

  1. Zbiory, wykazy informacji liczbowych.

Statystyka z ostatniego kwartału.

Statystyka wykazuje spadek, wzrost zachorowań.

Planować coś na podstawie statystyki.

Opierać się na statystykach.

Zrobić, sporządzić statystykę wypadków.

  1. Statystyka matematyczna – dział matematyki stosowanej oparty na rachunku prawdopodobieństwa, zajmujący się badaniem właściwości zbiorów na podstawie znajomości właściwości ich części.


Według „Wikipedi”:

Statystyka to nauka, której przedmiotem zainteresowania są metody pozyskiwania i prezentacji, a przede wszystkim analizy danych opisujących zjawiska masowe.

Duża część dziedzin wiedzy zajmuje się obserwacją otaczającego nas świata lub też posługuje się eksperymentem dla potwierdzenia swoich teorii. Takie badanie przebiega zazwyczaj według schematu:

Badaczowi potrzebny jest wtedy zestaw narzędzi - sprawdzonych metod, które umożliwią mu operowanie na dużych zbiorach danych. Tworzeniem i rozwijaniem takich użytecznych narzędzi zajmuje się właśnie statystyka.


Początki statystyki (Wikipedia).

Swoje początki statystyka wywodzi z tradycji dokonywania spisów powszechnych, czyli zbierania informacji na temat ludności.

Spisy powszechne były stosunkowo systematycznie przeprowadzane na terenie starożytnego Rzymu.

Z pewnością posiadanie informacji na temat stanu ludności ułatwiało rozpoznawanie trendów i odpowiednie planowanie.

Do ok. połowy XIX wieku termin statystyka oznaczał podany w tabelarycznej formie zbiór danych na temat stanu państwa. Można przypuszczać, że w pewnym momencie posiadanie podstawowych danych stało się niewystarczające, szczególnie przy coraz szybciej rozwijającej się gospodarce światowej. Konieczne stało się nie tylko ulepszanie metod pozyskiwania danych, ale również ich opisu i analizy. Zbiegło się to w czasie z szybkim rozwojem metod matematycznych, szczególnie teorii prawdopodobieństwa.



Dlaczego w statystyce mamy do czynienia z losowością

Pewne zjawiska zależą od wielu czynników, których nie jesteśmy w stanie kontrolować.

Często zamiast badać całą populację, badamy tylko próbkę tej populacji. Postępujemy tak, gdyż nie możemy zbadać całej populacji lub jest to ekonomicznie nie sensowne.


Jak widać, losowość zjawisk jest niejako wpisana w definicję metod statystycznych. Dlatego właśnie statystykę łączy bardzo ścisły związek z teorią prawdopodobieństwa, działem matematyki dzięki któremu jesteśmy w stanie poradzić sobie z niepewnością.



Podstawowe pojęcia statystyczne


Populacja

Populacja, zbiorowość, populacja statystyczna, populacja generalna, zbiorowość generalna – ogół jednostek objętych badaniem statystycznym. Elementy populacji są do siebie podobne pod względem badanej cechy, ale nie są identyczne. Z populacji można wyróżniać podpopulacje.


Jednostka statystyczna

Elementy populacji statystycznej nazywamy jednostkami statystycznymi.


Cecha statystyczna

zaś badana cecha to cecha statystyczna.


Cecha stała

Określająca populacje. Odpowiada na pytanie: co badamy? Charakteryzują podmiot badania – populację.


Cechy zmienne

To cechy podlegające badaniu. Rozróżniamy


Cechy jakościowe – niemierzalne.

Cechy ilościowe – mierzalne.

Cechy skokowe – dyskretne.

Cechy ciągłe.


Przykład: Wszyscy ludzie w Polsce posiadają cechę wzrostu - są pod tym względem podobni, ale nie identyczni: są ludzie wysocy i niscy. Populacją w badaniu statystycznym wzrostu ludzi w Polsce będą wszyscy ludzie w Polsce.


Nie wszystkie populacje muszą istnieć w rzeczywistości, niektóre z nich mają charakter wyłącznie hipotetyczny.



Ze względu na liczebność zbioru, populacje można podzielić na:



Ponieważ często badanie statystyczne całej populacji jest nieuzasadnione lub niemożliwe (przyczyny: patrz badanie statystyczne), dlatego bada się jedynie wybrane losowo elementy populacji, czyli próbę losową, a następnie wnioskuje na podstawie obserwacji cechy w próbie o możliwych wartościach cechy w populacji. Dlatego właśnie niektóre pojęcia statystyczne mogą odnosić się zarówno do populacji, jak i do próby (są to tzw. wielkości empiryczne). I tak rozróżniamy np.: rozkład prawdopodobieństwa w populacji i rozkład próby losowej (empiryczny), wariancję w populacji i wariancję z próby, korelację w populacjach i korelację z próby itd.


Przykład: Badaną cechą statystyczną jest wzrost Polaków. Populacją jest, jak już mówiliśmy, cała ludność Polski. Badanie statystyczne całej populacji jest nieuzasadnione z ekonomicznego punktu widzenia, dlatego wybieramy losowo próbę 1000 Polaków i notujemy wartości przyjmowane przez cechę: wzrost. Na podstawie wyników próby możemy obliczyć parametry rozkładu empirycznego cechy: średnią, odchylenie standardowe z próby itd. Dzięki tym wynikom oraz zasadom wnioskowania statystycznego możemy wnioskować o tym, jak wygląda rozkład cechy w całej populacji.



Badanie statystyczne

Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji Badanie może mieć charakter:


Badania pełne, całkowite, wyczerpujące – obejmują wszystkie jednostki statystyczne badanej populacji. Przykładem są: spis statystyczny, rejestracja bieżąca (meldunki, zgony, małżeństwa…)

Badania częściowe – badania na podstawie próbki.


Wydawać by się mogło, że badanie częściowe jako z założenia obarczone niepewnością stosowane jest bardzo rzadko. Istnieją jednak czynniki, które przemawiają na korzyść tego właśnie rodzaju badania:


Sposobami wyboru próby losowej zajmuje się metoda reprezentacyjna.

Problem uogólnienia wyników badania próby losowej na całą populację oraz popełnianych przy tym błędów to z kolei tematyka wnioskowania statystycznego.

Wnioskowanie statystyczne to dział statystyki zajmujący się problemami uogólniania wyników badania próby losowej na całą populację oraz szacowania błędów wynikających z takiego uogólnienia.

Wyróżnia się dwie grupy metod uogólniania wyników, definiujące jednocześnie dwa działy wnioskowania statystycznego:


W badaniach statystycznych mogą pojawić się dwojakiego rodzaju błędy, zwane błędami statystycznymi.

Błędy systematyczne, błędy losowe.


Przedmiotem opisu statystycznego może być cała populacja lub próba z populacji.

Opis może dotyczyć:


Na podstawie wyników pomiarów z próby możemy chcieć wnioskować o własnościach całej populacji.


Statystyka opisowa

Statystyka opisowa to dział statystyki zajmujący się metodami opisu danych statystycznych uzyskanych podczas badania statystycznego. Celem stosowania metod statystyki opisowej jest podsumowanie zbioru danych i wyciągnięcie pewnych podstawowych wniosków i uogólnień na temat zbioru.


Statystykę opisową stosujemy zazwyczaj jako pierwszy i podstawowy krok w analizie zebranych danych.


Do technik statystyki opisowej można zaliczyć:


  1. Opis tabelaryczny.

Dane przedstawiane są w postaci tabel. Dla małych zbiorów danych tabele mogą prezentować wszystkie dane, w przeciwnym przypadku tworzy się różnego rodzaju podsumowania, jak np. szereg rozdzielczy.


  1. Graficzna prezentacja wyników.

Dane prezentowane są w formie graficznej. Podstawowymi narzędziami są tutaj: histogram, wielobok liczebności i krzywa liczebności, które wykreślane są bezpośrednio na podstawie danych z szeregu rozdzielczego; wykres pudełkowy, przedstawiający zależności pomiędzy niektórymi statystykami pozycyjnymi; krzywa Lorentza charakteryzująca koncentrację wartości cechy.


  1. Wyznaczanie miar rozkładu.

Do opisu posługujemy się miarami rozkładu - różnego rodzaju wielkościami obliczanymi na podstawie uzyskanych danych. Interpretacja wartości tych miar dostarcza nam informacji na temat charakteru rozkładu cechy.


Miary można podzielić na trzy podstawowe kategorie:


  1. miary położenia

  2. miary zróżnicowania

  3. miary asymetrii

  4. miary koncentracji


Poza tym podziałem wyróżniamy miary klasyczne i miary nieklasyczne.


Techniki z wymienionych kategorii dostarczają wzajemnie uzupełniających się danych, dlatego najczęściej posługujemy się jednocześnie technikami z każdej z tych grup.


Statystyka stosowana

Statystyka jest stosowana w wielu dziedzinach wiedzy, w niektórych z nich tak intensywnie, że doczekała się własnej terminologii i wyspecjalizowanych metod. Z czasem wytworzyły się dziedziny z pogranicza statystyki i innych nauk. Należą do nich:



Biometria

Biometria to nauka zajmująca się badaniem zmienności populacji organizmów. Wyniki pomiarów biometrycznych po opracowaniu metodami statystyki matematycznej wykorzystywane są, między innymi w antropologii, fizjologii, genetyce, hodowli, medycynie.

Biometria to również technika dokonywania pomiarów istot żywych. W najnowszych zastosowaniach ukierunkowana jest na metody automatycznego rozpoznawania ludzi na podstawie ich cech fizycznych. Przykładem urządzeń do pomiarów biometrycznych na podstawie których można identyfikować konkretne osoby jest skaner tęczówki oka rejestrujący obraz tęczówki oka.


Demografia

(démos – "Naród", grafia – "opis, pismo") jest dziedziną nauki, która zajmuje się: życiem, powstawaniem i przemijaniem społeczności ludzkiej, w równej mierze jej opisem liczbowym (przyrostem naturalnym, migracjami), strukturą (wieku, płci, zawodową, narodowościową, wyznaniową), jak również jej rozmieszczeniem przestrzennym i dalszymi czynnikami, w szczególności społecznymi i socjologicznymi, które wpływają na jej zmiany. W śledzeniu i odkrywaniu praw rządzących tymi zmianami, jak również w ich prognozowaniu, demografia stosuje metody statystyczne.

Metodyka

Demografia uzyskuje dane do swych badań z publikacji statystycznych, reprezentacyjnych prób statystycznych i ze spisów ludności.

Do badań nad procesami demograficznymi (czyli ruchami ludności) używa się statystyk meldunkowych i innych, a z nich np. współczynnik urodzeń, współczynnik zgonów, współczynnik przyrostu naturalnego, współczynnik dzietności, dzietność, saldo migracji, oczekiwaną długość życia, etc. Typowe dla demografii jest również graficzne obrazowanie danych (np. piramida wieku).

W demografii historycznej, t.j. dla okresu pre-statystycznego (przed rokiem 1850) używa się opracowań danych kościelnych i innych dostępnych źródeł.


Ekonometria

Ekonometria - nauka pomocnicza ekonomii, wykorzystująca narzędzia matematyki, ekonomii matematycznej, statystyki oraz informatyki do badania ilościowych związków zachodzących między zjawiskami ekonomicznymi. Jest zbiorem metod opracowanych najczęściej poza ekonomią, ale wykorzystywanych na jej polu.

Celem ekonometrii jest empiryczna analiza teorii ekonomicznych, przewidywanie procesów ekonomicznych oraz dostarczanie przesłanek służących sterowaniu tymi procesami. Podstawowym narzędziem służącym tym celom jest model ekonometryczny.




P. Zaremba 4/4





Tags: wykład, znaczenia, podstawowe, opisowa, 438822doc, statystyka