Statystyki od dawna są integralną częścią życia. Ludzie spotykają się z tym wszędzie. Na podstawie statystyk wyciągane są wnioski o tym, gdzie i jakie choroby są powszechne, na co jest bardziej poszukiwane w danym regionie lub wśród określonej grupy ludności. Nawet konstrukcja programów politycznych kandydatów do organów rządowych opiera się na danych statystycznych. Wykorzystują je również sieci handlowe przy zakupie towarów, a producenci kierują się tymi danymi w swoich propozycjach.
Statystyki odgrywają ważną rolę w życiu społeczeństwa i wpływają na każdego z jego poszczególnych członków, nawet w małych sprawach. Na przykład, jeśli według statystyk większość ludzi woli ciemne kolory ubrań w danym mieście lub regionie, to znalezienie jasnożółtego płaszcza przeciwdeszczowego z kwiatowym nadrukiem w lokalnych sklepach będzie niezwykle trudne. Ale jakie ilości?czy te dane sumują się, aby mieć taki wpływ? Na przykład, co jest „istotne statystycznie”? Co dokładnie oznacza ta definicja?
Co to jest?
Statystyka jako nauka składa się z kombinacji różnych wielkości i pojęć. Jednym z nich jest pojęcie „znaczenia statystycznego”. Jest to nazwa wartości zmiennych, przy której prawdopodobieństwo pojawienia się innych wskaźników jest znikome.
Na przykład 9 na 10 osób zakłada gumowe buty na stopy podczas porannego spaceru po grzyby w jesiennym lesie po deszczowej nocy. Prawdopodobieństwo, że w którymś momencie 8 z nich założy na płótnie mokasyny jest znikome. Zatem w tym konkretnym przykładzie liczba 9 nazywana jest „istotnością statystyczną”.
W związku z tym, jeśli dalej rozwiniemy podany przykład praktyczny, sklepy obuwnicze kupują do końca sezonu letniego kalosze w większych ilościach niż w innych porach roku. Tak więc wielkość wartości statystycznej ma wpływ na zwykłe życie.
Oczywiście w złożonych obliczeniach, powiedzmy, podczas przewidywania rozprzestrzeniania się wirusów, brana jest pod uwagę duża liczba zmiennych. Ale sama istota wyznaczania istotnego wskaźnika danych statystycznych jest podobna, niezależnie od złożoności obliczeń i liczby wartości zmiennych.
Jak to jest obliczane?
Używane podczas obliczania wartości wskaźnika „istotności statystycznej” równania. Oznacza to, że można argumentować, że w tym przypadku o wszystkim decyduje matematyka. Najprostszą opcją obliczeń jest łańcuch operacji matematycznych, w który zaangażowane są następujące parametry:
- dwa rodzaje wyników uzyskanych z ankiet lub badania danych obiektywnych, takich jak ilość zakupów, oznaczonych literami a i b;
- wskaźnik wielkości próbki dla obu grup – n;
- wartość połączonego udziału próbki - p;
- Błąd standardowy - SE.
Następnym krokiem jest określenie ogólnego wyniku testu - t, jego wartość jest porównywana z liczbą 1,96 1,96 to średnia wartość, przenosząca zakres 95%, zgodnie z funkcją rozkładu t Studenta.
Często pojawia się pytanie, jaka jest różnica między wartościami n i p. Ten niuans można łatwo wyjaśnić na przykładzie. Załóżmy, że obliczana jest statystyczna istotność lojalności wobec dowolnego produktu lub marki kobiet i mężczyzn.
W tym przypadku po literach następuje:
- n - liczba respondentów;
- p - liczba zadowolonych z produktu.
Liczba ankietowanych kobiet w tym przypadku będzie oznaczona jako n1. W związku z tym mężczyźni - n2. Ta sama wartość będzie miała numery „1” i „2” symbolu p.
Porównanie wyniku testu ze średnią arkuszy kalkulacyjnych Studenta staje się tak zwaną „istotnością statystyczną”.
Co oznacza weryfikacja?
Wyniki wszelkich obliczeń matematycznych można zawsze sprawdzić, uczy się tego dzieci w szkole podstawowej. Logiczne jest założenieże skoro statystyki są określane za pomocą łańcucha obliczeń, to są one sprawdzane.
Jednak testowanie istotności statystycznej to nie tylko matematyka. Statystyka zajmuje się dużą liczbą zmiennych i różnymi prawdopodobieństwami, które nie zawsze są podatne na obliczenia. To znaczy, jeśli wrócimy do przykładu butów gumowych z początku artykułu, to logiczną konstrukcję danych statystycznych, na których będą polegać nabywcy towarów do sklepów, może zakłócić nietypowa dla jesieni sucha i upalna pogoda. W wyniku tego zjawiska zmniejszy się liczba kupujących kalosze, a sklepy poniosą straty. Oczywiście wzór matematyczny nie jest w stanie przewidzieć anomalii pogodowej. Ten moment nazywa się „błędem”.
To tylko prawdopodobieństwo wystąpienia takich błędów i uwzględnia sprawdzenie poziomu obliczonej istotności. Uwzględnia zarówno obliczone wskaźniki, jak i przyjęte poziomy istotności, a także wielkości umownie nazywane hipotezami.
Jaki jest poziom istotności?
Pojęcie „poziomu” jest zawarte w głównych kryteriach istotności statystycznej. Znajduje zastosowanie w statystyce stosowanej i praktycznej. Jest to rodzaj wartości, która uwzględnia prawdopodobieństwo możliwych odchyleń lub błędów.
Poziom opiera się na identyfikacji różnic w gotowych próbkach, pozwala ustalić ich istotność lub odwrotnie losowość. Pojęcie to ma nie tylko znaczenia cyfrowe, ale także ich osobliwe interpretacje. Wyjaśniająjak musisz zrozumieć wartość, a sam poziom jest określany przez porównanie wyniku ze średnim wskaźnikiem, ujawnia to stopień wiarygodności różnic.
Możemy więc wyobrazić sobie pojęcie poziomu w prosty sposób - jest to wskaźnik dopuszczalnego, prawdopodobnego błędu lub błędu we wnioskach wyciągniętych z uzyskanych danych statystycznych.
Jakie poziomy istotności są używane?
Istotność statystyczna współczynników prawdopodobieństwa błędu w praktyce opiera się na trzech podstawowych poziomach.
Pierwszy poziom to próg, przy którym wartość wynosi 5%. Oznacza to, że prawdopodobieństwo błędu nie przekracza poziomu istotności 5%. Oznacza to, że pewność co do nieskazitelności i nieomylności wniosków wyciąganych na podstawie danych z badań statystycznych wynosi 95%.
Drugi poziom to próg 1%. W związku z tym liczba ta oznacza, że można kierować się danymi uzyskanymi podczas obliczeń statystycznych z 99% pewnością.
Trzeci poziom - 0,1%. Przy tej wartości prawdopodobieństwo błędu jest równe ułamkowi procenta, co oznacza, że błędy są praktycznie wyeliminowane.
Jaka jest hipoteza w statystyce?
Błędy jako pojęcie dzielą się na dwa obszary, dotyczące przyjęcia lub odrzucenia hipotezy zerowej. Hipoteza to pojęcie, za którym zgodnie z definicją kryje się zestaw wyników ankiety, innych danych lub stwierdzeń. Czyli opis rozkładu prawdopodobieństwa czegoś związanego z przedmiotem rachunkowości statystycznej.
W prostych obliczeniach istnieją dwie hipotezy - zerowa i alternatywna. Różnica między nimi polega na tym, że hipoteza zerowa opiera się na założeniu, że nie ma fundamentalnych różnic między próbami biorącymi udział w określaniu istotności statystycznej, a alternatywna jest całkowicie przeciwna do niej. Oznacza to, że alternatywna hipoteza opiera się na obecności znaczącej różnicy w tych próbkach.
Jakie są błędy?
Błędy jako pojęcie w statystyce są wprost proporcjonalne do przyjęcia tej lub innej hipotezy jako prawdziwej. Można je podzielić na dwa kierunki lub typy:
- pierwszy typ wynika z przyjęcia hipotezy zerowej, która okazała się błędna;
- sekunda - spowodowane podążaniem za alternatywą.
Pierwszy typ błędu nazywany jest fałszywym alarmem i jest dość powszechny we wszystkich obszarach, w których używane są statystyki. W związku z tym błąd drugiego typu nazywany jest fałszywie ujemnym.
Dlaczego potrzebujemy regresji w statystykach?
Istotność statystyczna regresji polega na tym, że za jej pomocą można ustalić, na ile model różnych zależności wyliczony na podstawie danych odpowiada rzeczywistości; pozwala określić wystarczalność lub brak czynników do księgowania i wniosków.
Wartość regresji jest określana przez porównanie wyników z danymi wymienionymi w tabelach Fishera. Lub za pomocą analizy wariancji. Wskaźniki regresji są ważne, gdyzłożone badania statystyczne i obliczenia obejmujące dużą liczbę zmiennych, dane losowe i prawdopodobne zmiany.