Varijanca je jedna od najvažnijih mjera raspršenosti u statistici, koja nam pomaže da razumijemo koliko se podaci razlikuju od svoje srednje vrijednosti. Kada analiziramo skup podataka, vrlo je važno znati kako se ti podaci ponašaju. Varijanca nam daje uvid u to koliko su podaci raspršeni ili blizu prosječne vrijednosti. U ovom članku ćemo detaljno objasniti što je varijanca, kako se izračunava i zašto je važna.
Prvo, da bismo razumjeli varijancu, moramo se upoznati s pojmom srednje vrijednosti, također poznate kao aritmetička sredina. Srednja vrijednost se izračunava zbrajanjem svih vrijednosti u skupu podataka i dijeljenjem s brojem tih vrijednosti. Na primjer, ako imamo skup podataka {4, 8, 6, 5, 3}, srednja vrijednost bi bila (4 + 8 + 6 + 5 + 3) / 5 = 5.2.
Nakon što izračunamo srednju vrijednost, možemo pristupiti izračunu varijance. Varijanca se definira kao prosjek kvadrata odstupanja svake vrijednosti od srednje vrijednosti. To znači da uzimamo svaku vrijednost u našem skupu podataka, oduzmemo srednju vrijednost od te vrijednosti, kvadriramo rezultat i zatim izračunamo prosjek tih kvadrata.
Formula za izračun varijance (označena kao σ² za populacijsku varijancu ili s² za uzorkovnu varijancu) može se napisati na sljedeći način:
Za populacijsku varijancu:
σ² = (Σ (xi – μ)²) / N
Za uzorkovnu varijancu:
s² = (Σ (xi – x̄)²) / (n – 1)
Gdje je:
- σ² = populacijska varijanca
- s² = uzorkovna varijanca
- Σ = simbol za zbrajanje
- xi = svaka pojedinačna vrijednost u skupu podataka
- μ = srednja vrijednost populacije
- x̄ = srednja vrijednost uzorka
- N = ukupni broj vrijednosti u populaciji
- n = ukupni broj vrijednosti u uzorku
Sada, da bismo razumjeli kako se varijanca koristi u praksi, razmotrimo primjer. Pretpostavimo da imamo skup podataka koji predstavlja rezultate ispita pet učenika: 80, 85, 90, 70 i 75. Prvo ćemo izračunati srednju vrijednost:
(80 + 85 + 90 + 70 + 75) / 5 = 80.
Sljedeći korak je izračunati odstupanja od srednje vrijednosti:
- 80 – 80 = 0
- 85 – 80 = 5
- 90 – 80 = 10
- 70 – 80 = -10
- 75 – 80 = -5
Zatim kvadriramo svako od ovih odstupanja:
- 0² = 0
- 5² = 25
- 10² = 100
- (-10)² = 100
- (-5)² = 25
Sada zbrajamo kvadrate odstupanja:
0 + 25 + 100 + 100 + 25 = 250.
Za uzorkovnu varijancu dijelimo s (n – 1), dakle 250 / (5 – 1) = 250 / 4 = 62.5.
Varijanca nam daje značajnu informaciju o raspršenosti podataka. Što je veća varijanca, to su podaci više raspršeni. U praksi, varijanca se često koristi u različitim područjima, uključujući ekonomiju, psihologiju, biologiju i mnoge druge znanstvene discipline. Uz varijancu, statističari često koriste i standardnu devijaciju, koja je korijen varijance i daje nam informaciju u istim jedinicama kao i izvorni podaci.
U zaključku, varijanca formula je ključna za analizu podataka i razumijevanje njihove raspodjele. Bilo da radite u znanosti, poslovanju ili bilo kojem drugom području, poznavanje varijance i njezina izračuna može vam pomoći donijeti bolje odluke na temelju podataka.