Regresija vs korelacija
U statistici je važno utvrđivanje odnosa između dvije slučajne varijable. Daje mogućnost predviđanja jedne varijable u odnosu na druge. Regresijska analiza i korelacija primjenjuju se u vremenskim prognozama, ponašanju financijskog tržišta, uspostavljanju fizičkih odnosa eksperimentima i u mnogo stvarnijim scenarijima.
Što je regresija?
Regresija je statistička metoda koja se koristi za crtanje veze između dvije varijable. Kad se podaci prikupljaju, često postoje varijable koje ovise o drugima. Točan odnos između tih varijabli može se utvrditi samo regresijskim metodama. Utvrđivanje ovog odnosa pomaže razumjeti i predvidjeti ponašanje jedne varijable prema drugoj.
Najčešća primjena regresijske analize je procjena vrijednosti ovisne varijable za zadanu vrijednost ili raspon vrijednosti neovisnih varijabli. Na primjer, pomoću regresije možemo uspostaviti odnos između cijene robe i potrošnje, na temelju podataka prikupljenih iz slučajnog uzorka. Regresijska analiza stvara regresijsku funkciju skupa podataka, što je matematički model koji najbolje odgovara dostupnim podacima. To se lako može prikazati raspršenom plohom. Grafički, regresija je ekvivalentna pronalaženju najbolje uklapajuće krivulje za zadani skup podataka. Funkcija krivulje je funkcija regresije. Koristeći matematički model, potražnja robe može se predvidjeti za određenu cijenu.
Stoga se regresijska analiza široko koristi u predviđanju i predviđanju. Također se koristi za uspostavljanje odnosa u eksperimentalnim podacima, na poljima fizike, kemije i mnogih prirodnih znanosti i tehničkih disciplina. Ako je veza ili funkcija regresije linearna funkcija, tada je postupak poznat kao linearna regresija. U dijagramu raspršenja može se prikazati kao ravna crta. Ako funkcija nije linearna kombinacija parametara, tada je regresija nelinearna.
Što je korelacija?
Korelacija je mjera snage veze između dvije varijable. Koeficijent korelacije kvantificira stupanj promjene jedne varijable na temelju promjene druge varijable. U statistici je korelacija povezana s konceptom ovisnosti, što je statistički odnos između dvije varijable.
Pearsonsov koeficijent korelacije ili samo koeficijent korelacije r vrijednost je između -1 i 1 (-1≤r≤ + 1). To je najčešće korišteni koeficijent korelacije i vrijedi samo za linearni odnos između varijabli. Ako je r = 0, ne postoji veza, a ako je r≥0, relacija je izravno proporcionalna; tj. vrijednost jedne varijable raste s porastom druge. Ako je r≤0, odnos je obrnuto proporcionalan; tj. jedna se varijabla smanjuje kako se druga povećava.
Zbog uvjeta linearnosti, koeficijent korelacije r također se može koristiti za utvrđivanje prisutnosti linearnog odnosa između varijabli.
Koja je razlika između regresije i korelacije?
Regresija daje oblik odnosa između dvije slučajne varijable, a korelacija daje stupanj snage odnosa.
Regresijska analiza stvara regresijsku funkciju, koja pomaže u ekstrapolaciji i predviđanju rezultata, dok korelacija može pružiti samo informacije u kojem se smjeru može promijeniti.
Analiza daje preciznije linearne regresijske modele ako je koeficijent korelacije veći. (| r | ≥0,8)