Linearna vs logistička regresija
U statističkoj analizi važno je utvrditi vezu između relevantnih varijabli u istraživanju. Ponekad to može biti jedina svrha same analize. Jedan od snažnih alata koji se koristi za utvrđivanje postojanja odnosa i utvrđivanje odnosa je regresijska analiza.
Najjednostavniji oblik regresijske analize je linearna regresija, gdje je odnos između varijabli linearni odnos. U statističkom smislu, to donosi odnos između objašnjene varijable i varijable odgovora. Na primjer, pomoću regresije možemo uspostaviti odnos između cijene robe i potrošnje na temelju podataka prikupljenih iz slučajnog uzorka. Regresijska analiza proizvest će regresijsku funkciju skupa podataka, što je matematički model koji najbolje odgovara dostupnim podacima. To se lako može prikazati raspršenom plohom. Grafička regresija ekvivalentna je pronalaženju najbolje uklapajuće krivulje za zadani skup podataka. Funkcija krivulje je funkcija regresije. Pomoću matematičkog modela može se predvidjeti upotreba robe za određenu cijenu.
Stoga se regresijska analiza široko koristi u predviđanju i predviđanju. Također se koristi za utvrđivanje odnosa u eksperimentalnim podacima, na poljima fizike, kemije i u mnogim prirodnim znanostima i inženjerskim disciplinama. Ako je veza ili funkcija regresije linearna funkcija, tada je postupak poznat kao linearna regresija. U dijagramu raspršenja može se prikazati kao ravna crta. Ako funkcija nije linearna kombinacija parametara, tada je regresija nelinearna.
Logistička regresija usporediva je s multivarijantnom regresijom i stvara model koji objašnjava utjecaj više prediktora na varijablu odgovora. Međutim, u logističkoj regresiji varijabla krajnjeg rezultata trebala bi biti kategorična (obično podijeljena; tj. Par dostižnih ishoda, poput smrti ili preživljavanja, iako posebne tehnike omogućuju modeliranje više kategoriziranih informacija). Kontinuirana varijabla ishoda može se transformirati u kategorijalnu varijablu koja će se koristiti za logističku regresiju; međutim, rušenje kontinuiranih varijabli na ovaj način uglavnom se ne preporučuje jer to smanjuje točnost.
Za razliku od linearne regresije, prema srednjoj vrijednosti, prediktorske varijable u logističkoj regresiji ne moraju biti prisiljene biti linearno povezane, uobičajeno raspoređene ili imati jednake varijance unutar svakog klastera. Kao rezultat toga, odnos između prediktora i varijabli ishoda vjerojatno neće biti linearna funkcija.
Koja je razlika između logističke i linearne regresije?
• U linearnoj regresiji pretpostavlja se linearna veza između objašnjene varijable i varijable odgovora i analizom se pronalaze parametri koji zadovoljavaju model kako bi se dobio točan odnos.
• Linearna regresija provodi se za kvantitativne varijable, a rezultirajuća funkcija je kvantitativna.
• U logističkoj regresiji korišteni podaci mogu biti kategorički ili kvantitativni, ali rezultat je uvijek kategoričan.