Razlika Između KDD I Data Mining

Razlika Između KDD I Data Mining
Razlika Između KDD I Data Mining

Video: Razlika Između KDD I Data Mining

Video: Razlika Između KDD I Data Mining
Video: Data Mining #1 / Задачи Data Mining [Технострим] 2024, Studeni
Anonim

KDD vs Data mining

KDD (Otkrivanje znanja u bazama podataka) područje je računalne znanosti, koje uključuje alate i teorije koji pomažu ljudima u izdvajanju korisnih i ranije nepoznatih informacija (tj. Znanja) iz velikih zbirki digitaliziranih podataka. KDD se sastoji od nekoliko koraka, a Data Mining je jedan od njih. Data Mining je primjena određenog algoritma kako bi se iz podataka izvukli uzorci. Unatoč tome, KDD i Data Mining koriste se naizmjenično.

Što je KDD?

Kao što je gore spomenuto, KDD je područje računalnih znanosti koje se bavi izdvajanjem prethodno nepoznatih i zanimljivih podataka iz sirovih podataka. KDD je cjelokupan proces pokušaja razumijevanja podataka razvojem odgovarajućih metoda ili tehnika. Ovaj se postupak bavi mapiranjem podataka na niskoj razini u druge oblike koji su kompaktniji, apstraktniji i korisniji. To se postiže stvaranjem kratkih izvještaja, modeliranjem procesa generiranja podataka i razvojem prediktivnih modela koji mogu predvidjeti buduće slučajeve. Zbog eksponencijalnog rasta podataka, posebno u područjima kao što je poslovanje, KDD je postao vrlo važan proces pretvaranja ovog velikog bogatstva podataka u poslovnu inteligenciju, jer je ručno izdvajanje uzoraka naoko postalo nemoguće u posljednjih nekoliko desetljeća. Na primjer,trenutno se koristi za razne aplikacije poput analize društvenih mreža, otkrivanja prijevara, znanosti, ulaganja, proizvodnje, telekomunikacija, čišćenja podataka, sporta, pronalaženja informacija i uglavnom za marketing. KDD se obično koristi za odgovaranje na pitanja poput glavnih proizvoda koji bi u Wal-Martu mogli postići visoku zaradu sljedeće godine. Ovaj postupak ima nekoliko koraka. Počinje s razvijanjem razumijevanja domene aplikacije i cilja, a zatim stvaranjem ciljnog skupa podataka. Nakon toga slijedi čišćenje, predobrada, smanjenje i projekcija podataka. Sljedeći korak je korištenje Data Mininga (objašnjeno u nastavku) za identificiranje uzorka. Konačno, otkriveno znanje konsolidira se vizualizacijom i / ili interpretacijom.sport, pronalaženje informacija i uglavnom za marketing. KDD se obično koristi za odgovaranje na pitanja poput glavnih proizvoda koji bi u Wal-Martu mogli postići visoku zaradu sljedeće godine. Ovaj postupak ima nekoliko koraka. Počinje s razvijanjem razumijevanja domene aplikacije i cilja, a zatim stvaranjem ciljnog skupa podataka. Nakon toga slijedi čišćenje, predobrada, smanjenje i projekcija podataka. Sljedeći korak je korištenje Data Mininga (objašnjeno u nastavku) za identificiranje uzorka. Konačno, otkriveno znanje konsolidira se vizualizacijom i / ili interpretacijom.sport, pronalaženje informacija i uglavnom za marketing. KDD se obično koristi za odgovaranje na pitanja poput glavnih proizvoda koji bi u Wal-Martu mogli postići visoku zaradu sljedeće godine. Ovaj postupak ima nekoliko koraka. Počinje s razvijanjem razumijevanja domene aplikacije i cilja, a zatim stvaranjem ciljnog skupa podataka. Nakon toga slijedi čišćenje, predobrada, smanjenje i projekcija podataka. Sljedeći korak je korištenje Data Mininga (objašnjeno u nastavku) za identificiranje uzorka. Konačno, otkriveno znanje konsolidira se vizualizacijom i / ili interpretacijom. Počinje s razvijanjem razumijevanja domene aplikacije i cilja, a zatim stvaranjem ciljnog skupa podataka. Nakon toga slijedi čišćenje, predobrada, smanjenje i projekcija podataka. Sljedeći korak je korištenje Data Mininga (objašnjeno u nastavku) za identificiranje uzorka. Konačno, otkriveno znanje konsolidira se vizualizacijom i / ili interpretacijom. Počinje s razvijanjem razumijevanja domene aplikacije i cilja, a zatim stvaranjem ciljnog skupa podataka. Nakon toga slijedi čišćenje, predobrada, smanjenje i projekcija podataka. Sljedeći korak je korištenje Data Mininga (objašnjeno u nastavku) za identificiranje uzorka. Konačno, otkriveno znanje konsolidira se vizualizacijom i / ili interpretacijom.

Što je Data Mining?

Kao što je gore spomenuto, Data Mining je samo korak unutar cjelokupnog KDD procesa. Dva su glavna cilja Data Mininga definirana ciljem aplikacije, a to su provjera ili otkrivanje. Provjera je provjera korisnikove hipoteze o podacima, dok otkrivanje automatski pronalazi zanimljive obrasce. Četiri su glavna zadatka za rudarenje podataka: klasterizacija, klasifikacija, regresija i pridruživanje (sažimanje). Klasteriranje je identificiranje sličnih skupina iz nestrukturiranih podataka. Klasifikacija je pravila učenja koja se mogu primijeniti na nove podatke. Regresija je pronalaženje funkcija s minimalnom pogreškom u modeliranju podataka. A udruživanje traži odnose između varijabli. Zatim treba odabrati određeni algoritam za rukovanje podacima. Ovisno o cilju, različiti algoritmi poput linearne regresije, logističke regresije,mogu se odabrati stabla odluke i naivni Bayes. Zatim se pretražuju obrasci interesa za jedan ili više reprezentativnih oblika. Konačno, modeli se vrednuju ili pomoću prediktivne točnosti ili razumljivosti.

Koja je razlika između KDD i Data mining?

Iako se dva pojma KDD i Data Mining u velikoj mjeri koriste naizmjenično, oni se odnose na dva povezana, ali malo različita pojma. KDD je cjelokupni postupak izdvajanja znanja iz podataka, dok je Data Mining korak unutar KDD procesa, koji se bavi identificiranjem obrazaca u podacima. Drugim riječima, Data Mining je samo primjena određenog algoritma koji se temelji na sveukupnom cilju KDD procesa.

Preporučeno: