Semi Pridruživanje vs Bloom Pridruživanje
Polu spajanje i Bloom spajanje dvije su metode spajanja koje se koriste u obradi upita za distribuirane baze podataka. Prilikom obrade upita u distribuiranim bazama podataka, podaci se trebaju prenositi između baza podataka smještenih na različitim web mjestima. To bi mogla biti skupa operacija, ovisno o količini podataka koju treba prenijeti. Stoga je prilikom obrade upita u okruženju distribuirane baze podataka važno optimizirati upite kako bi se smanjila količina podataka koja se prenosi između web lokacija. Polu spajanje i pridruživanje cvjetanjem dvije su metode kojima se može smanjiti količina prijenosa podataka i izvršiti učinkovita obrada upita.
Što je Semi Join?
Polupriključivanje je metoda koja se koristi za učinkovitu obradu upita u okruženjima distribuirane baze podataka. Razmotrimo situaciju kada se baza podataka zaposlenika (koja sadrži podatke poput imena zaposlenika, broja odjela u kojem radi, itd.) Nalazi na mjestu 1 i baze podataka odjela (koja sadrži podatke kao što su broj odjela, naziv odjela, lokacija itd.) Koja se nalazi na mjestu 2. Na primjer, ako želimo dobiti ime zaposlenice i ime odjela za koji radi (samo za odjele smještene u “New Yorku”), izvršavanjem upita u procesoru upita smještenom na mjestu 3, postoji nekoliko načina na koje podaci bi se mogli prenositi između tri mjesta kako bi se postigao ovaj zadatak. No prilikom prijenosa podataka važno je napomenuti da nije potrebno prenositi cijelu bazu podataka između web mjesta. Samo neki atributi (ili korice) koji su potrebni za spajanje trebaju se prenijeti između web lokacija kako bi se izvršavanje upita učinkovito izvršilo. Polupriključivanje je metoda koja se može koristiti za smanjenje količine podataka koji se šalju između web mjesta. U poludruživanju samo se stupac pridruživanja prenosi s jedne web lokacije na drugu, a zatim se taj preneseni stupac koristi za smanjenje veličine otpremljenih odnosa između ostalih web lokacija. Za gornji primjer, možete jednostavno prenijeti broj odjela i naziv odjeljenja s lokacijama = "New York" s mjesta 2 na mjesto 1 i izvršiti spajanje na mjestu 1 i prenijeti konačni odnos natrag na mjesto 3.samo se stupac pridruživanja prenosi s jedne web lokacije na drugu, a zatim se taj preneseni stupac koristi za smanjenje veličine otpremljenih relacija između ostalih web lokacija. Za gornji primjer možete jednostavno prenijeti broj odjela i naziv odjeljenja s lokacijama = "New York" s mjesta 2 na mjesto 1 i izvršiti spajanje na mjestu 1 i prenijeti konačni odnos natrag na mjesto 3.samo se stupac pridruživanja prenosi s jedne web lokacije na drugu, a zatim se taj preneseni stupac koristi za smanjenje veličine otpremljenih relacija između ostalih web lokacija. Za gornji primjer, možete jednostavno prenijeti broj odjela i naziv odjeljenja s lokacijama = "New York" s mjesta 2 na mjesto 1 i izvršiti spajanje na mjestu 1 i prenijeti konačni odnos natrag na mjesto 3.
Što je Bloom Join?
Kao što je ranije spomenuto, bloom join je još jedna metoda koja se koristi za izbjegavanje prijenosa nepotrebnih podataka između web lokacija prilikom izvršavanja upita u okruženjima distribuirane baze podataka. U cvjetajućem spajanju, umjesto prenošenja samog stupca za spajanje, kompaktni prikaz stupca za spajanje prenosi se između web lokacija. Bloom join koristi bloom filter koji koristi bit vektora za izvršavanje upita o članstvu. Prvo se gradi bloom filter pomoću stupca za spajanje i prenosi se između mjesta, a zatim se izvode operacije spajanja.
Koja je razlika između Semi Join i Bloom Join?
Iako se metode polu spajanja i cvjetanja koriste kako bi se smanjila količina podataka koja se prenosi između web lokacija pri izvršavanju upita u okruženju distribuirane baze podataka, bloom join smanjuje količinu prenesenih podataka (broj korpica) u usporedbi s polu spajanjem pomoću koncept cvatućih filtara koji koriste bitni vektor za određivanje postavljenog članstva. Stoga će korištenje bloom join-a biti učinkovitije od korištenja polu spajanja.