Ha gondot jelent az adatkinyerés az adattárház számára forrásrendszerekből
Az IBM InfoSphere Data Replication az IBM által kínált adatbázis replikációs megoldás, mely a forrás adatbázis oldali változásokat a logokból kiolvasva közvetíti a cél adatbázis felé.
A logokat monitorozva a változások közel valós időben jelennek meg a cél adatbázisban.
Ahogy a következőkben látható Data Replication architektúra ábrát tanulmányozva látszik (forrás: https://www.ibm.com/docs/de/idr/11.4.0?topic=replication-administering-management-console),
az Access Server felel a replikáció vezérléséért. Az Access Servert ajánlott egy önálló infrastruktúra elemre telepíteni, és a megfelelő tűzfalszabályok beállítása után kapcsolatot kialakítani a forrás és cél adatbázisokat üzemeltető szerverekkel. Utóbbiakra szükséges telepíteni az Admin Agent-et (az adott szerveren a replikációt felügyelő elem, hétköznapibb megnevezése Replication Engine).
Az Engine olvassa az adatbázis logokat, közvetíti az adatbázis változásokat az Access Server felé, mely azt továbbítja a céloldali adatbázishoz telepített Engine részére. A céloldali Engine ennek alapján implementálja a cél adatbázisban a forrásoldalon bekövetkezett insert, update, delete műveleteket.
Az egyes adatbázisok nem rendelkeznek dedikált iránnyal, azaz minden telepített Engine mind forrás-, mind céladatbázis kiszolgálásra (változásainak “másolására”) alkalmassá válik, amennyiben a tűzfal-, és lokális szabályok is biztosítják ezt.
A felhasználói oldalról egy Management Console-nak nevezett grafikus felület támogatja a replikációs beállítások elvégzését. A Management Console telepíthető ugyanarra a szerver elemre, ahol az Access Server is elérhető, de akár önálló infrastruktúra elemre is – természetesen megfelelő biztonsági beállítások után.
A Management Console felületen az alábbi feladatokat lehet végrehajtani:
A replikációnak alapvetően kétféle módszertana létezik a rendszerben:
Az IBM InfoSphere Data Replication lehetővé teszi a legkülönfélébb adatbázistípusok közötti adatmozgatás lehetőségét, de a folyamat kialakítása megköveteli az egyes oszloptípusok megfelelő beállítását, mely kompatibilitást tesz lehetővé a két különböző típusú adatbázis között.
A replikációban érintett táblák esetében elvárás, hogy bármilyen, a forrás oldalon elkövetett módosítás megvalósításra kerüljön céloldalon is, hogy a két adatbázis közötti szinkron működés megmaradhasson.
A replikáció segíti megfelelő backup rendszerek kialakítását, tehermentesítheti az éles adatbázisokat, és lehetővé teszi, hogy további analitikus rendszerek épüljenek a replikált adatbázisokra. A replikált adatbázis erőforrásai ideálisak az operatív működés kiszolgálására, úgymint adatszolgáltatás vagy további adattranszformáció, ezzel is biztosítva azt, hogy a nyers adatok integritása változatlanul megmaradjon forrásoldalon.