how perform etl testing using informatica powercenter tool
Det er et kjent faktum at ETL-testing er en av de avgjørende aspektene ved enhver Business Intelligence (BI) basert applikasjon. For å få kvalitetssikring og aksept for å gå i virksomhet, bør BI-søknaden testes i god tid.
Det primære målet med ETL-testing er å sikre at ER ekstrakt, T ransform & L oad-funksjonalitet fungerer i henhold til forretningskravene og synkronisert med ytelsesstandardene.
Før vi graver i ETL-testing med Databehandling , er det viktig å vite hva ETL og Informatica er.
Hva du vil lære:
- Hva du lærer i denne ETL-opplæringen:
- Informatica PowerCenter ETL testverktøy:
- Forstå ETL-testing spesifikt for Informatica:
- Klassifisering av ETL-testing i Informatica:
- Fordeler med å bruke Informatica som et ETL-verktøy:
- Noen nyttige tips for å hjelpe deg med Informatica ETL-testing:
- Konklusjon:
- Anbefalt lesing
Hva du lærer i denne ETL-opplæringen:
- Grunnleggende om ETL, Informatica & ETL testing.
- Forstå ETL-testing spesifikt for Informatica.
- Klassifisering av ETL-testing i Informatica.
- Eksempel på testtilfeller for Informatica ETL-testing.
- Fordeler med å bruke Informatica som en ETL-verktøy .
- Tips & triks som hjelper deg med å teste.
I databehandling refererer Extract, Transform, Load (ETL) til en prosess i databasebruk og spesielt i datalagring som utfører:
- Datautvinning - Henter ut data fra homogene eller heterogene datakilder.
- Datatransformasjon - Formaterer dataene til ønsket type.
- Datainnlasting - Flytt og lagre dataene til et permanent sted for langvarig bruk.
Informatica PowerCenter ETL testverktøy:
Informatica PowerCenter er et kraftig ETL-verktøy fra Informatica Corporation. Det er en enkelt enhetlig dataintegrasjonsplattform for bedrifter for tilgang til, oppdagelse og integrering av data fra praktisk talt ethvert forretningssystem, i alle
Det er en enkelt enhetlig dataintegrasjonsplattform for bedrifter for å få tilgang til, oppdage og integrere data fra praktisk talt ethvert forretningssystem, i hvilket som helst format og levere disse dataene i hele virksomheten med hvilken som helst hastighet. Gjennom Informatica PowerCenter , lager vi arbeidsflyter som utfører ETL-operasjoner fra ende til annen.
Last ned og installer Informatica PowerCenter:
For å installere og konfigurere Informatica PowerCenter 9.x, bruk koblingen nedenfor som har trinnvise instruksjoner:
=> Informatica PowerCenter 9 Installasjons- og konfigurasjonsveiledning
Forstå ETL-testing spesifikt for Informatica:
ETL-testere har ofte relevante spørsmål om hva man skal teste i Informatica og hvor mye testdekning er nødvendig?
La meg ta deg gjennom en omvisning om hvordan du utfører ETL-testing spesifikt for Informatica.
De viktigste aspektene som egentlig skal dekkes i Informatica ETL-testing er:
- Testing av funksjonaliteten til Informatica-arbeidsflyten og dens komponenter; alle transformasjonene som er brukt i de underliggende kartlegginger.
- For å sjekke datafullstendigheten (dvs. sikre om de projiserte dataene blir lastet til målet uten avkorting og tap av data),
- Bekrefte om dataene blir lastet til målet innen estimerte tidsgrenser (dvs. evaluere ytelsen til arbeidsflyten),
- Sikre at arbeidsflyten ikke tillater at noen ugyldige eller uønskede data lastes inn i målet.
Klassifisering av ETL-testing i Informatica:
For bedre forståelse og brukervennlighet av testeren kan ETL-testing i Informatica deles inn i to hoveddeler -
hvordan du fjerner et element fra en matrise i java
# 1) Testing på høyt nivå
# 2) Detaljert testing
For det første i testing på høyt nivå:
- Du kan sjekke om Informatica-arbeidsflyten og relaterte objekter er gyldige eller ikke.
- Kontroller om arbeidsflyten blir fullført når den kjører.
- Bekreft om alle nødvendige økter / oppgaver blir utført i arbeidsflyten.
- Valider om dataene lastes inn i ønsket målkatalog og med forventet filnavn (i tilfelle arbeidsflyten lager en fil), etc.
I et nøtteskall kan du si at testing på høyt nivå inkluderer alle de grunnleggende sunnhetssjekkene.
Kommer til neste del dvs. detaljert testing i Informatica , vil du gå i dybden for å validere om logikken implementert i Informatica fungerer som forventet når det gjelder resultater og ytelse.
- Du må utføre validering av utdataene på feltnivå som vil bekrefte at hver transformasjon fungerer bra
- Kontroller om antall poster på hvert nivå av prosessering og til slutt om målet er som forventet.
- Overvåke grundig elementer som kildekvalifisering og mål i kilde / målstatistikk for økten
- Forsikre deg om at løpetiden for Informatica-arbeidsflyten er på nivå med beregnet kjøretid.
For å oppsummere kan vi si at den detaljerte testingen inkluderer en streng validering av Informatica-arbeidsflyten og den tilhørende dataflyten.
La oss ta et eksempel her:
Vi har en flat fil som inneholder data om forskjellige produkter. Den lagrer detaljer som navnet på produktet, beskrivelsen, kategorien, utløpsdatoen, prisen osv.
Mitt krav er å hente hver produktpost fra filen, generere en unik produkt-ID som tilsvarer hver post og laste den inn i måldatabasetabellen. Jeg må også undertrykke produktene som enten tilhører kategorien ‘C’ eller hvis utløpsdato er mindre enn dagens dato.
Si, den flate filen min (kilde) ser slik ut:
(Merk:Klikk på et hvilket som helst bilde for forstørret visning)
Basert på kravene mine angitt ovenfor, skal databasetabellen min (Target) se slik ut:
Tabellnavn: Tbl_Product
Prod_ID (primær nøkkel) | Produktnavn | Prod_description | Prod_category | Prod_utløpsdato | Prod_pris |
---|---|---|---|---|---|
1001 | ABC | Dette er produkt ABC. | M | 14.08.2017 | 150 |
1002 | DEF | Dette er produkt DEF. | S | 06.10.2018 | 700 |
1003 | PQRS | Dette er produkt PQRS. | M | 23.5.2019 | 1500 |
Nå, si, vi har utviklet en Informatica-arbeidsflyt for å få løsningen for ETL-kravene mine.
Den underliggende Informatica-kartleggingen vil lese data fra den flate filen, sende dataene gjennom en rutertransformasjon som vil forkaste rader som enten har produktkategori som 'C' eller utløpsdato, så bruker jeg en sekvensgenerering for å lage den unike primærnøkkelen verdier for Prod_ID-kolonnen i produkttabellen.
Til slutt vil postene bli lastet til produkttabellen som er målet for min Informatica-kartlegging.
Eksempler:
Nedenfor er eksempler på testtilfeller for scenariet forklart ovenfor.
Du kan bruke disse testtilfellene som en mal i Informatica-testprosjektet og legge til / fjerne lignende testtilfeller, avhengig av arbeidsflytens funksjonalitet.
# 1) Test Case ID: T001
Test Case Formål: Bekreft arbeidsflyt - (arbeidsflytnavn)
Test prosedyre:
- Gå til arbeidsflytbehandling
- Åpne arbeidsflyten
- Arbeidsflytmeny-> klikk på valider
Inngangsverdi / testdata: Kilder og mål er tilgjengelige og koblet sammen
Kilder: (alle kildeforekomster navn)
Kartlegginger: (alle kartleggingsnavn)
Mål: (alle navn på målinstanser)
Økt: (navn på alle økter)
Forventede resultater: Melding i arbeidsfeltbehandlerens statuslinje: “Arbeidsflyt (arbeidsflytnavn) er gyldig”
Faktiske resultater: Melding i arbeidsfeltbehandlerens statuslinje: “Arbeidsflyt (arbeidsflytnavn) er gyldig”
Merknader:Sende
Tester Kommentarer:
# 2) Test-saks-ID: T002
Test Case Formål: For å sikre om arbeidsflyten kjører
Test prosedyre:
- Gå til arbeidsflytbehandling
- Åpne arbeidsflyten
- Høyreklikk i arbeidsflytdesigner og velg Start arbeidsflyt
- Sjekk status i Workflow Monitor
Inngangsverdi / testdata: Samme som testdata for T001
Forventede resultater: Melding i utgangsvinduet i Workflow Manager: Oppgaveoppdatering: (workflow_name) (Succeeded)
Faktiske resultater: Melding i utgangsvinduet i Workflow Manager: Oppgaveoppdatering: (workflow_name) (Succeeded)
Merknader:Sende
Tester Kommentarer: Arbeidsflyten lyktes
Merk: Du kan enkelt se arbeidsflytens løpestatus (mislyktes / lykkes) i arbeidsflytmonitor som vist i eksemplet nedenfor. Når arbeidsflyten er fullført, gjenspeiles status automatisk i arbeidsflytmonitoren.
I skjermbildet ovenfor kan du se starttidspunktet og sluttiden for arbeidsflyten, samt statusen som vellykket.
# 3) Test Case ID: T003
Test Case Formål: For å validere om ønsket antall poster blir lastet inn til målet
Test prosedyre: Når arbeidsflyten har kjørt vellykket, går du til måltabellen i databasen
Sjekk antall rader i måldatabasetabellen
Inngangsverdi / testdata: 5 rader i kildefilen
Mål: databasetabell - (Tbl_Product)
Spørring som skal kjøres i SQL-server: Velg antall (1) fra (Tbl_Product)
hvordan å åpne en .dat fil?
Forventede resultater: 3 rader valgt
Faktiske resultater: 3 rader valgt
Merknader:Sende
Tester Kommentarer:
# 4) Test-saks-ID: T004
Test Case Formål: For å sjekke om sekvensgenerator i Informatica-kartlegging fungerer fint for å fylle ut (primærnøkkel_kolonne_navn f.eks. Prod_ID) kolonne
Test prosedyre: Når arbeidsflyten har kjørt vellykket, går du til måltabellen i databasen
Sjekk den unike sekvensen som genereres i kolonne Prod_ID
Inngangsverdi / testdata: verdien for Prod_ID er tom for hver rad i kildefilen
Sekvensgenerator kartlagt til Prod_ID-kolonnen i kartleggingen
Sekvensgeneratorens startverdi satt til 1001
Mål: databasetabell- (Tbl_Product) åpnet i SQL Server
Forventede resultater: Verdi fra 1001 til 1003 fylt ut mot hver rad for Prod_ID-kolonnen
Faktiske resultater: Verdi fra 1001 til 1003 fylt ut mot hver rad for Prod_ID-kolonnen
Merknader:Sende
Tester Kommentarer:
# 5) Test-saks-ID: T005
hvordan man skriver manuelle testsaker med et eksempel
Test Case Formål: For å validere om rutetransformasjon fungerer bra for å undertrykke poster i tilfelle produktkategorien er 'C' eller produktet er utløpt.
Test prosedyre: Når arbeidsflyten har kjørt vellykket, går du til måltabellen i databasen
Kjør spørringen på måltabellen for å sjekke om de ønskede postene er blitt undertrykt.
Inngangsverdi / testdata: 5 rader i kildefilen
Mål: databasetabell - (Tbl_Product)
Spørring som skal kjøres i SQL-server: Velg * fra produkt der Prod_category = ’C’ eller Prod_expiry_date< sysdate ;
Forventede resultater: ingen rader valgt
Faktiske resultater: ingen rader valgt
Merknader:Sende
Tester Kommentarer: (hvis noen)
# 6) Test Case ID: T006
Test Case Formål: For å sjekke ytelsen til arbeidsflyten ved å registrere kjøretidens arbeidsflyt.
Test prosedyre:
- Åpne arbeidsflytmonitoren og kjør som ble gjort som en del av T001.
- Registrer starttid og sluttid for arbeidsflyten.
- Beregn total kjøretid ved å trekke starttid fra sluttid.
Inngangsverdi / testdata: Arbeidsflyten har kjørt vellykket
Starttid for arbeidsflyt i skjermen
Sluttid for arbeidsflyten i skjermen.
Forventede resultater: 2 min 30 sek
Faktiske resultater: 2 min 15 sek
Merknader:Sende
Tester Kommentarer: Vurderer testen som 'Bestått' i tilfelle den faktiske løpetiden er +/- 10% av forventet løpetid.
# 7) Test Case ID: T007
Test Case Formål: Å validere data på måltabellkolonnivå for å sikre at det ikke er datatap.
Test prosedyre: Når arbeidsflyten har kjørt vellykket, går du til SQL Server.
Kjør spørringen på måltabellen for å kontrollere at det ikke er datatap.
Inngangsverdi / testdata: Arbeidsflyten har kjørt vellykket
Ett eksempel på post fra kilde flat fil.
SQL-spørring: Velg Topp 1 * fra Tbl_Patient;
Forventede resultater:
1 rad returnert
Prod_ID (primær nøkkel) | Produktnavn | Prod_description | Prod_category | Prod_utløpsdato | Prod_pris |
---|---|---|---|---|---|
1001 | ABC | Dette er produkt ABC. | M | 14.08.2017 | 150 |
Faktiske resultater:
1 rad returnert.
Prod_ID (primær nøkkel) | Produktnavn | Prod_description | Prod_category | Prod_utløpsdato | Prod_pris |
---|---|---|---|---|---|
1001 | ABC | Dette er produkt ABC. | M | 14.08.2017 | 150 |
Merknader:Sende
Tester Kommentarer: Vurderer testen som 'Bestått' i tilfelle den faktiske løpetiden er +/- 10% av forventet løpetid.
Fordeler med å bruke Informatica som et ETL-verktøy:
Informatica er et populært og vellykket ETL-verktøy fordi:
- Den har en høy 'go live' suksessrate (nesten 100%)
- Informatica har muligheten til å muliggjøre Lean Integration.
- Det er et rimelig verktøy sammenlignet med andre ETL-verktøy.
- Den leveres med intern jobbplanlegger. Så det er ikke nødvendig å bruke tredjepartsplanlegger separat som noen andre ETL-verktøy gjør.
- Enkel opplæring og tilgjengelighet av verktøy har gjort Informatica mer populært.
Noen nyttige tips for å hjelpe deg med Informatica ETL-testing:
- Generer testdataene før du utfører testscenariene.
- Testdataene skal være synkronisert med testsaken de brukes til.
- Forsikre deg om at du har dekket alle de tre scenariene - ingen data sendes inn, ugyldige data sendes inn og gyldige data sendes inn som input til Informatica-arbeidsflyten.
- Sørg for å teste at alle nødvendige data blir lastet for å målrette helt. For dette kan du bruke test case - T003 beskrevet ovenfor som et eksempel.
- Det er veldig viktig å teste at arbeidsflyten utfører alle datatransformasjoner riktig i henhold til forretningsregler.
- Jeg vil foreslå at for hver transformasjon som brukes i Informatica-kartleggingen, bør du ha en sjekkliste for å verifisere utdataene mot den. På den måten kan du enkelt rapportere feil hvis noen transformasjon ikke fungerer bra.
Konklusjon:
Så vi har sett i detalj noen av eksempler på testtilfeller som kan brukes som mal for å dekke ETL-testing i Informatica. Som jeg nevnte tidligere, kan du legge til / fjerne / endre disse testtilfellene avhengig av scenariet du har i prosjektet.
Som jeg nevnte tidligere, kan du legge til / fjerne / endre disse testtilfellene avhengig av scenariet du har i prosjektet.
Informatica PowerCenter er et fundament for alle dataintegrasjonsaktiviteter.
Du kan enkelt utføre skriptfri automatisert testing av data som er kopiert til test-, utviklings- eller produksjonsmiljø, og det er grunnen til at PowerCenter er det mest populære ETL-verktøyet i våre dager.
Anbefalt lesing => ETL vs. DB Testing - En nærmere titt på ETL Testing Behov
Om forfatteren: Dette er en gjesteartikkel av Priya K. Hun har 4+ års praktisk erfaring med å utvikle og støtte Informatica ETL-applikasjoner.
Legg gjerne ut spørsmål / kommentarer om dette ETL-verktøyet.
Anbefalt lesing
- Beste verktøy for testing av programvare 2021 (QA Test Automation Tools)
- Hvordan utføre backend-testing
- ETL Testing Intervju Spørsmål og svar
- ETL Testing Data Warehouse Testing Tutorial (En komplett guide)
- Testing Primer eBook Download
- ETL vs DB Testing - En nærmere titt på ETL Testing Need, Planning og ETL Tools
- Lastetesting ved hjelp av LoadUI - Et gratis og åpen kildekode lastetestingverktøy
- Topp 10 ETL-testverktøy i 2021