top 30 sas interview questions
Liste over de mest populære SAS-intervjuspørsmålene med svar:
I denne artikkelen vil vi se på noen av de grunnleggende så vel som avanserte konseptene i SAS-programmering gjennom de vanligste spørsmålene og svarene fra SAS-intervjuet.
Statistisk analysesystem, ofte kjent som SAS, betraktes som et sett med flere programmer som er integrert og brukt til ulike operasjoner som Data Management, Predictive - Perspective & Descriptive Analysis, Quality Improvement, Business Analysis, Application Development, etc.
SAS sitt store antall tilpasningskomponenter, samt omfattende programmeringstilnærmingsfunksjon sammen, utfører dataanalyse og datatransformasjonsoppgaver. Den kan kjøres på ethvert operativsystem (Linux, Windows osv.), Da den er plattformuavhengig.
Mest populære SAS intervju spørsmål og svar
Her går vi ..
Q # 1) Bruk funksjonene som utføres av SAS.
Svar: SAS (Statistical Analysis System) har sin egen betydning i alle forretningsdomener.
Nedenfor er noen av de oppsummerte funksjonene som utføres av SAS:
- Datastyring og prosjektledelse
- Datavarehus
- Operasjonell forskning og beslutningsstøtte
- Informasjonsinnhenting og kvalitetsstyring
- Forretningsplanlegging
- Statistisk analyse
Q # 2) Hva er de tre komponentene i SAS-programmering?
Svar: De tre komponentene i SAS-programmering er:
- Uttalelser
- Variabler
- Datasett
Q # 3) Bruk syntaksreglene som følges i SAS-setninger.
Svar: SAS-programmet er skrevet i Editor-vinduet. Her inneholder den en rekke uttalelser etterfulgt av riktig syntaks i en rekkefølge for at SAS-programmet skal forstå det.
Noen av syntaksreglene som følges i forbindelse med uttalelsesdel i SAS er som følger:
- Slutten på en uttalelse er markert med semikolon (;).
- Et semikolon brukes også til å skille flere utsagn som vises på en enkelt linje.
- SAS-uttalelser er ikke store og små bokstaver og ekstra mellomrom før uttalelser blir automatisk fjernet.
- Kommentarer kan inkluderes i SAS-programmet for uttalelser på to forskjellige måter som:
- En linje som begynner med en stjerne (*) og slutter med semikolon (;).
- En linje som begynner med en skråstrek og en stjerne (/ *) og slutter med en stjerne og en skråstrek (* /).
Sp # 4) Hva er datatypene SAS inneholder?
Svar: 'Numerisk' og 'Karakter' er de to typene datatyper som SAS-programmet inneholder.
Q # 5) Hva er PDV og deres funksjoner?
Svar: Program Data Vector (PDV) er et logisk konsept og er definert som et minneområde der et datasett blir bygget av SAS.
Funksjonene til PDV er som følger:
- Det opprettes en database med én observasjon om gangen.
- Inngangsbufferen for å lagre dataene fra en ekstern fil opprettes på tidspunktet for kompilering.
- PDV inneholder to automatiske variabler, nemlig _N_ (viser tellingen av datatrinnet som utføres) og _ERROR_ (varsler feilen som oppstår på tidspunktet for utførelsen).
Sp # 6) Hva vet du om SAS-datasettet?
Svar: SAS-datasett er i utgangspunktet referert til som dataene som er tilgjengelige for analyse i et SAS-program. SAS-datasett er også referert til som SAS-datatabellen.
SAS-datatabellen består av to deler:
- Kolonner med variabler
- Rekker med observasjoner
Nyttig informasjon om SAS-datasettet kan oppsummeres som følger:
- SAS datasett kan lese så godt som det har innebygde datakilder for bruk som Excel, Access, etc.
- Datasettet som bare brukes i den gjeldende økten, kjøres og kastes etter at økten er avsluttet, er kjent som Midlertidig datasett.
- Datasettet som er lagret for bruk i den fremtidige økten er også kjent som det permanente datasettet.
- Det innebygde datasettet kan nås ved hjelp av denne banen Biblioteker -> Mine biblioteker-> SASHELP.
Q # 7) Forklar hvorfor dobbel trailing @@ brukes i Input Statements?
Svar: Under datatrinn innebærer iterasjon, inkludert dobbel etterfølgende @@ i Input-uttalelser, at SAS bør ha gjeldende rekord for utførelse av neste Input-setning i stedet for å bytte til den nye posten.
Q # 8) Forklar forskjellen mellom NODUP og NODUPKEY-alternativene?
Svar: For å fjerne dupliserte verdier fra tabellen, PROC SORT er i utgangspunktet kategorisert mellom to alternativer:
- NODUP
- NODUPKEY
Forskjellen mellom disse to alternativene kan sees nedenfor:
NODUPKEY | NODUP |
---|---|
Sammenligner bare BY-variabelen i datasettet. | Sammenligner alle variablene i datasettet. |
Fjerner dupliserte alternativer for verdiene til variabelen som er oppført i BY-setningen. | Identifiserer og eliminerer dupliserte observasjoner. |
Syntaks: PROC SORT DATA = readin NODUPKEY; AV variabelnavn; LØPE; | Syntaks: PROC SORT DATA = readin NODUP; AV variabelnavn; LØPE; |
Sp # 9) Hvilken kommando brukes til å utføre sortering i SAS-programmet?
Svar: PROC SORT-kommandoen brukes til å utføre sortering, det være seg på en enkelt variabel eller flere variabler. Denne kommandoen utføres på datasettet der det nye datasettet opprettes som et resultat av sortering, men det originale datasettet forblir uendret.
Syntaks:
PROC SORT DATA=original OUT=Sorted; BY variable;
Hvor,
‘Original’ refererer til det originale datasettet
‘Sortert’ refererer til resultatet som sortert datasett
‘Variabel’ refererer til kolonnen som sorteringsoperasjonen utføres på.
Sortering kan gjøres i både stigende og fallende rekkefølge.
For at datasettet skal vises i synkende rekkefølge, brukes nøkkelordet ‘Descending’ i BY-setningen med kolonnenavnet som sortering skal utføres på.
PROC SORT DATA=original OUT=Sorted; BY DESCENDING variable
Q # 10) Forklar forskjellen mellom Informat og Format med et eksempel.
Svar: Forskjellen mellom Informat og Format kan forklares som:
Finne ut mer | Format |
---|---|
Angi SAS hvordan du skal lese data i SAS-variabelen. | Angi SAS hvordan du skal vise verdier i variabelen. |
Disse brukes til å lese dataene eller ta inndata fra eksterne filer. | Disse brukes til å skrive dataene. |
Q # 11) Differensier INPUT og INFILE.
Svar: Inkludert en INFILE-setning i SAS-programmeringen identifiserer en ekstern fil som består av dataene, mens inkludert INPUT-setning i SAS-programmering beskrives variablene som brukes.
Syntaksen for INFILE:
INFILE ‘filename’;
Syntaksen for INPUT:
INPUT ‘varname1’ ‘varname2’;
Q # 12) Forklar bruken av PROC-utskrift og PROC-innhold?
Svar: PROC-trinnet i SAS-programmet brukes til å påkalle innebygde prosedyrer for å analysere dataene i datasettet.
PROC-utskrift: Sikrer at dataene i datasettet blir lest riktig.
PROC innhold: Viser informasjonen om SAS-datasettet.
Q # 13) Forklar DATA_NULL_?
Svar: Som navnet definerer, er DATA_NULL_ et datatrinn som faktisk ikke lager noe datasett.
Den brukes til:
- Opprette makrovariabler.
- Skrive utdata uten datasett.
Sp # 14) Hvordan konverteres tegnvariabel til en numerisk variabel og omvendt?
Svar: Under SAS-programmering oppstår det mange oppgaver der en tegnverdi skal konverteres til det numeriske og på samme måte skal en numerisk verdi konverteres til en tegnverdi.
SETTE() brukes til å konvertere numerisk til tegn. I dette tilfellet må kildeformatet og kildevariabeltypen alltid være like.
Eksempel:
char_var= PUT( num_var, 6.);
INPUT () brukes til å konvertere et tegn til numerisk. I dette tilfellet må kildevariabeltypen alltid være tegnvariabler.
Eksempel:
Num_var= INPUT(char_var,2.0);
Sp # 15) Hva er hensikten med _CHARACTER_ og _NUMERIC_?
Svar: I gjeldende datasett,
_KARAKTER_ definerer alle tegnvariablene som er definert for øyeblikket.
Eksempel : For å inkludere alle tegnvariablene i PROC MEANS, brukes følgende utsagn:
PROC MEANS; Var_character_; Run;
_NUMERIC_ definerer alle de numeriske variablene som er definert for øyeblikket.
Eksempel: For å inkludere alle de numeriske variablene i PROC MEANS, brukes følgende utsagn:
PROC MEANS; Var_numeric_; Run;
Q # 16) Hvilke kommandoer brukes når det gjelder å inkludere eller ekskludere spesifikke variabler i datasettet?
Svar: DROP-, KEEP- og datasettalternativer brukes til dette formålet.
Variabelen vi vil fjerne fra datatrinnet er spesifisert i DROP-setningen.
Variabelen vi vil beholde fra datatrinnet er spesifisert i KEEP-setningen.
Q # 17) Skille mellom PROC MEANS og PROC SAMMENDRAG.
Svar: Forskjellen mellom PROC MEANS og PROC SAMMENDRAG kan forstås slik:
PROC BETYR | PROC Sammendrag |
---|---|
Denne prosedyren produserer utskrevet rapport som standard i OUTPUT-vinduet. | Denne prosedyren inkluderer UTSKRIFT i erklæringen for å produsere den trykte rapporten. |
PROC MEANS som standard tar alle de numeriske variablene i analysen. | PROC SAMMENDRAG tar variablene inn i den statistiske analysen som er beskrevet i VAR-setningen. |
Q # 18) Forklar formålet med SUBSTR-funksjoner i SAS-programmering.
Svar: Når det er krav fra programmet om å abstrakte en understrenging i SAS-programmering, brukes SUBSTR-funksjonen i tilfelle en tegnvariabel.
Når en startposisjon og lengde er spesifisert, brukes denne funksjonen til å abstrahere tegnstrenger.
Syntaks: SUBSTR (char_var, start, lengde);
Spørsmål nr. 19) Nevn og beskriv noen få SAS-tegnfunksjoner som kort brukes til datarengjøring.
Svar: Få SAS-tegnfunksjoner som brukes til datarensing er vervet nedenfor:
- Komprimer (char_string) funksjonen brukes til å fjerne blanke eller noen spesifiserte tegn fra en gitt streng.
- TRIM (str) funksjonen brukes til å fjerne etterfølgende blanke fra en gitt streng.
- LOWCASE (char_string) funksjonen brukes til å konvertere alle tegnene i en gitt streng til små bokstaver.
- UPCASE (char_string) funksjonen brukes til å konvertere alle tegnene i en gitt streng til store bokstaver.
- COMPBL (str) funksjonen brukes til å konvertere flere blanke til et enkelt blankt.
Q # 20) Nevn noen måter som en 'tabelloppslag' gjøres i SAS-programmering.
Svar: I SAS-programmering kan tabelloppslagsverdiene lagres på følgende måter:
- Kode
- Array
- Hash-objekt
- Format
- Datasett
Følgende teknikker brukes til å utføre 'tabelloppslag' i henholdsvis SAS:
- VELG / NÅR eller HVIS / DEN uttalelser
- Array Index-verdi
- Hash-nøkkelverdi
- FORMAT-setning, PUT-funksjon
- Slå sammen, bli med, KEY = Alternativ
La oss se et eksempel som viser 'Code' måte å utføre tabelloppslag ved å bruke 'IF / THEN' uttalelser:
data location; set myinfo; if AreaCode='226' then Location='Ontario, Canada'; else if AreaCode='212' then Location='New York, NY'; else Location='Unknown'; run;
Q # 21) Skille mellom CEIL- og FlOOR-funksjoner.
Svar: CEIL-funksjon brukes til å avkutte numeriske verdier der den viser utdata som det minste heltallet. Med det minste heltallet, betyr her at heltallverdien er større enn / lik argumentet.
Eksempel: CEIL (12.85) viser utdata som 13.
GULV-funksjon brukes til å avkutte numeriske verdier der den viser utdataene som det største heltallet. Med største heltall, betyr her at heltallverdien er mindre enn / lik argumentet.
Eksempel: FLOOR (12.85) viser utdata som 12.
Spørsmål nr. 22) Hva er måtene Macro-variabler kan opprettes i SAS-programmering?
Svar: Vel, en rekke forskjellige teknikker kan brukes til å lage makrovariabler i SAS-programmering.
Nedenfor er de fem mest brukte metodene:
- % LET-uttalelse
- Makroparametere (så vel som posisjonelle)
- % DO-setning (iterativ)
- INTO i PROC SQL
- CALL SYMPUTX rutine
Q # 23) Forklar formålet med RETAIN-setningen.
Svar: Som betydningen av ordet 'RETAIN' betyr å beholde verdien når den er tildelt, er formålet med RETAIN-setningen den samme i SAS-programmering som den innebærer.
Når det kreves å flytte fra gjeldende iterasjon til neste av datatrinnet i et SAS-program, ber RETAIN-uttalelsen på det tidspunktet SAS om å beholde verdiene i stedet for å sette dem til manglende.
Eksempel: La oss skrive ut et program som viser utgangsverdien til 'z' fra 1 ved å bruke RETAIN-setningen.
data abc; set xyz; RETAIN z 0; z = z + 1; run;
Q # 24) Hvilken kommando brukes til å lagre logger i den eksterne filen?
Svar: TRYKKET PROSESS kommandoen brukes til å lagre logger i den eksterne filen.
loadrunner intervju spørsmål og svar for erfarne
Eksempel:
PROC PRINTTO log='C:UsersabcDownloadsLOG11.txt' new; run;
Q # 25) Nevn noen vanlige feil som vanligvis begås i SAS-programmering.
Svar: Nedenfor er noen av de vanlige feilene som vanligvis blir begått, spesielt når du er ny i dette programmeringsspråket.
- Den grunnleggende syntaksen inkluderer et semikolon på slutten av hver uttalelse, og manglende semikolon er den vanligste feilen.
- Du hopper over å sjekke loggene etter at du har sendt inn programmet.
- Kommentere feil som å unnlate å bruke kommentarer der det er nødvendig eller bruke kommentarer på en upassende måte.
- Bruker ikke riktige feilsøkingsmetoder.
Q # 26) Nevn SAS-systemalternativer for feilsøking av SAS-makroer.
Svar: For å hjelpe med å spore makrokoden så vel som SAS-koden som genereres av makroene, kan noen systemalternativer brukes.
De er:
- MLOGIC
- MPRINT
- SYMBOLER
Meldingen som genereres av disse systemalternativene, kan sees i SAS-loggen.
Q # 27) Skille mellom SAS-funksjoner og SAS-prosedyrer.
Svar: De største forskjellene kan oppdages / forstås av saken forklart for både SAS-funksjoner og prosedyrer.
Sak:
Til Funksjon , blir argumentverdien gitt eller si tatt for beregning på tvers av observasjonen som er nevnt i programerklæringen, mens i tilfelle Fremgangsmåte forventes hver observasjon å ha bare en variabel som beregningen gjøres gjennom som nevnt i eksemplet nedenfor.
La oss forstå det med eksempler:
data average; set temp; avgtemp = mean( of T1 – T24 ); run;
Her i eksemplene ovenfor blir argumentene overført til gjennomsnittsfunksjonen tatt for beregning som en observasjon.
proc sort; by month; run; proc means; by month; var avgtemp; run;
Her i eksemplet ovenfor beregner Proc-funksjonen gjennomsnittstemperaturen for ett argument som sendes som en observasjon, dvs. etter måned.
Q # 28) Hva vet du om SYMPUT og SYMGET?
Svar: De største forskjellene mellom de to er nevnt nedenfor.
SYMPUT brukes til å lagre verdien til et datasett i makrovariabelen, mens SYMGET brukes til å hente verdien fra makrovariabelen til datasettet.
Q # 29) Forklar de spesielle inngangsavgrenserne som brukes i SAS-programmering.
Svar: De spesielle inngangsavgrensningene som brukes i SAS-programmering er:
- DLM
- DSD
De brukes i uttalelsen 'INFILE' og DSD har funksjonaliteten til å ignorere avgrensningene som vises i anførselstegn.
Sp # 30) Hvilken funksjon brukes til å telle antall intervaller mellom to SAS-datoer?
Svar: Intervallfunksjon INTCK brukes til å telle antall intervaller mellom to gitte SAS-datoer.
Syntaks:
INTCK(interval,start-of-period,end-of-period)
Konklusjon
Så langt har vi sett flere spørsmål og svar som ville gitt deg en klar forståelse av SAS-programmeringskonsepter, samt gitt deg en ide om hva slags spørsmål som blir stilt i SAS-intervjuer.
Vel, hvis du ikke er kjent med SAS-programmering, vil kunnskapen om noen teknologier innen dataprogrammering og fortrolighet med SQL (Structured Query Language) være en ekstra fordel for deg for å forstå og lære SAS raskt.
Håper, du er klar til å møte ethvert SAS-intervju trygt !!