Introducere in SPSS
Introducere in SPSS
Introducere in SPSS
SPSS
CUPRINS
OBIECTIVE........................................................................................................................3
Capitolul 1: Primii pasi in SPSS..........................................................................................4
1.1 Introducere in SPSS...................................................................................................4
1.2 Ce mai este nou la varianta SPSS 19.0 ?...................................................................5
1.3 Cele mai utilizate meniuri in SPSS............................................................................7
1.4 Meniul........................................................................................................................8
1.5 Status bar (Bara de stare)........................................................................................10
1.6 Casutele de dialog SPSS..........................................................................................10
Capitolul 2: Folosirea optiunii Help..................................................................................14
Capitoul 3: Fisierele de date..............................................................................................19
3.1 Fisierele de date.......................................................................................................19
3.2 Tipuri de fisiere de date...........................................................................................19
3.3 Deschiderea optiunii File Options...........................................................................20
3.4 Modul in care Editorul de date citeste datele din spreadsheet.................................20
3.5 Cum citeste Data Editor fisierele de tip tab-delimited.............................................22
3.6 Selectarea unei date sursa (Data Source).................................................................23
3.7 Crearea unor legaturi intre tabele............................................................................25
3.8 Tipul datelor.............................................................................................................28
3.9 Informatii despre fisiere...........................................................................................35
Capitolul 4: Data Editor.....................................................................................................38
4.1 Definirea Variabilelor (Define Variable)..................................................................39
4.2 Definirea etichetelor................................................................................................42
4.3 Definirea valorilor lipsa...........................................................................................43
4.4 Introducerea datelor................................................................................................46
4.5 Editarea datelor.......................................................................................................48
4.6 Inserarea de variabile noi.........................................................................................50
Bibliografie:.......................................................................................................................53
Graficele din tabelele pivot . Doar selectati portiunea din tabel pe care doriti sa o
afisati sub forma de grafic dati un click dreapta oriunde in spatiu selectat si
alegeti optiunea Create Graph
Draft Viewer . Puteti obtine in Draft Viewer outputuri (rezultate) care sa arate mai
bine utilizand:
Tabele cu margini imbunatatite folosind optiunile casutelor de dialog care
realizeaza linii clare si evidente pentru randuri (row), coloane si marginile
celulelor.
O aranjare mai buna a tabelelor ce se intind pe mai multe pagini si mai mult
control asupra prezentarii acestui tip de tabele.
Statistical enhancement (imbunatatirile din punct de vedere statistic). Imbunatatirile
din punct de vedere statistic aduse variantei de SPSS 9.0 presupun:
Analize profesioniste, scalari multidimensionale (ASCAL), si limbajul mAtrix
sunt acum disponibile in sistemul de baza.
Noi metode ale curbei ROC (ROC Curve) folosite pentru a evalua performanta
clasificarii schemelor in care este doar o variabila cu doua categorii ce sunt
clasificate dupa continut.
Metode ale optiunii Crosstabs imbunatatite pentru a include statistici de tipul
Cochran-Mantel-Haenszel.
Noi metode folosite de regresiile nominale (Nominal Regression) pentru a analiza
relatiile (legatura) intre variabile categoriale cu doua sau mai multe categorii si
variabile independente multiple. (disponibile in optiunea Regression Models)
File Management (gestiunea fisierelor) Noul asistent de texte (Text Wizard) usureaza
mai mult ca niciodata citirea in formate variate a fisirelor ce contin date de tip text.
1.4 Meniul
Multe din aplicatiile pe care doriti sa le efectuati in SPSS incep cu selectarile din
meniu. Fiecare fereastra in SPSS are propria bara de meniu cu selectari care se potrivesc
aplicatii din manualul de SPSS care vine alaturi de optiunile SPSS (de exemplu
Regression Models sau Advanced Models).
Pentru o intelegere de ansamblu a notiunilor de baza din SPSS consultati tutorialul
SPSS online. Din orice meniu SPSS alegeti: Help/tutorial
10
Pentru a folosi Help Index (este un buton din fereastra Help topics):
In orice fereastra alegeti: Help/Topics
Click pe butonul Index
Introduceti un termen pe care doriti sa il cautati in index
Dublu click pe elementul pe care il doriti
Optiunea Help Index , in functie de textul indrodus selecteaza explicarea din index
care se apropie cel mai tare de elementul dorit.
Utilizarea optiunii Full-text search din meniul Help:
In orice fereastra din meniu alegeti: Help/topics
Click pe butonul Find
Utilizati Find Setup Wizard (asistentul pentru setarile find) pentru a crea o
baza de data de tip text in sistemul Help
Introduceti cuvantul sau cuvintele pe care doriti sa le gasiti
Dublu click pe unul din elementele din lista pentru a-l afisa
Utilizarea optiunii Ask Me (intreaba-ma) din meniul Help:
In orice fereastra, din meniu alegeti : Help/Topics
Click pe butonul Ask me
Introduceti o intrebare sau cateva cuvinte cheie
11
12
in casuta de dialog Ooen File, selectati fisierul pe care doriti sa-l obtineti.
Click Open
3.2 Tipuri de fisiere de date
SPSS . Deschide fisiere de date salvate in format SPSS, inclusiv SPSS pentru
Windows, Macintosh, UNIX, precum si produsul DOS , SPSS/PC+.
SPSS/PC+ deschide fisiere SPSS/PC+
SYSTAT deschide fisiere de date SYSTAT
SPSS portabil deschide fisiere de date salvate in format SPSS portabil. Salvarea
unui fisier portabil dureaza mai mult decat salvarea unui fisier in format SPSS.
Excel. Deschide fisiere de tip spreadsheet salvate in Excel 4 sau versiuni
anterioare. Pentru Excel 5 sau versiuni ulterioare, utilizati Database Capture cu un
driver Excel ODBC potrivit.
Lotus 1-2-3. Deschide fisiere de date salvate in format 1-2-3 pentru versiunea
Lotus 3.0, 2.0 sau 1A.
SYLK. Deschide fisiere de date salvate in format SYLK (symbolic link), format
utilizat de unele aplicatii de tip spreadsheet.
dBASE. Deschide fisiere de format dBASE realizate in versiunile dBASE IV,
dBASE III, III Plus sau dBASE II. Fiecare varianta este o inregistrare
13
14
caractere sunt micsorate. Daca primele 8 caractere nu duc la formarea unui nume
unic, campul este dropped
Inregistrarile marcate pentru eliminare/stergere dar inca nesterse sunt incluse.
Softul creeaza o noua variabila de tip string, D_R care contine un asterisk pentru
cazurile marcate pentru stergere.
15
16
17
Pentru a constriu criteriul, aveti nevoie decel putin doua expresii si o relatie care sa fac
legatura intre ele.
Pentru crearea espresiei puneti cursorul pe casuta Expression. Puteti introduce
numele campului, constante, operatori aritmetici, functii numerice si de alt tip si
variabile logice. Alte metode de a introduce un camp intr-o casuta de criteriu
presupune dublu click pe campul din lista de campuri , tragerea campului din
Field List, sau selectarea campului din meniul drop down care este disponibil in
orice casuta expression activa.
Cele doua expresii sunt de obicei conectate printr-un operator relational cum ar fi
= sau >. Pentru a alege relatia puneti cursorul in ceula Relation si fie tastati
operatorul, fie il selectati din meniul drop down.
Functii. Sunt oferite ca si optiuni functii aritmetice, logice, string, data si timp si
SQL. Puteti selecta o functie din lista si sa o aduceti in casuta in are exprimati expresia,
sau puteti introduce orice functie SQL valida. Vedeti documentatia despre data de baze
referitor la functiile SQL valide.
Prompt for Value. Puteti intipari un prompt in interogarea dvs. Pentru a crea o
interogare parametru (parameter query). Cand utilizatorii deruleaza interogarea, vor fi
rugati sa introduca informatiile prezizate aici. Ar fi recomandat sa procedati astfel daca
aveti nevoie sa vedeti puncte de vedere diferite referitor la aceleasi date.
De exemplu poate doriti sa derulati aceeasi interogare pentru a vedea cifrele legate de
vanzari pentru quartere fiscale diferite. Plasati cursorul in orice celula Expression, si dati
click Prompt for Value pt a crea un prompt.
Crearea unei interogari parametru
Folositi casuta de dialog Prompt for Value pentru a crea un dialog ce solicita informatii
de la utilizatori de fiecare data cand cineva deruleaza interogarea dvs. Este folositor daca
doriti sa interogati aceeasi data sursa folosind criterii diferite.
Pentru a construi un prompt este necesar sa introduceti promtul string si o valoare
lipsa.Promtul string (alfanumeric) este afisat de fiecare data cand un utilizator ruleaza
intrebarea (interogarea)ta.Trebuie spacificat felul informatiei introduse si daca utilizatorul
nu selecteaza din lista ar trebui date indicatii despre cum ar trebui formata
introducerea(intrarea).De ex : Introduceti un quartil Q1 , Q2 ,Q3.
Permite utilizatorului sa selecteze din lista.
Daca acesta este verificat ,puteti limita utilizatorul la valorile plasate de dumneavoastra
aici, care sunt separate de incarcatura returnata.
18
Daca numele din campul bazelor de date nu este valid , nume unic a
variabilei,programul creaza un nume unic.Dati click pe orice celula pt a edita
numele variabilei..
Rezultate
Fereastra de dialog a rezultatelor afiseaza sintaxa SQL pt intrebarea ta.Poti copia SQL
in sintaxa Editor (nu este valabila in versiunea student) sau mai bine salvati datele.In alt
caz poti salva intrebarea pt utilizarea in viitor furnizand un nume si o cale in Save Query
din lista deja existenta(arhiva) sau dand click pe butonul Browse ,care te lasa sa specifici
un nume si o locatie folosind fereastra de dialog Save As.
Citirea fisierelor Excel 5 cu ODBC
Din meniu alege :
File
Database Capture
New query
Click Excels Files in Database Capture Wizard si apoi click Next
Selectati fisierul; Excel pe care il doritisi dati click OK. Fiecare foaie si lista
de nume in fisierul Excel este disponibila in lista Available Tables.
Trage-scapa(alege) foaia ori categoria de nume care doriti sa o cititi in lista
Retrieve Filds.
Click Finish.
Citirea fisierelor de date text
Asistentul de texte (Text Wizard) poate citi fisierele de date text formate intr-o variatete
de cai
Punct fisiere delimitate
Spatiu fisiere delimitate
Virgula- fisiere delimitate
Fixate- fisiere delimitate
Pt delimitarea fisierelor,puteti specifica si alte caractere ca delimitari intre valori si poti
specifica delimitatori multipli.
Citirea fisierelor de date text
Din meniu alege :
File
Read Text Data
Selecteaza fisierul text in fereastra de dialog Open
Urmeaza pasi din asistentul de texte pentru a defini cum se citeste fisierul de
date.
Pasul 1. din Text Wizard
19
Fisierul text esta mai intai afisat intr-o fereastra de exemplu(preview window).Poti alege
(aplica)un format predefinit (salvat deja de Text Wizard) sau urmariti pasi din T.W.(Text
Wizard) pt a specifica cum ar trebui citite datele.
Pasul 2 din Text Wizard
Acest pas furnizeaza informatii despre variabile.O variabila este similara cu un camp in
baza de date. De exemplu orice articol dintr-un chestional este o variabila.
Cum sunt variabilele tale aranjate ?
Pentru a citi corect datele Text Wizard are nevoie sa stie cum sa determine unde se
termina valoarea datelor pt urmatoarea variabila . Aranjamentul variabilelor defineste
metoda folosita pt a diferentia o variabila de urmatoarea variabila.
Delimitarea . Spatiile,virgulele,punctele, anexele sau alte caractere sunt folosite
pt a separa variabilele. Variabilele sunt inregistrate in acceasi ordine pt fiecare caz
dar nu neaparat localizate in aceeasi caseta(coloana).
Latime fixa. Fiecare variabila este inregistrata in aceeasi locatie , in acceasi
arhiva(linie ) pt fiecare caz in fisierul de date.Nici un delimitator nu este cerut
intre variabile. Chir in multe fisiere de date text generate de programele
calculatoarelor valorile datelor pot aparea ruland impreuna fara ca macar un
spatiu sa le separeu. Locatia cesetei determina care variabila este citita.
Sunt numele variabilelor incluse in topul fisierelor?
Daca prima linie a fisierului de date contine etichete decriptive pt fiecare
variabila, puteti folosi etichetele ca nume de variabila.Daca eticheta are mai mult de 8
caractere, ele sunt trunchiate (a trunchia) Daca primele 8 caractere nu formeaza un nume
unic al variabilei, numele este modificat pt a forma un nume unic al variabilei.
Pasul 3 din Text Wizard
Acest pas furnizeaza informatii despre cazuri . Un caz este similar cu o inregistrare in
baza de date . De ex fiecare respondent la un chestionar este un caz.
Pe care linie incepe primul caz de date ?
Indicati prima linie a fisierului de date care contine valorile datelor.Daca linia(linile)
de top (inceput)a fisierului de date contin etichete descriptive sau alt text care nu
reprezinta valorile datelor, aceasta nu va fi linia 1 .
Cum sunt cazurile tale reprezentate ?
Verifica cum determina T.W. unde se termina si unde incepe fiecare caz .
Fiecare linie reprezinta un caz
Fiecare linie reprezinta doar un caz. Este in mod frecvent corect pentru fiecare caz
sa se regaseasca intr-o singura linie, chiar si atunci cand asta ar insemna sa fie o linie
foarte lunga pentru fisierele de date cu un numar mare de variabile. Daca nu toate liniile
contin acelasi numar de valori de date, numarul variabilelor pentru fiecare caz este
determinat de linia cu cel mai mare numar de valori de date. Cazurile cu cele mai putine
valori de date sunt desemnate valori lipsa pentru variabilele in plus.
Un numar specific de variabile reprezinta un caz.
Numarul specific de varibile pt fiecare caz spune Text Wizard unde sa opreasca
citirea unui caz si unde sa inceapa citirea urmatorului. Multiple cazuri pot contine
aceleasi linii si cazurile pot incepe din mijlocul unei linii si sa continue pana la
urmatoarea linie. Text Wizard determina sfarsitul fiecarui caz bazandu-se pe numarul de
20
valori citite ,lund in considerare numarul de linii. Fiecare caz trebuie sa contina valori de
date(sau valori lipsa indicate prin delimitari) pentru toate variabilele, altfel fisierul de
date va fi citit incorect..
Cat de multe cazuri vrei sa importi ?
Pot fi importate toate cazurile in fisierele de date, primele n cazuri (n este un
numar pe care il specificati) sau un esantion luat la intamplare dintr-un procentaj
specificat (proportie specificata). Din moment ce alegera esantionului face (ia )o decizie
indepandenta pseudo-esantion pt fiecare caz , procentajul cazurilor selectate poate doar
aproxima proportia specificate . Cu cat sunt mai multe cazuri in baza de date cu atat mai
aproape este procentajul de cazuri fata de procentajul specificat.
Pasul 3 din Text Wizard Fisierele Latime-fixa
Acest pas furnizeaza informatii despre cazuri. Un caz este similar cu o inregistrare in
baza de date . De exemplu fiecare respondent la un chestionar este un caz.
Pe care linie incepe primul caz de date ?
Indicati prima linie a fisierului de date care contine valorile datelor. Daca
linia(liniile) de top (inceput)a fisierului de date contin etichete descriptive sau alt text
care nu reprezinta valorile datelor, aceasta nu va fi linia 1 .
Cate linii repsrezinat un caz ?
Verificati cum determina Text Wizard unde se termina fiecare caz si unde incepe
urmatorul caz. Fiecare variabila este definita de numarul de linii din cadrul unui caz si
locatia coloanei sale.Este necesar sa specificati numarul de linii pentru fiecare caz pentru
a citi corect datele.
Cate cazuri vrei sa importi ?
Poti importa toate cazurile in fisierele de date , primele n cazuri (n este un numar pe
care tu il aspecifici) sau un esantion luat la intamplare dintr-un procentaj specificat
(proportie specificata).Din moment ce alegera esantionului face (ia )o decizie
indepandenta pseudo-esantion pt fiecare caz , procentajul cazurilor selectate poate doar
aproxima proportia specificate . Cu cat sunt mai multe cazuri in baza de date cu atat mai
aproape este procentajul de cazuri fata de procentajul specificat.
21
22
23
24
25
Dati dublu click pe numele variabilei din capatul coloanei sau dati click oriunde
in teritoriul coloanei pentru variabila , iar din meniu alegeti: Data/ Define
Variable
Introduceti numele unei variabile
Selectati nivelul de masurare
Dati click pe Label (eticheta) pentru a aloca(stabili) etichetele variabilelor si
valoarea etichetelor variabilelor
Dati clik pe Missing Values(valorile lipsa) pentru a specifica(aloca) coduri
valorilor lipsa.
Dati click pe Column Format (formatul coloanei) pentru a schimba (a modifica)
latimea coloanei sau alinierea ei (pozitia aliniatului).
Numele variabilei (Variable Name)
Se tine cont de urmatoarele reguli in cazul stabilirii numelui unei variabile :
Numele trebuie neaparat sa inceapa cu o litera . Caracterele care urmeaza pot fi
litere,cifre,perioade sau simboluri @,#,_, or $.
Numele variabilelor nu se pot determina cu o perioada
Numele variabilelor care se termina cu _ (underscape) trebuie evitate(pentru a
evita conflictul cu variabilele create automat de unele proceduri)
Lungimea numelui unei variabile nu trebuie sa depaseasca mai mult de 8 caractere
Nu pot fi folosite (utilizate) spatii sau caractere speciale (de exemplu !,?, si *)
Numele fiecarei variabile trebuie sa fie unic , dublarea nu este permisa (nu este
permisa aparitia a doua variabile cu acelasi nume). Numele variabilelor nu sunt
cazuri(situatii) usoare.Numele NEWVAR , NewVar si newvar sunt considerate
toate identice.
Definirea Variabilelor : Masurarea
Se poate specifica nivelul de masurare ca si scala (date numerice pe un interval sau pe o
scala raport), ordinal sau nominal. Datele nominale si ordinale pot fi de asemenea
string(alfanumerice) sau numerice. Modalitatea de masurare este rele vanta doar pentru :
Folosirea graficelor care indentifica variabilele scala sau categoriale .Variabilele
nominale si ordinale sunt ambele tratate ca si variabile categoriale.
Fisierele de date in format SPSS folosite cu Answer Tree (arbore raspuns)
Pentru fisierele de date in format SPSS create in versiune mai veche de SPSS
(versiuni anterioare de SPSS) se aplica urmatoarele reguli :
Variabilele string(alfanumerice) sunt stabilite nominale.
Variabilele string si cele numerice cu valori definite ale etichetelor sunt stabilite
ordinale.
Variabilele numerice fara valorile etichetelor definite dar cu un numar mai mic de
valori sunt stabilite ordinale
Variabilele numerice fara valorile etichetelor definite dar cu un numar mai mare
de valori unice sunt stabilite scale(de tip scala)
26
27
28
29
Templates
Templates ofera o metoda pentru crearea si aplicarea unei variabile definta
templates(sablon)
Crearea unei variabile template
Activati fereastra Data Editor
Din meniu alegeti :
Data
Templates
Dati click pe Define in casuta de dialog Templete
Selectati atributele pe care doriti sa le definiti
Introduceti un nume template
Apoi dati click pe Add
Modificarea unei variabile Template
Activati fereastra de dialog Data Editor
Din meniu alegeti : Data / Templates
Alegeti Template din lista numerelor template
Click Define
Selectati atributele pe care doriti sa le definiti
Apoi dati click pe Change
Aplicarea unei variabile template
Selectati variabila sau variabilele din Data Editor (dati click pe numele variabilei
din capatul coloanei )
Din meniu alegeti : Data / Templates
Selectati template din lista de nume template
Verificati una sau mai multe atribute de definire a variabilelor pe care doriti sa le
aplicati
Dati click pe OK pentru a aplica template-ul variabilelor selectate.
30
31
32
Valorile data si numeric sunt transformate intr-un numar de secunde in celula activa in
unul din formatele numeric(de exemplu numeric , dolar punct sau virgula). De cand
datele sunt memorate intern ca numer de secunde, din 14 oct. 1582, transformarea datelor
in valori numerice poate produce niste numere extrem de mari . De exemplu data
10/29/91 este transformata in valoarea numerica de 12,908,073,600.
Transformarea datelor numerice in date sau timp
Valorile numerice sunt transformate in date sau timp daca valoarea reprezinta un numar
de secunde care (produce) creaza o data sau un timp real .Pentru date ,valorile numerice
mai mic decat 86,400 sunt atribuite (transformate,directionate) sistemului valorilor lipsa.
Inserarea noilor cazuri .
Introducerea unei date intr-o celula de pe un rand gol creaza automat un caz nou .
Editorul de date (meniul Data Editor) insereaza (introduce)sistemul valori lipsa pentru
toate variabilele cazului respectiv.Daca mai sunt alte randuri goale intre cazul nou si
cazurile existente , randurile goale devin de asemenea cazuri noi cu sitemul valori lipsa
pentru toate variabilele.
De asemenea puteti insera cazuri noi printre cazurile deja existente.
Inserarea unui nou caz printre cazurile existente.
Selectati orice celula de pe rand dedesubt de locul in care doriti sa inserati un nou
caz
Din meniu alegeti : Data / Insert Case
Un nou rand este inserat pentru cazul si pentru toate variabilele primite in sistemul
valorilor lipsa .
34
Bibliografie:
Grama A., Jaba E. Analiza statistica cu SPSS sub Windows, Editura
Polirom, Bucuresti, 2004
35