Met de rangcorrelatiecoëfficiënt van Spearman kunnen we vaststellen of twee variabelen een monotone functierelatie hebben (dat wil zeggen, wanneer het ene getal toeneemt, zal het andere getal ook toenemen, of vice versa). Om de rangcorrelatiecoëfficiënt van Spearman te berekenen, moet u gegevenssets rangschikken en vergelijken om d. te vinden2, en voer vervolgens de gegevens in de standaard of vereenvoudigde Spearman-rangcorrelatiecoëfficiëntformule in. U kunt deze coëfficiënten ook berekenen met behulp van Excel-formules of het R-commando.
Stap
Methode 1 van 3: Handmatige manier
Stap 1. Maak een tabel aan
De tabel wordt gebruikt om alle informatie op te nemen die nodig is om de Spearman Rank Correlatiecoëfficiënt te berekenen. Je hebt een tabel als deze nodig:
- Maak 6 kolommen met koppen, zoals in het voorbeeld.
- Bereid zoveel lege rijen voor als het aantal gegevensparen.
Stap 2. Vul de eerste twee kolommen in met dataparen
Stap 3. Voer de rangorde van de eerste kolom met gegevensgroepen in de derde kolom in van 1 tot n (aantal gegevens)
Geef een beoordeling van 1 voor de laagste waarde, een beoordeling van 2 voor de volgende laagste waarde, enzovoort.
Stap 4. Doe in de vierde kolom hetzelfde als in stap 3, maar dan om de gegevens in de tweede kolom te rangschikken
-
Als er twee (of meer) gegevens zijn die dezelfde waarde hebben, bereken dan de gemiddelde beoordeling van de gegevens en voer deze vervolgens in een tabel in op basis van deze gemiddelde waarde.
In het voorbeeld rechts staan er twee waarden van 5 op de beoordelingen 2 en 3. Aangezien er twee 5en zijn, zoekt u het gemiddelde van de beoordelingen. Het gemiddelde van 2 en 3 is 2,5, dus voer voor beide waarden een beoordelingswaarde van 2,5 in 5.
Stap 5. Bereken in kolom "d" het verschil tussen de twee getallen in de rangkolom
Dat wil zeggen, als de ene kolom de rang 1 heeft en de andere kolom de rang 3, is het verschil 2. (Het teken doet er niet toe, want de volgende stap is het kwadrateren van de waarde.)
Stap 6. Vier elk getal in kolom "d" en schrijf het resultaat in kolom "d2".
Stap 7. Tel alle gegevens bij elkaar op in kolom d2".
Het resultaat is d2.
Stap 8. Kies een van de volgende formules:
-
Als geen van de beoordelingen hetzelfde is als in de vorige stap, voert u deze waarde in de vereenvoudigde Spearman Rank Correlation Coefficient-formule in
en vervang "n" door het aantal gegevensparen om het resultaat te krijgen.
-
Als er een vergelijkbare rangorde is in de vorige stap, gebruikt u de standaard Spearman Rank Correlation Coefficient-formule:
Stap 9. Interpreteer de resultaten
De waarde kan variëren tussen -1 en 1.
- Als de waarde dicht bij -1 ligt, is de correlatie negatief.
- Als de waarde dicht bij 0 ligt, is er geen lineaire correlatie.
- Als de waarde dicht bij 1 ligt, is de correlatie positief.
Methode 2 van 3: Excel gebruiken
Stap 1. Maak een nieuwe kolom voor de gegevens samen met de rangorde
Als uw gegevens zich bijvoorbeeld in kolom A2:A11 bevinden, gebruikt u de formule "=RANK(A2, A$2:A$11)" en kopieert u deze naar beneden totdat deze alle kolommen en rijen bedekt.
Stap 2. Wijzig dezelfde beoordeling als beschreven in stap 3 en 4 van methode 1
Stap 3. Bereken in de nieuwe cel de correlatie tussen de twee rangkolommen met de formule "=CORREL(C2:C11, D2:D11)"
In dit voorbeeld verwijzen C en D naar de kolom waarin de rangorde staat. De nieuwe cel wordt gevuld met de Spearman Rank Correlatie.
Methode 3 van 3: R. gebruiken
Stap 1. Installeer eerst het R-programma als je dat nog niet hebt
(Zie
Stap 2. Sla uw gegevens op in CSV-vorm, plaats de gegevens waarvan u de correlatie wilt vinden in de eerste twee kolommen
Dit kunnen we doen door het menu "Opslaan als" te gebruiken.
Stap 3. Open R Editor
Als u vanaf de terminal werkt, voert u gewoon R uit. Als u vanaf het bureaublad werkt, klikt u op het R-pictogram.
Stap 4. Typ de volgende opdracht:
- d <- read.csv("NAME_OF_YOUR_CSV.csv") en druk op Enter.
- cast(rang(d[, 1]), rang(d[, 2]))
Tips
De gegevens moeten uit minimaal 5 paren bestaan zodat de trend zichtbaar is (het aantal gegevens is in het voorbeeld 3 paren alleen om de berekeningen te vereenvoudigen)
Waarschuwing
- De Spearman-rangcorrelatiecoëfficiënt identificeert alleen de sterkte van de correlatie waar de gegevens consistent stijgen of dalen. Als er een andere trend in de gegevens is, Spearman's rangcorrelatie Nee een juiste weergave zal geven.
- Deze formule is gebaseerd op de aanname dat er geen gelijke beoordelingen zijn. Als er dezelfde rangorde is als in het voorbeeld, moeten we deze definitie gebruiken: de correlatiecoëfficiënt van het vermenigvuldigingsmoment met rang.