3 manieren om de rangcorrelatiecoëfficiënt van Spearman te berekenen

Inhoudsopgave:

3 manieren om de rangcorrelatiecoëfficiënt van Spearman te berekenen
3 manieren om de rangcorrelatiecoëfficiënt van Spearman te berekenen

Video: 3 manieren om de rangcorrelatiecoëfficiënt van Spearman te berekenen

Video: 3 manieren om de rangcorrelatiecoëfficiënt van Spearman te berekenen
Video: How to Calculate the Circumference of a Circle 2024, November
Anonim

Met de rangcorrelatiecoëfficiënt van Spearman kunnen we vaststellen of twee variabelen een monotone functierelatie hebben (dat wil zeggen, wanneer het ene getal toeneemt, zal het andere getal ook toenemen, of vice versa). Om de rangcorrelatiecoëfficiënt van Spearman te berekenen, moet u gegevenssets rangschikken en vergelijken om d. te vinden2, en voer vervolgens de gegevens in de standaard of vereenvoudigde Spearman-rangcorrelatiecoëfficiëntformule in. U kunt deze coëfficiënten ook berekenen met behulp van Excel-formules of het R-commando.

Stap

Methode 1 van 3: Handmatige manier

Tabel_338
Tabel_338

Stap 1. Maak een tabel aan

De tabel wordt gebruikt om alle informatie op te nemen die nodig is om de Spearman Rank Correlatiecoëfficiënt te berekenen. Je hebt een tabel als deze nodig:

  • Maak 6 kolommen met koppen, zoals in het voorbeeld.
  • Bereid zoveel lege rijen voor als het aantal gegevensparen.
Tabel2_983
Tabel2_983

Stap 2. Vul de eerste twee kolommen in met dataparen

Tabel3_206
Tabel3_206

Stap 3. Voer de rangorde van de eerste kolom met gegevensgroepen in de derde kolom in van 1 tot n (aantal gegevens)

Geef een beoordeling van 1 voor de laagste waarde, een beoordeling van 2 voor de volgende laagste waarde, enzovoort.

Tabel4_228
Tabel4_228

Stap 4. Doe in de vierde kolom hetzelfde als in stap 3, maar dan om de gegevens in de tweede kolom te rangschikken

  • Mean_742
    Mean_742

    Als er twee (of meer) gegevens zijn die dezelfde waarde hebben, bereken dan de gemiddelde beoordeling van de gegevens en voer deze vervolgens in een tabel in op basis van deze gemiddelde waarde.

    In het voorbeeld rechts staan er twee waarden van 5 op de beoordelingen 2 en 3. Aangezien er twee 5en zijn, zoekt u het gemiddelde van de beoordelingen. Het gemiddelde van 2 en 3 is 2,5, dus voer voor beide waarden een beoordelingswaarde van 2,5 in 5.

Tabel5_263
Tabel5_263

Stap 5. Bereken in kolom "d" het verschil tussen de twee getallen in de rangkolom

Dat wil zeggen, als de ene kolom de rang 1 heeft en de andere kolom de rang 3, is het verschil 2. (Het teken doet er niet toe, want de volgende stap is het kwadrateren van de waarde.)

Tabel6_205
Tabel6_205

Stap 6. Vier elk getal in kolom "d" en schrijf het resultaat in kolom "d2".

Stap 7. Tel alle gegevens bij elkaar op in kolom d2".

Het resultaat is d2.

Stap7_812
Stap7_812

Stap 8. Kies een van de volgende formules:

  • Als geen van de beoordelingen hetzelfde is als in de vorige stap, voert u deze waarde in de vereenvoudigde Spearman Rank Correlation Coefficient-formule in

    Stap8_271
    Stap8_271

    en vervang "n" door het aantal gegevensparen om het resultaat te krijgen.

    Stap9_402
    Stap9_402
  • Als er een vergelijkbare rangorde is in de vorige stap, gebruikt u de standaard Spearman Rank Correlation Coefficient-formule:

    Spearman
    Spearman

Stap 9. Interpreteer de resultaten

De waarde kan variëren tussen -1 en 1.

  • Als de waarde dicht bij -1 ligt, is de correlatie negatief.
  • Als de waarde dicht bij 0 ligt, is er geen lineaire correlatie.
  • Als de waarde dicht bij 1 ligt, is de correlatie positief.

Methode 2 van 3: Excel gebruiken

Stap 1. Maak een nieuwe kolom voor de gegevens samen met de rangorde

Als uw gegevens zich bijvoorbeeld in kolom A2:A11 bevinden, gebruikt u de formule "=RANK(A2, A$2:A$11)" en kopieert u deze naar beneden totdat deze alle kolommen en rijen bedekt.

Stap 2. Wijzig dezelfde beoordeling als beschreven in stap 3 en 4 van methode 1

Stap 3. Bereken in de nieuwe cel de correlatie tussen de twee rangkolommen met de formule "=CORREL(C2:C11, D2:D11)"

In dit voorbeeld verwijzen C en D naar de kolom waarin de rangorde staat. De nieuwe cel wordt gevuld met de Spearman Rank Correlatie.

Methode 3 van 3: R. gebruiken

Stap 1. Installeer eerst het R-programma als je dat nog niet hebt

(Zie

Stap 2. Sla uw gegevens op in CSV-vorm, plaats de gegevens waarvan u de correlatie wilt vinden in de eerste twee kolommen

Dit kunnen we doen door het menu "Opslaan als" te gebruiken.

Stap 3. Open R Editor

Als u vanaf de terminal werkt, voert u gewoon R uit. Als u vanaf het bureaublad werkt, klikt u op het R-pictogram.

Stap 4. Typ de volgende opdracht:

  • d <- read.csv("NAME_OF_YOUR_CSV.csv") en druk op Enter.
  • cast(rang(d[, 1]), rang(d[, 2]))

Tips

De gegevens moeten uit minimaal 5 paren bestaan zodat de trend zichtbaar is (het aantal gegevens is in het voorbeeld 3 paren alleen om de berekeningen te vereenvoudigen)

Waarschuwing

  • De Spearman-rangcorrelatiecoëfficiënt identificeert alleen de sterkte van de correlatie waar de gegevens consistent stijgen of dalen. Als er een andere trend in de gegevens is, Spearman's rangcorrelatie Nee een juiste weergave zal geven.
  • Deze formule is gebaseerd op de aanname dat er geen gelijke beoordelingen zijn. Als er dezelfde rangorde is als in het voorbeeld, moeten we deze definitie gebruiken: de correlatiecoëfficiënt van het vermenigvuldigingsmoment met rang.

Aanbevolen: