spss - Wie berechne ich diese Statistiken?

Translate

Ich schreibe eine App, um die Recherche zu erleichtern, und ein Teil davon beinhaltet statistische Berechnungen. Derzeit verwenden die Forscher ein Programm namensSPSS. Ein Teil der Ausgabe, die ihnen wichtig ist, sieht folgendermaßen aus:

[Part of the SPSS output

Sie sind wirklich nur besorgt über dieFundSig.Werte. Mein Problem ist, dass ich keinen statistischen Hintergrund habe und nicht herausfinden kann, wie die Tests heißen oder wie sie berechnet werden.

Ich dachte dasFWert könnte das Ergebnis der seinF-Test, aber nachdem ich die auf Wikipedia angegebenen Schritte befolgt hatte, erhielt ich ein Ergebnis, das sich von dem unterschied, wasSPSSgibt.

This question and all comments follow the "Attribution Required."

Alle Antworten

Translate

Diese Internetseitekönnte dir ein bisschen mehr helfen. Ebenfallsdieses.

Ich arbeite aus einer ziemlich rostigen Erinnerung an einen Statistikkurs, aber hier geht nichts:

Wenn Sie eine Varianzanalyse (ANOVA) durchführen, berechnen Sie die F-Statistik tatsächlich als das Verhältnis aus den mittleren quadratischen Varianzen "zwischen den Gruppen" und den mittleren quadratischen Varianzen "innerhalb der Gruppen". Der zweite Link oben scheint für diese Berechnung ziemlich gut zu sein.

Dadurch misst die F-Statistik genau, wie leistungsfähig Ihr Modell ist, da die Varianz "zwischen den Gruppen" die Erklärungskraft und die Varianz "innerhalb der Gruppen" ein zufälliger Fehler ist. High F impliziert ein hoch signifikantes Modell.

Wie bei vielen statistischen Operationen bestimmen Sie Sig zurück. unter Verwendung der F-Statistik. Hier sind Ihre Wikipedia-Informationen etwas nützlich. Was Sie tun möchten, ist - unter Verwendung der von SPSS vorgegebenen Freiheitsgrade - den richtigen P-Wert zu finden, bei dem einF Tabellegibt Ihnen die von Ihnen berechnete F-Statistik. Der P-Wert, bei dem dies geschieht [F (Tabelle) = F (berechnet)], ist die Signifikanz.

Konzeptionell zeigt ein niedrigerer Signifikanzwert eine sehr starke Fähigkeit, die Nullhypothese abzulehnen (was für diese Zwecke bedeutet, dass Ihr Modell erklärende Kraft hat).

Tut allen Mathe-Leuten leid, wenn irgendetwas davon falsch ist. Ich werde zurückschauen, um Änderungen vorzunehmen !!!

Viel Glück. Statistik macht Spaß, nur vielleicht nicht dieser Teil. =)

Quelle
Truman Lee
Translate

Ich gehe von Ihrer Frage aus, dass Ihre Forschungskollegen den Prozess automatisieren möchten, mit dem bestimmte statistische Analysen durchgeführt werden (dh sie möchten Prozessdatensätze stapelweise verarbeiten). Sie haben zwei Möglichkeiten:

1) SPSS kann jetzt über Python (ab Version 15) skriptfähig gemacht werden. Gehen Sie zu spss.com und suchen Sie nach Python. Sie können Python-Skripte schreiben, um Datenanalysen zu automatisieren, Schlüsselwerte aus Pivot-Tabellen zu extrahieren und die Antworten dann nach Ihren Wünschen zu verarbeiten. Dies hat den Vorteil, dass ein genauer Vergleich zwischen den Ergebnissen Ihres Python-Skripts und den von Hand berechneten SPSS-Bemühungen Ihrer Mitarbeiter möglich ist. Sie müssen also keine Statistiken kennen, um diese Arbeit zu erledigen (was ein entscheidender Vorteil ist).

2) Sie können dies in R tun, einer kostenlosen Statistikumgebung, die wahrscheinlich per Skript erstellt werden kann. Dies hat den Nachteil, dass Sie Statistiken lernen müssen, um sicherzustellen, dass Sie es richtig machen.

Quelle
Translate

Statistik ist schwer :-). Nach einem Jahr des Lesens und erneuten Lesens von Büchern und Zeitungen kann ich nur mit Zuversicht sagen, dass ich die Grundlagen davon verstehe.

Möglicherweise möchten Sie vorgefertigte Bibliotheken für die von Ihnen verwendete Programmiersprache untersuchen, da es sich um viele Fallstricke in Mathematik im Allgemeinen und Statistik im Besonderen handelt (Rundungsfehler sind ein offensichtliches Beispiel).

Als Beispiel könnten Sie einen Blick darauf werfendas R-ProjektDies ist sowohl eine interaktive Umgebung als auch eine Bibliothek, die Sie aus Ihrem C ++ - Code heraus verwenden können und die unter der GPL verteilt ist (dh wenn Sie sie nur intern verwenden und nur die Ergebnisse veröffentlichen, müssen Sie Ihren Code nicht öffnen).

Quelle
Translate

Kurz gesagt: Tun Sie dies nicht von Hand, verknüpfen / verwenden Sie vorhandene Software. Und die Antwort von sain_grocen ist falsch. :(

Dies sind alles Tests für die Signifikanz von Parameterschätzungen, die normalerweise in multivariaten Antwort-Mehrfachregressionen verwendet werden. Dies wären keine einfachen Dinge, die außerhalb einer statistischen Programmierumgebung zu tun wären. Ich würde vorschlagen, entweder die Ausgabe eines bereits vorhandenen statistischen Programms abzurufen oder eines zu verwenden, mit dem Sie diesen Code verknüpfen und verwenden können.

Ich befürchte, dass die erste Antwort (sain_grocen's) Sie auf den falschen Weg führen wird. Seine Erklärung ist wahrscheinlich ein Sonderfall dessen, womit Sie sich tatsächlich befassen. Die in seinen Links erläuterte Anova bezieht sich auf eine einzelne Antwort in einem ausgewogenen Design. Dies sind nicht die F-Statistiken, die Sie sehen. Die Namen in Ihrer Ausgabe (Pillais Trace, Hotellings Trace, ...) sind einige der verfügbaren multivariaten Versionen. Sie haben unter bestimmten Annahmen F-Verteilungen. Ich kann hier kein Lehrbuch mit Material erklären. Ich würde Ihnen raten, zunächst "Applied Multivariate Statistical Analysis" von Johnson und Wichern zu betrachten

Quelle
Translate

Können Sie mehr erklären, warum SPSS selbst keine gute Lösung für das Problem ist? Wird Pivot-Tabellen als Ausgabe generiert, die schwer zu manipulieren sind? Sind es die Kosten des Programms?

F-Statistiken können sich aus einer beliebigen Anzahl bestimmter Tests ergeben. Das F ist nur eine Verteilung (lose: eine Beschreibung der "Häufigkeiten" von Wertegruppen), wie ein Normal (Gauß) oder eine Uniform. Im Allgemeinen ergeben sie sich aus Varianzverhältnissen. Meinung: Viele Statistiker (ich selbst eingeschlossen) finden F-basierte Tests instabil (Jargon: nichtrobust).

Die speziellen Ausgabestatistiken (Pillais Spur usw.) legen nahe, dass die ursprüngliche Analyse ein MANOVA-Beispiel ist, das, wie andere Poster beschreiben, ein kompliziertes und schwer zu beschaffendes Verfahren ist.

Ich vermute auch, dass dies, basierend auf der MANOVA und der Verwendung von SPSS, ein Psychologie- oder Soziologieprojekt ist ... wenn nicht, bitte aufklären. Es kann sein, dass andere, einfachere Modelle tatsächlich leichter zu verstehen und wiederholbarer sind. Wenden Sie sich an Ihre lokale statistische Beratungsgruppe der Universität, falls Sie eine haben.

Viel Glück!

Quelle
Translate

Hier ist eine Erklärung von MANOVA ouptput von einer sehr guten Seite zu Statistiken und zu SPSS:

Ausgabe mit Erklärung:http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm

Wie und warum MANOVA oder multivariates GLM durchführen: (gleicher Pfad wie oben, jedoch mit '/manova.htm' endend)

Das Schreiben von Software von Grund auf zur Berechnung dieser Ausgaben wäre sowohl langwierig als auch schwierig. Es gibt viele numerische Probleme und Matrixinversionen zu tun.

Wie Henry sagte, verwenden Sie Python-Skripte oder R. Ich würde vorschlagen, mit jemandem zusammenzuarbeiten, der SPSS kennt, wenn es um Skripte geht. Darüber hinaus kann SPSS selbst die Ausgabetabellen mithilfe von OMS in Dateien exportieren. Ein Skript in SPSS kann dies tun.

Finden Sie heraus, wer in Ihrer Forschungsgruppe SPSS kennt, und arbeiten Sie mit ihnen zusammen.

Quelle