spss - Comment calculer ces statistiques?

Translate

J'écris une application pour faciliter certaines recherches, et cela implique en partie des calculs statistiques. À l'heure actuelle, les chercheurs utilisent un programme appeléSPSS. Une partie de la sortie qui leur tient à cœur ressemble à ceci:

[Part of the SPSS output

Ils ne sont vraiment préoccupés que parFetSig.valeurs. Mon problème est que je n'ai aucune expérience en statistique et que je n'arrive pas à comprendre comment s'appellent les tests ou comment les calculer.

Je pensais queFla valeur peut être le résultat deTest F, mais après avoir suivi les étapes indiquées sur Wikipédia, j'ai obtenu un résultat différent de ce queSPSSdonne.

This question and all comments follow the "Attribution Required."

Toutes les réponses

Translate

Ce sitepourrait vous aider un peu plus. Égalementcelui-là.

Je travaille à partir d'un souvenir assez rouillé d'un cours de statistiques, mais rien n'y va:

Lorsque vous effectuez une analyse de variance (ANOVA), vous calculez en fait la statistique F comme le rapport entre les variances quadratiques moyennes «entre les groupes» et les variances quadratiques moyennes «au sein des groupes». Le deuxième lien ci-dessus semble assez bon pour ce calcul.

Cela permet à la statistique F de mesurer exactement la puissance de votre modèle, car la variance «entre les groupes» est un pouvoir explicatif et la variance «au sein des groupes» est une erreur aléatoire. Un F élevé implique un modèle hautement significatif.

Comme dans de nombreuses opérations statistiques, vous déterminez en arrière Sig. en utilisant la statistique F. Voici où vos informations Wikipédia sont légèrement utiles. Ce que vous voulez faire, c'est - en utilisant les degrés de liberté que vous donne SPSS - trouver la valeur P appropriée à laquelle unTableau Fvous donnera la statistique F que vous avez calculée. La valeur P où cela se produit [F (table) = F (calculé)] est la signification.

Conceptuellement, une valeur de signification plus faible montre une très forte capacité à rejeter l'hypothèse nulle (ce qui, à ces fins, signifie que votre modèle a un pouvoir explicatif).

Désolé pour tous les mathématiciens si tout cela est faux. Je reviendrai pour apporter des modifications !!!

Bonne chance à toi. Les statistiques sont amusantes, mais peut-être pas cette partie. =)

La source
Truman Lee
Translate

Je suppose d'après votre question que vos collègues de recherche veulent automatiser le processus par lequel certaines analyses statistiques sont effectuées (c'est-à-dire qu'ils veulent traiter par lots des ensembles de données). Vous avez deux options:

1) SPSS est désormais scriptable via python (à partir de la version 15) - allez sur spss.com et recherchez python. Vous pouvez écrire des scripts python pour automatiser les analyses de données et extraire les valeurs clés des tableaux croisés dynamiques, puis traiter les réponses comme vous le souhaitez. Cela a le mérite de permettre une comparaison exacte entre les résultats de votre script python et les efforts calculés manuellement dans SPSS de vos collaborateurs. Ainsi, vous n'aurez pas vraiment besoin de connaître de statistiques pour faire ce travail (ce qui est un avantage clé)

2) Vous pouvez le faire dans R, un environnement de statistiques gratuit, qui pourrait probablement être scripté. Cela a l'inconvénient que vous devrez apprendre des statistiques pour vous assurer que vous le faites correctement.

La source
Translate

Les statistiques sont difficiles :-). Après un an de lecture et de relecture de livres et d'articles, je ne peux que dire avec confiance que j'en comprends les bases.

Vous voudrez peut-être étudier des bibliothèques prêtes à l'emploi pour le langage de programmation que vous utilisez, car elles sont nombreuses en mathématiques en général et en statistiques en particulier (les erreurs d'arrondi en sont un exemple évident).

À titre d'exemple, vous pouvez jeter un œil àle projet R, qui est à la fois un environnement interactif et une bibliothèque que vous pouvez utiliser à partir de votre code C ++, distribué sous GPL (c'est-à-dire si vous ne l'utilisez qu'en interne et ne publiez que les résultats, vous n'avez pas besoin d'ouvrir votre code).

La source
Translate

En bref: ne le faites pas à la main, liez / utilisez un logiciel existant. Et la réponse de sain_grocen est incorrecte. :(

Ce sont tous des tests de signification des estimations de paramètres qui sont généralement utilisés dans les régressions multiples à réponse multivariée. Ce ne serait pas des choses simples à faire en dehors d'un environnement de programmation statistique. Je suggérerais soit d'obtenir la sortie d'un programme statistique préexistant, soit d'utiliser celui que vous pouvez lier et utiliser ce code.

J'ai peur que la première réponse (sain_grocen) vous conduise sur la mauvaise voie. Son explication est probablement un cas particulier de ce à quoi vous avez réellement affaire. L'anova expliqué dans ses liens est pour une seule réponse variable, dans une conception équilibrée. Ce ne sont pas les statistiques F que vous voyez. Les noms dans votre sortie (Pillai's Trace, Hotelling's Trace, ...) font partie des versions multivariées disponibles. Ils ont des distributions F selon certaines hypothèses. Je ne peux pas expliquer ici un manuel de valeur, je vous conseillerais de commencer par regarder "Applied Multivariate Statistical Analysis" de Johnson et Wichern

La source
Translate

Pouvez-vous expliquer plus en détail pourquoi SPSS lui-même n'est pas une bonne solution au problème? Est-ce que cela génère des tableaux croisés dynamiques en sortie qui sont difficiles à manipuler? Est-ce le coût du programme?

Les statistiques F peuvent provenir d'un certain nombre de tests particuliers. Le F est juste une distribution (en gros: une description des «fréquences» des groupes de valeurs), comme une normale (gaussienne), ou uniforme. En général, ils résultent de rapports de variances. Opinion: de nombreux statisticiens (moi y compris) trouvent que les tests basés sur F sont instables (jargon: non-robuste).

Les statistiques de sortie particulières (trace de Pillai, etc.) suggèrent que l'analyse originale est un exemple de MANOVA, qui, comme d'autres affiches le décrivent, est une procédure compliquée et difficile à obtenir.

Je suppose aussi que, basé sur la MANOVA, et l'utilisation de SPSS, il s'agit d'un projet de psychologie ou de sociologie ... sinon éclaircissez-vous. Il se peut que d'autres modèles plus simples soient en fait plus faciles à comprendre et plus reproductibles. Consultez le groupe de consultation statistique de votre université locale, si vous en avez un.

Bonne chance!

La source
Translate

Voici une explication de la sortie MANOVA, à partir d'un très bon site sur les statistiques et sur SPSS:

Sortie avec explication:http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm

Comment et pourquoi faire MANOVA ou GLM multivarié: (même chemin que ci-dessus, mais se terminant par '/manova.htm')

Ecrire un logiciel à partir de zéro pour calculer ces extrants serait à la fois long et difficile; il y a beaucoup de problèmes numériques et d'inversions matricielles à faire.

Comme Henry l'a dit, utilisez des scripts Python, ou R. Je suggérerais de travailler avec quelqu'un qui connaît SPSS si les scripts. De plus, SPSS lui-même est capable d'exporter les tables de sortie vers des fichiers en utilisant quelque chose appelé OMS. Un script dans SPSS peut le faire.

Découvrez qui dans votre groupe de recherche connaît SPSS et travaillez avec eux.

La source