Melangeabilité de résultats

Discussions générales concernant les mathématiques et n'entrant pas dans les catégories suivantes.
[participation réservée aux utilisateurs inscrits]
Règles du forum
Merci de soigner la rédaction de vos messages et de consulter ce sujet avant de poster. Pensez également à utiliser la fonction recherche du forum.
toitoinebzh
Utilisateur confirmé
Utilisateur confirmé
Messages : 14
Inscription : vendredi 13 juillet 2012, 11:47

Melangeabilité de résultats

Message non lu par toitoinebzh »

Bonjour,

Je poste ce message pour un problème portant sur la mélangeabilité de résultats.
Voilà un exemple de contexte, une personne A et une personne B réalise une série de mesures dans un laboratoire.
J'aimerai savoir si les résultats sont comparables/mélangeables.

N'étant pas spécialement fan de statistiques, je me suis tourné sur le test de Student et j'ai codé un bout de code en python pour me faire la main.
Le code génère 2 lots de valeurs aléatoires et compare ensuite la moyenne, l'écart type et réalise le test de Student.

Code : Tout sélectionner

from scipy import stats
import numpy as np


methodeA = np.random.normal(loc=0.0, scale=1.0, size=1000)
methodeB = np.random.normal(loc=0.0, scale=1.0, size=1000)

print("=Moyenne=")
print(np.mean(methodeA), np.mean(methodeB))

print("=Ecart type=")
print(np.std(methodeA), np.std(methodeB))

print("=Test de Student=")
res = stats.ttest_ind(methodeA, methodeB, equal_var = False)
print(res)
Autant sur le code, je m'en sors, autant sur l'interprétation, je suis moins à l'aise.
=Moyenne=
0.043277025241434154 -0.06426757952135953
=Ecart type=
0.9976377161916354 1.032751394460674
=Test de Student=
Ttest_indResult(statistic=2.367239279950603, pvalue=0.018016150418434233)
Les moyennes et écarts-types ne sont effectivement pas exactement les mêmes ce qui est prévisible.
Par contre pour le test de Student, je ne sais pas sur de le comprendre.

Ici la p-value est faible, ce qui veut dire que les écarts entre les moyennes/écarts-types observés ne sont pas dûs aux hasard ?
La statistique t reste un mystère pour moi.

Je suis preneur d'explications et aussi d'autres calculs envisageables pour juger de la mélangeabilité de résultats.
Framboise
Utilisateur chevronné
Utilisateur chevronné
Messages : 1177
Inscription : lundi 21 mai 2007, 13:57
Statut actuel : Autre
Localisation : Dordogne

Re: Melangeabilité de résultats

Message non lu par Framboise »

Hello toitoinebzh

J'ai regardé le problème mais étant un peu flemme j'ai testé le code python sur:
https://www.onlinegdb.com/online_python_compiler
Je suppose une moyenne de 0.0 et écart type de 1.0 en lisant le code source.

"Mes" résultats divergent quelque peu :
1er essai:
=Moyenne=
-0.015557970717008533 -0.013680258737069417
=Ecart type=
0.9945188282221789 0.9891891274832094
=Test de Student=
TtestResult(statistic=np.float64(-0.04231042780009032), pvalue=np.float64(0.9662554602607074), df=np.float64(1997.942311819156))

2e essai:
=Moyenne=
0.009566048038056963 0.030220379951948446
=Ecart type=
1.0170915404246001 0.9611852339950261
=Test de Student=
TtestResult(statistic=np.float64(-0.4664966073760046), pvalue=np.float64(0.6409110952905601), df=np.float64(1991.6477641611787))
C'est cohérent pour le calcul "naïf" classique moyenne/écart type.
Pour le test de Student... bof-bof d'une fois à l'autre ! Seul le df est grossièrement reproductible.
Encore faut-il supposer que les mesures aient les mêmes caractéristiques aléatoires, ce qu'implique la simulation numérique pour l'hypothèse "nulle".

Note:
La student-t distribution est utilisée en principe pour les petits échantillons, typiquement jusque 30 environ.

Quelques documentations:
https://en.wikipedia.org/wiki/Student%2 ... stribution
https://en.wikipedia.org/wiki/Student%27s_t-test
traductions: ( moins bonnes à mon avis... )
https://fr.wikipedia.org/wiki/Loi_de_Student
https://fr.wikipedia.org/wiki/Test_de_Student

Ou encore:
Numerical Recipes - The Art of Scientific Computing
https://numerical.recipes/book.html
chap 14 Statistical Description of Data p. 720->766
Les codes sources sont disponible, mais à copier à la main car la copie "Ctrl-C" est brouillée volontairement.
Un exposé clair et pointu de différentes méthodes avec leurs applications en code C.

Student's t-distribution in Statistics
https://www.geeksforgeeks.org/engineeri ... tatistics/
J'ai le virus des sciences, ça se soigne ?