Que signifie "hors estimation"?
L'estimation des prix est basée sur une
régression linéaire multiple, pas à pas avec
analyse de la variance.
Cette méthode exige le respect d'hypothèses mathématiques dont on évalue ( a posteriori) la validité en faisant un test de normalité des résidus.
Ces tests (
D'Agostino et
Anderson-Darling) n'ont été positifs qu'après élimination de certains vins, réfractaires aux mathématiques, ce sont eux qui sont classés
"Hors estimation".
Pourquoi deux types d'estimation
Un de mes buts premiers c'est d'offrir le maximum d'information, pour ça je privilégie les classements concernant le plus de vins possibles.
La première estimation porte sur la mote moyenne (en fait la note et ses puissances deux, trois et quatre), il permet de prendre en compte 405 vins en 2005.
Le second porte sur l'ensemble des dégustateurs, il permet de mesurer l'influence de chaque dégustateur sur le prix. Il offre un "meilleur R
2" mais présente deux inconvénients:
- il porte sur un nombre réduit de vins (188 en 2005), ceux goûtés par TOUS les dégustateurs significatifs
- sauf en 2005, il ne satisfait pas aux contraintes mathématiques d'une regression linéaire.