Que signifie "hors estimation"?

L'estimation des prix est basée sur une régression linéaire multiple, pas à pas avec analyse de la variance.
Cette méthode exige le respect d'hypothèses mathématiques dont on évalue ( a posteriori) la validité en faisant un test de normalité des résidus.
Ces tests (D'Agostino et Anderson-Darling) n'ont été positifs qu'après élimination de certains vins, réfractaires aux mathématiques, ce sont eux qui sont classés "Hors estimation".

Pourquoi deux types d'estimation

Un de mes buts premiers c'est d'offrir le maximum d'information, pour ça je privilégie les classements concernant le plus de vins possibles.
La première estimation porte sur la mote moyenne (en fait la note et ses puissances deux, trois et quatre), il permet de prendre en compte 405 vins en 2005.
Le second porte sur l'ensemble des dégustateurs, il permet de mesurer l'influence de chaque dégustateur sur le prix. Il offre un "meilleur R2" mais présente deux inconvénients:
- il porte sur un nombre réduit de vins (188 en 2005), ceux goûtés par TOUS les dégustateurs significatifs
- sauf en 2005, il ne satisfait pas aux contraintes mathématiques d'une regression linéaire.

Avertissement

Cette étude est basée sur un échantillon de vins (ou de dégustateurs), les résultats seront différents avec des échantillons différents.
Pour ceux qui sont vraiment très courageux
Regression:1982 1990 2003 2004 2005 2006 2007 2008 2009 2009 2010 2011 2012