RAPPRESENTAZIONE GRAFICA DEI DATI
- La regressione lineare -

Occupiamoci ora del metodo analitico per ricavare la miglior linea retta che interpola una serie di punti sperimentali, metodo chiamato regressione lineare.
Per semplificare la trattazione, assumeremo d'ora in poi che le incertezze si abbiano solo sulle grandezza in ordinata e che tutte le incertezze siano uguali. Altro assunto (peraltro ragionevole) che faremo č che ogni misura in y sia governata dall distribuzione di Gauss, con lo stesso parametro y per tutte le misure.

Quello che in pratica vogliamo determinare sono le due costanti A e B che determinano la retta migliore avente la forma

y = Ax + B

Se conoscessimo le costanti A e B allora per ogni singolo potremmo calcolare il corrispondente valore vero di yi come

yi = Axi + B

poichč la misura yi č governata da una distribuzione normale centrata su questo valore vero con parametro y, la probabilitą di ottenere il valore osservato yi č

dove i pedici A e B indicano che questa probabilitą dipende dai loro valori che sono incogniti. La probabilitą di ottenere il nostro insieme completo di valori osservati y1...yN č

dove l'esponente č dato da

Le migliori stime per le costanti si ottengono imponendo che la probabilitą sia massima, in quanto gli yi cono i valori effettivamente osservati: questo equivale ad imporre che la somma dei quadrati nell'esponente sia minima. Per trovare tali valori differenziamo rispetto ad A e B e poniamo le derivate uguali a zero:

e

Queste due equazioni possono essere riscritte come:

e

Tali equazioni, note anche come equazioni normali, una volta risolte, danno la stima delle costanti A e B

e

dove abbiamo introdotto l'abbreviazione

Calcolate le miglior stime delle costanti A e B dai valori misurati (xi,yi) č spontaneo chiedersi quali siano le incertezze nelle nostre stime.

Incertezza sulle costanti A e B


L'interpolazione
Il metodo dei minimi quadrati