Per introdurre la distribuzione binomiale ricorriamo ad un
esempio.
Supponiamo che tre persone (Francesca, Luigi e Tiziano)
escono ciascuno dalla loro casa per andare a prendere il medesimo
autobus e che ciascuno di essi abbia probabilità pari a p
di riuscire ad arrivare in tempo alla fermata (e ovviamente
probabilità 1-p di perdere l'autobus): ci si chiede quale
sia la probabilità che due dei tre personaggi in questione
riesca nell'intento. 
Cominciamo col notare che si richiede la probabilità che due prendano l'autobus, senza specificare quali: in questo modo l'evento due persone prendono l'autobus si può verificare in tre modi diversi ossia
 Dunque l'evento almeno in due prendono l'autobus, che
denoteremo 
, sarà
rappresentabile come 
 
 
 dove F, L e T sono rispettivamente
Francesca, Luigi e Tiziano che prendono l'autobus, mentre 
, 
 e 
 corrispondono ognuno al rispettivo
personaggio deluso per aver perso l'autobus.
Potendo inoltre considerare i tre personaggi (eventi) indipendenti, per
i teoremi della somma e del
prodotto delle
probabilità, la probabilità dell'evento 
 sarà: 
 
 
Ponendo 1 - p = q otteniamo in definitiva
  P(
) =
3 p2q  
 Vediamo la generalizzazione di questo esempio.
Si considerino N prove indipendenti in cui l'evento A
può verificarsi o meno: sia p la probabilità (costante
per ogni prova) che l'evento A si presenti e di
conseguenza 1-p=q la probabilità che esso non si
verifichi. Cerchiamo la probabilità 
 che l'evento A si verifichi m
volte in N prove. 
 Consideriamo a questo proposito l'evento 
 corrispondente al verificarsi di A
esattamente m volte in N prove.
Come nell'esempio precedente questo evento può realizzarsi in
più modi diversi: decomponiamo allora l'evento 
 in una somma di prodotti
di eventi, consistenti nel presentarsi o meno di A in una
singola prova.
Se denotiamo con 
 il
presentarsi dell'evento A nell'i-esima prova e con 
 il non
presentarsi di A nell'i-esima prova, abbiamo che ogni
variante di apparizione dell'evento 
 si compone di m apparizioni
dell'evento A e di n-m eventi 
 con indici distinti 
 
 
 Il numero di combinazioni possibili è uguale a 
, cioè al numero di modi
diversi in cui si possono scegliere le m prove, tra le N
totali, in cui abbia luogo l'evento A.
Per il teorema di
moltiplicazione delle probabilità nel caso di eventi indipendenti, la
probabilità di ogni combinazione è pmqN-m.
Essendo le varie combinazioni mutuamente escludentesi,
per il teorema dell'addizione,
la probabilità dell'evento 
 è pari a : 
 
 
 Il coefficiente 
è detto coefficiente binomiale e viene spesso indicato
come 
: in
particolare il suo valore è