Article publié dans l'édition été 2015 de Gestion

Les gestionnaires des entreprises de service sont parfois confrontés à une situation qui semble paradoxale : d’un côté, il se crée de longues files de clients qui attendent d’être servis, alors que de l’autre côté, les indicateurs de performance indiquent que la capacité de service n’est utilisée qu’à 85 %. Il doit bien y avoir quelqu’un qui se trompe quelque part, non ?

Calculer la capacité d’un point de service est pourtant assez simple : s’il faut en moyenne cinq minutes pour servir un client, la capacité est de 12 clients à l’heure. Ainsi, s’il arrive en moyenne10 clients à l’heure, on croira que la capacité est plus que suffisante. Pourtant, dans un tel système, on aurait en moyenne quatre clients qui attendent, et le temps d’attente moyen pour avoir accès au point de service serait de... 25 minutes !


LIRE AUSSI: Dossier avenir du commerce de détail - La logistique, colonne vertébrale du commerce électronique


Comment un résultat aussi contre-intuitif est-il possible ? Lorsqu’on évalue que la capacité de notre point de service est suffisante, c’est qu’on présume que le temps de service sera effectivement de cinq minutes pour chaque client et qu’il arrivera un client toutes les six minutes. Dans un tel cas, la capacité serait effectivement plus que suffisante pour répondre à la demande. Mais en réalité, si on parle d’un temps moyen de cinq minutes pour servir un client, c’est que ce temps est variable : certains clients seront servis en deux ou trois minutes, alors que pour d’autres il faudra sept ou huit minutes, voire davantage. De la même façon, le taux d’arrivée des clients est une moyenne : à moins qu’on ait fixé des rendez-vous très précis (et même dans ce cas !), les clients ne se présentent pas à intervalles réguliers.

Oui, mais, me direz-vous, tout cela doit bien s’égaliser, au bout du compte ? Les clients dont le temps de service est plus court compenseront pour ceux auxquels on doit consacrer plus de temps, non ? Non, justement. Il est impossible de stocker la capacité d’un tel service : si pendant deux ou trois minutes, il n’y a aucun client à servir, ce temps est irrémédiablement perdu. Par contre, dès que deux clients se présentent dans un intervalle rapproché, ou dès qu’un client requiert un temps de service plus long, il risque de se créer une file d’attente, et cette file pourrait prendre beaucoup de temps à se résorber.

point critique file d'attente

Illustration: Istock

Le graphique illustre la relation entre le taux d’utilisation de la capacité et le nombre moyen de clients dans la file d’attente, en employant les données de notre exemple de départ. Comme on le voit, si la capacité était utilisée à 100 %, la file d’attente serait infinie. Le point d’inflexion de la courbe – c’est-à-dire le taux d’utilisation de la capacité à partir duquel la longueur moyenne de la file augmente rapidement – se situe aux environs de 80 %. Autrement dit, si l’on souhaite que les files d’attente ne soient pas trop longues, il faut accepter d’opérer à environ 80 % de la capacité disponible. Ce constat a cependant un corollaire : si on fait face à des files d’attente très longues, il suffit souvent d’une petite augmentation de la capacité pour réduire ces files de manière importante.

La mathématique des files d’attente est loin d’être nouvelle ; elle remonte en fait au début du 20e siècle, lorsque le Danois Agner Erlang s’est penché sur le problème des files d’attente des standards téléphoniques. Toutefois, comme elle est assez complexe, on la cache bien profondément dans les différents logiciels de planification des besoins en capacité qu’utilisent la plupart des grandes entreprises de service. Mais si l’on n’en comprend pas les principes, on continue vainement à espérer qu’il sera possible un jour d’utiliser toute la capacité disponible sans file d’attente.