Statistics

Dans la presse, certains sujets reviennent souvent. Et l’un d’eux, c’est celui du salaire moyen dans le pays. Fin 2015, on pouvait par exemple lire sur le site jobat.be. « Le Belge gagne en moyenne 3200 € brut par mois ». Plus récent encore, en décembre 2016, l’un des sites les plus lus en Belgique francophone titrait « Voici le revenu moyen des Belges : 1473 € net par mois ». En tant que statisticien, les articles du genre sont pour moi un véritable fléau. Ils sont souvent très courts, rédigés à la va-vite et donnent au lecteur une image biaisée de la situation salariale réelle dans le pays. Ces articles de presse sont donc parfois plus proches de la désinformation que de l’information. Ce que je vais faire avec Albert dans la vidéo du jour, c’est expliquer comment correctement faire les choses.

In the press, some subjects often come back. And one of them is the average wage in the country. At the end of 2015, for example, one could read on jobat.be. “The Belgian earns on average 3200 € gross per month”. Even more recently, in December 2016, one of the most read sites in French-speaking Belgium had the following headline: “Here is the average income of the Belgians: 1473 € net per month”. As a statistician, such articles are a real scourge to me. They are often very short, drafted and give the reader a biased picture of the real wage situation in the country. These press articles are sometimes closer to misinformation than to information. What I’m going to do with Albert in the video of the day is explaining how to properly do things.

Pour commencer, Albert, nous allons représenter tous les salariés par cette boule bleue. Cette boule contient 100% des salariés à temps plein du pays. Traçons maintenant un axe horizontal représentant les salaires bruts et étalons de tous ces salariés pour l’année 2014 selon les chiffres officiellement fournis par les autorités belges en 2016. Le résultat que nous avons face à nous, c’est ce que les statisticiens appellent une “distribution”. Grâce à cette distribution, ce qui se passe dans le pays est à présent d’une redoutable clarté. Le gros des salariés, un peu moins de 80%, se trouve entre 1750 et 4130 € brut.

To begin with, Albert, we will represent all the employees by this blue ball. This ball contains 100% of the country’s full-time employees. Let us now draw a horizontal axis representing the gross wages and standards of all these employees for the year 2014 according to the figures officially provided by the Belgian authorities in 2016. The result that we face is that which statisticians call a “distribution”. Thanks to this distribution, what is happening in the country is now of a formidable clarity. The majority of employees, a little less than 80%, is between 1750 and 4130 € gross.

Le salarié typique en 2014, c’était donc celui dont le salaire brut tombe entre ces deux bornes. Et voilà Albert, ce n’était pas si difficile, quand même ? Et pourtant dans la presse, on voit très rarement apparaître la distribution des salaires, pour ne pas dire jamais ! A la place, le lecteur se voit servir une image illustrative profonde, faites vos jeux, les choix sont : pluie de billets sur salarié ; liasse de billets élégamment agencée passant d’une main à l’autre ; ou fiche de paie accompagnée de son austère calculatrice. Et le gagnant du jour est…pluie de billets sur salarié !

The typical employee in 2014 was therefore the one whose gross wage falls between these two bounds. And here Albert, it was not so difficult, anyway? And yet in the press, one sees very rarely appear the distribution of wages, not to say never! Instead, the reader is served a profound illustrative image, make your games, the choices are: rain of notes on employee; Bundle of notes elegantly arranged passing from one hand to the other; Or pay slip accompanied by his austere calculator. And the winner of the day is … rain of tickets on employee!

Une fois le travail d’écriture du journaliste achevé, il ne reste en général de la distribution des salaires qu’une seule chose : sa moyenne. Et c’est bien là le problème…comment peut-on un seul instant espérer capturer quelque chose d’aussi complexe qu’une distribution par un seul nombre ? Comme si cela ne suffisait pas, la moyenne est en plus une mesure statistique très inappropriée pour résumer une distribution de salaires. Pour mieux s’en rendre compte, prenons un exemple. Albert et ses meilleurs amis sont des petits chats très productifs. Ils chassent des papillons à l’extérieur en été, renversent des tas de trucs de janvier à décembre, régurgitent des boules de poils, bref, ce sont des travailleurs passionnés qui aiment le travail bien fait.

Once the journalist’s writing has been completed, there is usually only one thing left for the distribution of wages: his average. And this is the problem … how can one hope to capture something as complex as a distribution by a single number? As if this were not enough, the average is also a very inappropriate statistical measure to summarize a wage distribution. To better understand this, let’s take an example. Albert and his best friends are very productive little cats. They hunt butterflies outdoors in summer, spill lots of stuff from January to December, regurgitate hairballs, in short, they are enthusiastic workers who love work well done.

Pour ses services, disons qu’Albert recevait un brut de 2500 € par mois en 2014. Tandis qu’Oscar était à 2600, Marine à 3000, Max à 3100 et Emilie à 6500. Avec leurs salaires de 2500 à 3100 €. Albert, Oscar, Marine et Max formaient clairement un groupe homogène dont Emilie avec ses 6500 € ne faisait pas partie. Si on calcule le salaire moyen d’Albert à Max, nous obtenons une moyenne de 2800 €. Bien qu’aucun des 4 chats concernés n’a gagné ce salaire en 2014, tous sont assez proches de cette valeur, et quelqu’un qui tenterait de résumer la situation des quatre chats par cette moyenne ne se tromperait pas. Ajoutons maintenant le salaire d’Emilie dans le problème. Si on calcule le salaire moyen des cinq petits chats, nous obtenons à présent… 3540 €.

For his services, let’s say that Albert received a gross of 2500 € per month in 2014. While Oscar was at 2600, Marine at 3000, Max at 3100 and Emilie at 6500. With their salaries from 2500 to 3100 €. Albert, Oscar, Marine and Max clearly formed a homogeneous group of which Emilie with its 6500 € was not a part. If we calculate the average salary from Albert to Max, we get an average of 2800 €. Although none of the 4 affected cats earned this wage in 2014, all are fairly close to this value, and someone who would attempt to summarize the situation of the four cats by this average would not be mistaken. Let us now add Emilie’s salary to the problem. If we calculate the average salary of the five small cats, we now get … 3540 €.

Un salaire moyen bien différent des 2800 € obtenus il y a quelques instants ! Ce nouveau salaire moyen reflète très mal ce qu’Albert, Oscar, Marine et Max gagnent puisqu’ils sont tous les quatre en-dessous de cette nouvelle moyenne de 440 à même 1040 € dans le cas d’Albert. L’image obtenue de tous les petits chats via cette nouvelle moyenne ne colle pas à la réalité de façon satisfaisante. Le même phénomène se produit avec les salaires en Belgique et dans la plupart des pays du monde. L’existence d’une minorité de salariés aux revenus élevés amène à une contamination de la moyenne, la tirant vers une valeur qui n’est au final pas représentative du gros des salariés. En Belgique en 2014, le salaire brut moyen était ainsi de 3414 € un salaire que deux tiers des salariés n’atteignaient en fait pas. Si l’on souhaite correctement résumer une distribution, il faut au minimum en calculer les quintiles.

An average salary very different from the 2,800 € obtained a few moments ago! This new average salary reflects very poorly what Albert, Oscar, Navy and Max are gaining since they are all four below this new average of 440 at even 1040 € in the case of Albert. The image obtained from all small cats via this new average does not satisfactorily stick to reality. The same phenomenon occurs with wages in Belgium and in most countries of the world. The existence of a minority of employees with high incomes leads to a contamination of the average, drawing it towards a value that is ultimately not representative of the bulk of the employees. In Belgium in 2014, the average gross salary was thus € 3414 a salary that two thirds of the employees actually did not reach. If we want to correctly summarize a distribution, we must at least compute the quintiles.

L’idée, c’est de diviser les salariés en cinq blocs de 20%. Ainsi, en 2014, 20% des salariés gagnaient moins de 2440 € par mois, 20% se trouvaient entre 2440 et 2800, 20% entre 2800 et 3209, etc, comme affiché à l’écran. Les quintiles se sont les quatre valeurs sous l’axe que l’on peut d’ailleurs numéroter de la plus petite à la plus grande. Ensemble, les quintiles résument la distribution des salaires de façon nettement plus riche et satisfaisante que la moyenne. Et on peut les utiliser pour facilement situer son propre salaire par rapport au reste des salariés. Ainsi, Albert, avec ton salaire fictif [comme quoi c’est partout pareil :P] de 2500 € en 2014, tu tombes entre le 1er et le 2e quintile. 20% des salariés au moins gagnaient donc moins que toi et 60% au moins gagnaient davantage.

The idea is to divide the employees into five blocks of 20%. Thus, in 2014, 20% of employees earned less than € 2440 per month, 20% were between 2440 and 2800, 20% between 2800 and 3209, etc., as shown on the screen. The quintiles have the four values below the axis that can be numbered from the smallest to the largest. Together, the quintiles summarize the distribution of wages in a much richer and satisfactory way than the average. And they can be used to easily situate their own salary in relation to the rest of the employees. So, Albert, with your fictitious salary (like this is everywhere the same: P] of 2500 € in 2014, you fall between the 1st and the 2nd quintile. 20% of employees at least earned less than you and 60% at least earned more

Une version plus raffinée de tout ceci consiste à diviser les salariés non pas en 5 blocs un peu grossiers de 20%, mais en 10 blocs plus fins de 10%. Le résultat est le suivant. Les valeurs sous l’axe allant de 2220 à 5178 ne sont alors plus appelées les quintiles, mais les déciles, et il y en a 9 au total. Le 5e décile, dont la valeur est 2976, est un peu particulier. Il divise tous les salariés en deux blocs de 50%. Tu le connais probablement, Albert, sous le nom de médiane. 50% des salariés dans le pays gagnaient moins de 2976 € en 2014 et 50% gagnaient plus.

A more sophisticated version of all this consists of dividing the employees not in 5 coarse blocks of 20%, but in 10 finer blocks of 10%. The result is as follows. The values under the axis from 2220 to 5178 are no longer called the quintiles, but the deciles, and there are 9 in all. The 5th decile, whose value is 2976, is somewhat peculiar. It divides all employees into two blocks of 50%. You probably know him, Albert, under the name of median. 50% of employees in the country earned less than € 2976 in 2014 and 50% earned more.

Si je fais l’exercice de situer le salaire d’Albert sur base des déciles, je constate qu’avec 2500 €, il tombe entre le 2e et le 3e décile. Il y a donc au moins 20% des gens qui gagnaient moins que lui en 2014 et au moins 70% qui gagnaient davantage. Pointer du doigt de façon systématique ceux qui utilisent la moyenne pour résumer une distribution de salaires serait toutefois une erreur. Après tout, cela a quand même du sens de constater que, par exemple, le salaire moyen dans la petite ville de Dinant était égal à 73% du salaire moyen à Anvers et à seulement 66% du salaire moyen à Bruxelles.

If I do the exercise of locating Albert’s salary on the basis of the deciles, I find that with 2500 €, it falls between the 2nd and 3rd decile. So there are at least 20% of people earning less in 2014 and at least 70% earning more. Finger pointing systematically to those who use the average to summarize a wage distribution would be a mistake. After all, it still makes sense to note that, for example, the average wage in the small town of Dinant was 73% of the average wage in Antwerp and only 66% of the average wage in Brussels.

Ou que le salaire moyen d’une femme occupée à temps plein en 2014 n’atteignaient que 94% de celui d’un homme. Ou encore que quelqu’un travaillant dans le secteur de la restauration gagne en moyenne 57% de celui travaillant dans l’industrie pharmaceutique, et seulement 47% de celui travaillant dans l’industrie pétrochimique. Retiens, Albert, que disséquer la situation salariale dans le pays est une tâche très complexe. Mais si tu as bien compris ce que je t’ai raconté aujourd’hui, mon espoir est que tu réussiras à faire face aux articles de presse sur le sujet avec un peu moins de crédulité que par le passé. Cette vidéo est la seconde à avoir bénéficié d’un financement partiel via nos fans. Si vous aussi vous souhaitez soutenir Albert et l’aider à vivre toujours plus d’aventures, rendez-vous sur tipeee.com/amisdalbert [Et oui ! les croquettes c’est pas gratuit !] Merci de nous avoir regardé et à très bientôt pour une prochaine vidéo.

Or that the average wage of a full-time woman in 2014 was only 94% of that of a man. Or that someone working in the restaurant sector earns on average 57% of that working in the pharmaceutical industry, and only 47% of that working in the petrochemical industry. Retiens, Albert, that dissecting the wage situation in the country is a very complex task. But if you have understood what I have told you today, my hope is that you will be able to deal with the press articles on the subject with a little less credulity than in the past. This video is the second to have received partial funding through our fans. If you also want to support Albert and help him to live more adventures, go to tipeee.com/amisdalbert [And yes! The croquettes is not free!] Thank you for having looked at us and very soon for a next video.