 |
Master Géomarketing
et Stratégies Territoriales |
| La grille, moyen fondamental de l'analyse |
Les représentations traditionnelles et leurs limites
Les systèmes d’information géographique sont conçus pour afficher une donnée avec un choix de représentations diverses.
Afin de positionner une donnée dans l’espace, il est indispensable de connaître ses coordonnées. Les coordonnées X,Y
traditionnellement utilisées en France dans le système de projection Lambert 2 étendu correspondent au nombre de mètres
calculés depuis l’intersection de l’abscisse et de l’ordonnée d’un graphique qui contiendrait la totalité du territoire
métropolitain (depuis 2002, le système officiel est le RGF 93 et les mètres ont été remplacés par des degrés). A partir
d’une adresse (lieu repéré dans l’espace par une désignation qui existe dans la carte) une opération de traitement, le
" géocodage ", permet d’obtenir les valeurs X et Y. Celles ci autorisent l’affichage automatique d’une représentation de
la donnée au point précis calculé.
L’affichage de ce type est appelé symbolique, les éléments servant à représenter les données géocodées étant des symboles.
Tous ces modes de représentation (points, boules, camemberts, histogrammes, logos, codes barre….)
peuvent être qualifiés au mieux de descriptifs, sinon d’anecdotiques, en ce sens où ils ne peuvent
décrire qu’un faible volume de données sous une forme fragmentée; ils ne fournissent pas une information
synthétique sur la zone étudiée et ne peuvent pas, tels quels, faire l’objet de traitements.
Dans la pratique, l’analyse ne doit surtout pas porter sur un examen visuel de représentations de ce type,
car le choix des formes, des volumes et des couleurs, la superposition inévitable d’informations fausseront
nécessairement le jugement de l’observateur. Il est donc indispensable d’avoir recours à d’autres modes
descriptifs dont la lecture ne puisse être mise en question. En outre, dans le cadre d’études, il est
fréquemment nécessaire de faire appel à des fichiers volumineux, ainsi, par exemple, la population de
l’ensemble des communes ou la localisation des entreprises implantées sur une agglomération. Prenons l’exemple
des 45.000 entreprises de Bordeaux; si l’on représente l’information sous forme de points, la lecture devient
impossible, aussi bien pour évaluer la quantité d’entreprises et leur concentration (les points se superposent)
qu’à fortiori pour représenter des valeurs qui peuvent être attachées à chaque entreprise (ses effectifs, son
chiffre d’affaires, ….).

Il est, par conséquent, indispensable d’utiliser une approche différente qui sache fournir
l’information requise sous une forme claire, fiable et précise. La réponse va consister à
agglomérer les informations de façon lisible selon un mode et une finesse qui seront liés au
volume de données et à l’étendue du territoire étudié. La méthode d’agglomération forme la base
de l’analyse spatiale et a été conçue dans le droit fil des travaux d’économistes en économie
spatiale bien connus, comme Lösch et Christaller. Cette méthode repose sur une division homogène
de l’espace, non pas en hexagones, qui seraient plus complexes à gérer, mais en simples carrés,
dont la taille peut se réduire (en théorie) à celle d’un point.
Description de la méthode d’analyse sur grille
Les données, localisées par leur position X,Y, doivent être affectées aux carreaux de grilles
(qui seront désignés par le terme "cellules") en fonction des coordonnées X’, Y’, ….. X““, Y““ de
chaque carreau. Le chargement des données dans ces cellules homogènes, présente deux avantages essentiels :
d’une part, il libère l’utilisateur des contraintes imposées par les découpages administratifs et lui
permet de travailler sur des zones plus fines, d’autre part l’information à traiter est mise en densité
automatiquement ; ainsi dans l’exemple qui suit, les effectifs des entreprises sont répartis dans des
zones de 30 x 30 m et les valeurs résultantes affectées aux cellules indiquent de façon pertinente la
répartition des salariés sur la zone étudiée. Les données affectées aux cellules peuvent être n’importe
quel type d’information disponible dans la base étudiée: le nombre d’entreprises présentes dans le
périmètre d’une cellule (comptage), la somme des valeurs affectées à une adresse (effectifs, chiffre
d’affaires, consommation des ménages...). Lorsque la source support des données est non plus une
adresse, mais une surface, îlot, Iris, commune, canton ou département, (Ex : statistiques de population)
la dimension de la surface administrative en question peut être supérieure à celle de la cellule.
Dans ce cas, les valeurs devront être réparties en fonction de la surface intersectée par la cellule.
Dans l’hypothèse où les cellules auraient une taille moyenne équivalente ou supérieure aux surfaces
administratives considérées, le principe du calcul est absolument identique, car, dans tous les cas,
la cellule pourra intersecter un objet administratif dont il sera nécessaire de distribuer la valeur.

Les avantages de l’analyse de grille
La plupart des logiciels S.I.G. qui ont été conçus à l’origine pour traiter principalement la cartographie,
se sont convertis au géomarketing qui offre des débouchés potentiels non négligeables. Toutefois l’approche
technique disponible n’apporte pas une réponse satisfaisante pour l’analyste : les systèmes traditionnels
traitent la carte en objets (dans le sens d’objet informatique) : les tronçons de rues, les communes, les
îlots, …., sont gérés comme des objets et les valeurs des données correspondantes sont affectées à ces objets.
Le résultat est trompeur à la lecture : Considérons à titre d’exemple la représentation des populations à l’Iris
sur le nord du département des Hauts de Seine (en dégradés de cyan). L’Iris 4E avec 9.938 h sur 8 km2 est
représenté comme proportionnellement beaucoup plus peuplé que l’Iris 1B avec 5.182 h dont la surface est 100
fois plus faible. Ceci est vrai en valeur absolue; toutefois pour les objectifs du marketing, il est infiniment
préférable d’avoir par exemple 200.000 prospects dans les Hauts de Seine, plutôt que dans le Sahara. Seule une
représentation en densité rendra compte de l’intérêt économique d’un territoire, comme l’exprime la carte
suivante (en dégradés d’orange), l’Iris 1B ayant une densité de population 50 fois supérieure à l’Iris 4E,
il représente un potentiel marketing bien plus important.

Avantage supplémentaire de l’analyse de grille, l’organisation de l’espace en cellules identiques,
homogènes et homothétiques sous forme de carroyage correspond précisément à un modèle mathématique de matrice.
Le calcul matriciel est simple et permet de traiter les séries de données avec des opérateurs de type arithmétique,
statistique ou booléen. Cette approche autorise ainsi l’introduction des moyens de calcul sur les données spatialisées ;
ces fonctions ne peuvent bien évidemment pas être mises en oeuvre dans les systèmes qui affectent les données aux objets
de la carte. C’est sur base de cette capacité au calcul matriciel que l’on peut distinguer les outils de géomarketing
de ceux de cartographie.

Des précautions évidentes sont à prendre en fonction du type de données à traiter; si l’on doit afficher une
valeur moyenne, une densité ou une proportion (revenu moyen à la commune, densité de population à l’Iris ou part
de marché au département, il ne faudra pas répartir ces valeurs en fonction de la surface, mais les attribuer
globalement à chaque cellule qui compose l’objet géographique considéré.
En conclusion, la grande force de l’approche de l’analyse de grille consiste en l’affectation
permanente de la donnée (Chiffre d’affaires, consommation, …..) à la position géographique réelle
et précise de son support (Société, ménage, …..) exprimée en coordonnées X,Y. Le traitement des données
est ainsi libéré des contraintes liées à la sémantique du découpage de l’espace en objets
(îlots < Iris < Commune < Canton < Département < Région < Pays), qui se complique encore lors du
traitement au numéro dans la rue, une rue pouvant être répartie entre plusieurs Iris. La lecture d’une
donnée devient donc immédiate, du niveau "n° dans la rue" au niveau "pays entier", sans modification du
référent (Coordonnées X,Y).
Exemples de traitement de séries de données dans l’espace
La répartition des phénomènes économiques dans l’espace fait qu’il est souvent difficile d’identifier
les nuances d’une série de données lorsqu’il existe une très forte amplitude dans la répartition des données
de la série considérée. Ainsi, si l’on souhaite représenter l’implantation des ménages en France, la densité
varie de 0,01 à plus de 50.000 unités au km2. En utilisant un simple affichage en densité, le dégradé de
couleurs en mode 32 bits, fait apparaître un point noir sur Paris et un dégradé de couleur quasiment uniforme
sur le reste de la France. Un phénomène identique est constaté dans le cadre de l’analyse de la plupart des données
économiques à cause du poids considérable de la région parisienne. On appliquera donc une opération de statistique
descriptive, la discrétisation, qui consistera à repartir les 20.344.520 ménages en classes de taille identique.
Le nombre de classes doit être laissé au choix de l’opérateur; toutefois, sur des séries de données importantes,
il sera recommandé de choisir dix classes de chacune environ 2.034.452 ménages.

En affectant un degré de couleur à chaque classe dont les valeurs varieront de 1 à 10, on obtient une
représentation beaucoup plus lisible de l’implantation des ménages. Enfin, en regroupant les 5 classes
de plus forte densité (classes 6 à 10) et en leur affectant une couleur spécifique (rouge), puis les 3
classes suivantes (3 à 5) avec une autre couleur (orange), et enfin les deux dernières (1 et 2) d’une
troisième couleur (jaune), l’observateur est à même de visualiser directement l’implantation de 50 %
(en rouge) ou 80% (en rouge + orange) des ménages qui habitent dans les zones à plus forte densité.
La répartition 80 / 20 est intéressante dans la mesure ou elle confirme dans la plupart des cas le
principe de la loi de Pareto. Ici, 80% de la population est implantée sur environ 20% du territoire.
Moyennes, corrélations et écarts à la régression
Lorsque deux phénomènes économiques paraissent liés, il est intéressant d’utiliser l’analyse bivariée
qui consiste à appliquer un calcul de régression de Y en X et de X en Y, pour vérifier le niveau de lien
entre deux séries de données. Ainsi les ventes d’un produit d’équipement des ménages semblent très étroitement
liées à la densité de population de la zone étudiée :

On effectuera, dans un premier temps un calcul de pénétration de marché (valeur des ventes / population des ménages).
Pour une meilleure lecture du résultat, l’affichage est réparti en classes partagés sur base de la valeur de l’écart
type; à ces sous ensembles sont affectées des couleurs discriminantes. La représentation de la série obtenue est
globalement assez homogène, avec une moyenne à 7,5% et un écart type de 0,036. Par contre, certaines cellules
indiquent une très forte pénétration (72%), le minimum étant à 0,14%. On constate, en particulier, une très
forte pénétration de marché aux alentours de Rennes;

Dans le cadre d’une analyse géomarketing, l’inconvénient majeur d’une analyse de pénétration de marché par
recours classique à la division des valeurs des ventes par les valeurs de marché, est que, si la valeur du
marché d’une zone est très faible et que les ventes sur la même zone soient proportionnellement élevées,
une lecture peu attentive du résultat sur la carte pourra faire penser que l’on a identifié une zone
intéressante dans l’absolu. Le raisonnement est également valable à contrario, où l’on constate, par
exemple, ci dessus que la ville de Rennes est proche de la moyenne avec 7%, ce qui occultera la valeur
absolue attachée aux ventes et correspondant à ce demi point de différence avec la moyenne. Une méthode
plus efficace pour faire apparaître les écarts significatifs en valeur absolue, consiste à utiliser le
calcul d’écarts à la régression spatiale. Dans notre exemple, l’étude de la régression ventes / ménages
et ménages / ventes, réalisée sur l’intersection dans l’espace des deux séries à prés de 100%, fournit
deux droites très proches dont l’angle de régression est très faible. La configuration du nuage de points
présente une forte densité. Toutefois, on constate qu’un certain nombre de points (les résidus en statistique)
échappent au nuage, aussi bien dans le sens d’une pénétration beaucoup plus forte du marché par rapport à la
population, qu’au contraire dans le sens d’une pénétration plus faible

Comme aucune variable explicative immédiate ne justifie le phénomène, on aura recours à une représentation
dans l’espace avec, au préalable, une analyse des écarts à la régression. Cette analyse confirme les
conclusions précédentes, avec des positions extrêmes relativement dispersées (-20 à +56) et un écart-type
de seulement 2,66. La localisation des écarts sur une carte permet de visualiser les valeurs les plus
importantes sur les zones les plus fortement urbanisées. La carte démontre, en outre, que les communes
à population relativement faible, mais à écart élevé (très forte pénétration de marché), sont limitrophes
des villes les plus importantes. Les villes de taille moyenne (10-25.000 ménages) ont une consommation
supérieure à celle du nuage, alors que Brest (62.000 ménages) est dans la moyenne et que la commune de
Rennes (84.000 ménages) est très en retrait. Pour cette dernière, la faiblesse de consommation du produit
concerné est compensée par une sur - consommation de la part des communes avoisinantes. Ce mode de
représentation donne une meilleure idée des ventes, puisque n’apparaissent comme significatives que les
zones où les valeurs absolues des différences sont fortes; ainsi les 0,5 points de sous réalisation par
rapport à la moyenne, à Rennes, correspondent à 1.319 ventes et les 65 points de sur performance de la
commune voisine portent sur seulement 780 ventes.
Les deux exemples présentés illustrent les capacités offertes par l’analyse de grille.
Celle ci de par sa configuration matricielle permet l’utilisation de nombreuses autres fonctions
ouvertes issues des opérateurs mathématiques classiques.
