Echantillonnage de données : sélection aléatoire de données

Intérêt d’une sélection aléatoire

Le commissaire aux comptes effectue la plupart de ses contrôles par sondage. La formation d’un échantillon de données à sonder est réalisée selon différentes méthodes au choix de l’auditeur (conformément à la NEP-530. Sélection des éléments à contrôler). La sélection des données s’opère en fonction :

  • d’un seuil de signification,
  • d’une méthode statistique,
  • d’une formule aléatoire,
  • de critères plus ou moins subjectifs.

Ces différentes méthodes sont utilisables conjointement mais la plupart du temps, l’échantillon est formé à partir d’un seuil de signification (par exemple, toutes les données dont le montant est supérieur à 100 K€). L’utilisation dogmatique de ce critère de sélection éliminera systématiquement toutes les données inférieures au seuil (alors que précisément l’ensemble des membres d’une population donnée mérite l’attention du CAC) et ne répond pas au caractère imprévisible des contrôles du commissaire aux comptes institué par les NEP (normes d’exercice professionnel), notamment la NEP-330 intitulée “Procédures d’audit mises en oeuvre par le commisaire aux comptes à l’issue de son évaluation des risques”.

L’utilisation du hasard, en complément d’autres méthodes d’échantillonnage, est très intéressante à double titre :

  • D’une part, cette méthode répond aux prescriptions des NEP sur l’imprévisibilité des contrôles du CAC; dans le cadre de la prévention de la fraude, ce genre de méthode introduit un climat d’insécurité pour le fraudeur ou l’éventuel fraudeur, en effet, toutes les transactions sont susceptibles d’entrer dans le périmètre de l’audit et non pas seulement les plus importantes.
  • D’autre part, elle permet d’élargir l’éventail de données auditées… et finalement d’augmenter la probabilité de détecter erreurs et fraudes, ces dernières étant d’ailleurs le plus souvent découvertes par hasard.

Réalisation d’un échantillonnage aléatoire à l’aide d’une requête SQL

L’exemple qui suit servira d’illustration au propos précédent. Nous utiliserons un grand livre général (table ACCESS intitulée GL comprenant les champs de données compte, libellé (d’écriture), journal, débit, crédit et numéro de pièce). Il comprend dix-huit mille lignes d’écritures et nous souhaitons n’en retenir aléatoirement aux fins d’audit que dix lignes.

Texte de la requête SQL à rédiger :

SELECT TOP 10 GL.Compte, GL.Libellé, GL.Débit, GL.Crédit, GL.Journal, GL.Date, GL.Lettrage, GL.Pièce

FROM GL

ORDER BY Rnd(compte);

Explication :

L’échantillonnage tourne autour des deux fonctions suivantes :

  • «ORDER BY Rnd(compte)» trie les lignes aléatoirement par le champ «compte»,
  • «TOP 10» signifie que l’on ne sélectionne que les dix premières lignes du résultat de la requête.

Résultat obtenu :

Bien entendu, chaque exécution de la requête donne un résultat différent.

Share Button
The following two tabs change content below.
Benoît RIVIERE
Après seize années passées en cabinet d’expertise-comptable et de commissariat aux comptes (où j’ai exercé comme expert-comptable et chef de mission audit), j’ai pris le poste de directeur comptable d’un groupe de distribution automobile en novembre 2014. Au cours de ma carrière, j’ai acquis une expérience significative en audit et en exploitation des systèmes d’information (analyse de données, automatisation des tâches, programmation informatique) au service de la production des comptes annuels et consolidés. C’est cette expérience personnelle et ma passion pour l’informatique que je partage sur ce blog. Mon CV / Réalisations personnelles et projets informatiques / Ma collection / Me contacter

5 commentaires

  1. Bonjour,

    Je fais un mémoire sur l’utilisation de l’échantillonnage. Et je souhaite avoir une explication. A partir de quel moment un échantillon peut être considéré comme représentatif d’une population auditée??

    Merci!

  2. Pingback: Analyse de données : interroger une base de données avec une requête SQL – Audit & Systèmes d'Information

  3. Cet article est intéressant. Il s’intitule “Intérêt d’une sélection aléatoire”. N’oublions donc pas que la sélection aléatoire (qui donne une chance à chaque individu de la population d’être prélevé) est une condition nécessaire mais non suffisante pour un sondage statistique (la NEP 530, tout comme l’ISA 530, autorise le non-statistique). Les autres conditions étant l’utilisation de lois statistiques (ou de probabilités) pour la détermination de la taille de l’échantillon ainsi que pour la conclusion du sondage. Une sélection aléatoire et une conclusion par une règle de 3 ne donnent pas un sondage statistique.
    L’aléatoire peut aussi être simple ou par intervalles (de lignes ou d’euros).
    Michel PIRON

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.