Echantillonnage de données : sélection aléatoire de données

Intérêt d’une sélection aléatoire

Le commissaire aux comptes effectue la plupart de ses contrôles par sondage. La formation d’un échantillon de données à sonder est réalisée selon différentes méthodes au choix de l’auditeur (conformément à la NEP-530. Sélection des éléments à contrôler). La sélection des données s’opère en fonction :

d’un seuil de signification,
d’une méthode statistique,
d’une formule aléatoire,
de critères plus ou moins subjectifs.

Ces différentes méthodes sont utilisables conjointement mais la plupart du temps, l’échantillon est formé à partir d’un seuil de signification (par exemple, toutes les données dont le montant est supérieur à 100 K€). L’utilisation dogmatique de ce critère de sélection éliminera systématiquement toutes les données inférieures au seuil (alors que précisément l’ensemble des membres d’une population donnée mérite l’attention du CAC) et ne répond pas au caractère imprévisible des contrôles du commissaire aux comptes institué par les NEP (normes d’exercice professionnel), notamment la NEP-330 intitulée “Procédures d’audit mises en oeuvre par le commisaire aux comptes à l’issue de son évaluation des risques”.

L’utilisation du hasard, en complément d’autres méthodes d’échantillonnage, est très intéressante à double titre :

D’une part, cette méthode répond aux prescriptions des NEP sur l’imprévisibilité des contrôles du CAC; dans le cadre de la prévention de la fraude, ce genre de méthode introduit un climat d’insécurité pour le fraudeur ou l’éventuel fraudeur, en effet, toutes les transactions sont susceptibles d’entrer dans le périmètre de l’audit et non pas seulement les plus importantes.
D’autre part, elle permet d’élargir l’éventail de données auditées… et finalement d’augmenter la probabilité de détecter erreurs et fraudes, ces dernières étant d’ailleurs le plus souvent découvertes par hasard.

Réalisation d’un échantillonnage aléatoire à l’aide d’une requête SQL

L’exemple qui suit servira d’illustration au propos précédent. Nous utiliserons un grand livre général (table ACCESS intitulée GL comprenant les champs de données compte, libellé (d’écriture), journal, débit, crédit et numéro de pièce). Il comprend dix-huit mille lignes d’écritures et nous souhaitons n’en retenir aléatoirement aux fins d’audit que dix lignes.

Texte de la requête SQL à rédiger :

SELECT TOP 10 GL.Compte, GL.Libellé, GL.Débit, GL.Crédit, GL.Journal, GL.Date, GL.Lettrage, GL.Pièce

FROM GL

ORDER BY Rnd(compte);

Explication :

L’échantillonnage tourne autour des deux fonctions suivantes :

«ORDER BY Rnd(compte)» trie les lignes aléatoirement par le champ «compte»,
«TOP 10» signifie que l’on ne sélectionne que les dix premières lignes du résultat de la requête.

Résultat obtenu :

Bien entendu, chaque exécution de la requête donne un résultat différent.

Bio
Derniers articles

Benoît RIVIERE

Après seize années passées en cabinet d’expertise-comptable et de commissariat aux comptes (où j’ai exercé comme expert-comptable et chef de mission audit), j’ai pris le poste de directeur comptable d’un groupe de distribution automobile en novembre 2014. Au cours de ma carrière, j’ai acquis une expérience significative en audit et en exploitation des systèmes d’information (analyse de données, automatisation des tâches, programmation informatique) au service de la production des comptes annuels et consolidés. C’est cette expérience personnelle et ma passion pour l’informatique que je partage sur ce blog. Mon CV / Réalisations personnelles et projets informatiques / Ma collection / Me contacter

5 commentaires

EL KHATIRI

mercredi 16 août 2017 at 14 h 29 min

Bonjour,

Je fais un mémoire sur l’utilisation de l’échantillonnage. Et je souhaite avoir une explication. A partir de quel moment un échantillon peut être considéré comme représentatif d’une population auditée??

Merci!
Pingback: Analyse de données : interroger une base de données avec une requête SQL – Audit & Systèmes d'Information
Michel PIRON

mercredi 29 novembre 2017 at 16 h 34 min

Cet article est intéressant. Il s’intitule “Intérêt d’une sélection aléatoire”. N’oublions donc pas que la sélection aléatoire (qui donne une chance à chaque individu de la population d’être prélevé) est une condition nécessaire mais non suffisante pour un sondage statistique (la NEP 530, tout comme l’ISA 530, autorise le non-statistique). Les autres conditions étant l’utilisation de lois statistiques (ou de probabilités) pour la détermination de la taille de l’échantillon ainsi que pour la conclusion du sondage. Une sélection aléatoire et une conclusion par une règle de 3 ne donnent pas un sondage statistique.
L’aléatoire peut aussi être simple ou par intervalles (de lignes ou d’euros).
Michel PIRON
Benoît RIVIERE

samedi 2 décembre 2017 at 17 h 13 min

Bonsoir Michel,
Merci pour ces précisions. Si tu souhaites apporter des précisions sur les sondages statistiques, n’hésite pas.
Bonne soirée,
Benoît
Benoît RIVIERE

vendredi 19 janvier 2018 at 13 h 09 min

Bonjour M. EL KHATIRI,
J’avoue ne pas maîtriser suffisamment ce sujet pour y apporter une réponse.
Bon courage pour vos recherches,
B. RIVIERE

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.

Audit & Systèmes d'Information

Pistes de réflexion sur l’audit et les systèmes d’information

Echantillonnage de données : sélection aléatoire de données

Benoît RIVIERE

Derniers articles parBenoît RIVIERE (voir tous)

5 commentaires

Laisser un commentaire