חברת CaseWare-IDEA פרסמה מדריך למתחילים לאיתור הונאות ומעילות באמצעות תחקור נתונים :

  1. ניתוח באמצעות חוק בנפורד
  2. הצלבת נתונים וניתוח מתאם (קורלציה)
  3. בדיקות Same -Same - Same ו Same - Same -Different
  4. בדיקת אי רציפות
  5.  איתור כפולים ודומים (Fuzzy matches)

להלן תמצית המדריך אותו ניתן להוריד לקריאה ב Offline.

ניתוח באמצעות חוק בנפורד

ניתוח באמצעות חוק בנפורד היא גישה אפקטיבית במסגרת חקירת הונאה. החוק מגדיר שהספרה המובילה בסט גדול של נתונים טבעיים, תהיה קטנה: 49% מהערכים יתחילו בספרה 1 או 2 ורק 4.7% מהערכים יתחילו בספרה 9.

ניתן להשתמש בחוק בנפורד לבדיקות כגון:

  • תנועות של חשבונות חייבים
  • תנועות יומן
  • תנועות בכרטיסי אשראי
  • נתוני הלוואות
  • הזמנות רכש
  • עלויות מלאי
  • מחירי מניות
  • יתרות לקוח והחזרים

חלק מהבדיקות האפשריות באמצעות חוק בנפורד הן:

  1. הספרה הראשונה - בחינת על של הנתונים,
  2. הספרה השנייה - בחינת על שמסייעת לזהות ציות לחוק,
  3. שתי הספרות הראשונות - בדיקה ממוקדת לניתוח ההתפלגות של צירופי קומבינציות מ 10 ועד 99,
  4. מבחן הסכימה - איתור מספרים גבוהים בהשוואה לשאר המספרים באוכלוסייה,
  5. מבחן הסדר השני - חיפוש שונות בין המספרים ומציין האם קיימת בעיה בנתונים,
  6. שלוש הספרות הראשונות - בחינת על בה נשתמש לבחירת מדגמי ביקורת. הבדיקה מזהה בד"כ באיתור ערכים מספריים כפולים,
  7. שתי הספרות האחרונות - מסייע בזיהוי מספרים מומצאים או מספרים מעוגלים.

הצלבת נתונים וניתוח מתאם

מרכיב הכרחי בתחקור נתונים היא היכולת להשוות ולנתח שני בסיסי נתונים שאין משווים בינהם באופן נורמלי. כלי תחקור נתונים לביקורת חייבים לכלול יכולת הצלבת נתונים (Join), כלי פשוט אך עוצמתי להצלבת נתונים בין קבצים.

נשתמש ב Join ל:

  1. חיבור שדות משני בסיסי נתונים לבסיס נתונים אחד לניתוח
  2. בחינת הנתונים לזהות ( או שוני) בין בסיסי נתונים

ניתוח קורלציה הוא כלי נוסף בו נשתמש לקביעה האם קיים קשר בין חתיכות נתונים שונות בשני מקורות או יותר כגון דוח מס שנתי ותנועות חייבים. אם קיים מתאם גבוה בין שני השדות לאורך זמן, ייתכן וזהו סימן להונאה.

בדיקות Same -Same - Same ו Same - Same -Different

מטרת הבדיקות Same -Same - Same  להלן SSS והבדיקה Same-Same-Different להלן SSD לזהות כפולים לא שגרתיים כסימן פוטנציאלי לשגיאות או הונאות.

בדיקת SSS מזהה רשומות המכילות שדות או נתונים שהם בכפילות זהה לרשומות אחרות. באמצעות הבדיקה ניתן לאתר תשלומי הוצאות כפולות, מקרים של תשלומים כפולים לספקים שבוצעו בטעות, תביעות מרובות בגין אחריות מוצר או תשלומי שירות כפולים בתוכניות ביטוח בריאות.

בדיקת SSD נועדה לזהות רשומות כמעט זהות לשדות נבחרים ע"י המשתמשים. הבדיקה בעלת ערך לאיתור שגיאות והונאות ובמיוחד לאיתור שגיאות בתנועות חייבים.

בדיקת אי רציפות

לרוב, סימנים מסגירים להונאה היא האינפורמציה שמבקרים פנימיים וחוקרי מעילות  אינם מוצאים. סדרות כגון מספרי חשבוניות, צ'קים ומספרי הזמנות הם בדרך כלל עוקבים וללא אי רציפויות.

במטלת אי רציפות Gap Detection בה משתמשים לבדיקת שלמות, ניתן להשתמש לזיהוי פריטים חסרים ברצף נומרי או טווח תאריכים בקובץ. אי רציפות מעידה על פריטים חסרים.

באמצעות Gap Detection ניתן לאתר תנועות חסרות, לדוגמא בעסקי המסעדות בהן אי רציפות במספרי הקופה הרושמת עשוי להצביע על ביטול תנועות או תנועות שלא הוזנו המצביעים על הזמנות שלא תועדו. בדיקה שימושית במיוחד אצל שלטונות המס.

איתור כפולים ודומים (Fuzzy matches)

איתור כפולים ודומים הינם כלי מפתח בגישה לאיתור רשומות זהות ודומות בשדות טקסט. מילת המפתח היא דומה. לאיתור רשומות זהות לחלוטין קיימים כלים רבים.

מרגע שרשומה זוהתה כאחת שיש לה דומות, ניתן לאסוף אותן לקבוצות הנקראות Fuzzy groups ולדרג אותן בהתאם לדרגת הדמיון בין חברות הקבוצה. ככל שנתונים דומים יותר,  דרגת הדמיון גבוהה.

באמצעות הכלי ניתן לאתר רשומות עם שונות קלה כגון טעויות כתיב או קיצור של "שד." במקום "שדרה" ( או "רח." במקום "רחוב"). שינויים מינוריים אלה אותם קשה למצוא ללא כלי Fuzzy Duplicates מאפשרים למועלים ליצור רשומות כפלות שאינן זהות לחלוטין.

הרשמה

שכחת סיסמה?