نویسنده: آرمان آذرنیک
رمزارزها که امروزه با حذف واسطه در انتقال پول به رقیبی قدر برای بانک ها تبدیل شده اند به دلیل ناشناس بودن و سختی یا در برخی موارد غیرممکن بودن ردیابی به ارز ایده آل برای بازارهای سیاه تبدیل شده ا ند. گسترش روزافزون مقبولیت آنها از سوی جوامع و راحت تر شدن خرج کردن دلیل دیگری برای محبوبیت رمزارزها در میان مجرمان است. یکی از موارد پر استفاده از رمزارزها برای پولشویی و فرار مالیاتی بوده و اکثر دولت ها و نهادهای بین المللی شدیدا به دنبال راهکارهایی برای شناسایی این دست موارد هستند. امروزه که پولشویی به روش های سنتی انجام نمی شود، روش های سنتی نیز برای کشف آن ناکارآمد بوده و ساخت گراف تراکنش ها و استفاده از روش های یادگیری ماشین در کندوکاو ویژگی های این گراف ها به بهترین راه حل تشخیص این موارد بدل گردیده است. پژوهش های مختلفی در دهه اخیر در این خصوص صورت گرفته و محققان روش های مختلفی برای تشخیص پولشویی با استفاده از یادگیری ماشین ارائه کرده و با انجام مقایسه، کارایی این روش ها را به اثبات رسانده اند. در این گزارش به بررسی برخی از پژوهش ها در حوزه ی پولشویی و کلاهبرداری پرداخته و خط مشی برای کارهای آینده ترسیم می کنیم.
واژگان کلیدی: رمزارز، پولشویی،علم شبکه، یادگیری ماشین
پس از فروپاشی افتصادی بانکهای آمریکا در سال ۲۰۰۸ و خارج کردن سرمایهها از بانک، بی اعتمادی به نظام پولی بیشتر شده و افراد به دنبال راهکارهای جایگزین برای نگهداری و انتقال پو های خود گشتند . با توجه به پدیده نوظهور شبکه جهانی اینترنت ، رمزارزها به دلیل امنیت بالا، تمرکز زدای و تحت کنترل فرد و نهاد و کشورها نبودن محبوبیت بالابی یافته و ارزش و استفاده از آن ها به طور میانگین همواره افزایشی بوده است. اما ماند هر فناوری دیگر، بشر به دنبال سو استفاده از رمزارزها نیز بوده چه بسا افرادی که به دنبال شکستن امنیت رمزارزها، استفاده از آن ها برای موارد غیر قانونی و غیر اخالاقی ماند قاچاق، مواد مخدر، پولشویی و تقلب بودهاند. با توجه به اهمیت این موضوع، جلوگیری و تشخیص این موارد نیز اهمیتی دو چندان یافته و پژوهشهای بسیاری در سراسر دنیا برای جلوگیری و تشخیص این سو استفادهها انجام شده و در حال انجام است.
تبهکاران اکثرا اعمال مغایر قانون خود را با اهداف مالی همراه کرده و یا حداقل نیازمندی های مالی (مانند اعمال تروریسمی) دارند. قاچاقچیان، دزدان و سایر قانون شکنان، همگی نیاز یه خرج کردن پول کثیف خود داشته و در صورتی که قادر به انجام آن نباشند انگیزه اصلی ارتکاب جرم را از دست می دهند، بنابراین تشخیص و مبارزه با پولشویی اهمیتی دو چندان می یابد.
با توجه به اینکه شبکه تراکنشهای رمزارزها و صاحبان حساب ها قابلیت مدل سازی به صورت شبکههای پیچیده پویا را دارند، شناخت و تحلیل این شبکه ها کمک بسیاری به شناسایی متقلبان میکند.
پولشویی که از زمان های اسکناس های کاغذی وجود داشته، تکنیکی است که مختص به مجرمان بوده و آن ها با کمک این تکنیک، پولی که از راه های غیرقانونی (قاچاق مواد مخدر، فعالیت های تروریستی، قاچاق کالا، کلاهبرداری، دزدی و...) به دست می آورند را به شیوه ای قانونی به بدنه اقتصادی تزریق می کنند و به این ترتیب حجم عظیم پول های نقد را در جریان روند قانونی بانکی وارد نموده تا از پول نامشروع خود استفاده کنند. این عمل مجرمانه، تقریبأ در تمام کشورهای دنیا اتفاق می افتد و معمولأ پول، بین چند کشور جا به جا خواهد شد. با توجه به این نکته که در این فرآیند پول کثیفی که از راه های غیرقانونی به دست آمده به پول تمیز تبدیل می شود، در اصطلاح به آن پولشویی می گویند. بر اساس تعریف وزارتخانه خزانه داری آمریکا[۱]، پولشویی به عمل پنهان و یا تبدیل کردن دارایی های مالی به قسمی گفته می شود که بتوان از آن ها استفاده کرد بدون آنکه فعالیت غیر قانونی که باعث تولید آن ها شده است قابل تشخیص باشد.
مراحل تبدیل پول کثیف به تمیز به شرح زیر است:
تزریق پول
با توجه به این نکته که بانک ها موظفند تا تراکنش های با مبلغ بالا را گزارش دهند، مرحله تزریق پول، معمولأ پرخطرترین مرحله پول شویی به حساب می آید. در این مرحله، پول کثیف به شکل سپرده های نقدی بانکی، وارد یک مؤسسه مالی قانونی می شود. البته خلافکاران برای وارد کردن اولیه پول به حساب های بانکی، از روش های مختلفی استفاده می کنند تا به این ترتیب، نیاز به ارایه گزارش برای پول ها را نداشته باشند. از جمله این روش ها می توان به کوچک و خرد کردن تراکنش های واریزی اشاره کرد.
لایه بندی
لایه بندی، پیچیده ترین مرحله است و در صورتی که موفقیت آمیز باشد، گرفتن رد پول کثیف، تقریبأ غیرممکن خواهد بود. در این مرحله، برای تغییر ماهیت پول های کثیف، آن ها را از طریق تراکنش های مختلف مالی به حساب های مختلف ارسال می کنند و به این ترتیب، پیگیری آن ها دشوار می شود. لایه بندی از طریق چندین تراکنش بانک به بانک در کشورهای مختلف، امکان پذیر است و به واسطه آن، ماهیت وجه پولی که در حساب های مختلف است تغییر می کند.
ادغام و یکپارچه سازی
در مرحله ادغام، پول کثیف وارد چرخه عادی اقتصاد می شود و به نظر می رسد که از یک منبع قانونی به دست آمده است. به این ترتیب که در این مرحله، سرمایه گذاری هایی که در بخش لایه بندی انجام شده بود، به پول نقد تبدیل می شود و مجرم بدون آن که درگیر قانون شود می تواند از پول شسته شده استفاده کند.
فناوری زنجیره بلوکی را شاید بتوان یکی از مهم ترین ابداعات بشر در دهه های اخیر و به لحاظ کاربرد و منظر انقلابی بودن هم سطح با اینترنت دانست. برای درک چیستی این فناوری بهتر است از واژه شناسی آن شروع کنیم که به معنی زنجیره ای متصل از بلاک هایی است که اطلاعات در آن ها ثبت می شوند. زنجیره بلوکی را می توان یک پایگاه داده ی توزیع شده در نظر گرفت که بین گره های یک شبکه ی رایانه ای به اشتراک گذاشته می شوند. اهمیت این فناوری در غیرقابل دستکاری و امن بودن اطلاعات ذخیره شده در آن است.
این فناوری کاربردهای بسیاری دارد از جمله:
خدمات مالی: زنجیره بلوکی به ثبت تراکنش های مالی و اطمینان از عدم دستکاری آن ها کمک می کند.
بهداشت و درمان: برای ثبت اطلاعات بیماران در بلاک ها از فناری زنجیره بلوکی استفاده می شود.
حکمرانی: در زمینه هایی مانند رای دهی و جلوگیری از تقلب در انتخابات از این فناوری استفاده می شود.
شاید بتوان این حوزه را مهم ترین کاربرد فناوری زنجیره بلوکی دانست زیرا همانگونه که پیشتر ذکر شد، اطمینان از عدم دستکاری اطلاعات مهمترین ویژگی این فناوری بوده و از طرفی حوزه های مالی نیز بیشترین انگیزه را برای این دستکاری ایجاد می کنند، پس به نوعی این فناوری یکی از بهترین استفاده های خود را در این حوزه خواهد داشت. از کاربردهای این فناوری در این حوزه می توان به موارد زیر اشاره نمود:
رمزارزها: رمزارزها، ارزهای دیجیتال رمزنگاری شده ای هستند که برای معاملات از آن ها استفاده شده و هرروزه در حال گسترش هستند.
کیف پول دیجیتال: کیف پول های دیجیتال الزاما برای حوزه مالی نبوده ولی کاربرد اصلی آن ها در نگه داری موجودی رمزارزها و انجام تراکنش هاست.
امور وراثت: در این سری مواردی که خود فرد احتمال عدم پایبندی به وصیت را پس از فوت خود می دهد، از این فناوری و قرارداد هوشمند استفاده می شود.
وام و اعتبار: برای ثبت وام و اطمینان از بازپرداخت آن ها، اطلاعات آن در یک بلاک به صورت قرارداد هوشمند ثبت می شود.
حسابداری: برای جلوگیری از دستکاری حساب ها و تراکنش ها خصوصا برای مبحث مالیات، ثبت آن ها در بلاک یک روش پرکاربرد است.
رمزارز ها را شاید بتوان محبوب ترین و پرکاربردترین استفاده ی فناوری زنجیره بلوکی دانست. از سال ۲۰۰۹ و پس از انتشار مقاله سفید بیت کوین۱ توسط خالق آن ساتوشی ناکاموتو[۲]، حوزه ی رمزارزها به شدت رواج یافته و هر ساله رمزارزهای جدیدی توسط افراد و نهادها معرفی می شوند. رمز ارز یا ارز رمزنگاری شده یک نوع ارز دیجیتال است که به وسیله فناوری رمزنگاری امنیت آن تضمین می شود.رمزارز نوعی ارز دیجیتال است که امکان انتقال ارزش در محیط دیجیتال را برای افراد فراهم می کند.
رمز ارز نوعی ارز دیجیتال است. خیلی از افراد این دو مفهوم را به جای هم استفاده می کنند. این در حالی است که رمزارزها فقط یک دسته از ارزهای دیجیتال را شکل می دهند. ارز دیجیتال شکلی از پول است که فقط در فضای دیجیتال و الکترونیک وجود دارد. برای استفاده از ارزهای دیجیتال در معاملات باید از کامپیوتر یا کیف پول متصل به اینترنت استفاده کنید.
مفهوم یادگیری ماشین به عنوان یکی از زیرشاخه های هوش مصنوعی که در آن سعی بر آموختن به ماشین(رایانه) بدون برنامه نویسی صریح و از طریق مثال هایی است که به آن داده مي شود، بیش از ۶۰ سال پیش مطرح شده است. اما اکنون به دلیل پیشرفت بسیار زیاد قدرت محاسباتی رایانه ها و روش های حل مسائل و الگوریتم ها و خصوصا افزایش سرعت و حجم تولید داده ها که رکن اصلی و ورودی یادگیری ماشین است؛ بسیار مورد توجه قرار گرفته است.
انواع روش های یادگیری ماشین را می توان در چهار دسته جای داد:
یادگیری نظارت شده
داده هایی برچسب گذاری شده به عنوان ورودی به ماشین داده شده و خروجی نیز مشخص می گردد؛ ماشین الگوی رسیدن از ورودی به خروجی را یاد می گیرد. مانند تشخیص هرزنامه های الکترونیکی و سایر نامه های الکترونیکی؛ که تعداد بسیار زیادی نامه الکترونیکی از قبل آماده شده با برچسب های هرزنامه و غیرهرزنامه به ماشین داده می شود تا خود ماشین به دنبال ویژگی های مشترک آن دسته ها گشته و در آینده بتواند نامه های الکترونیکی را که از قبل برچسب گذاری نشده اند را در یکی از این دو دسته جای دهد. یادگیری نظارت شده قابل تقسیم به دو دسته کلی، دسته بندی و رگرسیون است.
یادگیری نظارت نشده
داده ها بدون برچسب گذاری یا دسته بندی به ماشین داده شده و هدف دسته بندی داده های ورودی براساس شباهت ها و تفاوت ها و تشخیص الگو بین آن هاست. مثلا تعداد بسیار زیادی تصویر سیب و پرتقال برچسب گذاری نشده به ماشین داده شده و ماشین شباهت و تفاوت های آن ها را یافته و آن ها را در دو دسته جدا قرار می دهد بدون آنکه هیچ تصوری از مفهوم سیب و یا پرتقال داشته باشد. یادگیری نظارت شده قابل تقسیم به دو دسته کلی، قوانین انجمنی و خوشه بندی است.
یادگیری تقویتی
این نوع یادگیری با تشویق رفتار مطلوب و تنبیه رفتار نامطلوب انجام می شود؛ ماشین با بازخوردهایی که از اعمال خود می گیرد به صورت آزمون و خطا مسائل مختلف را درک و تفسیر می کند؛ هدف ماشین به حداکثر رساند پاداش است و برچسب گذاری در این روش وجود ندارد. این روش در بازی های رایانه ای بسیار استفاده می شود و همان روشی است که باعث برد رایانه در بازی شطرنج در برابر انسان می شود.
کولادون و همکاران [۳] برای تحلیل پولشویی در شبکه ی افراد،از داده های واقعی جمع آوری شده ی یک کارخانه در ایتالیا در طول ۱۹ ماه استفاده کرده و به کمک علم شبکه، به تحلیل پولشویی در آن شبکه پرداختند.آن ها ابتدا داده های خود را به صورت مدلی از تراکنش ها، افراد و عملیات های کسب و کار درآورده و در آخر صحت کار خود را با کمک دادگاه های ایتالیا و بررسی پرونده برخی افراد آن کارخانه آزمودند. در این کارخانه، صورتحساب برای خدماتی که انجام نشده یا کالاهایی که فروخته یا خریداری نشده بودند صادر می شد.
طبق یافته های آن ها، افراد مجرم معمولا سریع وارد شبکه شده، ارتباط سازی لازم خود را با افراد مهم شبکه انجام داده و سریع از شبکه خارج می شوند بنابراین افراد و کسب و کارهای تازه وارد و افرادی که به تازگی از شبکه خارج شده اند مشکوک به پولشویی هستند. طبق تحلیل های آن ها، مواردی که اطلاعات ناقص دارند نیز با احتمال بالاتری درگیر پولشویی هستند. همچنین آن ها با مقایسه ی شبکه ی خود و ویژگی های آن با چندین شبکه ی دچار پولشویی دیگر دریافتند که استخراج این ویژگی ها و مقایسه ی آن ها با یکدیگر در شبکه های مالی، به تشخیص زودهنگام پولشویی در شبکه ی جدید کمک می کند.
ترتیچنی و همکاران [۴] برای تشخیص پولشویی در شبکه ها، با علم به ناکامل بودن اطلاعات گره ها و یال ها در اکثر شبکه ها، تشخیص مخاطره بر اساس رفتار جمعی یک گروه را پیشنهاد کرده و روش خود را با داده هایی که از سه حوزه قضایی مختلف دریافت کرده بودند آزمایش کردند.
آنان ابتدا داده های خود را جمع آوری نموده و مدلی به شکل گراف از تراکنش ها ساختند. سپس از الگوریتم غیرنظارت شده ی تشخیص انجمن استفاده کردند تا گروه ها را در شبکه ی تراکنش های خود بیابند، سپس از گروه ها ویژگی هایی استخراج کرده و آن ها را همراه با ویژگی های قبلی که در تراکنش ها موجود بود، به الگوریتم غیرنظارت شده داده تا خوشه ی ناهنجار را تشخیص داده و نهایتا یک متخصص پولشویی، داده های ناهنجار را برای اطمینان بررسی می کند.
برای تشخیص انجمن ها و برچسب گذاری آن ها از الگوریتم نیمه نظارت شده ی انتشار برچسب استفاده نموده و برای تشخیص ناهنجاری ابتدا از الگوریتم ماشین بردار پشتیبان استفاده نمودند که آن را با توجه به حجم بالای داده ها بسیار کند دانسته، سپس به سراغ الگوریتم غیرنظارت شده ی عامل دور افتاده محلی برای تشخیص ناهنجاری رفتند که آن هم علاوه بر مناسب نبودن برای چنین داده هایی، کارایی پایینی داشت و نهایتا از الگوریتم جنگل ایزوله بدین منظور استفاده کردند. ترتینچی با مقایسه ی روش خود با دیگر روش ها در زمانی که اطلاعات شبکه ناقص باشد نتیجه مطلوبی را دریافت کرده است.
ژو و همکاران[۵] با تحلیل ابربرنامه ی چینی Tecent QQ به بررسی پولشویی با استفاده از ارز مخصوص این برنامه یعنی Q پرداختند. این ابربرنامه چینی با بیش از ۸۶۰میلیون کاربر، یکی از محبوب ترین برنامه ها بوده و قابلیت گفتوگو، بازی، تماشای فیلم و گوش دادن به موسیقی و ... را دارد. ارز این برنامه توسط مجرمان با قیمتی بسیار پایین یا حتی رایگان و یا حتی با دخل و تصرف حساب دیگران جمع آوری شده و برای مشکوک نشدن صاحب برنامه در حساب های زیادی نگه داری شده، سپس مجرم در پایگاه های اینترنتی مختلفی مانند Ebay فروش آن ها را با تخفیفی بسیار زیاد برای وسوسه کردن خریداران تبلیغ کرده و به فروش می رسانند، سپس ارز فروخته شده را از حساب های مختلف خود به حساب خریدار درون برنامه انتقال می دهد.
مجرم پول کثیف خود را با اختلاف قیمتی که این رمزارز را به دست آورده و قیمت اصلی آن پاک می کند. ژو برای این آزمایش، تبلیغات فروش این ارز را ردیابی نموده و آن را خریداری نموده، سپس حساب هایی که در برنامه از آن ها ارز به حساب خریدار انتقال داده شده را برچسب گذاری کرده و ویژگی های این حساب ها را همراه دیگر حساب های فعال در آن بازه ثبت کرده اند. ویژگی هایی مانند فعالیت های ورود و خروج به حساب کاربری، پرداخت های حساب شامل مقدار، تاریخ، سرویس خریداری شده، نوع پرداخت و تعداد روز های فعال حساب و .. سپس گرافی از حساب های کاربری دریافت کننده و پرداخت کننده این ارز ساخته و با حذف دریافت کنندگان ارز و تبریل گراف اولیه، گراف جدیدی ساخته و تحلیل های علم شبکه و الگوریتم یادگیری ماشین خود را روی آن انجام می دهند.
آن ها همچنین مطالعه ای روی پولشویی در دنیای واقعی داشته تا رفتارها و الگو های کلیدی آن را پیدا کنند، نهایتا روش خود را روی مجموعه ای از ۴۹۴۴۱۴ داده ی کاربران که ۱۱۴۸۹۱ مورد آن ها مشکو به پولشویی بوده و شامل ۵۶ ویژگی می شدند را با الگوریتم های رگرسون خطی، جنگل تصادفی و ماشین بردار پشتیبان آزموده و با جنگل تصادفی و ماشین بردار پشتیبان بهترین نتیجه را گرفتند.
لیما و همکاران[۶] با تاکید بر اهمیت جلوگیری از پولشویی در جلوگیری از خلاف، روش SNA۱ را معرفی کردند تا به حسابرسان قانونی در ردیابی پول ها کمک کنند.
آن ها با مصور سازی حرکت پول در یک شبکه.۳ ۶ و شفاف سازی افراد و مسیرهای کلیدی، به بررسی این شبکه با استفاده از علم شبکه پرداخته و نتیجه گرفتند که افراد زیادی پول کمی جابه جا کرده و افراد کمی پول زیادی را جابه جا می کنند.
لیما و همکاران نیز تاکید داشتند که شناسایی ویژگی های یک شبکه ی دچار پولشویی و مقایسه ي آن با دیگر نمونه های پیشین به تحلیل بهتر این شبکه کمک می کند.
کلاچالا و همکاران [۷] ضمن بررسی برخی چالش ها روش های ایجاد لیست سیاه را نیز مقایسه کرده اند لیست سیاه در رمزارزها، فرآبند تشخیص تراکنش هایی است که در اعمال مجرمانه مانند دزدی و پولشویی دخیل بوده و سکه های آن تراکنش را آلوده کرده اند و جلوی مبادله آن در جای دیگری را می گیرند.
این ایده از لیست سیاه وزات خزانه داری آمریکا [۸] الهام برداری شده که در آن، اسامی افراد و شرکت هایی که نباید با آن ها مبادله تجاری داشت منتشر می شود. اما از چالش های آن، بی تاثیر بودن ابزارهای تنبیهی رمزارزهایی مانند بیت کوین است، زیرا هر فرد قادر به ساخت تعداد نامحدودی حساب بوده و در صورت جریمه شدن یک حساب، حساب دیگری می سازد.
مشکل دیگر روش لیست سیاه با توجه به فراسزمینی بودن شبکه رمزارزها، فراسرزمینی و متحد شدن سازمان های مختلف از کشورها و حوزه های قضایی مختلف مانند FATF و پلیس بین الملل است. چالش دیگر این روش با توجه به توزیع شده بودن و به طول انجامیدن فرآیند ثبت بلوک ها، آنست که شاید سکه ای ابتدا در لیست سیاه نبوده و کاربر آن را دریافت نماید اما در ادامه با بررسی بیشتر شبکه وارد لیست سیاه شده و کاربر غیر خاطی از این امر متضرر شود، با ایجاد تاخیر در ساخت بلاک ها میتوان اثر این امر را کاهش داد اما دچار مشکلات دیگری خواهیم شد.
چالش بعدی تعدد رمزارزهاست که در صورتی که مجرم دارایی خود را به ارزهای مختلف در حساب های مختلف تقسثیم کند، ردیابی آن ها را دشوارتر می کند. مورد دیگر سازمانی است که همه بر روی آن برای ایجاد لیست سیاه توافق داشته باشند که با توجه به کثرت نظرها دشوار است.
از چالش های دیگر می توان از خرابکاری عمدی در این حالت یاد کرد که فرد دارای سکه های آلوده با توزیع سریع آن در یک شبکه ی چگال، کل شبکه را آلوده سازد.
کلاچا همچنین دو روش زیر مجموعه لیست سیاه یعنی زهر و کوتاهی مو را نیز بررسی کرد، در روش زهر هر سکه ای که در تراکنشی مشکوک بوده نشان گذاری شده و هر تراکنشی که حتی شامل یکی از این سکه ها بشود نیز نشان گذاری خواهد شد.
روش کوتاهی مو اینقدر سختگیر نبوده و تنها سکه های انتقال مشکوک را نشان گذاری می کند. طبق نظر کلاچا این لیست سیاه رمزارزها باید به طور عمومی منتشر شود تا با کاهش انگیزه ی افراد به مبادله ی ّ ای خودشان، نهایتا آن سکه ها از دور و استفاده عمومی خارج شده و اقبال مجرمان آن به دلیل لکه دار شدن سکه برای انجام جرم با کاهش انگیزه مالی کاهش پیدا خواهد کرد.
بداوی و همکاران [۹] به شناسایی الگو های تراکنش های قانونی و غیر قانونی پرداخته و با استفاده از روش های نظارت شده ي یادگیری ماشین مانند شبکه های عصبی کم عمق و درخت تصمیم به دستبدی تراکنش ها در سه دسته ي قانونی، غیرقانونی و نامعلوم پرداخته و به ترتیب به دقت ۸۸/۹ و ۹۳/۴ درصدی رسیدند.
آن ها آزمایش خود را روی ۲۰۰ هزار داده ی تراکنش با ۱۶۶ ویژگی شامل زمانمهر، کارمزد تراکنش، حداقل و حداکثر و میانگین مبلغ تراکنش هاانجام داده و داده ها را به صورت ۷۵ درصد برای تعیلم، ۱۵ درصد برای آزمون و ۱۰ درصد برای اعتبار سنجی تقسیم بندی کردند.
آنها ابتدا داده های خود را به صورت گرافی با ۲۰۳۷۶۹ گره نمایشگر افراد و ۲۳۴۳۵۵ یال نمایشگر تراکنش ها مدل سازی کرده و سپس از الگوریتم های یادگیری نظارت شده ی ذکر شده استفاده کردند. شکل.۳ ۸ مدل الگوریتم شبکه عصبی کم عمق ساخته شده برای ساخت دسته بند را نشان می دهد.
وبر و همکاران [۱۰] با مجموعه داده ي ELLIPTIC که گرافی از تراکنش های شبکه ی بیت کوین است که در آن گره ها تراکنش ها و یال ها جریان ها تراکنش هستند، برای دسته بندی آن ها به دو دسته ی قانونی و غیر قانونی از روش های یادگیری ماشین نشارت شده ی رگرسیون خطی، پرسپترون چند لایه و جنگل تصادفی استفاده کرده و با تقسیم بندی داده ها به صورت -۷۰ ۳۰ برای تعلیم و آزمودن الگوریتم شبکه گراف کانولوشنال که شبه پرسپترون چند لایه است استفاده کرده و به دقت ۹۰ درصدی رسیدند.
عزیز و همکاران [۱۱] برای تشخیص تراکنش های غیر قانونی در شبکه اتریوم از روش LGBM که بر پایه ی درخت تصمیم بوده استفاده کرده و آن را با سایر روش های یادگیری ماشین مقایسه کرده و به کارایی روش خود پی برده اند.
داده های آن ها شامل ۹۸۴۱ تراکش قانونی و غیر قانونی با ۱۷ویژگی بوده که به صورت -۸۰ ۲۰ به مجموعه داده های تعلیم و آزمون تقسیم شدند. آن ها روش خود را با رگرسیون خطی، k نزدیک ترین همسایه، پرسپترون چند لایه، جمگل تصادفی، ماشین بردار پشتیبان،ADABoost ، XGBoost مقایسه کرده و روش آن ها با ۹۸/۶ درصد و سپس XGBoost با .۹۷ ۷ درصد دقت (شکل .۳ ۹)بهریت کارایی را داشته و با تغییر برخی آرگمان ها دقت روش خود را تا ۹۹/۰۳ درصد بالا بردند. همچنین روش آن ها با وجود آنکه با تعداد داده های بالا بهتر کار می کند، نیازمند اشغال فضای حافظه ي کمتری است.
بیناگاری و همکاران [۱۲] کاربرد الگوریتم درخت مانند XGBoost را برای تشخیص پولشویی آزمایش کرده و از مجموعه داده ی elliptic به دلیل بزرگی و در دسترس عموم بودن استفاده کرده اند. در این مجموعه داده که به شکل گراف مدل سازی شده، ۲۰۳۷۹۵ گره نمایشگر تراکنش ها و ۲۳۴۳۵۴ یال جهت دار نمایشگر جریان های تراکنش هستند که دارای برچسب قانونی و غیر قانونی بوده و می توان از آن ها در الگوریتم یادگیری ماشین نظارت شده استفاده نمود.
۴ داده با برچسب غیرقانونی و ۴۲۰۱۸ داده با برچسب قانونی نشان گذاری شده و سایر داده ها برچسب ندارند. هر تراکنش نیز تا ۱۶۶ ویژگی داشته که شامل مواردی مانند کارمزد تراکنش، مبلغ تراکنش، زمانمهر آن و ... می شود.
الراب و همکاران [۱۳] برای شناسایی پولشویی در شبکه ی بیت کوین از روش های یادگیری ماشین نظارت شده روی داده های ellipticاستفاده کرده و برای کاهش تعداد موارد مثبت کاذب تلاش کرده اند.
آن ها ابتدا داده های خود را پیش پردازش کرده و آن را بر اساس زمانمهرها به دو دسته ی تعلیم و آموزش تقسیم بندی کرده اند. الراب برای ارزیابی کار خود از الگوریتم های یادگیری ماشین نظارت شده ی جنگل تصادفی، k نزدیک ترین همسایگی، AdaBoost و Gradient Boosting استفاده کرده و الگوریتم های ماشین بردار پشتیبان و رگرسیون خطی را از ابتدا به دلیل نامتعادل بودن برچسب های مجموعه داده و عدم کارایی کنار گذاشته اند. آن ها روش ترکیبی خود را بهتر از الگوریتم های ذکر شده یافته و به دقت ۹۸/۱۳ درصدی با تنها ۷ مورد مثبت کاذب رسیدند.
بهومیک و همکاران [۱۴] با پژوهش بر روی شبکه ی بلاکچین به منظور تشخیص کلاهبرداری، هشت الگوریتم مختلف یادگیری ماشین شامل رگرسیون خطی، پرسپترون چندلایه، درخت تصمیم، ماشین بردار پشتیبان، جنگل تصادفی و شبکه عصبی عمیق را استفاده کرده و به دقت ۹۷ درصدی رسیدند.
آن ها برای انجام این آزمایش پس از تایید اولیه یک تراکنش در شبکه کار خود را شروع می کنند تا سربار کمی برای سیستم داشته باشد، ابتدا داده های خود را پیش پردازش کرده و به صورت -۸۰ ۲۰ برای تعلیم و آزمایش جداسازی کرده و سپس الگوریتم های خود را روی آن ها اعمال می کنند.
الراب و همکاران [۱۵] روشی بر اساس تاگوریتم یادگیری ماشین شبکه گراف کانولوشنال تقویت شده با شبکه پرسپترون پیشنهاد داده تا تراکنش های غیرقانونی در شبکه ی بیت کوین را شناسایی کنند. آنان از مجموعه داده ی Elliptic استفاده کرده و داده ها را بر اساس مهرزمانی به مجموعه ی آموزش و آزمون تقسیم بندی کرده اند.
آن ها شبکه گراف کانولوشنال را توسعه داده زیرا خود آن ذاتا بر روی گراف بدون جهت کار کرده اما مدل مجموعه ای از تراکنش های جهت دار شبکه ی بیت کوین است و با این بهبود نهایتا به دقت ۹۷/۴ درصدی رسیدند.
پولشویی عملی مجرمانه است که خود شاید در ادامه یا شروع کننده ي اعمال تبهکارانه دیگری مانند تروریسم، قاچاق انسان و کالا، مواد مخدر، دزدی، گروگانگیری و ... باشد[۱۷]. اهمیت مبارزه با پولشویی در آنست که اگر تبهکاری از پول کثیف و خلافی که به دست می آورد نتواند استفاده کند و این پول برای او قابل خرج کردن نباشد، انگیزه ی انجام اعمال خلاف برای وی به شدت کاهش می یابد.
پولشویی از زمان های بسیار قدیم و به صورت انتقال و نگه داری و خرج کردن اسکناس های کاغذی و طلا و جواهرات رایح بوده اما با افزایش حسابرسی های نهادهای داخلی و بین المللی و نظارت شدید، جابه جایی فیزیکی این اموال سخت تر شده و تبکاران رو به استفاده از روش های جدیدتر پولشویی مانند ایجاد کسب وکارهای سوری و لایه گذاری تراکنش های بانکی خود آورده اند[۱۸].
اما با شروع هزاره سوم میلادی و تصویب قوانین پولشویی جهانی مانند FATF و الزام کشورها برای پیوستن و پذیرفتن این قوانین جدید، در حالی که دنیای پول کثیف مجرمان در حال کوچکتر شدن و محدود به چندین کشور و حوزه قضایی بود، اختراعی جدید دنیا را تکان داده و دریچه هایی بدون مرز جغرافیایی برای این مجرمان گشود، خصوصا که این بار هیچ نهاد متمرکزی برای مبارزه با پولشویی و سایر این دست جرایم وجود نداشته و مهمتراز آن علاوه بر حذف نیاز به واسطه، گمنامی تبکاران را تضمین می کند.
فناوری زنجیره بلوکی و رمز ارزهایی که بر بستر آن پیاده شده اند،همه گیری و دسترسی پذیری بالای اینترنت در سراسر دنیا و روش های ناپدید ساختن ردگیری همراه با ویژگی بی هویت بودن حساب های کاربری رمزارزها که امکان ساخت تعداد بیشمار حساب را با هر فرد می دهد، به نظر می رسد مبارزه با پولشویی را سال ها عقب انداخته باشد، اما فناوری و علومی مانند علم شبکه و یادگیری ماشین آماده اند تا با دقت و سرعت بالا به کمک کشور ها و حسابرسان قانونی آمده و جلوی پیروزی تبکاران در این جدال را بگیرند.
با توجه به ماهیت غیر فیزیکی رمزارزها و تعداد بسیار زیاد کاربران و تراکنش ها و روش های جدیدی که هر روزه برای دور زدن قوانین پولشویی ابداع می شوند، دیگر علوم ساده رایانه ای و محاسباتی مانند چند ده خط برنامه برای تشخیص پولشویی کافی نبوده و روش های یادگیری ماشین با انعطاف پذیری بالای خود قدرت مواجه با این تغییر پذیری روش های پولشویی را دارند.
با توجه به اهمیت شدید مبارزه با پولشویی، سالانه انجمن ها و سخرانی ها و پژوهش های بسیاری در این زمینه انجام شده و کشور ها و سازمان ها و بانک های بین المللی، پلیس بین الملل و سازمان های داخلی کشور های آمریکایی و اروپایی که حساسیت بسیاری روی این موضوع دارند حمایت ویژه ای از پژوهشگرانی که دستاوری در این حوزه ها داشته باشند انجام می دهند.
پژوهش های بسیاری هر ساله در این حوزه ها انجام می شود که برخی از آن ها را در فصل قبل مرور کردیم. اکثر پژوهشگران از داده های آماده ی Elliptic که به صورت مدلی از گراف تراکنش ها در شبکه ي بیت کوین است استفاده کرده که دارای بیش از ۲۰۰ هزار داده ي برچسب خورده بوده و قابلیت اعمال الگوریتم های مختلف یادگیری ماشین نظارت شده ای مانند درخت تصمیم بر روی آن ها را دارد. همچنین برخی پژوهشگران صرفا پولشویی را مورد مطالعه قرار نداده و همه ی انواع کلاهبرداری هایی که در تراکنش های بانکی یا رمزارزی قابل انجام است را مطالعه کرده اند. اما چیزی که اکثر این مقالات مشترک بود، استفاده از روش های مدل سازی افراد، شبکه و تراکنش ها، استفاده از علم شبکه برای تحلیل و استفاده از یادگیری ماشین برای تشخیص بود.
با توجه به اینکه تمهیدات قانونی و پژوهش های کافی برای مبارزه با پولشویی به روش های سنتی و حتی بانکی وجود داشته و سایر اقدامات لازم اکثرا اجرایی هستند اما پولشویی به وسیله ی رمزارزها نسبتا جدید محسوب شده و هنوز تا رسیدن به نتیجه مطلوب فاصله بسیاری داریم، برآنیم تا در آینده با به کار گیری علوم ذکر شده و کمک گرفتن از پژوهش های پیشین، روشی موثرتر و سریع تر برای مبارزه و تشخیص پولشویی در رمزارزها ابداع کرده که روش شناسی انجام آن به شرح زیر خواهد بود:
۱- ابتدا مجموعه داده ای بزرگ، قابل اطمینان و با تعداد نمونه های کافی برچسب خورده جمع آوری شود. سعی خواهد شد تا روشی برای استخراج مستقیم داده ها به شکل و تعداد دلخواد از شبکه ی رمزارز دلخواه انجام شود.
۲- مجموعه داده با تعدادی از روش های مورد مطالعه ی ذکر شده آزمایش شده تا کارایی آن روش ها با این مجموعه داده سنجیده شده و ملاک ارزیابی کار آینده ی ما قرار گیرد.
۳- مجموعه داده به شکلی مناسب از شبکه و یا گراف مدلسازی شده به نحوی که بتوان بر روی آن از هر دو دسته الگوریتم های یادگیری ماشین و تحلیل شبکه استفاده نمود.
۴- با انجام آزمایش، تغییر در آرگمان های الگوریتم ها، استفاده از الگوریتم های جدید و روش های ترکیبی، به جستوجوی الگوریتمی با بازده و دقت بالاتر خواهیم پرداخت.
۵- با توجه به اهمیت تعداد موارد مثبت کاذب و منفی کاذب، سعی در بهبود این معیارها خواهیم داشت.
[1] https://www.treasury.gov/ofac/downloads/sdnlist.pdf
[2] Nakamoto, S. and Bitcoin, A., 2008. A peer-to-peer electronic cash system. Bitcoin.–URL: https://bitcoin. org/bitcoin. pdf, 4(2).
[3] Colladon, A.F. and Remondi, E., 2017. Using social network analysis to prevent money laundering. Expert Systems with Applications, 67, pp.49-58.
[4] Tertychnyi, P., Lindström, T., Liu, C. and Dumas, M., 2022, December. Detecting Group Behavior for Anti-Money Laundering With Incomplete Network Information. In 2022 IEEE International Conference on Big Data (Big Data) (pp. 2383-2388). IEEE.
[5] Zhou, Y., Wang, X., Zhang, J., Zhang, P., Liu, L., Jin, H. and Jin, H., 2017. Analyzing and detecting money-laundering accounts in online social networks. IEEE Network, 32(3), pp.115-121.
[6] Sousa Lima, R., Marques Serrano, A.L., Onome Imoniana, J. and Medeiros Cupertino, C., 2022. Identifying financial patterns of money laundering with social network analysis: A Brazilian case study. Journal of Money Laundering Control, 25(1), pp.118-134.
[7] Kolachala, K., Simsek, E., Ababneh, M. and Vishwanathan, R., 2021, August. SoK: money laundering in cryptocurrencies. In Proceedings of the 16th International Conference on Availability, Reliability and Security (pp. 1-10).
[8] https://www.fincen.gov/what-money-laundering
[9] Badawi, A.A. and Al-Haija, Q.A., 2021, November. Detection of money laundering in bitcoin transactions. In 4th Smart Cities Symposium (SCS 2021) (Vol. 2021, pp. 458-464). IET.
[10] Weber, M., Domeniconi, G., Chen, J., Weidele, D.K.I., Bellei, C., Robinson, T. and Leiserson, C.E., 2019. Anti-money laundering in bitcoin: Experimenting with graph convolutional networks for financial forensics. arXiv preprint arXiv:1908.02591.
[11] Aziz, R.M., Baluch, M.F., Patel, S. and Ganie, A.H., 2022. LGBM: a machine learning approach for Ethereum fraud detection. International Journal of Information Technology, pp.1-11.
[12] Ahmed, A., 2021. Anti-money laundering recognition through the gradient boosting classifier. Academy of Accountingand Financial Studies Journal, 25(5).
[13] Alarab, I., Prakoonwit, S. and Nacer, M.I., 2020, June. Comparative analysis using supervised learning methods for anti-money laundering in bitcoin. In Proceedings of the 2020 5th international conference on machine learning technologies (pp. 11-17).
[14] Bhowmik, M., Chandana, T.S.S. and Rudra, B., 2021, April. Comparative study of machine learning algorithms for fraud detection in blockchain. In 2021 5th international conference on computing methodologies and communication (ICCMC) (pp. 539-541). IEEE.
[15] Alarab, I., Prakoonwit, S. and Nacer, M.I., 2020, June. Competence of graph convolutional networks for anti-money laundering in bitcoin blockchain. In Proceedings of the 2020 5th international conference on machine learning technologies (pp. 23-27).
[16] Möser, M., Böhme, R. and Breuker, D., 2013, September. An inquiry into money laundering tools in the Bitcoin ecosystem. In 2013 APWG eCrime researchers summit (pp. 1-14). Ieee.
[17] Mei, D., Ye, Y. and Gao, Z., 2014. Literature review of international anti-money laundering research: a scientometrical perspective. Open Journal of Social Sciences, 2(12), p.111.
[18] Al-Suwaidi, N.A. and Nobanee, H., 2021. Anti-money laundering and anti-terrorism financing: a survey of the existing literature and a future research agenda. Journal of Money Laundering Control, 24(2), pp.396-426.