معرفی و دانلود کتاب Automating Data Quality Monitoring

Automating Data Quality Monitoring
Automating Data Quality Monitoring

کسب‌وکارهای جهان هر روز مجموعاً 2.5 کوین‌تیلیون (عدد 1 با 18 صفر بتوان 2) بایت داده مصرف می‌کنند. اما چه مقدار از این حجم عظیم داده - که برای ساخت محصولات، تقویت سیستم‌های هوش مصنوعی و تصمیم‌گیری‌های تجاری استفاده می‌شود - کیفیت پایینی دارد یا بدرد نخور است؟ این کتاب عملی به شما نشان می‌دهد که چگونه می‌توانید اطمینان حاصل کنید که داده‌هایی که سازمان شما به آن‌ها تکیه می‌کند فقط حاوی سوابق با کیفیت بالا باشد.

اکثر مهندسان داده، تحلیلگران داده و دانشمندان داده واقعاً به کیفیت داده ها اهمیت می دهند، اما آنها اغلب زمان، منابع یا درک لازم برای ایجاد یک راه حل نظارت بر کیفیت داده که در مقیاس موفق باشد را ندارند. در این کتاب، جرمی استنلی و پیج شوارتز از Anomalo توضیح می‌دهند که چگونه می‌توانید از نظارت خودکار کیفیت داده‌ها برای پوشش دادن همه جداول خود به طور موثر، هشدار فعالانه در مورد هر دسته از مسائل و حل مشکلات سریعا استفاده کنید.

این کتاب به شما کمک خواهد کرد:

  • بیاموزید که چرا کیفیت داده یک اصل الزامی تجاری است
  • درک و ارزیابی مدل های یادگیری بدون نظارت برای تشخیص مسائل داده ها
  • سیستم اطلاع رسانی را پیاده‌سازی کنید که بی توجهی به هشدار را کاهش می‌دهند و به شما امکان می‌دهند مشکلات را به سرعت بررسی و حل کنید
  • ادغام نظارت خودکار کیفیت داده ها با کاتالوگ داده ها، لایه های تنظیم و سیستم های BI و ML
  • محدودیت های نظارت خودکار کیفیت داده ها و نحوه غلبه بر آنها را درک کنید
  • نحوه استقرار و مدیریت راه حل نظارت خود را در مقیاس متفاوت بیاموزید
  • نظارت خودکار بر کیفیت داده ها را برای طولانی مدت حفظ کنید

این کتاب در ژانویه 2024 توسط انتشارات Oreilly منتشر شد و در 8 فصل جمع آوری شده است که عبارتند از:

1. The Data Quality Imperative (ضرورت کیفیت داده)

2. Data Quality Monitoring Strategies and the Role of Automation (استراتژی های نظارت بر کیفیت داده ها و نقش اتوماسیون)

3. Assessing the Business Impact of Automated Data Quality Monitoring (ارزیابی تأثیر تجاری نظارت خودکار بر کیفیت داده ها)

4. Automating Data Quality Monitoring with Machine Learning (خودکارسازی نظارت بر کیفیت داده ها با یادگیری ماشین)

5. Building a Model That Works on Real-World Data (ساخت مدلی که بر روی داده های دنیای واقعی کار می کند)

6. Implementing Notifications While Avoiding Alert Fatigue (اجرای سیستم هشداردهی با جلوگیری از بی‌توجهی به هشدارها)

7. Integrating Monitoring with Data Tools and Systems (یکپارچه سازی نظارت با ابزارها و سیستم های داده)

8. Operating Your Solution at Scale (راه‌اندازی راه‌حل شما به صورت مقیاس‌پذیر)

همچنین در مورد انواع مشکلات کیفیت داده ها به عنوان پیوست درج شده است.

جهت دانلود رایگان کتاب به کانال تلگرام Computer Ebook (@itpdfbook) مراجعه نمایید.