خواندن ۱۶ دقیقه·۵ سال پیش

نقش حکمروایی داده در بهبود مدیریت شهری

چکیده

شهرهای امروز با چالش‌های مختلفی از جمله رشد اقتصادی، پایداری محیط زیست، تاب‌آوری اجتماعی، آلودگی هوا و ترافیک روبرو هستند. با در نظر داشتن این چالش‌ها، نیازمند اطلاعاتی برای تحلیل و پیش‌بینی در جهت مدیریت بحران‌ها در شرایط خاص هستیم. بسیاری از شهرها در حال سرمایه‌گذاری در تحقیقات فناوری اطلاعات و توسعه سیاست‌هایی برای بهبود کیفیت زندگی شهروندان هستند. با توجه به روند ICT برای شهرهای پایدار هوشمند، فرآیند برنامه‌ریزی آینده شهر، بسیار مهم است. در این راستا یکی از تجربیات موفق نگارندگان این مقاله استفاده از تحلیل‌های پژوهشگران با در اختیار گذاشتن داده‌ی غیر حساس بصورت داده باز و داده‌ی حساس بصورت ناشناس‌سازی شده با پیروی از قوانین PDPC می‌باشد.

این تجربه بر اساس مطالعه نمونه‌های جهانی صورت گرفته با چارچوب پیکره دانش مدیریت داده DMBOK تطبیق دارد و نیارمند حفظ حریم خصوصی و محرمانگی اطلاعات است. این امر مقدمه ای بر پیاده‌سازی حکمروایی داده در سازمان‌ها با رعایت کلیه وجوه مدیریت داده شامل تولید و اشتراک داده‌، اطمینان از کیفیت داده‌، یکپارچگی داده‌ بین سازمان‌ها و بخش‌های مختلف، حفظ حریم خصوصی افراد، شیوه انتشار آزاد اطلاعات و مباحث مرتبط با آن است.

1- مقدمه

تقاضا برای تحلیل های آماری با کیفیت، همچنان رو به افزایش است. آمار به موقع و قابل اعتماد، ورودی اصلی برای تحلیل‌های تصمیم‌ساز است.یکی از نیازمندی‌های دستیابی به هدف فوق در این زمینه، پیشرفت در کیفیت و کمیت داده در کلیه جنبه‌های آن است. یکی از اصلی‌ترین چالش‌های این حوزه که از جلوه‌های حقوق شهروندی نیز به شمار می‌آید، حفظ حریم خصوصی شهروندان و رعایت ملاحظات امنیتی در تولید، اشتراک و انتشار داده‌ می‌باشد.حکمروایی داده تمامی فعالیت‌های مدیریت‌ داده را هدایت می‌کند و هدف آن اطمینان از مدیریت مناسب داده بر اساس سیاست‌ها و روش‌ها است.[2] برای تعیین سطح محرمانگی داده، مراحل و فرآیندهای مختلفی از قبیل بررسی سطح کیفیت داده، ایجاد مخزن فراداده، ایجاد شناسنامه داده نیاز است تا بتوان بر اساس وضع موجود، تصمیم‌گیری کرد. در این مقاله به بررسی نحوه پیاده‌سازی فرآیندهای ذکر شده در مرکز آمار و رصد شهری تهران پرداخته و برخی نمونه‌های جهانی مطالعه شده را شرح می‌دهیم.

2- حکمروایی داده

حکمروایی داده‌ها، فرآیندهای مشخص نمودن حقوق تصمیم‌گیری و چارچوب پاسخگویی برای ایجاد، ذخیره‌سازی، ارزیابی،کاربرد و آرشیو داده‌ها است. با گسترش روزافزون فناوری اطلاعات، ایده شهر هوشمند مطرح و به یکی از اهداف راهبردی شهرداری تهران تبدیل شده ‌است. اطلاعات بسیار زیادی در شهر هوشمند از منابع مختلف گردآوری می‌شوند و مورد تحلیل قرار می‌گیرند. این اطلاعات که اغلب از طریق سنسورها و یا با بهره‌گیری از فناوری اینترنت اشیا جمع‌آوری می‌شوند، تمامی حوزه‌های شهری مانند حمل‌ونقل، خدمات شهری و ... را شامل می‌شوند.امروزه بسیاری از سازمان‌ها، نیازمند حرکت به سمت داده‌محوری هستند. منظور نگارندگان این مقاله از داده محوری تصمیم‌سازی و انتخاب استراتژی بر مبنای داده می‌باشد، اما این امر مستلزم تغییر فرهنگ سازمان نیز است. [1] این تغییر فرهنگ می‌تواند از طریق ابلاغ سند بالادستی و لازم‌الاجرا برای کلیه واحدهای سازمانی صورت پذیرد. یکی از اسناد معتبر جهانی در این زمینه، سند پیکره مدیریت دانش DMBOK است. این پیکره دارای یک مدل چارچوب DAMA-DMBOK است که با نام چرخ داما مطابق شکل 1 معرفی می‌گردد.[3]

شکل 1چرخ داما (قلمروهای دانشی مدیریت داده)

شایان ذکر است که حکمروایی داده جهت حفظ سازگاری، تعادل و هماهنگی بین سایر بخش‌ها در مرکز این چرخ و در مرکز فعالیت‌های مدیریت داده قرار گرفته‌است. در ادامه مقاله به تشریح برخی از بخش‌های شکل 1 و نحوه پیاده‌سازی آن در مرکز آمار و رصد شهری سازمان فناوری اطلاعات شهرداری تهران به عنوان یک تجربه موفق می‌پردازیم.

3- مدیریت فراداده در کلان‌داده

در تجزیه و تحلیل کلان‌داده‌ها باید اهمیت و حساسیت فراداده را در نظر گرفت. توصیف خود داده (بانک اطلاعاتی، مدل داده)، مفاهیم مرتبط با داده (فرآیندهای کسب‌وکار، سیستم‌ها، نرم‌افزار و زیرساخت) و ارتباط بین داده و مفاهیم، بیان‌گر فراداده است که اطلاعاتی در مورد فرآیندهای کسب‌وکار و جنبه‌های فنی، قواعد و محدودیت‌های مرتبط با داده و ساختار فیزیکی و منطقی آنها می‌باشد. سازمان به کمک فراداده می‌تواند داده، سیستم و جریان کاری خود را درک و به نحو مطلوب از آن استفاده نماید. فراداده امکان ارزیابی کیفیت داده را فراهم می‌آورد.

استاندارد ISO/IEC 11179 نیز چارچوبی برای تعریف اجزای فراداده ارائه داده‌است تا انتقال داده بر مبنای آن تسهیل گردد. این استاندارد در 6 بخش چارچوب ایجاد و استانداردسازی عناصر داده، مشخصه‌های پایه، قوانین و راهنمای تعاریف داده، اصول نام‌گذاری و شناسایی عناصر داده، شناسایی و ثبت عناصر داده ارائه شده است. [9] ثابت شده است که یک فرآیند قوی مدیریت فراداده، برای مدیریت موفقیت آمیز اطلاعات، امری لازم و ضروری است.

شکل 2 تغییر حاکمیت داده با تجزیه و تحلیل کلان‌داده (منبع: Infosys Research)

چندین فرآیند حاکمیت به طور همزمان در تجزیه و تحلیل کلان‌داده‌ها، در حال انجام است که هر کدام به دنبال پاسخ دادن به یک درخواست خاص هستند که در شکل 2 نشان داده شده‌است. [9]

برخی از اطلاعاتی که به عنوان فراداده در رابطه با داده‌، در سند حکمروایی تعریف می‌گردد، به شرح ذیل است:

جدول 1برخی اطلاعات لازم جهت تکمیل فراداده

4- امنیت داده

حفظ و صیانت از داده‌، ازمهم‌ترین ملاحظات در انتشار اطلاعات است. ظهور عصر کلان داده‌ها نه تنها فرصت‌‎های مهمی برای پیشرفت اجتماعی فراهم کرده‌است، بلکه تهدیدات بسیاری از نظر امنیت اطلاعات را نیز برای جامعه به وجود آورده‌است و محافظت از حریم خصوصی اطلاعات شخصی را به یک نگرانی تبدیل کرده است. برای تحقق امنیت و حفاظت از حریم خصوصی اطلاعات کلان داده، نه تنها تعداد زیادی از فن‌آوری‌های حرفه‌ای امنیت اطلاعات خصوصی مورد نیاز است، بلکه باید آگاهی از حفظ حریم خصوصی شهروندان در شهر ما تقویت شود تا امنیت اطلاعات و حریم خصوصی قابل پیاده سازی باشد.

اگر کلان‌داده‌ها در فرآیند استفاده به خوبی برای کاربر محافظت نشوند، حریم خصوصی کاربران و امنیت داده‌ها، مستقیماً با تهدید مواجه می‌شوند. با توجه به محتوای مختلف محافظت از داده، می‌توان آن را به شناسه‌های ناشناس و محافظت از حریم خصوصی تقسیم کرد.[11]

در مرکز آمار و رصد شهری، با استفاده از قانون حمایت از داده‌های شخصی(PDPA[1])، برخی اطلاعات در حوزه‌‌های آلودگی هوا، مترو، پسماند، میادین میوه و تره‌بار و دروربین‌های ترافیکی در پورتال داده نمای تهران به آدرس data.tehran.ir جهت استفاده دانشجویان و پژوهشگران قابل بهره‌برداری است.

تصویری از فرآیند ناشناس‌سازی داده به طور خلاصه مطابق شکل2نمایش داده می‌شود.[4]

یکی دیگر از راه‌های برقراری امنیت داده، طبقه‌بندی آن است. طبقه‌بندی داده‌ها، فرآیند سازماندهی داده‌ها به دسته‌های مناسب برای استفاده و حفاظت از اطلاعات است. در زمینه‌ی امنیت اطلاعات، داده‌ها براساس سطح حساسیت آن برچسب‌گذاری می‌شوند و یافتن، پیگیری و حفاظت از اطلاعات مهم، آسان‌تر می‌شود. به این ترتیب، طبقه‌بندی داده‌ها به طور قابل توجهی به حکمروایی داده، مدیریت ریسک، تطابق قانونی و امنیت اطلاعات کمک می‌کند. بر اساس این طبقه‌بندی، نحوه‌ی مدیریت انتشار، دسترسی، ذخیره‌سازی، پشتیبان‌گیری و سایر موارد مرتبط با مدیریت داده مشخص می‌شود.

5- مفاهیم ناشناس‌سازی داده

ناشناس‌سازی داده به درک خوبی از عناصر زیر نیاز دارد که باید در هنگام تعیین تکنیک‌های ناشناس‌سازی و سطح ناشناس‌سازی مناسب، مورد توجه قرار گیرد:

1-‌ هدف از ناشناس‌سازی و فواید آن: هدف از ناشناس‌سازی، حذف هرگونه شناسه فردی و سازمانی است که درصورت انتشار به حریم خصوصی افراد و یا انتشار اطلاعات محرمانه سازمان، لطمه وارد کند.

فرآیند ناشناس‌سازی، صرف نظر از تکنیک‌های مورد استفاده، اطلاعات اصلی موجود در مجموعه داده را تا حدودی کاهش می‌دهد. از این رو، به‌طور کلی، با افزایش دامنه ناشناس ماندن، وضوح یا دقت مجموعه داده کاهش می‌یابد. لذا با توجه به میزان اطلاعات مورد نیاز از مجموعه داده و میزان حساسیت داده می‌بایست توازنی را بین این دو معیار لحاظ نمود.

2-‌ ویژگی‌های تکنیک‌های ناشناس‌سازی:

با در نظر گرفتن نوع داده ویژگیهای تکنیک ناشناس سازی تغییر می کند.منظور از این ویژگی‌ها این است که هرکدام از تکنیک‌های مشخص شده برای ناشناس‌سازی ممکن است برای یک وضعیت مناسب‌تر از سایر تکنیک‌ها باشند و لزوما یک تکنیک در دو حالت مختلف نتیجه مطلوب نخواهد داشت. به عنوان مثال، اگر مقدار داده یک مقدار پیوسته باشد ، تکنیک‌هایی مانند درهم‌سازی داده بسیار بهتر عمل می‌کنند. در حالت کلی، تکنیک‌های مختلف ناشناس‌سازی، داده را به روش‌های مختلفی تغییر می‌دهد؛ برخی فقط قسمت‌های یک ویژگی را اصلاح می‌کنند (به عنوان مثال نقاب زدن کاراکترها) و بعضی از آن‌ها مقدار یک ویژگی را در چندین رکورد جایگزین می‌کنند (مثلاً تجمیع).

3-‌ استنباط از اطلاعات ناشناس‌سازی شده: ممکن است اطلاعات خاصی از داده‎‌های ناشناس‌سازی شده استنباط شود. به عنوان مثال نقاب زدن ممکن است داده‌های شخصی را مخفی کند، اما طول داده‌‌ی اصلی را از نظر تعداد کاراکترها مخفی نمی‌کند.

لذا بهتر است که استفاده کنند بدانده که از کدامیک از ویژگیهای داده می تواند به نتیجه برسد و از کدامیک از آنها نمی تواند نتیجه گیری کند.

4-‌ تخصص در مورد موضوع: تکنیک‌های ناشناس‌سازی، اساساً "قابلیت شناسایی[4]" یک یا چند نمونه از مجموعه داده اصلی را به سطحی قابل قبول از استاندارد ریسک سازمان کاهش می‌دهد. ارزیابی "قابلیت شناسایی" باید قبل و بعد از استفاده از تکنیک‌های ناشناس‌سازی انجام شود و این امر مستلزم درک خوبی از موضوعی است که داده به آن مربوط می‌شوند.

5-‌ صلاحیت در انتخاب فرآیند و تکنیک‌های ناشناس‌سازی: ناشناس‌سازی، فرآیندی پیچیده است. علاوه بر داشتن تخصص درباره موضوع داده، سازمان‌هایی که مایل به اشتراک‌گذاری مجموعه داده‌های ناشناس هستند نیز باید اطمینان حاصل کنند که فرآیند ناشناس‌سازی توسط افرادی انجام می‌شود که در فنون و اصول ناشناس‌سازی آگاهی داشته باشند. اگر تخصص لازم در سازمان یافت نشود، باید از افراد متخصص خارج از سازمان، کمک گرفته شود.

6-‌ دریافت‌کننده داده‌ی ناشناس‌سازی شده: عواملی مانند تخصص دریافت‌کنندگان در مورد موضوع داده، کنترل‌های انجام شده برای محدود کردن دریافت‌کنندگان و جلوگیری از اشتراک داده با طرف‌های غیر مجاز، نقش مهمی در انتخاب تکنیک‌های ناشناس‌سازی دارند. به‌طور خاص‌، استفاده مورد انتظار از داده‌های ناشناس‌سازی شده، توسط دریافت‌کننده ممکن است محدودیت‌هایی را در تکنیک‌های کاربردی اعمال کند.

7-‌ ابزارها: با توجه به پیچیدگی و محاسبه مورد نیاز، ابزارهای نرم‌افزاری می‌توانند برای اجرای تکنیک‌های ناشناس‌سازی بسیار مفید باشند. بعضی از ابزارها به‌طور خاص در دسترس هستند، اما هیچ توصیه‌ای برای ارزیابی داده ناشناس‌سازی شده یا شناسایی مجدد آن ارائه نمی‌دهد. لازم به ذکر است که حتی بهترین ابزارها به ورودی‌های کافی نیاز دارند (مثلاً پارامترهای مناسب برای استفاده)، یا ممکن است حاوی محدودیت‌هایی باشند، از این رو نظارت انسانی و آشنایی با ابزارها و داده همچنان مورد نیاز است.

6- تکنیک های پایه‌ای ناشناس‌سازی داده

1-‌ از بین بردن ویژگی‌

2-‌ ازبین بردن رکورد

3-‌ نقاب‌زدن کاراکترها

4-‌ نام مستعار

5-‌ تعمیم‌دادن

6-‌ مبادله و جابه‌جایی

7-‌ درهم‌سازی داده

8- داده‌های ترکیبی

9- تجمیع داده

در ادامه نحوه پیاده‌سازی نقاب زدن کاراکترها و تجمیع داده را توضیح خواهیم داد.

7- نقاب زدن کاراکترها

شرح: نقاب زدن کاراکترها، تغییر کاراکترهای یک مقدار داده است، به عنوان مثال با استفاده از نماد ثابت ("*" یا "x"و... ). نقاب زدن معمولاً جزئی محسوب می‌شود، یعنی فقط برای برخی از کاراکترهای صفت اعمال می‌گردد.

زمان استفاده روش: وقتی مقدار داده، رشته‌ای از کاراکترها باشد و پنهان کردن بخشی از آن برای مشخص کردن میزان ناشناس بودن مورد نیاز، کافی است.

نحوه استفاده: بسته به ماهیت ویژگی، کاراکترهای مناسب، با نمادی انتخاب شده جایگزین می‌شود. بسته به نوع ویژگی، ممکن است تصمیم به جایگزین کردن تعداد مشخصی از کاراکترها (مانند شماره کارت اعتباری) یا تعداد متغیر کاراکترها (به عنوان مثال برای آدرس ایمیل) گرفته شود.

نکات:

در بعضی موارد حساسیت داده ها به میزانی بالاست که حتی نیاز به نوعی نقاب زدن می باشد که طول داده‌های اصلی نیز می بایست مخفی بماند.

مثال:

این مثال، یک فروشگاه مواد غذایی آنلاین را به منظور بهبود کارایی عملیاتی و مطالعه ای در مورد تقاضای تحویل آن با استفاده از تاریخچه داده نشان می‌دهد. این شرکت 4 رقم آخر کد پستی را با روش نقاب زنی ناشناس کرده و دو رقم اول را که با "کد بخش" در سنگاپور مطابقت دارند، نمایش داده‌است.

8- تجمیع داده

شرح: تبدیل یک مجموعه داده از لیستی از رکوردها به تجمیعی خلاصه از مقادیر

زمان استفاده روش: هنگامی که سوابق فردی لازم نیست و داده های تجمیع شده برای این هدف کافی است.

نحوه استفاده: بحث مفصل درباره اقدامات آماری فراتر از محدوده این مقاله است، اما روش‌های معمول مورد استفاده شامل مجموع کل، میانگین و ... است.
همچنین ممکن است مفید باشد که با دریافت‌کننده داده در مورد فواید مورد انتظار از داده ناشناس‌سازی شده گفتگو کرده و یک روش اتخاذ گردد.

نکات: در مثال زیر اگر داده‌های جمع‌آوری شده دارای یک رکورد واحد در هر یک از دسته‌ها باشد، شناسایی یک اهدا کننده می‌تواند برای شخصی با دانش اضافی آسان باشد.

مثال: در این مثال، یک سازمان خیریه سوابق مربوط به کمک‌های مالی و همچنین برخی اطلاعات در مورد اهدا کنندگان را در اختیار دارد. سازمان خیریه ارزیابی کرد که داده‌های تجمیع‌شده برای یک مشاور خارجی برای انجام تجزیه و تحلیل داده کافی است، از این رو جمع‌آوری داده را در مجموعه داده اصلی انجام می‌دهد.

9- انتشار آزاد اطلاعات

تلاش‌های سازمان یافته برای دسترسی آزاد به داده‌های علمی و پیش‌بینی مفهوم دسترسی آزاد به عنوان یک جنبش سازمان یافته، به دهه 50 میلادی باز می‌گردد (کمیته موفقیت‌های علمی مشاهدات زمین از فضا، شورای تحقیقات ملی، 2008). بهره‌برداری از مجموعه داده های بزرگ یا "کلان داده" نوید قابل توجهی را برای نوآوری ، بهره وری و رشد برنامه های تجاری و صنعتی مانند خرده فروشی ، حمل و نقل و انرژی داده است. افزایش آگاهی عمومی باعث افزایش تقاضا برای شفافیت از طرف دولت ها و سازمان‌ها شده است.[5]

کارگروه دولت باز (2007) پیشنهاد کرد که اگر داده‌ها به روشی عمومی و مطابق با هشت اصل زیر برای عملکرد بهتر پیاده‌سازی شوند، داده‌های آن دولت، باز در نظر گرفته می‌شوند:

(1) داده‌های کامل شده (2) داده‌های اولیه (3) داده‌های به‌موقع (4) داده‌های قابل دسترسی (5) داده‌های قابل پردازش ماشین (6) دسترسی بدون تبعیض به داده‌ها (7) قالب‌های داده غیر اختصاصی و (8) داده‌های بدون مجوز.

این اصول بهترین روش را در پیاده‌سازی داده‌های آزاد فراهم می‌کند به گونه‌ای که دولت‌ها موثرتر، شفاف‌تر و مرتبط با زندگی شهروندان می‌شوند (Open Working Group 2007). با توجه به کمبود روش ارزیابی، این هشت اصل به عنوان رهنمودهای مناسب و مفید در ارزیابی عملکرد اجرای داده‌های باز پذیرفته شده‌است. ما داده های متعلق به شهر را در صورت عمومی بودن به روشی که با این اصول سازگار باشد، داده باز می دانیم.[12]

برای اینکه بتوان حداکثر استفاده را از داده‌های موجود به عمل آورد، لازم است تا علاوه بر ارائه اطلاعات به ‌نحوی‌که برای انسان‌ها قابل‌فهم باشد، اطلاعات را به گونه قابل‌فهم برای ماشین نیز ارائه نمود. اتحادیه اروپا کارگروهی را به‌طور تخصصی در زمینه داده‌کاوی و متن‌کاوی تأسیس کرده است. بسیاری از محققان، شرکت‌های دانش‌بنیان، مؤسسات تحقیقاتی، کتابخانه‌ها و شرکت‌های کوچک و متوسط در چنین پروژه‌هایی مشارکت دارند.

همان‌گونه که ذکر شد کشورهای مختلف در زمینه ارائه آزاد اطلاعات گام برداشته‌اند. جدول 2 تعدادی از این کشورها و درگاه ارائه اطلاعات آزاد آن‌ها را به‌عنوان نمونه نشان می‌دهد.[ 5]

جدول 2 تجربیات کشورهای مختلف در زمینه داده‌های باز

10- بانک جهانی[1]

مأموریت گروه داده‌ی توسعه بانك جهانی، ارائه اطلاعات ملی و بین المللی با كیفیت بالا به مشتریان در داخل و خارج از آن گروه و ارتقاء ظرفیت كشورهای عضو برای تولید و استفاده از اطلاعات آماری است. به عنوان بخشی از سیستم بین المللی آماری، گروه داده با سایر سازمان‌ها در مورد روش‎های جدید آماری، فعالیت‌های جمع‌آوری داده و برنامه‌های ایجاد ظرفیت آماری همکاری می‌کند. بخش اعظم داده از سیستم‌های آماری کشورهای عضو تهیه شده است و کیفیت داده‌های جهانی به میزان عملکرد این سیستم‌های ملی بستگی دارد. بانک جهانی برای کمک به کشورهای در حال توسعه در بهبود ظرفیت، کارآیی و اثربخشی سیستم‌های آماری ملی تلاش می‌کند. بدون داشتن داده‌های ملی بهتر و جامع‌تر، تدوین سیاست‌های مؤثر یا نظارت بر پیشرفت در جهت اهداف جهانی غیرممکن است. [6]

11- مخزن داده‌های لندن[2]

مخزن داده‌های لندن توسط GLA[3] به عنوان اولین قدم برای انتشار آزاد اطلاعات لندن، ایجاد شده ‌است. داده‌های خام معمولاً تا زمانی که به روشی معنی‌دار ارائه نشوند، نتیجه‌ای برای ارائه ندارند و بیشتر افراد نیز ابزار لازم برای تبدیل این داده به اطلاعات معنادار را ندارند. سیاست حفظ حریم خصوصی مخزن داده‌های لندن، مطابق قانون محافظت از داده(DPA[4]) 2018 و مقررات حفاظت از داده های عمومی اتحادیه اروپا (GDPR[5]) از حریم شخصی و پردازش داده های شخصی، محافظت می‌گردد.[7]

12- داده‌های باز نیویورک[6]

داده‌های باز نیویورک (NYC Open Data)، تعداد زیادی از داده‌های عمومی تولید شده توسط سازمان‌های مختلف شهر نیویورک و دیگر سازمان‌های شهر را برای استفاده عمومی در دسترس قرار می‌دهد. به عنوان بخشی از فرآیند این سایت برای بهبود دسترسی، شفافیت و پاسخگویی دولت، کاتالوگ دسترسی به مخزن داده‌هایی با قابلیت ماشین‌خوان ارائه شده‌است.

13- پورتال داده‌نمای تهران

پورتال داده باز یک وبسایت قابل دسترسی برای عموم است که داده‌های قابل انتشار برای بارگیری عمومی بر بستر آن قرار می‌گیرد. طبق قانون انتشار و دسترسی آزاد به اطلاعات هر شخص ايراني حق دسترسي به اطلاعات عمومي را دارد، مگر آن كه قانون منع ‌كرده‌ باشد و مؤسسات عمومي مكلفند اطلاعات موضوع اين قانون را در حداقل زمان ممكن و بدون تبعيض در دسترسي مردم قرار دهند.ما درمرکز آمار ورصد شهری تهران نیز در راستای انتشار آزاد اطلاعات، همانند شهرهای بزرگ جهان، اقدام به انتشار داده های آماری شهر تهران در پورتال داده‌نمای تهران نموده ‌ایم. این پورتال تحت نظر سازمان فناوری اطلاعات و ارتباطات شهرداری تهران فعالیت دارد و در آذرماه 1397 راه‌اندازی شده است. ایده‌ی اصلی این پورتال همانند نمونه‌های مشابه، ایجاد فضایی برای دسترسی راحت و سریع پژوهشگران، دانشگاهیان، تحلیل‌گران و ... به آمار و اطلاعات شهر تهران می‌باشد. اطلاعات در 18 مجموعه و 59 زیرمجموعه در قالب نمودار و جداول ارائه گردیده‌ وتاکنون (زمستان 1398) بیش از 850 مجموعه داده، شامل اطلاعات آمارنامه شهر تهران که به صورت ماشین‎خوان، قابل استفاده می‌باشد، بارگذاری گردیده‌است.

نتیجه‌گیری

در راستای رسیدن به هدف حکمروایی داده در جهت تصمیم سازی مدیریتی بر پایه اصول علمی و بدور از گرایش های سلیقه ای و حزبی مفاهیمی چون داده باز یا همان انتشار آزاد اطلاعات غیر حساس و ناشناس سازی داده یا همان تغییر داده های حساس به گونه ای که دیگر قابلیت شناسایی نداشته باشد، آشکار می شود.

با توجه به تجربه موفق مرکز آمار و رصد شهری در این زمینه وبا توجه به دسترسی این مرکز به کلیه داده های مربوط به شهرداری سعی بر ارایه راهکارهایی در این خصوص داشتیم. این دستورالعملها می تواند به عنوان یک الگوی موفق برای کلیه سازمانها و ادارات مشابه مورد استفاده قرار گیرد.[8] هدف بعدی این مرکز استفاده از روشهای گوناگون علم داده در جهت پیشگویی و پیش بینی آینده می باشد تا بتوان از این تحلیل ها برای پیشگیری از بحرانهای احتمالی در آینده و مدیریت بهینه شهری استفاده نمود.

منابع

[1]پیکره دانش مدیریت داده DMBOK. ترجمه علی کمندی(1398).چاپ اول. ناشر: جهاد دانشگاهی صنعتی شریف

[2]. DAMA-DMBOK2 Framework-2016

[3]. DAMA-DMBOK_ Data Management Body of Knowledge (2nd Edition)

[4].PDPC Singapore. GUIDE TO BASIC DATA ANONYMISATION TECHNIQUES (published 25 January 2018)

[5]. European Commission DG Research & Innovation RTD-B6-PP-2011-2: Study to develop a set of indicators to measure open access by Science-Metrix Inc.

[6]. http://www.worldbank.org/(2020/03/03)

[7].https://data.london.gov.uk/about/privacy-policy/(2020/03/03)

[8]. نظام جامع آماری شهرداری تهران- 1396

[9].BIGDATA:CHALLENGES- VOL 11 NO 12013

[10]. Data Classification Standard – UNSW- SYDNEY- March2019

[11]. Big Data Security and Privacy Protection(8th International Conference on Management and Computer Science (ICMCS 2018))

[12]. Sharing government-owned data with the public: a cross-country analysis Sharing government-owned data with the public: a cross-country analysis of open data practice in the Middle East of open data practice in the Middle East 2012

نویسندگان: دکتر سارا بوربور حسینبیگی - شیرین حامدآهنگری

داده باز

سارا بوربور

شاید از این پست‌ها خوشتان بیاید

سارا بوربور

خواندن ۱۶ دقیقه·۵ سال پیش

نقش حکمروایی داده در بهبود مدیریت شهری

چکیده

1- مقدمه

2- حکمروایی داده

3- مدیریت فراداده در کلان‌داده

برخی از اطلاعاتی که به عنوان فراداده در رابطه با داده‌، در سند حکمروایی تعریف می‌گردد، به شرح ذیل است:

4- امنیت داده

تصویری از فرآیند ناشناس‌سازی داده به طور خلاصه مطابق شکل2نمایش داده می‌شود.[4]

5- مفاهیم ناشناس‌سازی داده

2-‌ ویژگی‌های تکنیک‌های ناشناس‌سازی:

6- تکنیک های پایه‌ای ناشناس‌سازی داده

1-‌ از بین بردن ویژگی‌

2-‌ ازبین بردن رکورد

3-‌ نقاب‌زدن کاراکترها

4-‌ نام مستعار

5-‌ تعمیم‌دادن

6-‌ مبادله و جابه‌جایی

7-‌ درهم‌سازی داده

8- داده‌های ترکیبی

9- تجمیع داده

در ادامه نحوه پیاده‌سازی نقاب زدن کاراکترها و تجمیع داده را توضیح خواهیم داد.

7- نقاب زدن کاراکترها

نکات:

مثال:

8- تجمیع داده

شرح: تبدیل یک مجموعه داده از لیستی از رکوردها به تجمیعی خلاصه از مقادیر

زمان استفاده روش: هنگامی که سوابق فردی لازم نیست و داده های تجمیع شده برای این هدف کافی است.

9- انتشار آزاد اطلاعات

10- بانک جهانی[1]

11- مخزن داده‌های لندن[2]

12- داده‌های باز نیویورک[6]

13- پورتال داده‌نمای تهران

نتیجه‌گیری

منابع

[1]پیکره دانش مدیریت داده DMBOK. ترجمه علی کمندی(1398).چاپ اول. ناشر: جهاد دانشگاهی صنعتی شریف

[2]. DAMA-DMBOK2 Framework-2016

[3]. DAMA-DMBOK_ Data Management Body of Knowledge (2nd Edition)

[4].PDPC Singapore. GUIDE TO BASIC DATA ANONYMISATION TECHNIQUES (published 25 January 2018)

[5]. European Commission DG Research & Innovation RTD-B6-PP-2011-2: Study to develop a set of indicators to measure open access by Science-Metrix Inc.

[6]. http://www.worldbank.org/(2020/03/03)

[7].https://data.london.gov.uk/about/privacy-policy/(2020/03/03)

[8]. نظام جامع آماری شهرداری تهران- 1396

[9].BIGDATA:CHALLENGES- VOL 11 NO 12013

[10]. Data Classification Standard – UNSW- SYDNEY- March2019

[11]. Big Data Security and Privacy Protection(8th International Conference on Management and Computer Science (ICMCS 2018))

نویسندگان: دکتر سارا بوربور حسینبیگی - شیرین حامدآهنگری

داده باز

سارا بوربور

شاید از این پست‌ها خوشتان بیاید