ویرگول
ورودثبت نام
mojtaba safavi
mojtaba safavi
mojtaba safavi
mojtaba safavi
خواندن ۴ دقیقه·۱ روز پیش

تحلیل جغرافیایی آگهی‌های دیوار؛ داده‌ها درباره شهر چه می‌گویند؟

در این بررسی، حدود ۷۰ هزار آگهی منتشرشده در سایت دیوار @divar جمع‌آوری و تحلیل شده است. تمرکز اصلی این تحلیل، بررسی پراکندگی جغرافیایی آگهی‌ها و ارتباط آن با دسته‌بندی موضوعی آن‌هاست؛ اینکه آگهی‌ها در شهر چگونه توزیع شده‌اند و چه الگوهایی از دل داده‌ها قابل مشاهده است.

داده‌های استفاده‌شده در این تحلیل، در بازه‌ای حدود سه روز جمع‌آوری شده‌اند. به‌دلیل محدودیت‌های زیرساختی، امکان جمع‌آوری داده در بازه زمانی طولانی‌تر وجود نداشت. بنابراین نتایج این بررسی را باید به‌عنوان یک تحلیل اکتشافی در نظر گرفت؛ تحلیلی که هدف آن شناسایی الگوها و روندهای اولیه است، نه ارائه تصویری قطعی از رفتار بازار در بلندمدت.

در ادامه، ابتدا به‌صورت خلاصه روند کار توضیح داده می‌شود و سپس نتایج حاصل از تحلیل داده‌ها بررسی خواهد شد.

جمع‌آوری و آماده‌سازی داده‌ها

داده‌ها با استفاده از زبان پایتون از سایت دیوار اسکرپ شدند. این داده‌ها شامل جزئیات هر آگهی بود تا امکان استخراج موقعیت جغرافیایی (Latitude و Longitude) نیز فراهم شود. پس از جمع‌آوری، داده‌ها در پایگاه داده PostgreSQL ذخیره شدند.

با توجه به نصب افزونه PostGIS روی دیتابیس، مختصات جغرافیایی خام به داده‌های قابل پردازش مکانی تبدیل شد تا امکان تحلیل جغرافیایی و کلاسترینگ فراهم شود. در این مرحله تمرکز صرفاً روی آماده‌سازی داده‌ها برای تحلیل بوده و از توضیح جزئیات فنی صرف‌نظر شده است.

دسته‌بندی موضوعی آگهی‌ها (بدون در نظر گرفتن موقعیت جغرافیایی)

در گام اول، آگهی‌ها صرفاً بر اساس موضوع دسته‌بندی شدند و موقعیت جغرافیایی در این بخش لحاظ نشده است.

دسته بندی کلی داده ها
دسته بندی کلی داده ها

این نمودار به‌وضوح نشان می‌دهد که آگهی‌های مربوط به «ملک» (خرید، فروش و اجاره) بیشترین سهم را در میان کل آگهی‌ها دارند. در مقابل، دسته «اجتماعی» کمترین سهم را به خود اختصاص داده است. پس از ملک، آگهی‌های خرید و فروش وسایل نقلیه و سپس لوازم آشپزخانه بیشترین فراوانی را دارند.

این توزیع، تصویری کلی از رفتار کاربران در ثبت آگهی ارائه می‌دهد؛ تصویری که بدون در نظر گرفتن بُعد مکانی، صرفاً حجم تقاضا و عرضه را نشان می‌دهد.

افزودن بُعد جغرافیایی و کلاسترینگ مکانی

در مرحله بعد، شاخص جغرافیایی یا همان Point به داده‌ها اضافه شد. برای این کار، مختصات Latitude و Longitude به داده‌های مکانی قابل پردازش تبدیل شدند تا بتوان آگهی‌ها را بر اساس موقعیت جغرافیایی تحلیل و دسته‌بندی کرد.

در این بررسی، شهر به شبکه‌هایی مربعی با مساحت یک کیلومتر مربع تقسیم شد و آگهی‌ها درون این شبکه‌ها گروه‌بندی شدند. سپس نواحی با بیشترین تراکم آگهی استخراج شد. برای نمایش و تحلیل بهتر نتایج، از ابزارهای بصری‌سازی نقشه استفاده شده است.

در این نقشه، نواحی با بیشترین تراکم آگهی به رنگ قرمز و نواحی با تراکم کمتر به رنگ‌های سردتر نمایش داده شده‌اند. آنچه در نگاه اول جلب توجه می‌کند، تمرکز بالای آگهی‌ها در برخی مناطق خاص شهر است.

نکته قابل‌توجه این است که در بسیاری از این کلاسترهای پرتراکم، بیشترین آگهی‌ها مربوط به خرید و فروش خودرو و لوازم آشپزخانه هستند و برخلاف انتظار، آگهی‌های ملکی سهم کمتری در این نواحی دارند.

ابی اسمانی به اگهی ماشین و ابی تیره وسایل اشپزخانه
ابی اسمانی به اگهی ماشین و ابی تیره وسایل اشپزخانه

برای مثال:

  • در محدوده‌های صادقیه و سازمان آب، آگهی‌های خرید و فروش خودرو بیشترین سهم را دارند.

  • در مناطق اسکندری و نواب، آگهی‌های مربوط به لوازم آشپزخانه (به‌ویژه صندلی) غالب هستند.

  • در ناحیه پامنار، بیشترین آگهی‌ها به لوازم آشپزخانه از نوع اجاق گاز اختصاص دارد.

نکته‌ای که برای من جالب بود، نبود تراکم قابل‌توجه آگهی‌های خودرو در منطقه عباس‌آباد است. انتظار می‌رفت این منطقه سهم بالاتری در این دسته داشته باشد، اما داده‌ها چنین الگویی را نشان ندادند. یکی از دلایل احتمالی می‌تواند نوع خودروهای معامله‌شده در این محدوده باشد؛ به‌نظر می‌رسد فروش خودروهای لوکس در این منطقه رایج‌تر است و این نوع آگهی‌ها معمولاً مخاطب عمومی کمتری دارند و در کلاسترهای پرتراکم دیده نمی‌شوند.

تمرکز بر آگهی‌های ملکی و الگوهای مکانی آن‌ها

در مرحله بعد، تمرکز صرفاً روی آگهی‌های ملکی قرار گرفت و این دسته از آگهی‌ها به‌صورت جداگانه روی نقشه کلاستر شدند.

کلاسترینگ روی داده های ملک - شرح رنگ از طیف کمرنگ به پررنگ متناسب با تعداد اگهی ها
کلاسترینگ روی داده های ملک - شرح رنگ از طیف کمرنگ به پررنگ متناسب با تعداد اگهی ها

بر اساس این تصویر، بیشترین تراکم آگهی‌های ملکی در محدوده نواب، حدفاصل خیابان امام خمینی تا آزادی مشاهده می‌شود. کلاسترهای قابل‌توجه دیگری نیز در مناطق مرزداران و سازمان آب دیده می‌شوند.

با بررسی دقیق‌تر آگهی‌های ملکی در محدوده نواب و جیحون مشخص شد که بخش قابل‌توجهی از این آگهی‌ها مربوط به اجاره‌های کوتاه‌مدت و روزانه هستند. به همین دلیل، این دسته از آگهی‌ها به‌صورت مجزا بررسی شدند.

آگهی‌های اجاره کوتاه‌مدت و ارتباط آن با موقعیت مکانی

این نقاط، بیشترین تراکم آگهی‌های اجاره کوتاه‌مدت را نشان می‌دهند که در هر کلاستر، تعداد آن‌ها به حدود ۱۰ آگهی می‌رسد. یکی از دلایل احتمالی این الگو، نزدیکی این مناطق به مراکز درمانی و بیمارستان‌هاست. البته عوامل دیگری نیز می‌تواند در شکل‌گیری این الگو نقش داشته باشد، اما به‌دلیل نبود شاخص‌های تکمیلی در داده‌ها، امکان بررسی دقیق‌تر آن‌ها وجود نداشت.

جمع‌بندی

این بررسی، تلاشی اکتشافی برای درک الگوهای جغرافیایی آگهی‌ها در یک بازه زمانی کوتاه است. با وجود محدودیت زمانی داده‌ها، نتایج نشان می‌دهد که حتی در یک نمونه محدود نیز می‌توان الگوهایی معنادار از رفتار کاربران و توزیع موضوعی آگهی‌ها در سطح شهر مشاهده کرد؛ الگوهایی که در صورت گسترش داده‌ها در بازه‌های زمانی طولانی‌تر، می‌توانند به تحلیل‌های عمیق‌تر و دقیق‌تری منجر شوند.

تحلیلدیوارتحلیل داده
۱
۰
mojtaba safavi
mojtaba safavi
شاید از این پست‌ها خوشتان بیاید