در این بررسی، حدود ۷۰ هزار آگهی منتشرشده در سایت دیوار @divar جمعآوری و تحلیل شده است. تمرکز اصلی این تحلیل، بررسی پراکندگی جغرافیایی آگهیها و ارتباط آن با دستهبندی موضوعی آنهاست؛ اینکه آگهیها در شهر چگونه توزیع شدهاند و چه الگوهایی از دل دادهها قابل مشاهده است.
دادههای استفادهشده در این تحلیل، در بازهای حدود سه روز جمعآوری شدهاند. بهدلیل محدودیتهای زیرساختی، امکان جمعآوری داده در بازه زمانی طولانیتر وجود نداشت. بنابراین نتایج این بررسی را باید بهعنوان یک تحلیل اکتشافی در نظر گرفت؛ تحلیلی که هدف آن شناسایی الگوها و روندهای اولیه است، نه ارائه تصویری قطعی از رفتار بازار در بلندمدت.
در ادامه، ابتدا بهصورت خلاصه روند کار توضیح داده میشود و سپس نتایج حاصل از تحلیل دادهها بررسی خواهد شد.
دادهها با استفاده از زبان پایتون از سایت دیوار اسکرپ شدند. این دادهها شامل جزئیات هر آگهی بود تا امکان استخراج موقعیت جغرافیایی (Latitude و Longitude) نیز فراهم شود. پس از جمعآوری، دادهها در پایگاه داده PostgreSQL ذخیره شدند.
با توجه به نصب افزونه PostGIS روی دیتابیس، مختصات جغرافیایی خام به دادههای قابل پردازش مکانی تبدیل شد تا امکان تحلیل جغرافیایی و کلاسترینگ فراهم شود. در این مرحله تمرکز صرفاً روی آمادهسازی دادهها برای تحلیل بوده و از توضیح جزئیات فنی صرفنظر شده است.
در گام اول، آگهیها صرفاً بر اساس موضوع دستهبندی شدند و موقعیت جغرافیایی در این بخش لحاظ نشده است.

این نمودار بهوضوح نشان میدهد که آگهیهای مربوط به «ملک» (خرید، فروش و اجاره) بیشترین سهم را در میان کل آگهیها دارند. در مقابل، دسته «اجتماعی» کمترین سهم را به خود اختصاص داده است. پس از ملک، آگهیهای خرید و فروش وسایل نقلیه و سپس لوازم آشپزخانه بیشترین فراوانی را دارند.
این توزیع، تصویری کلی از رفتار کاربران در ثبت آگهی ارائه میدهد؛ تصویری که بدون در نظر گرفتن بُعد مکانی، صرفاً حجم تقاضا و عرضه را نشان میدهد.
در مرحله بعد، شاخص جغرافیایی یا همان Point به دادهها اضافه شد. برای این کار، مختصات Latitude و Longitude به دادههای مکانی قابل پردازش تبدیل شدند تا بتوان آگهیها را بر اساس موقعیت جغرافیایی تحلیل و دستهبندی کرد.
در این بررسی، شهر به شبکههایی مربعی با مساحت یک کیلومتر مربع تقسیم شد و آگهیها درون این شبکهها گروهبندی شدند. سپس نواحی با بیشترین تراکم آگهی استخراج شد. برای نمایش و تحلیل بهتر نتایج، از ابزارهای بصریسازی نقشه استفاده شده است.

در این نقشه، نواحی با بیشترین تراکم آگهی به رنگ قرمز و نواحی با تراکم کمتر به رنگهای سردتر نمایش داده شدهاند. آنچه در نگاه اول جلب توجه میکند، تمرکز بالای آگهیها در برخی مناطق خاص شهر است.
نکته قابلتوجه این است که در بسیاری از این کلاسترهای پرتراکم، بیشترین آگهیها مربوط به خرید و فروش خودرو و لوازم آشپزخانه هستند و برخلاف انتظار، آگهیهای ملکی سهم کمتری در این نواحی دارند.

برای مثال:
در محدودههای صادقیه و سازمان آب، آگهیهای خرید و فروش خودرو بیشترین سهم را دارند.
در مناطق اسکندری و نواب، آگهیهای مربوط به لوازم آشپزخانه (بهویژه صندلی) غالب هستند.
در ناحیه پامنار، بیشترین آگهیها به لوازم آشپزخانه از نوع اجاق گاز اختصاص دارد.
نکتهای که برای من جالب بود، نبود تراکم قابلتوجه آگهیهای خودرو در منطقه عباسآباد است. انتظار میرفت این منطقه سهم بالاتری در این دسته داشته باشد، اما دادهها چنین الگویی را نشان ندادند. یکی از دلایل احتمالی میتواند نوع خودروهای معاملهشده در این محدوده باشد؛ بهنظر میرسد فروش خودروهای لوکس در این منطقه رایجتر است و این نوع آگهیها معمولاً مخاطب عمومی کمتری دارند و در کلاسترهای پرتراکم دیده نمیشوند.
در مرحله بعد، تمرکز صرفاً روی آگهیهای ملکی قرار گرفت و این دسته از آگهیها بهصورت جداگانه روی نقشه کلاستر شدند.

بر اساس این تصویر، بیشترین تراکم آگهیهای ملکی در محدوده نواب، حدفاصل خیابان امام خمینی تا آزادی مشاهده میشود. کلاسترهای قابلتوجه دیگری نیز در مناطق مرزداران و سازمان آب دیده میشوند.
با بررسی دقیقتر آگهیهای ملکی در محدوده نواب و جیحون مشخص شد که بخش قابلتوجهی از این آگهیها مربوط به اجارههای کوتاهمدت و روزانه هستند. به همین دلیل، این دسته از آگهیها بهصورت مجزا بررسی شدند.

آگهیهای اجاره کوتاهمدت و ارتباط آن با موقعیت مکانی
این نقاط، بیشترین تراکم آگهیهای اجاره کوتاهمدت را نشان میدهند که در هر کلاستر، تعداد آنها به حدود ۱۰ آگهی میرسد. یکی از دلایل احتمالی این الگو، نزدیکی این مناطق به مراکز درمانی و بیمارستانهاست. البته عوامل دیگری نیز میتواند در شکلگیری این الگو نقش داشته باشد، اما بهدلیل نبود شاخصهای تکمیلی در دادهها، امکان بررسی دقیقتر آنها وجود نداشت.
این بررسی، تلاشی اکتشافی برای درک الگوهای جغرافیایی آگهیها در یک بازه زمانی کوتاه است. با وجود محدودیت زمانی دادهها، نتایج نشان میدهد که حتی در یک نمونه محدود نیز میتوان الگوهایی معنادار از رفتار کاربران و توزیع موضوعی آگهیها در سطح شهر مشاهده کرد؛ الگوهایی که در صورت گسترش دادهها در بازههای زمانی طولانیتر، میتوانند به تحلیلهای عمیقتر و دقیقتری منجر شوند.