هنگام کار با داده ها و به خصوص قالب داده dataframe نیاز هست که شرط هایی را روی داده ها پیاده سازی کنیم. در مثال زیر با استفاده از تابع query به این کار پرداخته شده است:
مجموعه داده زیر را در نظر بگیرید. این مجموعه داده مربوط به قیمت خانه های تهران است که در اینجا موجود است.
import numpy as np import pandas as pd df = pd.read_csv('Data.csv', encoding="utf-8") df.drop_duplicates(subset =None, keep = 'first', inplace = True) df['neighborhood'] = df['neighborhood'].astype(pd.StringDtype()) df.shape
به طور خلاصه در کدهای بالا ابتدا سطرهای تکرار حذف شد و در ادامه نوع داده neighborhood به صورت رشته در نظر گرفته شد.
ابعاد داده هم برابر (9 و 12383) است.
df.head()
خروجی عبارتست از:
این مجموعه داده شامل ستون های ارزش ملک (total_value) (که برحسب اجاره ماهیانه (rent) و پیش پرداخت(deposit) محاسبه شده است)، محله (neighborhood)، متراژ (area)، سال ساخت (year) است. همچنین داشتن و یا نداشتن آسانسور (elavator)، پارکینگ (parking) و انباری (warehouse) در این مجموعه داده موجود است.
df.query(" rent <30000000 & warehouse !=0 ")
دستور بالا خانه هایی را که اجاره بهای ماهیانه آنها کمتر از 30000000 است و انباری دارد را نمایش می دهد:
df.query(" year > 1395 or deposit < 50000000 ")
دستور بالا خانه هایی را نمایش می دهد که سال ساخت آنها از 1396 است یا مبلغ پیش پرداخت آنها کمتر از 50000000 است: