ویرگول
ورودثبت نام
محمد فاتحی
محمد فاتحی
خواندن ۱ دقیقه·۲ سال پیش

معرفی تابع query در پایتون

هنگام کار با داده ها و به خصوص قالب داده dataframe نیاز هست که شرط هایی را روی داده ها پیاده سازی کنیم. در مثال زیر با استفاده از تابع query به این کار پرداخته شده است:

مجموعه داده زیر را در نظر بگیرید. این مجموعه داده مربوط به قیمت خانه های تهران است که در اینجا موجود است.

import numpy as np import pandas as pd df = pd.read_csv('Data.csv', encoding=&quotutf-8&quot) df.drop_duplicates(subset =None, keep = 'first', inplace = True) df['neighborhood'] = df['neighborhood'].astype(pd.StringDtype()) df.shape

به طور خلاصه در کدهای بالا ابتدا سطرهای تکرار حذف شد و در ادامه نوع داده neighborhood به صورت رشته در نظر گرفته شد.

ابعاد داده هم برابر (9 و 12383) است.

df.head()

خروجی عبارتست از:

این مجموعه داده شامل ستون های ارزش ملک (total_value) (که برحسب اجاره ماهیانه (rent) و پیش پرداخت(deposit) محاسبه شده است)، محله (neighborhood)، متراژ (area)، سال ساخت (year) است. همچنین داشتن و یا نداشتن آسانسور (elavator)، پارکینگ (parking) و انباری (warehouse) در این مجموعه داده موجود است.

df.query(&quot rent <30000000 & warehouse !=0 &quot)

دستور بالا خانه هایی را که اجاره بهای ماهیانه آنها کمتر از 30000000 است و انباری دارد را نمایش می دهد:

df.query(&quot year > 1395 or deposit < 50000000 &quot)

دستور بالا خانه هایی را نمایش می دهد که سال ساخت آنها از 1396 است یا مبلغ پیش پرداخت آنها کمتر از 50000000 است:


پایتونتحلیل دادهمجموعه داده قیمت خانه های تهرانتابع querypandas
علاقه مند به تحلیل داده و داده کاوی. لینکدین:https://www.linkedin.com/in/mohammad-fatehi-09654062/
شاید از این پست‌ها خوشتان بیاید