برنامه نویسی ساده :) یخورده دواپس :) پایتون، گو، علاقمند/دوستدار/استفاده کننده گنو/ لینوکس :) خیلی علاقمند به یادگیری و یاد دادن:) ایمیل من: a.tafreshi440@gmail.com تلگرام من: Amirmahdi_tafreshi@
یه کوچولو وب اسکرپینگ با پایتون:) (۲)
سلام طبق معمول امیرمهدی هستم :)
بریم شروع کنیم.
وب اسکرپینگ اقلب ۲ بخشه. یسری وقتا برای اتومیشن و ... و یسری وقتا برای جمع آوری داده و این جور چیزا :) برای اتومیشن، معمولا از سلنیوم استفاده می کنن چون باهاش تعامل با سایت راحت تره. ولی برای کار های ساده تر و کراول و اینا معمولا reauests و bs4. البته که از سلنیوم برای این کار ها هم میشه استفاده کرد.
فعلا ما هم می خوایم ساده شروع کنیم و قسمت دلار در بیاریم :). برنامه ای که می خوایم روش کار کنیم برنامه ای هست که بره و از این سایت قیمت دلار رو برای ما بگیره و بیاره و مثال هامون رو فعلا روی این برنامه پیش میریم.
خب اول از همه ما برای پردازش و استخراج داده باید به سایت ریکوئست بزنیم برای این کار از لایبری requets استفاده می کنیم پس خط زیر رو به برنامتون اضافه کنید :
import requets
بعد متغییری به نام url تعریف می کنیم و url مون رو میزاریم توش :
url = "http://www.tgju.org/dollar-chart"
لایبری requests بخشی داره به نام session که برای ریکوئست زدن استفاده میشه اما خب دقیقا مثل یک سیسن هست :) یعنی مثلا اگر ما با این سیسن توی جایی لاگین کنیم، لاگین می مونیم :) برای کار ما get خالص کافیه ولی خب مثال سیزن میشه این طوری :
session = requests.session()
site = session.get(url)
و با get :
site = requests.get(url)
کوتاه بود ولی تا این جا با ۴ تا خط کد تونستیم محتوای سایت رو بگیریم و در قسمت بعدی با bs4 روش کار انجام میدیم :)
مطلبی دیگر از این انتشارات
دیوونه بازی با پایتون : کتابخانه ریجکس!!
مطلبی دیگر از این انتشارات
کار با بانک داده مونگو با استفاده از پایتون
مطلبی دیگر از این انتشارات
واقعا فقط فریمورک بزرگ تر ها خوبن؟!