وب اسکرپینگ ما با پایتون اومدیم ! (۳)

وب اسکرپینگ (ببخشید قسمت ها روش نمی نویسم)
وب اسکرپینگ (ببخشید قسمت ها روش نمی نویسم)


سلام طبق معمول امیرمهدی هستم

به خاطر تاخیر عذر خواهی می کنم

خب تا جایی پیش رفتیم که ما یاد گرفتیم به سایت request (هنوز با این ء کیبورد اوبونتو کنار نیومدم به خاطر همین انگلیسی می نویسم (: ) بزنیم و محتواش رو ‌ذخیره کنیم ولی خب از این جا به بعد می خوایم محتوا ی سایت رو پردازش کنیم برای این کار از لایبری bs4 (بیوتیفول سوپ ۴) استفاده می کنیم برای استفاده کردن از کتابخونه به جز ایمپورت کردن bs4 نیازه بخش اصلیش هم از توی اسم لایبری ایمپورت کنیم BeautifulSoup رو از توش ایمپورت کنیم پس کد زیر رو به برناممون اضافه می کنیم :

from bs4 import BeautifulSoup

حالا ما می خوایم عناصر صفحه رو تجزیه کنیم. یا به اصطلاح پارسش کنیم. مثلا یک مثال کاملا بچه گونش این هست که ما یک سوپ داریم میدیمش به bs4 میگیم تمام هویجاش رو به ما بده ! طعم پیازش رو به ما بده ! ما توی خط کد زیر دیتای requestمون رو به bs4 میدیم تا بعدن بتونیم دیتامون رو پارس کینم یا مثالش این هست که بهش بگیم تمام تگ های A سایت رو بهمون بده. این خط کد رو به بقیه ی کد هامون اضافه می کنیم تا بتونیم بعدن دیتامون رو پارس کنیم ! :

soup = BeautifulSoup(site.text, 'html.parser')


خب واقعا ببخشید دیر به دیر و کوتاه تر از کوتاه میزارم احتمالا دیگه از قسمت بعدی اینجوری نشه :)