در هنگام نوشتن و ترجمه این مطلب به دلیل طولانی بودن، ویرگول با مشکلات ذخیره سازی و سینک مواجه شده است و این مطلب تا زمان حل مشکل به صورت ناتمام و آرشیو نگه داری می شود. برای خواندن منبع اصلی لطفا به لینک زیر مراجعه کنید:
https://web.dev/howbrowserswork/
این مطلب به صورت تخصصی برای توسعه دهندگان نوشته شده است و برای مطالعه آن نیاز به اطلاعات حداقلی درباره توسعه وب دارید.برای توسعه دهندگان یادگیری اجزای داخلی مرورگر می تواند به تصمیم گیری شما کمک شایانی بکند و با آن دلیل پشت بهترین الگو ها را بفهمید.
امروزه در زمان خوبی سپری می کنیم که اکثر مرورگر های معروف متن باز هستند و می توانیم داخل این مرورگر ها رو مشاهده و بررسی کنیم بر عکس زمان IE که مرورگر ها مثل جعبه سیاه غیر قابل دسترسی بودند. اکنون زمان خوبی است تا ببینیم داخل این همه خط سی پلاس پلاس چه میگذرد و مرورگر ها چگونه کار می کنند.
مرورگر های وب پرکاربردترین نرم افزار های جهای هستند. در این آموزش ما نگاهی تخصصی به نحوه کار این نرم افزار می اندازیم و خواهیم دید که وقتی آدرس سایت گوگل را در نوار جستجو تایپ می کنیم چه اتفاقی می افتد تا زمانی صفحه گوگل را در مرورگر مشاهده می کنیم.
امروز در سال 2023 هنوز هم مرورگر Google Chrome با اختلاف در شماره یک قرار دارد و بعد به ترتیب مرورگر های سافاری، ادج، اپرا، فایرفاکس و سامسونگ اینترنت برترین مرورگر های فعلی جهان هستند. گوگل کروم و سافاری هر دو از موتور متن باز وبکیت استفاده می کنند که البته گوگل از سال 2013 انشعاب (Fork) جدیدی از وبکیت را به نام بلینک شروع کرد که هم اکنون گوگل کروم نسخه 28، ادج نسخه 79 و اپرا نسخه 15، اندروید 4.4 به بعد یا حتی اسپاتیفای و Node.js هم از استفاده می کنند. بلینک متن باز و بخشی از پروژه Chromium است که با همکاری گوگل، متا، ماکروسافت، اپرا، ادوبی، اینتل، آی بی ام، سامسونگ و ... توسعه می یابد.
بنا به StatCounter statistics سهم بازار مرورگر در سراسر جهان از جولای 2022 تا جولای 2023 با برتری 63.55% گوگل کروم همراه بوده است.
وظیفه اصلی مرورگر ها ارائه منابع انتخابی شما در دنیای وب است. مرورگر درخواست شما را به سرور می دهد و در نتیجه جواب را برای شما نمایش می دهد. این منابع معمولا سند های HTML هستند ولی ممکن PDF، عکس یا حتی نوع دیگری باشد. آدرس این منابع توسط کاربر به وسیله URI (Uniform Resource Identifier) مشخص می شود.
روش این تفسیر و نمایش HTML به چگونگی مشخص شدن خصوصیات HTML و CSS بر می گردد. این مشخصات توسط سازمان W3C (World Wide Web Consortium) اجرا می شود. این سازمان وظیفه حفظ استاندارد های وب را بر عهده دارد. برای سال ها مرورگر ها تنها بخشی از مشخصات را اجرا و باقی را با پسوند های خود توسعه دادند که باعث مشکلات جدی ناسازگاری شد. امروزه اکثر مرورگر ها کم و بیش با مشخصات مطابقت دارند.
مرورگر ها شباهت بسیاری با هم دیگر دارند که برخی رایج ترین آن ها :
شاید عجیب به نظر برسد ولی رابط کاربری مرورگر ها در هیچ جای رسمی تعریف نشده است و تمام چیزی که می بینید توسط بهترین تمرین ها و تجربه و حتی کپی مرورگر ها از یک دیگر بوجود امده است. مشخصات رسمی HTML5 هیچ تعریفی برای رابط کاربری مرورگر ها تعریف نکرده و فقط برخی عناصر مهم را فهرست بندی کرده است که می توان به نوار وضعیت و نوار ابزار اشاره کرد. البته برخی مرورگر ها ویژگی ها منحصر به فرد خودشان را دارند مانند هوش مصنوعی ادج.
اجزای اصلی مرورگر عبارتند از:
به این نکته توجه کنید که مرورگر های مانند کروم از چندین لایه موتور رندر استفاده می کنند در واقع برای هر تب جدا گانه یک موتور تا هر تب در یک فرایند جداگانه اجرا شود.
مسئولیت موتور رندر همان رندر کردن به معنای کلمه است : تولید ماشینی تصاویر بر پایهٔ مدلهای محاسباتی، و سپس نمایاندن رایانهای آنها بر روی نمایشگر
به طور پیشفرض موتور رندر می تواند اسناد HTML و XML و حتی عکس را نمایش دهد. برای نمایش دیگر اطلاعات به افزونه نیاز دارد برای مثال برای نمایش PDF به افزونه مشاهده گر PDF نیاز دارد. در این فصل ما فقط بر روی وظیفه اصلی تمرکز می کنیم : نمایش HTML و عکس که با CSS فرمت شده است.
مرورگرهای مختلف از موتورهای رندر متفاوتی استفاده می کنند : IE از Trident، فایرفاکس از Gecko، سافاری از WebKit، کروم و اپرا از بلینک.
وبکیت یک موتور رندر متن باز است که ابتدا به عنوان موتور برای پلتفورم لینوکس شروع به کار کرد و توسط اپل برای مک و ویندوز در دسترس قرار گرفت.
موتور رندر کارش رو با دریافت اصلاعات از شبکه درخواستی آغاز می کند. این کار توسط تکه های 8 کیلوبایتی انجام می شود.
سپس مراحل زیر توسط موتور رندر انجام می شود :
موتور رندر شروع به تحلیل سند HTML می کند و عناصر رو تبدیل می کنه به گره های (nodes) DOM در درختی به نام content tree یا درخت محتوا، بعد موتور اطلاعات ظاهری (style) رو از عناصر و CSS خارجی تحلیل می کنه. اطلاعات ظاهری و عناصر با هم در HTML یک درخت دیگه ای رو شکل می دهند به نام : درخت رندر
درخت رندر شامل مستطیل هایی با ویژگی های بصری مثل رنگ و ابعاد است. این مستطیل ها به ترتیب بر روی نمایشگر نمایش داده می شوند.
بعد از ساخت و ساز درخت رندر مرحله بعدی پردازش لایه بندی است. پردازش لایه بندی به معنی دادن مختصات دقیق محل قرارگیری هر گره (node) است که کجا صفحه نمایش داده شود. مرحله بعدی نقاشی است - موتور رندر کارش تمام شده و حالا هر گره توسط بک اند رابط کاربری (UI backend) نقاشی می شود.
توجه کنید که این یک روند آهسته و تدریجی است. برای تجربه کاربری بهتر ، موتور رندر سعی می کند در سریع ترین زمان ممکن محتوا را در صفحه نمایش دهد. قبل از شروع ساخت و لایه بندی درخت رندر منتظر نمی ماند تا تمام عناصر HTML تحلیل شود. بخشی از محتوا تحلیل و نمایش داده می شوند درحالی که این روند با بقیه مطالبی که از شبکه دربافت می کند ادامه می دهد.
مثال هایی از جریان اصلی
در دو عکس بالا می توانید WebKit و Gecko مشاهده کنید که از دید فنی کمی متفاوت عمل می کنند ولی در جریان اصلی یکسان هستند.
گکو درختی از عناصر که بصری فرمت شده رو یک درخت قاب (Frame tree) می نامند و هر عنصر در آن یک قاب (Frame) است. وب کیت از اصطلاح درخت رندر (Render Tree) که از Render Objects تشکیل شده است استفاده می کند. وب کیت برای قراردادن عناصر از اصطلاح layout و گکو از اصطلاح Reflow استفاده می کند. پیوست (Attachment) اصطلاح وب کیت برای اتصال گره های (Nodes) DOM و اطلاعات است تا درخت رندر را ایجاد کند. یک تفاوت غیر معنایی جزئی گکو این است که بین HTML و درخت DOM یک لایه اضافه دارد به نام سینک محتوا (content sink) که کارخانه ای برای تولید عناصر DOM است.
از ان جایی که تحلیل (parsing) مرحله ای مهم در موتور رندر می باشد، کمی عمیق تر وارد این مبحث می شویم اما اول با یک مقدمه کوچک از تحلیل شروع می کنیم.
تحلیل یک سند به معنی ترجمه آن به ساختاری است که کد می تواند از ان استفاده کند. نتیجه تحلیل معمولا یک درخت از گره ها است ساختار یک سند را ارائه می دهد که به آن درخت تحلیل (parse tree) یا درخت نحو (syntax tree) می گویند.
برای مثال، تحلیل عبارت 2 + 3 - 1
این درخت را برمی گرداند:
تحلیل بر پایه قوانینی است که syntax سند از آن پیروی می کند : زبانی یا قالبی که در آن نوشته شده است. هر قالبی که تحلیل می شود باید دستورات قطعی از واژگان و قوانین نحوی داشته باشد که به آن دستور زبان مستقل از متن (Context-free grammar) می گویند.
تحلیل - ترکیب واژگان
تحلیل می تواند به دو بخش مجزا کوچک برای پردازش تقسیم شود : تحلیل واژگانی (lexical analysis) و تحلیل نحوی (syntax analysis)
تحلیل واژگانی فرآیندی است که ورودی را به توکن ها تبدیل می کند. توکن ها واژگان زبانی هستند : مجموعه ای از بلوک های ساختمانی. در زبان انسان شامل تمام کلماتی است که در فرهنگ لغت یک زبان آمده است.
تحلیل نحوی اعمال کردن نحوه دستور زبان است.
تحلیل کننده ها معمولا کار را به دو مولفه (Component) تقسیم می کنند: lexer یا tokenizer که وظیفه دارد ورودی را به توکن ها تبدیل کند و تحلیل کننده وظیفه ساختن درخت تحلیل را براساس تحلیل ساختار سند با توجه به نحوه دستور زبان دارد.
لکسر می داند که چگونه کاراکتر های نامربوط مانند فاصله و خط پایان را از بین ببرد.
پروسه تحلیل تکرار شونده است. تحلیل کننده معمولا از لکسر توکن جدید میخواهد و سعی می کند توکن را با یکی از قوانین نحوی (syntax rules) تطبیق دهد. اگر توکن مطابقت داشته باشد یک گره (node) متناظر با توکن به درخت تحلیل اضافه می شود و تحلیل کننده یک توکن دیگر را درخواست می کند.
اگر هیچ قانونی مطابقت نداشت، تحلیل کننده توکن را داخلی ذخیره می کند و اینقدر درخواست توکن می کند تا قانونی که با تمام توکن های ذخیره شده داخلی مطابقت داشته باشد پیدا شود. درصورتی که هیچ قانونی پیدا نشود تحلیل کننده یک اعتراض مطرح می کند به این معنی که این سند معتبر نیست و دارای خطای نحوی(syntax) می باشد.
در بسیاری از موارد درخت تحلیل محصول آخر نیست. تحلیل معمولا درون ترجمه استفاده می شود: تبدیل ورودی سند به یک قالب (format) دیگر همانند تلفیق (compilation). کامپایلر که کد منبع را به زبان ماشین کامپایل می کند ابتدا آن را تحلیل می کند به درخت تحلیل و سپس ترجمه درخت را به سند کد ماشین.
مثال تحلیل
در مثال بالا ما درخت تحلیل را توسط اصطلاحات ریاضی بیان کردیم. بیایید سعی کنیم یک زبان ریاضی ساده تعریف کنیم و پروسه تحلیل را ببینیم.
اصطلاح کلیدی
زبان ما می تواند شامل اعداد صحیح، علامت مثبت و منفی باشد.
نحو (Syntax):
1. بلوک های ساختار نحو زبان عبارت ها، اصطلاحات و عملیات هستند.
2. زبان ما می تواند شامل هر تعداد اصطلاح (expressions) باشد.
3. هر اصطلاح توسط شرایط (term) به دنبال عملیات (operation) که به دنبال یک شرایط دگیر است تعریف می شود.
4. یک عملیات یا توکن مثبت است یا توکن منفی.
5. یک شرایط یا یک توکن عدد صحیح است یا اصطلاح.
بیایید ورودی 2 + 3 -1 را بررسی کنیم.
اولین رشته فرعی که با یک قانون مطابقت دارد 2 است: طبق قانون 5 یک شرایط (term) است. دومین تطبیق 2+3 است: با قانون سوم مطابقت دارد: یک شرایط به دنبال یک عمل به دنبال عملی دیگر. مطابقت بعدی فقط در آخر ورودی انجام می شود. 2+3-1 یک اصطلاح است زیرا ما هم اکنون می دانیم که 2+3 یک شرایط است، پس ما یک شرایط به دنبال یک عملیات داریم که به دنبال یک شرایط دیگر است. 2++ با هیچ قوانینی مطابقت ندارد بنابراین یک ورودی نامعتبر است.
تعاریف رسمی برای واژگان و نحو
واژگان معمولا توسط عبارت باقاعده (regular expression) بیان می شوند.
برای مثال زبان ما به صورت زیر تعریف می شود:
INTEGER: 0|[1-9][0-9]*
PLUS: +
MINUS: -
همانطور که می بینید، اعداد صحیح توسط عبارت باقاعده تعریف شده است.
نحو معمولا در قالبی به نام فرم باکوس نائور (Backus–Naur form) تعریف می شود. زبان ما به صورت زیر تعریف می شود:
expression := term operation term
operation := PLUS | MINUS
term := INTEGER | expression
گفتیم که یک زبان می تواند تحلیل بشود با عبارت باقاعده اگر دستور های زبانش، دستور زبان مستقل از متن باشند. یک تعریف حسی از دستور زبان مستقل از متن یک دستور زبانی است که کاملا بتوان در فرم باکوس نائور بیان شود. برای کسب اطلاعات بیشتر به صفحه ویکی پدیا دستور زبان مستقل از متن مراجعه کنید.
دو نوع تحلیل کننده وجود دارد: تحلیل کننده بالا به پایین و تحلیل کننه پایین به بالا. یک تعریف حسی این است که تحلیل کننده بالا به پایین ساختار سطح بالا نحو را بررسی می کند و سعی می کند قوانین مرتبط را پیدا کنند. تحلیل کننده پایین به بالا با ورودی شروع می کند و به تدریج آن را به قوانین نحوی تبدیل می کند، از قوانین سطح پایین شروع می کند تا قوانین سطح بالا مطابقت داشته باشند.
بزارید ببینیم چگونه دو نوع تحلیل کننده مثال ما را تحلیل می کنند.
تحلیل کننده بالا به پایین با قوانین سطح بالا شروع می کند: 2+3 را به عنوان یک اصطلاح تشخیص می دهد. سپس 2+3-1 را به عنوان یک اصطلاح تشخیص می دهد (پروسه شناسایی یک اصطلاح تکامل می یابد و با قوانین دیگر تطبیق پیدا می کند اما نقطه شروع قوانین سطح بالا است).
تحلیل کننده سطح پایین به بالا ورودی را اسکن می کند تا زمانی که یک قانون پیدا شود. سپس ورودی پیدا شده را که تطبیق دارد با قانون جایگزین می کند. این کار تا پایان ورودی ادامه پیدا می کند. اصطلاح مطابقت شده در پشته (stack) تحلیل کننده قرار می گیرد.
Stack Input 2 + 3 - 1 term + 3 - 1 term operation 3 - 1 expression - 1 expression operation 1 expression -
این نوع تحلیل کننده از پایین به بالا را پارسر انتقال کاهش (shift-reduce parser) می گویند، زیرا ورودی به راست انتقال یافته است (یک اشاره گر را تصور کنید که ابتدا به شروع ورودی اشاره می کند و به سمت راست حرکت می کند) و به تدریج به قوانین نحوی کاهش می یابد.
ابزار هایی وجود دارند که می توانند تحلیل کننده تولید کنند. شما به آن ها دستور زبانی می دهید (واژگان و دستورات نحو) و برای شما یک تحلیل کننده کاری می دهند. ساختن یک تحلیل کننده نیاز به درک عمیقی از تحلیل دارد و اصلا ایجاد یک تحلیل کننده بهینه با دست کار راحتی نیست، پس تولید کننده تحلیل کننده می تواند خیلی مفید باشد.
وب کیت از دو نوع تولید کننده تحلیل کننده استفاده می کند: فلکس برای ایجاد لکسر و بایسون برای ایجاد یک تحلیل کننده (ممکن است با نام های لکس (Lex) و یاک (Yacc) هم بشناسید). ورودی فلکس فایلی است حاوی تعاریف عبارت باقاعده از توکن ها است.ورودی بایسون قوانین نحو زبان در قالب فرم باکوس نائور است.
وظیفه تحلیل کننده HTML این است که HTML را تبدیل کند به درخت تحلیل .
تعریف گرامری HTML
واژگان و دستورات نحوی HTML در مشخصات ایجاد شده توسط اتحادیه وب جهانگستر تعریف شده است.
همانطور که در مقدمه تحلیل دیدیم، دستور زبان نحو را می توان به طور رسمی با استفاده از فرمت باکوس نائور تعریف کرد.
متاسفانه تمام موضوعات تحلیل کننده مرسوم در HTML اعمال نمی شود (من آنها را فقط برای سرگرمی مطرح نکردم - آنها در تحلیل CSS و جاوا اسکریپت استفاده خواهند شد). HTML را نمی توان به راحتی با دستور زبان مستقل از متن که تحلیل کننده ها به آن نیاز دارند تعریف کرد.
یک قالب رسمی برای تعریف HTML وجود دارد - تعریف نوع سند یا دی تی دی (Document Type Definition) - اما یک دستور زبان مستقل از متن نیست.
در نگاه اول عجیب به نظر می رسد: HTML بسیار به XML نزدیک است و تعداد زیادی تحلیل کننده XML وجود دارند. یک نوع XML از HTML وجود دارد به نام XHTML، پس تفارت بزرگ چیست ؟
تفاوت بزرگ در این است که رویکرد HTML بیشتر بخشنده است: به شما اجازه می دهد تگ های خاصی را حذف کنید (بعد به طور ضمنی اضافه می شوند)، یا بعضی وقت ها برچسب های (tags) شروع و پایان را حذف کنید یا ... در کل HTML ملایم است ولی XML برعکس سفت و سخت است.
این جزئیات به ظاهر کوچک دنیایی از تفاوت را ایجاد می کند. در یک سمت این دلیل اصلی محبوب بودن HTML است: اشتباهات شما را می بخشد و زندگی را برای توسعه دهنده آسان می کند. در یک سمت دیگر، نوشتن یک دستور زبان رسمی را دشوار می کند. بطور مختصر، HTML توسط تحلیل کننده های مرسوم به راحتی تحلیل نمی شود از آن جایی که یک دستور زبان مستقل از متن نیست و با تحلیل کننده های XML تحلیل نمی شود.
تعریف نوع سند (DTD)
تعریف HTML در قالب DTD است. این قالب برای تعریف زبان های خانواده اسجیامال (StandardGeneralized Markup Language) استفاده می شود. این قالب شامل تعاریفی برای همه عناصر مجاز، ویژگی ها و سلسه مراتب (Hierarchy) آنها است. همانطور که قبلا دیدیم، HTML DTD یک دستور زبان مستقل از متن را تشکیل نمی دهد.
تعداد کمی از نوع DTD وجود دارند. حالت سخت صرفاً با مشخصات فنی مطابقت دارد، اما سایر حالت ها شامل پشتیبانی از نشانه گذاری (markup) مورد استفاده مرورگرها در گذشته هستند. هدف سازگاری عقبرو (backward compatibility) با محتوا قدیمی است. DTD حالت سخت فعلی این جا است: www.w3.org/TR/html4/strict.dtd
درخت خروجی (درخت تحلیل) یک درخت از عناصر DOM و ویژگی گره های آن است. مدل شیءگرای سند ارائه شیء از سند HTML و رابط عناصر HTML با دنیای خارج مانند جاوااسکریپت (JavaScript) است.
ریشه این درخت شیء Document است.
مدل شیءگرای سند تقریباً رابطه یک به یک با نشانه گذاری دارد. مثلا:
<html> <body> <p> Hello World </p> <div> <img src="example.png"/></div> </body> </html>
این نشانه گذاری به درخت DOM زیر ترجمه می شود:
همانند HTML، مدل شیءگرای سند توسط اتحادیه وب جهانگستر تعریف شده است.
وقتی گفتم درخت شامل گره های DOM است. منظورم این است که درخت از عناصری ساخته شده است که یکی از رابط های DOM را پیاده سازی می کند. مرورگر از پیاده سازی های مشخصی استفاده می کند که ویژگی های دیگری دارد که در داخل مرورگر استفاده می شود.
همانطور که در قسمت قبل مشاهده کردیم، HTML نمی تواند توسط تحلیل کننده بالا به پایین یا پایین به بالا تحلیل شود.
دلایل عبارتند از:
1. ماهیت بخشنده زبان.
2. این واقعیت که مرورگرها تحمل خطای مرسوم برای پشتیبانی از موارد شناخته شده HTML نامعتبر را دارند.
3. پروسه تحلیل مجدد وارد می شود. برای زبانهای دیگر، منبع در طول تحلیل تغییر نمیکند، اما در HTML، کد پویا (مانند عناصر اسکریپت حاوی فراخوانهای ) میتواند گره های اضافی اضافه کند، بنابراین فرآیند تحلیل در واقع ورودی را تغییر میدهد.
مرورگرها قادر به استفاده از تکنیک های تحلیل معمولی نیستند پس تحلیل کننده های سفارشی خودشان را برای تحلیل HTML ایجاد می کنند.
الگورتم تحلیل با جزئیات کامل در اینجا توضیح داده شده است. الگوریتم از دو مرحله تشکیل شده است: توکن سازی (tokenization) و درخت سازی (tree construction).
توکن سازی یک تحلیلگر واژگانی است، ورودی را به توکن تحلیل می کند. در کنار توکن های HTML برچسب های شروع، پایان و نام صفت ها و ویژگی ها هستند.
توکن سازی توکن را می شناسد، آن را به درخت سازنده می دهد و کاراکتر بعدی را برای تشخیص نشانه بعدی مصرف می کند و تا پایان ورودی به همین ترتیب ادامه می دهد.
خروجی الگوریتم توکن HTML است. الگوریتم به عنوان یک ماشین حالت بیان میشود. هر حالت یک یا چند کاراکتر از جریان ورودی را استفاده میکند و وضعیت بعدی را با توجه به آن کاراکترها به روز میکند. این تصمیم تحت تأثیر وضعیت توکنسازی فعلی و وضعیت درختسازی است. این بدان معناست که همان کاراکتر استفاده شده، بسته به وضعیت فعلی، نتایج متفاوتی را برای حالت بعدی به همراه خواهد داشت. الگوریتم برای توصیف کامل بسیار پیچیده است، بنابراین بیایید یک مثال ساده را ببینیم که درک اصلی ما کمک میکند.
مثال ساده - ساخت توکن برای مثال زیر:
<html> <body> Hello world </body> </html>
حالت اولیه "وضعیت داده" است. وقتی با کاراکتر < مواجه میشوید، وضعیت به "Tag open state - نشانه گذاری وضعیت باز" تغییر میکند. مصرف یک کاراکتر a-z باعث ایجاد یک "Start tag token - شروع نشانه گذاری توکن" میشود، وضعیت به "Tag name state - نشانه گذاری نام وضعیت" تغییر میکند. تا زمانی که کاراکتر > استفاده شود در این حالت میمانیم. هر کاراکتر به نام توکن جدید اضافه میشود. در مورد حالت ما توکن ایجاد شده یک توکن html است.
با رسیدن به تگ >، توکن فعلی منتشر میشود و وضعیت به "وضعیت داده" تغییر میکند. تگ <body> نیز با همین مراحل انجام میشود. تا کنون تگهای html و body منتشر شده است. ما اکنون به "وضعیت داده" بازگشتهایم. استفاده کاراکتر H از Hello world باعث ایجاد و انتشار یک توکن کاراکتر میشود، این کار تا رسیدن به < از </body> ادامه مییابد. ما برای هر کاراکتر از Hello world یک توکن کاراکتر منتشر میکنیم.
ما اکنون به "Tag open state - نشانه گذاری وضعیت باز" بازگشتهایم. مصرف ورودی بعدی / باعث ایجاد یک توکن تگ پایانی و انتقال به "Tag name state - نشانه گذاری نام وضعیت" میشود. دوباره در این وضعیت میمانیم تا به > برسیم. سپس توکن تگ جدید منتشر میشود و به "وضعیت داده" برمی گردیم. با ورودی </html> مانند مورد قبلی رفتار میشود.
الگوریتم درخت سازی
هنگامی که تحلیلگر ایجاد میشود، شی Document ایجاد میشود. در مرحله ساخت درخت، درخت DOM با سند در ریشه آن اصلاح میشود و عناصر به آن اضافه میشود. هر توکن منتشر شده توسط توکن سازی توسط سازنده درخت پردازش میشود. برای هر توکن، مشخصات مشخص میکند که کدام عنصر DOM مربوط به آن است و برای این توکن ایجاد میشود. این عنصر به درخت DOM و همچنین پشته (stack) عناصر باز اضافه میشود. این پشته برای تصحیح عدم تطابق تودرتو و تگهای بسته نشده استفاده میشود. این الگوریتم همچنین به عنوان یک ماشین حالت توصیف میشود. حالتها «حالتهای درج» نامیده میشوند.
بیایید فرآیند درخت سازی را برای مثال ورودی ببینیم:
<html> <body> Hello world </body> </html>
ورودی مرحله درخت سازی، دنبالهای از نشانهها از مرحله توکنسازی است. حالت اول "initial mode - حالت اولیه" است. دریافت توکن "html" باعث انتقال به حالت "before html" و پردازش مجدد توکن در آن حالت میشود. این باعث ایجاد عنصر HTMLHtmlElement میشود که به شی ریشه Document اضافه میشود.
وضعیت به "before head" تغییر خواهد کرد. سپس توکن "body" دریافت میشود. یک HTMLHeadElement به طور ضمنی ایجاد میشود، اگرچه ما یک توکن "head" نداریم و به درخت اضافه میشود.
اکنون به حالت "in head" و سپس به "after head" میرویم. توکن بدنه دوباره پردازش میشود، یک HTMLBodyElement ایجاد و درج میشود و حالت به "in body" منتقل میشود.
توکن های کاراکتر رشته "Hello world" اکنون دریافت شده است. اولین مورد باعث ایجاد و درج یک گره "متن" میشود و کاراکترهای دیگر به آن گره اضافه میشوند.
دریافت توکن پایان body باعث انتقال به حالت "after body" میشود. اکنون تگ پایان html را دریافت میکنیم که ما را به حالت "after after body" منتقل میکند. دریافت توکن پایان فایل، تحلیل را تمام می کند.
در این مرحله، مرورگر سند را بهعنوان تعاملی علامتگذاری میکند و شروع به تحلیل اسکریپتهایی میکند که در حالت "deferred - به تعویق افتاده" هستند: آنهایی که باید پس از تحلیل سند اجرا شوند. سپس حالت سند روی "complete" تنظیم میشود و رویداد "load" اجرا خواهد شد.
شما میتوانید الگوریتمهای کامل برای توکنسازی و درخت سازی را در مشخصات HTML5 مشاهده کنید.
شما هرگز خطای "Invalid Syntax" را در صفحه HTML دریافت نمیکنید. مرورگرها هرگونه محتوای نامعتبر را برطرف میکنند و کارشان را ادامه میدهند.
<html> <mytag> </mytag> <div> <p> </div> Really lousy HTML </p> </html>
من باید حدود یک میلیون قانون را نقض کرده باشم ("mytag" یک برچسب استاندارد نیست، اشتباه تودرتو عناصر "p" و "div" و موارد دیگر) اما مرورگر هنوز آن را به درستی نشان میدهد و شکایت نمیکند. بنابراین بسیاری از کدهای تحلیلگر اشتباهات نویسندهHTML را رفع میکنند.
رسیدگی به خطا در مرورگرها کاملاً ثابت است، اما به طرز شگفت انگیزی بخشی از مشخصاتHTML نبوده است. مانند نشانک گذاری (bookmarking) و دکمههای عقب/جلو، این چیزی است که در طول سالها در مرورگرها توسعه یافته است. ساختارهای نامعتبر HTML وجود دارد که در بسیاری از سایتها تکرار میشوند، و مرورگرها سعی میکنند آنها را به روشی مطابق با سایر مرورگرها اصلاح کنند.
مشخصاتHTML5 برخی از این الزامات را تعریف می کند. (WebKit این توضیح را به خوبی در ابتدای کلاس تحلیل کنندهHTML خلاصه می کند.)
متأسفانه، ما مجبوریم بسیاری از اسناد HTML را مدیریت کنیم که به خوبی شکل نگرفته اند، بنابراین تحلیل کننده باید نسبت به خطاها مدارا کند.
ما باید حداقل از شرایط خطای زیر مراقبت کنیم:
1. عنصری که اضافه میشود به صراحت در داخل برخی از برچسبهای بیرونی ممنوع است. در این حالت باید تمام تگها را تا آن چیزی که عنصر را ممنوع میکند ببندیم و سپس آن را اضافه کنیم.
2. ما مجاز به اضافه کردن مستقیم عنصر نیستیم. ممکن است شخصی که سند را مینویسد برخی از برچسبها را در این بین فراموش کرده باشد (یا اینکه تگ بین آن اختیاری است). این میتواند در مورد برچسبهای زیر باشد: HTML HEAD BODY TBODY TR TD LI ...
3. ما میخواهیم یک عنصر بلوک (block element) را در یک عنصر درون خطی (inline element) اضافه کنیم. تمام عناصر درون خطی را تا عنصر بلوک بالاتر بعدی ببندید.
4. اگر این کمکی نکرد، عناصر را ببندید تا زمانی که اجازه اضافه کردن عنصر را پیدا کنیم - یا تگ را نادیده بگیرید.
بیایید چند نمونه از قدرت تحمل خطای WebKit را ببینیم:
کد:
if (t->isCloseTag(brTag) && m_document->inCompatMode()) { reportError(MalformedBRError); t->beginTag = true; }
توجه داشته باشید که رسیدگی به خطا داخلی است: به کاربر ارائه نخواهد شد.
میز ولگرد، جدولی است در داخل جدول دیگری، اما نه در داخل سلول جدول.
برای مثال:
<table> <table> <tr><td>inner table</td></tr> </table> <tr><td>outer table</td></tr> </table>
وب کیت سلسله مراتب (hierarchy) را به دو جدول هم نژاد تغییر می دهد:
<table> <tr><td>outer table</td></tr> </table> <table> <tr><td>inner table</td></tr> </table>
کد:
if (m_inStrayTableContent && localName == tableTag) popBlock(tableTag);
وب کیت از یک پشته برای محتویات عنصر فعلی استفاده می کند: جدول داخلی را از پشته جدول بیرونی خارج می کند. اکنون میزها از یک نژاد خواهند بود.
در صورتی که کاربر فرمی را در فرم دیگری قرار دهد، فرم دوم نادیده گرفته می شود.
کد:
if (!m_currentFormElement) { m_currentFormElement = new HTMLFormElement(formTag, m_document); }
سلسله مراتب تگ خیلی عمیق
این نظر خودش گویای داستان است:
سایت www.liceo.edu.mx نمونهای از سایت هایی است که به سطحی از تودرتو بودن در حدود 1500 تگ دست مییابد که همگی از مجموعهای از <b>ها هستند. قبل از نادیده گرفتن همه آنها با هم، فقط حداکثر 20 تگ تودرتو از یک نوع را مجاز می کنیم.
کد:
bool HTMLParser::allowNestedRedundantTag(const AtomicString& tagName) { unsigned i = 0; for (HTMLStackElem* curr = m_blockStack; i < cMaxRedundantTagDepth && curr && curr->tagName == tagName; curr = curr->next, i++) { } return i != cMaxRedundantTagDepth; }
دوباره این نظر خودش گویای داستان است:
پشتیبانی از HTML واقعا شکسته. ما هرگز تگ بدنه را نمی بندیم، زیرا برخی از صفحات وب احمقانه آن را قبل از پایان واقعی سند می بندند. برای بستن چیزها به فراخوانی end() تکیه کنیم.
کد:
if (t->tagName == htmlTag || t->tagName == bodyTag ) return;
بنابراین نویسندگان وب مراقب باشند - مگر اینکه بخواهید به عنوان نمونه در یک قطعه کد در قدرت تحمل خطای WebKit ظاهر شوید - HTML خوب بنویسید.
مفاهیم تحلیل را در مقدمه به خاطر دارید؟ خب، برخلاف HTML این CSS یک دستور زبان مستقل از متن (Context-free grammar) است و میتواند با استفاده از انواع تحلیلگر هایی که در مقدمه توضیح داده شد، تحلیل شود. در واقع مشخصات CSS، گرامر واژگانی و نحوی CSS را تعریف می کند.
بیایید چند نمونه را ببینیم:
گرامر واژگانی با عبارات منظم برای هر نشانه تعریف می شود:
comment \/\*[^*]*\*+([^/*][^*]*\*+)*\/ num [0-9]+|[0-9]*"."[0-9]+ nonascii [\200-\377] nmstart [_a-z]|{nonascii}|{escape} nmchar [_a-z0-9-]|{nonascii}|{escape} name {nmchar}+ ident {nmstart}{nmchar}*
مشخص کننده یا identifier (خلاصه indent) است، مانند نام کلاس. "name" یک شناسه (id) عنصر است (که با "#" معرفی می شود)
گرامر نحو در فرم باکوس نائور توضیح داده شده است.
ruleset : selector [ ',' S* selector ]* '{' S* declaration [ ';' S* declaration ]* '}' S* ; selector : simple_selector [ combinator selector | S+ [ combinator? selector ]? ]? ; simple_selector : element_name [ HASH | class | attrib | pseudo ]* | [ HASH | class | attrib | pseudo ]+ ; class : '.' IDENT ; element_name : IDENT | '*' ; attrib : '[' S* IDENT S* [ [ '=' | INCLUDES | DASHMATCH ] S* [ IDENT | STRING ] S* ] ']' ; pseudo : ':' [ IDENT | FUNCTION S* [IDENT S*] ')' ] ;
توضیح:
یک مجموعه قوانین این ساختار است:
div.error, a.error { color:red; font-weight:bold; }
هردو div.error و a.error انتخابگر هستند. قسمت داخل آکولاد حاوی قوانینی است که توسط این مجموعه قوانین اعمال می شود. این ساختار به طور رسمی در این تعریف تعریف شده است:
ruleset : selector [ ',' S* selector ]* '{' S* declaration [ ';' S* declaration ]* '}' S* ;
این بدان معنی است که یک مجموعه قوانین یک انتخابگر یا به صورت اختیاری تعدادی انتخابگر است که با کاما و فاصله از هم جدا شده اند (S مخفف فضای سفید است). یک مجموعه قوانین شامل آکولاد و داخل آنها یک اعلان یا به صورت اختیاری تعدادی اعلان است که با یک نقطه ویرگول از هم جدا شده اند. "declaration - اعلامیه" و "selector - انتخاب کننده" در تعاریف فرم باکوس نائور زیر تعریف خواهند شد.
وبکیت از تولید کننده تحلیگر Flex و Bison برای ایجاد تحلیلگر به طور خودکار از فایلهای دستور زبان CSS استفاده میکند. همانطور که از مقدمه تحلیلگر به یاد میآورید، Bison یک تحلیلگر کاهش شیفت از پایین به بالا ایجاد میکند. فایرفاکس از تحلیلگر بالا به پایین استفاده میکند که به صورت دستی نوشته شده است. در هر دو مورد، هر فایل CSS در یک شیء StyleSheet تحلیل میشود. هر شی شامل قوانین CSS است. اشیاء قانون CSS حاوی اشیاء انتخابگر و اعلان و سایر اشیاء مربوط به دستور زبان CSS است.
مدل وب همگام (synchronous) است. نویسندگان انتظار دارند اسکریپتها بلافاصله پس از رسیدن تحلیلگر به تگ تحلیل و اجرا شوند. تحلیل سند تا زمانی که اسکریپت اجرا نشود متوقف میشود. اگر اسکریپت خارجی است، ابتدا منبع باید از شبکه واکشی شود - این کار به صورت همزمان انجام میشود و تجزیه تا زمانی که منبع واکشی شود متوقف میشود. این مدل سالها بود و در مشخصات HTML4 و 5 نیز مشخص شده است. نویسندگان میتوانند ویژگی "defer" را به یک اسکریپت اضافه کنند، در این صورت تجزیه سند متوقف نمیشود و پس از تجزیه سند اجرا میشود. HTML5 گزینهای را برای علامتگذاری اسکریپت بهعنوان ناهمزمان اضافه میکند تا توسط یک رشته دیگر تجزیه و اجرا شود.
هم WebKit و هم Firefox این بهینهسازی را انجام میدهند. در حین اجرای اسکریپتها، رشته دیگری بقیه سند را تجزیه میکند و متوجه میشود که چه منابع دیگری باید از شبکه بارگیری شود و آنها را بارگذاری میکند. به این ترتیب میتوان منابع را روی اتصالات موازی بارگذاری کرد و سرعت کلی بهبود یافت. توجه: تجزیهکننده حدسی فقط ارجاع به منابع خارجی مانند اسکریپتهای خارجی، شیوه نامهها و تصاویر را تجزیه میکند: درخت DOM را تغییر نمیدهد - که به تجزیهکننده اصلی واگذار میشود.
از طرف دیگر شیوهنامه ها (Style sheet) مدل متفاوتی دارند. از لحاظ مفهومی به نظر میرسد که از آنجایی که شیوه نامهها درخت DOM را تغییر نمیدهند، دلیلی وجود ندارد که منتظر آنها باشیم و تجزیه سند را متوقف کنیم. با این حال، مشکلی وجود دارد که اسکریپتها اطلاعات سبک را در مرحله تجزیه سند میخواهند. اگر استایل هنوز بارگذاری و تجزیه نشده باشد، اسکریپت پاسخهای اشتباه دریافت میکند و ظاهراً این باعث مشکلات زیادی شده است. به نظر میرسد یک مورد لبه است اما بسیار رایج است. فایرفاکس همه اسکریپتها را وقتی که یک شیوه نامه وجود دارد که هنوز در حال بارگذاری و تجزیه است، مسدود میکند. WebKit تنها زمانی اسکریپتها را مسدود میکند که سعی کنند به ویژگیهای سبک خاصی دسترسی پیدا کنند که ممکن است توسط شیوه نامههای بارگیری نشده تحت تأثیر قرار گیرند.
در حالی که درخت DOM در حال ساخت است، مرورگر درخت دیگری به نام درخت رندر میسازد. این درخت از عناصر بصری به ترتیب نمایش داده میشود. این نمایش تصویری سند است. هدف این درخت این است که امکان رنگ آمیزی محتویات به ترتیب صحیح آنها را فراهم کند.
فایرفاکس عناصر موجود در درخت رندر را فریم می نامد. WebKit از اصطلاح renderer یا render object استفاده می کند.
یک رندر می داند چگونه خود و فرزندانش را چیدمان و نقاشی کند.
کلاس RenderObject WebKit، کلاس پایه رندرها، تعریف زیر را دارد:
class RenderObject{ virtual void layout(); virtual void paint(PaintInfo); virtual void rect repaintRect(); Node* node; //the DOM node RenderStyle* style; // the computed style RenderLayer* containgLayer; //the containing z-index layer }
هر رندر نمایانگر یک ناحیه مستطیلی است که معمولاً مطابق با جعبه CSS یک گره است، همانطور که توسط مشخصات CSS2 توضیح داده شده است. این شامل اطلاعات هندسی مانند عرض، ارتفاع و موقعیت است.
نوع جعبه تحت تأثیر مقدار "نمایش" ویژگی سبک است که به گره مربوط می شود (به بخش محاسبه سبک مراجعه کنید). در اینجا کد WebKit برای تصمیم گیری در مورد اینکه چه نوع رندری باید برای یک گره DOM ایجاد شود، با توجه به ویژگی نمایش آمده است:
RenderObject* RenderObject::createObject(Node* node, RenderStyle* style) { Document* doc = node->document(); RenderArena* arena = doc->renderArena(); ... RenderObject* o = 0; switch (style->display()) { case NONE: break; case INLINE: o = new (arena) RenderInline(node); break; case BLOCK: o = new (arena) RenderBlock(node); break; case INLINE_BLOCK: o = new (arena) RenderBlock(node); break; case LIST_ITEM: o = new (arena) RenderListItem(node); break; ... } return o; }
نوع عنصر نیز در نظر گرفته می شود: به عنوان مثال، کنترل های فرم و جداول دارای قاب های خاص هستند.
در WebKit اگر عنصری بخواهد یک رندر ویژه ایجاد کند، متد ()createRenderer را لغو می کند. رندرها به اشیایی با سبک اشاره می کنند که حاوی اطلاعات غیر هندسی هستند.
رندرها با عناصر DOM مطابقت دارند، اما رابطه یک به یک نیست. عناصر DOM غیر بصری در درخت رندر درج نمیشوند. یک مثال عنصر "سر" است. همچنین عناصری که مقدار نمایش آنها به "none" اختصاص داده شده است در درخت ظاهر نمیشوند (در حالی که عناصر با نمای "پنهان" در درخت ظاهر میشوند).
عناصر DOM وجود دارد که با چندین شیء بصری مطابقت دارد. اینها معمولاً عناصری با ساختار پیچیده هستند که با یک مستطیل قابل توصیف نیستند. به عنوان مثال، عنصر "انتخاب" سه رندر دارد: یکی برای ناحیه نمایش، یکی برای کادر لیست کشویی و دیگری برای دکمه. همچنین هنگامی که متن به چند خط شکسته میشود زیرا عرض برای یک خط کافی نیست، خطوط جدید به عنوان رندر اضافی اضافه میشوند.
نمونه دیگری از رندرهای متعدد، HTML شکسته است. طبق مشخصات CSS، یک عنصر درون خطی باید فقط شامل عناصر بلوک یا فقط عناصر درون خطی باشد. در مورد محتوای مختلط، رندرهای بلوک ناشناس برای بسته بندی عناصر درون خطی ایجاد خواهند شد.
برخی از اشیاء رندر با یک گره DOM مطابقت دارند اما در همان مکان درخت نیستند. شناورها و عناصر کاملاً قرار گرفته خارج از جریان هستند، در قسمت دیگری از درخت قرار میگیرند و به قاب واقعی نگاشت میشوند. قاب نگهدارنده مکان جایی است که باید میبودند.
در فایرفاکس، ارائه به عنوان شنونده برای به روز رسانیهای DOM ثبت میشود. ارائه ایجاد فریم را به FrameConstructor واگذار میکند و سازنده سبک را حل میکند (به محاسبه سبک مراجعه کنید) و یک فریم ایجاد میکند.
در WebKit به فرآیند حل استایل و ایجاد رندر «پیوست» میگویند. هر گره DOM دارای یک روش "اتصال" است. پیوست سنکرون است، درج گره به درخت DOM، گره جدید را متد «پیوست» مینامد.
پردازش تگهای html و body منجر به ساخت ریشه درخت رندر میشود. شیء رندر ریشه مطابق با چیزی است که مشخصات CSS آن را بلوک حاوی مینامد: بالاترین بلوک که شامل تمام بلوکهای دیگر است. ابعاد آن عبارتند از viewport: پنجره مرورگر ابعاد منطقه را نمایش میدهد. فایرفاکس آن را ViewPortFrame و WebKit آن را RenderView مینامد. این شی رندر است که سند به آن اشاره میکند. بقیه درخت به عنوان یک درج گرههای DOM ساخته شده است.
مشخصات CSS2 در مدل پردازش را ببینید.
ساخت درخت رندر مستلزم محاسبه خواص بصری هر شی رندر است. این کار با محاسبه ویژگیهای سبک هر عنصر انجام میشود.
این سبک شامل برگههای سبک با ریشههای مختلف، عناصر سبک درون خطی و ویژگیهای بصری در HTML است (مانند ویژگی "bgcolor"). این سبک به ویژگیهای سبک CSS منطبق ترجمه میشود.
منشاء شیوه نامهها، برگههای سبک پیش فرض مرورگر، شیوه نامههای ارائه شده توسط نویسنده صفحه و شیتهای سبک کاربر هستند - اینها شیوه نامههایی هستند که توسط کاربر مرورگر ارائه میشود (مرورگرها به شما امکان میدهند سبکهای مورد علاقه خود را تعریف کنید. به عنوان مثال، در فایرفاکس، این با قرار دادن یک style sheet در پوشه "Firefox Profile" انجام میشود).
محاسبه سبک چند مشکل را به همراه دارد:
1. دادههای سبک یک ساختار بسیار بزرگ است که دارای ویژگیهای سبک متعدد است، این میتواند باعث مشکلات حافظه شود.
2. یافتن قوانین تطبیق برای هر عنصر در صورتی که بهینه نشده باشد میتواند باعث مشکلات عملکرد شود. پیمودن کل فهرست قوانین برای هر عنصر برای یافتن موارد منطبق، کار سنگینی است. انتخابگرها میتوانند ساختار پیچیدهای داشته باشند که میتواند باعث شود فرآیند تطبیق در مسیری به ظاهر امیدوارکننده شروع شود که بیفایده بودن آن ثابت شده است و باید مسیر دیگری را امتحان کرد.
به عنوان مثال - این انتخابگر ترکیبی:
div div div div{ ... }
به این معنی که قوانین در مورد یک <div> که از نسل 3 div است اعمال میشود. فرض کنید میخواهید بررسی کنید که آیا این قانون برای عنصر <div> داده شده اعمال میشود یا خیر. شما مسیر خاصی را برای بررسی به بالای درخت انتخاب میکنید. ممکن است لازم باشد درخت گره را به سمت بالا طی کنید تا متوجه شوید که فقط دو div وجود دارد و این قانون اعمال نمیشود. سپس باید مسیرهای دیگری را در درخت امتحان کنید.
3. اعمال قوانین شامل قوانین آبشاری کاملاً پیچیدهای است که سلسله مراتب قوانین را تعریف میکند.
بیایید ببینیم مرورگرها چگونه با این مشکلات روبرو میشوند:
گرههای WebKit به اشیاء سبک ارجاع میدهند (RenderStyle). این اشیاء را میتوان در برخی شرایط توسط گرهها به اشتراک گذاشت. گرهها خواهر و برادر یا پسر عمو هستند و:
1. عناصر باید در یک حالت ماوس باشند (به عنوان مثال، یکی نمیتواند در :hover باشد در حالی که دیگری نیست)
2. هیچ یک از عناصر نباید شناسه داشته باشند
3. نام تگها باید مطابقت داشته باشد
4. ویژگیهای کلاس باید مطابقت داشته باشند
5. مجموعه ویژگیهای نقشه برداری شده باید یکسان باشد
6. حالتهای پیوند باید مطابقت داشته باشند
7. حالات تمرکز باید مطابقت داشته باشند
8. هیچ یک از عناصر نباید تحت تأثیر انتخابگرهای مشخصه قرار گیرند، جایی که تأثیر به این صورت تعریف میشود که منطبق بر انتخابگر باشد که از یک انتخابگر ویژگی در هر موقعیتی در انتخابگر استفاده میکند.
9. نباید هیچ ویژگی سبک درون خطی روی عناصر وجود داشته باشد
10. اصلا نباید انتخابگر خواهر و برادری در حال استفاده باشد. WebCore به سادگی یک سوئیچ سراسری را زمانی که انتخابگر خواهر و برادری با آن مواجه میشود پرتاب میکند و اشتراکگذاری سبک را برای کل سند در زمانی که آنها حضور دارند غیرفعال میکند. این شامل انتخابگر + و انتخابگرهایی مانند :first-child و :last-child است.
فایرفاکس دارای دو درخت اضافی برای محاسبه سبک آسانتر است: درخت قانون و درخت زمینه سبک. WebKit همچنین دارای اشیاء سبک است اما آنها در درختی مانند درخت زمینه سبک ذخیره نمیشوند، فقط گره DOM به سبک مربوطه خود اشاره میکند.
زمینههای سبک حاوی مقادیر پایانی هستند. مقادیر با اعمال تمام قوانین تطبیق به ترتیب صحیح و انجام دستکاریهایی که آنها را از مقادیر منطقی به مقادیر مشخص تبدیل میکند، محاسبه میشوند. به عنوان مثال، اگر مقدار منطقی درصدی از صفحه باشد، محاسبه شده و به واحدهای مطلق تبدیل میشود. ایده درخت قانون واقعا هوشمندانه است. به اشتراک گذاری این مقادیر بین گرهها برای جلوگیری از محاسبه مجدد آنها را امکانپذیر میکند. این همچنین باعث صرفه جویی در فضا میشود.
همه قوانین مطابق در یک درخت ذخیره میشوند. گرههای پایین در یک مسیر دارای اولویت بیشتری هستند. درخت شامل تمام مسیرهای منطبق قوانین یافت شده است. ذخیره قوانین با تنبلی انجام میشود. درخت در ابتدا برای هر گره محاسبه نمیشود، اما هر زمان که یک سبک گره باید محاسبه شود، مسیرهای محاسبه شده به درخت اضافه میشوند.
ایده این است که مسیرهای درخت را به عنوان کلمات در یک فرهنگ لغت ببینیم. بیایید بگوییم که قبلاً این درخت قانون را محاسبه کردهایم:
فرض کنید باید قوانین را برای عنصر دیگری در درخت محتوا مطابقت دهیم و متوجه شویم که قوانین مطابق (به ترتیب صحیح) B-E-I هستند. ما قبلاً این مسیر را در درخت داریم زیرا قبلاً مسیر A-B-E-I-L را محاسبه کردهایم. اکنون کار کمتری برای انجام دادن خواهیم داشت.
بیایید ببینیم درخت چگونه کار ما را نجات میدهد.
زمینههای سبک به ساختارها تقسیم میشوند. این ساختارها حاوی اطلاعات سبک برای یک دسته خاص مانند حاشیه یا رنگ هستند. تمام ویژگیهای یک ساختار یا ارثی هستند یا غیر ارثی. ویژگیهای ارثی ویژگیهایی هستند که مگر اینکه توسط عنصر تعریف شوند، از والد آن به ارث میرسند. ویژگیهای غیر ارثی (که ویژگیهای «تنظیم مجدد» نامیده میشوند) اگر تعریف نشده باشند، از مقادیر پیشفرض استفاده میکنند.
درخت با ذخیرهسازی کل ساختارها (شامل مقادیر پایانی محاسبه شده) در درخت به ما کمک میکند. ایده این است که اگر گره پایینی تعریفی برای یک ساختار ارائه نمیکند، میتوان از یک ساختار ذخیرهشده در یک گره بالایی استفاده کرد.
هنگام محاسبه زمینه سبک برای یک عنصر خاص، ابتدا یک مسیر را در درخت قانون محاسبه میکنیم یا از یک مسیر موجود استفاده میکنیم. سپس شروع به اعمال قوانین در مسیر برای پر کردن ساختارها در زمینه سبک جدید خود میکنیم. ما از گره پایین مسیر شروع میکنیم - یکی با بالاترین اولویت (معمولاً خاصترین انتخابگر) و درخت را تا زمانی که ساختار ما پر شود، طی میکنیم. اگر هیچ مشخصاتی برای ساختار در آن گره قانون وجود نداشته باشد، میتوانیم تا حد زیادی بهینهسازی کنیم - از درخت بالا میرویم تا زمانی که گرهای را پیدا کنیم که آن را کاملاً مشخص کند و به سادگی به آن اشاره کنیم - این بهترین بهینهسازی است - کل ساختار به اشتراک گذاشته میشود. این باعث صرفه جویی در محاسبه مقادیر نهایی و حافظه میشود.
اگر تعاریف جزئی پیدا کنیم از درخت بالا میرویم تا ساختار پر شود.
اگر هیچ تعریفی برای ساختار خود پیدا نکردیم، در صورتی که ساختار یک نوع "ارثی" باشد، به ساختار والد خود در درخت زمینه اشاره میکنیم. در این مورد ما همچنین موفق به اشتراک گذاری ساختارها شدیم. اگر ساختار بازنشانی باشد، از مقادیر پیشفرض استفاده میشود.
اگر خاصترین گره مقادیری را اضافه کند، باید محاسبات اضافی برای تبدیل آن به مقادیر واقعی انجام دهیم. سپس نتیجه را در گره درخت ذخیره میکنیم تا بتوان از آن برای کودکان استفاده کرد.
اگر عنصری خواهر یا برادر یا برادری داشته باشد که به همان گره درخت اشاره میکند، میتوان کل زمینه سبک را بین آنها به اشتراک گذاشت.
بیایید یک مثال را ببینیم: فرض کنید ما این HTML را داریم
<html> <body> <div class="err" id="div1"> <p> this is a <span class="big"> big error </span> this is also a <span class="big"> very big error</span> error </p> </div> <div class="err" id="div2">another error</div> </body> </html>
و قوانین زیر:
div {margin: 5px; color:black} .err {color:red} .big {margin-top:3px} div span {margin-bottom:4px} #div1 {color:blue} #div2 {color:green}
برای ساده کردن کارها، فرض کنید باید فقط دو ساختار را پر کنیم: ساختار رنگ و ساختار حاشیه. ساختار رنگ فقط یک عضو دارد: رنگ ساختار حاشیه شامل چهار طرف است.
درخت قانون حاصل به این شکل خواهد بود (گرهها با نام گره مشخص میشوند: تعداد قاعدهای که روی آن اشاره میکنند):
درخت زمینه به این شکل خواهد بود (نام گره: گره قانون که به آن اشاره می کنند):
فرض کنید HTML را تجزیه میکنیم و به تگ دوم <div> میرسیم. ما باید یک زمینه سبک برای این گره ایجاد کنیم و ساختارهای سبک آن را پر کنیم.
ما قوانین را مطابقت میدهیم و متوجه میشویم که قوانین تطبیق برای <div> 1، 2 و 6 هستند. این بدان معنی است که یک مسیر موجود در درخت وجود دارد که عنصر ما میتواند از آن استفاده کند و فقط باید گره دیگری را به آن اضافه کنیم. قانون 6 (گره F در درخت قانون).
ما یک زمینه سبک ایجاد میکنیم و آن را در درخت زمینه قرار میدهیم. زمینه سبک جدید به گره F در درخت قانون اشاره میکند.
اکنون باید ساختارهای سبک را پر کنیم. ما با پر کردن ساختار حاشیه شروع خواهیم کرد. از آنجایی که آخرین گره قانون (F) به ساختار حاشیه اضافه نمیشود، میتوانیم به بالای درخت برویم تا زمانی که یک ساختار ذخیرهسازی شده محاسبهشده در درج گره قبلی را پیدا کنیم و از آن استفاده کنیم. ما آن را در گره B خواهیم یافت، که بالاترین گرهای است که قوانین حاشیه را مشخص میکند.
ما برای ساختار رنگی تعریفی داریم، بنابراین نمیتوانیم از ساختار کش استفاده کنیم. از آنجایی که رنگ یک ویژگی دارد، لازم نیست برای پر کردن سایر ویژگیها از درخت بالا برویم. ما مقدار پایانی را محاسبه میکنیم (رشته را به RGB و غیره تبدیل میکنیم) و ساختار محاسبه شده را در این گره ذخیره میکنیم.
کار بر روی عنصر دوم <span> حتی سادهتر است. قوانین را مطابقت میدهیم و به این نتیجه میرسیم که مانند دهانه قبلی به قانون G اشاره میکند. از آنجایی که ما خواهر و برادرهایی داریم که به یک گره اشاره میکنند، میتوانیم کل زمینه سبک را به اشتراک بگذاریم و فقط به بافت دهانه قبلی اشاره کنیم.
برای ساختارهایی که حاوی قوانینی هستند که از والد به ارث برده شدهاند، کش روی درخت زمینه انجام میشود (ویژگی رنگ در واقع به ارث میرسد، اما فایرفاکس آن را به عنوان تنظیم مجدد در نظر میگیرد و آن را در درخت قانون ذخیره میکند).
به عنوان مثال اگر قوانینی را برای فونتها در یک پاراگراف اضافه کنیم:
p {font-family: Verdana; font size: 10px; font-weight: bold}
سپس عنصر پاراگراف، که فرزندی از div در درخت زمینه است، میتوانست همان ساختار فونت را با پدرش به اشتراک بگذارد. این در صورتی است که هیچ قانون فونتی برای پاراگراف مشخص نشده باشد.
در WebKit که درخت قانون ندارد، اعلانهای همسان چهار بار پیمایش میشوند. ابتدا ویژگیهای غیر مهم با اولویت بالا اعمال میشوند (خواصی که ابتدا باید اعمال شوند زیرا سایرین به آنها وابسته هستند، مانند نمایش)، سپس اولویت بالا مهم، سپس اولویت عادی غیر مهم، سپس قوانین مهم اولویت عادی. این به این معنی است که ویژگیهایی که چندین بار ظاهر میشوند مطابق ترتیب آبشاری صحیح حل میشوند. آخرین برنده است.
بنابراین به طور خلاصه: اشتراک گذاری اشیاء سبک (به طور کامل یا برخی از ساختارهای داخل آنها) مسائل 1 و 3 را حل میکند. درخت قانون فایرفاکس همچنین به اعمال خواص به ترتیب صحیح کمک میکند.
چندین منبع برای قوانین سبک وجود دارد:
1. قوانین CSS، چه در شیوه نامه های خارجی یا در عناصر سبک.
p {color: blue}
2. ویژگی های سبک درون خطی مانند
<p style="color: blue" />
3. ویژگی های بصری HTML (که به قوانین سبک مربوطه نگاشت می شوند)
<p bgcolor="blue" />
دو مورد آخر به راحتی با عنصر تطبیق داده میشوند زیرا او دارای ویژگیهای سبک است و ویژگیهای HTML را میتوان با استفاده از عنصر به عنوان کلید نگاشت کرد.
همانطور که قبلا در شماره 2 ذکر شد، تطبیق قوانین CSS میتواند پیچیدهتر باشد. برای حل مشکل، قوانین برای دسترسی آسانتر دستکاری میشوند.
پس از تجزیه صفحه سبک، طبق انتخابگر، قوانین به یکی از چندین نقشه هش اضافه میشوند. نقشههایی بر اساس شناسه، نام کلاس، بر اساس نام تگ و یک نقشه کلی برای هر چیزی که در آن دسته بندیها قرار نمیگیرد وجود دارد. اگر انتخابگر یک id باشد، قانون به نقشه شناسه اضافه میشود، اگر کلاس باشد به نقشه کلاس و غیره اضافه میشود.
این دستکاری تطبیق قوانین را بسیار آسانتر میکند. نیازی به جستجو در هر اعلان نیست: ما میتوانیم قوانین مربوط به یک عنصر را از نقشهها استخراج کنیم. این بهینهسازی 95+٪ از قوانین را حذف میکند، به طوری که حتی نیازی به در نظر گرفتن آنها در طول فرآیند تطبیق (4.1) نیست.
بیایید برای مثال قوانین سبک زیر را ببینیم:
p.error {color: red} #messageDiv {height: 50px} div {margin: 5px}
اولین قانون در نقشه کلاس درج می شود. دومی در نقشه شناسه و سومی در نقشه تگ.
برای قطعه HTML زیر:
<p class="error">an error occurred</p> <div id=" messageDiv">this is a message</div>
ابتدا سعی میکنیم قوانینی را برای عنصر p پیدا کنیم. نقشه کلاس حاوی یک کلید "error" است که تحت آن قانون "p.error" پیدا میشود. عنصر div قوانین مربوطه را در نقشه شناسه (کلید id است) و نقشه برچسب خواهد داشت. بنابراین تنها کار باقی مانده این است که بفهمیم کدام یک از قوانین استخراج شده توسط کلیدها واقعاً مطابقت دارند.
به عنوان مثال اگر قانون برای div بود
table div {margin: 5px}
همچنان از نقشه برچسب استخراج میشود، زیرا کلید سمت راستترین انتخابگر است، اما با عنصر div ما که جد جدولی ندارد مطابقت ندارد.
هم WebKit و هم Firefox این دستکاری را انجام میدهند.
شی استایل دارای ویژگیهای مربوط به هر ویژگی بصری است (همه ویژگیهای CSS اما عمومی تر). اگر خاصیت با هیچ یک از قوانین منطبق تعریف نشده باشد، برخی از ویژگیها را میتوان توسط شیء سبک عنصر والد به ارث برد. سایر ویژگیها دارای مقادیر پیش فرض هستند.
مشکل زمانی شروع میشود که بیش از یک تعریف وجود داشته باشد - در اینجا دستور آبشار برای حل مسئله میآید.
یک اعلان برای یک ویژگی سبک میتواند در چندین شیوه نامه و چندین بار در یک شیوه نامه ظاهر شود. این بدان معناست که ترتیب اعمال قوانین بسیار مهم است. به این ترتیب "آبشار" میگویند. طبق مشخصات CSS2، ترتیب آبشار (از کم به زیاد) است:
1. اعلامیههای مرورگر
2. اظهارنامههای عادی کاربر
3. اظهارنامههای عادی نویسنده
4. نویسنده اظهارات مهم
5. اعلامیههای مهم کاربر
اعلانهای مرورگر کمترین اهمیت را دارند و کاربر تنها در صورتی از نویسنده رد میکند که اعلان به عنوان مهم علامت گذاری شده باشد. اعلانهای با همان ترتیب بر اساس ویژگی مرتبسازی میشوند و سپس به ترتیبی که مشخص میشوند. ویژگیهای بصری HTML به اعلانهای CSS منطبق ترجمه میشوند. آنها به عنوان قوانین نویسنده با اولویت پایین در نظر گرفته میشوند.
ویژگی انتخابگر توسط مشخصات CSS2 به صورت زیر تعریف میشود:
1. اگر اعلانی که از آن گرفته شده است به جای یک قانون با انتخابگر، یک ویژگی «style» است، 0 در غیر این صورت (= a)
2. شمارش تعداد ویژگیهای ID در انتخابگر (= b)
3. تعداد سایر صفات و شبه کلاسها را در انتخابگر بشمارید (= c)
4. تعداد نام عناصر و شبه عناصر را در انتخابگر بشمارید (=d)
الحاق چهار عدد a-b-c-d (در یک سیستم اعداد با پایه بزرگ) ویژگی را میدهد.
پایه اعدادی که باید استفاده کنید با بالاترین تعداد شما در یکی از دستهها تعریف میشود.
به عنوان مثال، اگر a=14 میتوانید از پایه هگزادسیمال استفاده کنید. در حالت بعید که a=17 به یک پایه اعداد 17 رقمی نیاز دارید. وضعیت بعدی میتواند با انتخاب کنندهای مانند این اتفاق بیفتد: html body div div p... (17 برچسب در انتخابگر شما ... خیلی محتمل نیست).
چند نمونه:
* {} /* a=0 b=0 c=0 d=0 -> specificity = 0,0,0,0 */ li {} /* a=0 b=0 c=0 d=1 -> specificity = 0,0,0,1 */ li:first-line {} /* a=0 b=0 c=0 d=2 -> specificity = 0,0,0,2 */ ul li {} /* a=0 b=0 c=0 d=2 -> specificity = 0,0,0,2 */ ul ol+li {} /* a=0 b=0 c=0 d=3 -> specificity = 0,0,0,3 */ h1 + *[rel=up]{} /* a=0 b=0 c=1 d=1 -> specificity = 0,0,1,1 */ ul ol li.red {} /* a=0 b=0 c=1 d=3 -> specificity = 0,0,1,3 */ li.red.level {} /* a=0 b=0 c=2 d=1 -> specificity = 0,0,2,1 */ #x34y {} /* a=0 b=1 c=0 d=0 -> specificity = 0,1,0,0 */ style="" /* a=1 b=0 c=0 d=0 -> specificity = 1,0,0,0 */
پس از تطبیق قوانین، آنها بر اساس قوانین آبشار مرتب میشوند. WebKit از مرتبسازی حبابی برای فهرستهای کوچک و مرتبسازی ادغامشده برای فهرستهای بزرگ استفاده میکند. WebKit مرتبسازی را با نادیده گرفتن عملگر ">" برای قوانین پیادهسازی میکند:
static bool operator >(CSSRuleData& r1, CSSRuleData& r2) { int spec1 = r1.selector()->specificity(); int spec2 = r2.selector()->specificity(); return (spec1 == spec2) : r1.position() > r2.position() : spec1 > spec2; }
WebKit از پرچمی استفاده میکند که نشان میدهد آیا همه سبکبرگهای سطح بالا (از جمله @imports) بارگیری شدهاند یا خیر. اگر استایل هنگام اتصال به طور کامل بارگذاری نشده باشد، از نگهدارندههای مکان استفاده میشود و در سند مشخص میشود و پس از بارگیری شیوه نامهها مجدداً محاسبه میشوند.
وقتی رندر ایجاد میشود و به درخت اضافه میشود، موقعیت و اندازه ندارد. محاسبه این مقادیر را layout یا reflow مینامند.
HTML از یک مدل طرحبندی مبتنی بر جریان استفاده میکند، به این معنی که در بیشتر مواقع میتوان هندسه را در یک پاس محاسبه کرد. عناصر بعدی "در جریان" معمولاً بر هندسه عناصری که زودتر "در جریان هستند" تأثیر نمیگذارند، بنابراین طرحبندی میتواند از چپ به راست، از بالا به پایین در سند ادامه یابد. استثنائاتی وجود دارد: برای مثال، جداول HTML ممکن است به بیش از یک پاس نیاز داشته باشند.
سیستم مختصات نسبت به قاب ریشه است. مختصات بالا و چپ استفاده میشود.
Layout یک فرآیند بازگشتی است. از رندر اصلی شروع میشود که با عنصر <html> سند HTML مطابقت دارد. Layout به صورت بازگشتی از طریق برخی یا تمام سلسله مراتب فریم ادامه مییابد و اطلاعات هندسی را برای هر رندری که به آن نیاز دارد محاسبه میکند.
موقعیت رندر ریشه 0،0 و ابعاد آن نمای درگاه است - قسمت قابل مشاهده پنجره مرورگر.
همه رندرها یک روش "layout" یا "reflow" دارند، هر رندر متد طرح بندی فرزندان خود را که نیاز به چیدمان دارند فراخوانی میکند.
برای اینکه برای هر تغییر کوچک یک طرح بندی کامل انجام نشود، مرورگرها از یک سیستم "کثیف بیت" استفاده میکنند. رندری که تغییر یا اضافه شده است، خود و فرزندانش را به عنوان "کثیف" علامت گذاری میکند: نیاز به طرح بندی.
دو پرچم وجود دارد: "کثیف"، و "کودکان کثیف هستند"، به این معنی که اگرچه خود رندر ممکن است خوب باشد، اما حداقل یک فرزند دارد که به طرح بندی نیاز دارد.
Layout میتواند در کل درخت رندر فعال شود - این طرح "جهانی" است. این میتواند در نتیجه اتفاق بیفتد:
1. یک تغییر سبک جهانی که بر همه رندرها تأثیر میگذارد، مانند تغییر اندازه فونت.
2. در نتیجه تغییر اندازه صفحه نمایش
چیدمان میتواند افزایشی باشد، فقط رندرهای کثیف چیده میشوند (این میتواند باعث آسیبهایی شود که به چیدمانهای اضافی نیاز دارد).
وقتی رندر کثیف باشد، طرحبندی افزایشی (ناهمزمان) فعال میشود. به عنوان مثال زمانی که رندرهای جدید به درخت رندر اضافه میشوند، پس از اینکه محتوای اضافی از شبکه آمد و به درخت DOM اضافه شد.
چیدمان افزایشی به صورت ناهمزمان انجام میشود. فایرفاکس «فرمانهای جریان مجدد» را برای طرحبندیهای افزایشی در صف قرار میدهد و یک زمانبندی اجرای دستهای این دستورات را آغاز میکند. WebKit همچنین دارای یک تایمر است که یک طرح بندی افزایشی را اجرا میکند - درخت عبور میکند و رندرهای "کثیف" طرح بندی میشوند.
اسکریپتهایی که اطلاعات سبک را میخواهند، مانند "offsetHeight" میتوانند طرح بندی افزایشی را به طور همزمان فعال کنند.
طرح کلی معمولاً به صورت همزمان فعال میشود.
گاهی اوقات طرح به عنوان یک تماس پس از طرح اولیه فعال میشود زیرا برخی از ویژگیها مانند موقعیت پیمایش تغییر کرده است.
هنگامی که یک طرح با یک "تغییر اندازه" یا تغییر در موقعیت رندر (و نه اندازه) راه اندازی میشود، اندازههای رندر از حافظه پنهان گرفته میشوند و دوباره محاسبه نمیشوند…
در برخی موارد فقط یک درخت فرعی اصلاح میشود و طرح از ریشه شروع نمیشود. این میتواند در مواردی اتفاق بیفتد که تغییر محلی است و محیط اطراف خود را تحت تأثیر قرار نمیدهد - مانند متن درج شده در فیلدهای متنی (در غیر این صورت هر ضربه کلید باعث ایجاد طرحی میشود که از ریشه شروع میشود).
طرح معمولاً دارای الگوی زیر است:
1. رندر والد عرض خود را تعیین میکند.
2. والدین به سراغ فرزندان میروند و:
--1. رندر فرزند را قرار دهید (x و y آن را تنظیم میکند).
--2. در صورت نیاز طرح فرزند را صدا میکند - آنها کثیف هستند یا ما در یک چیدمان جهانی هستیم یا به دلایل دیگر - که قد کودک را محاسبه میکند.
3. والدین از ارتفاعهای انباشته کودکان و ارتفاع حاشیهها و بالشتکها برای تنظیم ارتفاع خود استفاده میکنند - این مورد توسط والدین رندر والد استفاده خواهد شد.
4. بیت کثیف خود را روی false تنظیم میکند.
فایرفاکس از یک شی "state" (nsHTMLReflowState) به عنوان پارامتری برای چیدمان استفاده میکند (که "reflow" نامیده میشود). در میان سایر موارد، این ایالت شامل عرض والدین نیز میشود.
خروجی طرح فایرفاکس یک شی "متریک" (nsHTMLReflowMetrics) است. این شامل ارتفاع محاسبه شده رندر خواهد بود.
عرض رندر با استفاده از عرض بلوک کانتینر، ویژگی "width" سبک رندر، حاشیهها و حاشیهها محاسبه میشود.
به عنوان مثال عرض div زیر:
<div style="width: 30%"/>
توسط WebKit به صورت زیر محاسبه میشود (روش کلاس RenderBox calcWidth):
عرض کانتینر حداکثر کانتینرهای موجودWidth و 0 است. در این مورد، عرض موجود در این حالت، ContentWidth است که به صورت زیر محاسبه میشود:
clientWidth() - paddingLeft() - paddingRight()
clientWidth و clientHeight نمایانگر فضای داخلی یک شی به استثنای حاشیه و نوار اسکرول است.
- عرض عناصر ویژگی سبک "width" است. با محاسبه درصد عرض ظرف به عنوان یک مقدار مطلق محاسبه میشود.
- حاشیههای افقی و بالشتکها اکنون اضافه شدهاند.
تا اینجا این محاسبه "عرض ترجیحی" بود. اکنون حداقل و حداکثر عرض محاسبه خواهد شد.
اگر عرض ترجیحی بیشتر از حداکثر عرض باشد، از حداکثر عرض استفاده میشود. اگر کمتر از حداقل عرض باشد (کوچکترین واحد نشکن) از حداقل عرض استفاده میشود.
در صورت نیاز به طرح بندی، مقادیر در حافظه پنهان ذخیره میشوند، اما عرض تغییر نمیکند.
هنگامی که یک رندر در وسط یک چیدمان تصمیم میگیرد که باید شکسته شود، رندر متوقف میشود و به والد چیدمان میگوید که باید شکسته شود. والد رندرهای اضافی را ایجاد میکند و طرح بندی را روی آنها فراخوانی میکند.
در مرحله نقاشی، درخت رندر پیمایش میشود و متد "paint()" رندر برای نمایش محتوا در صفحه فراخوانی میشود. نقاشی از مؤلفه زیرساخت رابط کاربری استفاده میکند.
مانند چیدمان، نقاشی نیز میتواند جهانی باشد - کل درخت رنگ شده است - یا افزایشی. در نقاشی افزایشی، برخی از رندرها به گونهای تغییر میکنند که بر کل درخت تأثیر نمیگذارد. رندر تغییر یافته مستطیل آن را روی صفحه باطل میکند. این باعث میشود که سیستم عامل آن را به عنوان یک "منطقه کثیف" ببیند و یک رویداد "رنگ" ایجاد کند. سیستم عامل این کار را هوشمندانه انجام میدهد و چندین منطقه را در یک منطقه ادغام میکند. در کروم پیچیدهتر است زیرا رندر در فرآیندی متفاوت از فرآیند اصلی است. کروم تا حدودی رفتار سیستم عامل را شبیهسازی میکند. ارائه به این رویدادها گوش میدهد و پیام را به ریشه رندر میدهد. درخت تا رسیدن به رندر مربوطه طی میشود. خودش (و معمولاً فرزندانش) را دوباره رنگ میکند.
CSS2 ترتیب فرآیند نقاشی را مشخص میکند. این در واقع ترتیبی است که عناصر در زمینههای انباشته روی هم چیده میشوند. این ترتیب روی نقاشی تأثیر میگذارد زیرا پشتهها از پشت به جلو رنگ میشوند. ترتیب انباشته شدن یک رندر بلوک به صورت زیر است:
1. رنگ پس زمینه
2. تصویر پس زمینه
3. حاشیه
4. فرزندان
5. طرح کلی
فایرفاکس روی درخت رندر میرود و یک لیست نمایشی برای مستطیل رنگ شده میسازد. این شامل رندرهای مربوط به مستطیل، به ترتیب نقاشی درست (پس زمینه رندرها، سپس حاشیهها و غیره) است.
به این ترتیب درخت باید فقط یک بار برای رنگ آمیزی مجدد به جای چندین بار پیمایش شود - تمام پس زمینهها، سپس همه تصاویر، سپس تمام حاشیهها و غیره.
فایرفاکس فرآیند را با اضافه نکردن عناصری که پنهان میشوند، بهینه میکند، مانند عناصری که کاملاً در زیر عناصر غیر شفاف دیگر قرار دارند.
قبل از رنگ آمیزی مجدد، WebKit مستطیل قدیمی را به عنوان یک بیت مپ ذخیره میکند. سپس فقط دلتای بین مستطیل جدید و قدیمی را رنگ میکند.
مرورگرها سعی میکنند حداقل اقدامات ممکن را در پاسخ به یک تغییر انجام دهند. بنابراین تغییر در رنگ یک عنصر فقط باعث رنگ آمیزی مجدد عنصر میشود. تغییر در موقعیت عنصر باعث چیدمان و رنگ آمیزی مجدد عنصر، فرزندان آن و احتمالاً خواهر و برادر میشود. افزودن یک گره DOM باعث طرح بندی و رنگ آمیزی مجدد گره میشود. تغییرات عمده، مانند افزایش اندازه قلم عنصر "html"، باعث بیاعتباری حافظه پنهان، تغییر شکل و رنگ آمیزی مجدد کل درخت میشود.
موتور رندر تک رشته است. تقریباً همه چیز، به جز عملیات شبکه، در یک رشته اتفاق میافتد. در فایرفاکس و سافاری این موضوع اصلی مرورگر است. در کروم، موضوع اصلی پردازش برگه است.
عملیات شبکه میتواند توسط چندین رشته موازی انجام شود. تعداد اتصالات موازی محدود است (معمولاً 2 - 6 اتصال).
موضوع اصلی مرورگر یک حلقه رویداد است. این یک حلقه بینهایت است که روند را زنده نگه میدارد. منتظر رویدادها (مانند رویدادهای چیدمان و نقاشی) میماند و آنها را پردازش میکند. این کد فایرفاکس برای حلقه رویداد اصلی است:
while (!mExiting) NS_ProcessNextEvent(thread);
با توجه به مشخصات CSS2، اصطلاح canvas «فضایی که ساختار قالببندی ارائه میشود» را توصیف میکند: جایی که مرورگر محتوا را نقاشی میکند.
بوم برای هر بعد از فضا بینهایت است اما مرورگرها یک عرض اولیه را بر اساس ابعاد درگاه دید انتخاب میکنند.
با توجه به www.w3.org/TR/CSS2/zindex.html، بوم اگر در بوم دیگری باشد شفاف است، و اگر این بوم نباشد، رنگ تعریف شده از مرورگر به آن داده میشود.
مدل جعبه CSS جعبههای مستطیلی را که برای عناصر در درخت سند ایجاد میشوند و مطابق با مدل قالببندی بصری چیده میشوند، توصیف میکند.
هر کادر دارای یک ناحیه محتوا (مثلاً متن، یک تصویر و غیره) و قسمتهای انتخابی، حاشیه و حاشیه است.
هر گره 0…n چنین جعبه تولید می کند.
همه عناصر دارای ویژگی "نمایش" هستند که نوع جعبه ای را که تولید می شود تعیین می کند.
مثال ها:
block: generates a block box. inline: generates one or more inline boxes. none: no box is generated.
پیشفرض درون خطی است، اما شیوه نامه مرورگر ممکن است پیشفرضهای دیگری را تنظیم کند. به عنوان مثال: نمایش پیش فرض برای عنصر "div" بلوک است.
میتوانید یک نمونه سبک پیشفرض را در اینجا پیدا کنید: www.w3.org/TR/CSS2/sample.html
سه طرح وجود دارد:
1. نرمال: شیء مطابق با محل آن در سند قرار می گیرد. این بدان معناست که مکان آن در درخت رندر مانند مکان آن در درخت DOM است و بر اساس نوع جعبه و ابعاد آن قرار گرفته است.
2. شناور: جسم ابتدا مانند جریان معمولی قرار می گیرد، سپس تا آنجا که ممکن است به سمت چپ یا راست حرکت می کند
3. مطلق: شی در درخت رندر در مکانی متفاوت از درخت DOM قرار می گیرد
طرح موقعیت یابی توسط ویژگی "position" و ویژگی "float" تنظیم می شود.
در موقعیت یابی استاتیک هیچ موقعیتی تعریف نمی شود و از موقعیت یابی پیش فرض استفاده می شود. در طرح های دیگر، نویسنده موقعیت را مشخص می کند: بالا، پایین، چپ، راست.
نحوه چیدمان جعبه با موارد زیر تعیین می شود:
جعبه بلوک: یک بلوک را تشکیل می دهد - مستطیل خود را در پنجره مرورگر دارد.
جعبه درون خطی: بلوک خود را ندارد، اما درون یک بلوک حاوی است.
بلوک ها به صورت عمودی یکی پس از دیگری قالب بندی می شوند. خطوط درونی به صورت افقی قالب بندی می شوند.
جعبه های درون خطی در داخل خطوط یا "جعبه های خط" قرار می گیرند. خطوط حداقل به بلندی بلندترین جعبه هستند، اما می توانند بلندتر باشند، زمانی که کادرها "خط پایه" تراز شوند - به این معنی که قسمت پایینی یک عنصر در نقطه ای از کادر دیگری غیر از پایین تراز شده است. اگر عرض ظرف کافی نباشد، خطوط درونی روی چندین خط قرار می گیرند. معمولاً در یک پاراگراف این اتفاق می افتد.
موقعیت یابی نسبی - مانند معمول قرار گرفته و سپس توسط دلتای مورد نیاز جابجا می شود.
یک جعبه شناور به سمت چپ یا راست یک خط منتقل می شود. ویژگی جالب این است که جعبه های دیگر در اطراف آن جریان دارند. HTML:
<p> <img style="float: right" src="images/image.gif" width="100" height="100"> Lorem ipsum dolor sit amet, consectetuer... </p>
به نظر خواهد رسید:
طرح دقیقاً بدون توجه به جریان عادی تعریف می شود. عنصر در جریان عادی شرکت نمی کند. ابعاد نسبت به ظرف است. در حالت ثابت، کانتینر درگاه دید است.
کادر ثابت حتی زمانی که سند اسکرول می شود حرکت نمی کند!
این توسط ویژگی z-index CSS مشخص می شود. نشان دهنده بعد سوم جعبه است: موقعیت آن در امتداد "محور z".
جعبه ها به پشته ها تقسیم می شوند (که زمینه های انباشتگی نامیده می شود). در هر پشته ابتدا عناصر پشتی و عناصر جلو در بالا، نزدیکتر به کاربر نقاشی میشوند. در صورت همپوشانی، عنصر اصلی، عنصر قبلی را پنهان می کند.
پشته ها بر اساس ویژگی z-index مرتب شده اند. جعبه هایی با ویژگی "z-index" یک پشته محلی را تشکیل می دهند. درگاه دید دارای پشته بیرونی است.
مثال:
<style type="text/css"> div { position: absolute; left: 2in; top: 2in; } </style> <p> <div style="z-index: 3;background-color:red; width: 1in; height: 1in; "> </div> <div style="z-index: 1;background-color:green;width: 2in; height: 2in;"> </div> </p>
نتیجه این خواهد بود:
اگر چه div قرمز قبل از رنگ سبز در نشانه گذاری است، و قبلاً در جریان معمولی رنگ می شد، ویژگی z-index بالاتر است، بنابراین در پشته ای که توسط جعبه ریشه نگهداری می شود جلوتر است.