خیلی پیش میآید که بخواهید بعد از اسکن اسناد و مدارک و تبدیل کردن آن به PDF، روی آن تغییراتی اعمال کنید. اما حتی اگر یک بار برای ایجاد تغییرات در فایل PDF اسکن شده اقدام کرده باشید، میدانید که این کار میتواند چقدر چالش برانگیز باشد.
تشخیص متن در PDF چند راه ساده دارد. با انجام این کارها به راحتی میتوانید تغییرات دلخواه را روی فایلهای متنی اعمال کنید. ما سعی میکنیم این پست 3 تا از کارآمدترین روشها را برای تشخیص متن در PDFبه شما نشان دهد.
یکی از سادهترین روشها برای انجام این کار استفاده از UPDFاست. سازندگان این ابزار مدام آن را به روز رسانی میکنند و کارهای زیادی هست که بتوانید با این نرم افزار انجام دهید.
استفاده از نرم افزار UPDF ساده بوده و این ابزار دارای ویژگیهای مفید زیادی است. UPDFفقط یک ویرایشگر PDFنیست، بلکه یک PDFخوان، ابزار حاشیه نویسی PDFو سازمان دهنده PDFنیز هست.
بهترین چیز در مورد UPDFاین است که تشخیص کلمات در PDFبا OCR را برای شما آسانتر میکند. علاوه بر این، بسیاری از ویژگیهای دیگر نیز در این ابزار وجود دارد.
نسخه رایگان نرم افزار UPDF را در این لینک دانلود کنید.
https://updf.com/download-guide/?device=WIN
اگر بتوانید فایل PDF خود را مثل شما یک سند Word ویرایش کنید یعنی به راحتی میتوانید در محتوای فعلی آن تغییرات ایجاد کنید.
در سادهترین حالت میتوانید اسناد PDF خود را با بولد کردن، پاراگراف بندی جدید و تغییرات ظاهری تا حد امکان برجسته کنید.
میتوانید به کمک UPDF بین صفحات خالی در یک فایل PDF صفحات دیگری از PDFرا درج کنید. همچنین میتوانید با استفاده از UPDF، یک صفحه یا کل PDF را جایگزین کنید.
یکی دیگر از امکانات UPDF این است که میتوانید چندین فایل PDFرا در آن به صورت هم زمان باز کنید. در این صورت امکان ویرایش چند فایل به صورت یکجا وجود دارد و حتی میتوانید فایلهای مختلف را با هم تلفیق کنید.
با استفاده از امکانات UPDF میتوانید اسناد PDF خود را به راحتی و به صورت الکترونیکی امضا کنید.
مرحله 1: به ابزار OCR بروید
سند PDF را باز کنید و به دکمه «تشخیص متن با استفاده از OCR» از پانل سمت راست بروید.
مرحله 2: تنظیم OCR
· در منوی از شده، گزینه «Searchable PDF» را در بخش نوع سند انتخاب کنید.
· میتوانید «Layout» را که با ابزار OCR دنبال میشود، با گزینههای موجود در منو تعریف کنید. برای باز کردن تنظیمات طرحبندی پیشرفته، نماد «چرخدنده» را انتخاب کنید. هر گزینه ای را که میخواهید در این فرآیند پوشش دهید علامت بزنید.
· پس از انجام تنظیمات طرحبندی، به «Document Language» بروید و هر زبانی را که میخواهید بهطور خاص شناسایی کنید، از بین 38 گزینه موجود در UPDFانتخاب کنید.
· با گزینههای موجود در فهرست، «Resolution Image» را تنظیم کنید. اگر از وضوح به درستی آگاه نیستید، دکمه «Detect Optimal Resolution» را انتخاب کنید.
· محدوده صفحه خاصی از سندی را که باید روی آن OCRانجام دهید، مشخص کنید.
· برای OCR کردن یک PDF، روی دکمه «Perform OCR» بروید.
· حالا باید مکان ذخیرهسازی سند تبدیلشده را ارائه کنید و روی «save» کلیک کنید تا متن در PDFتشخیص داده شود.
روش 2. نحوه تشخیص متن در PDF با Adobe Acrobat
وقتی صحبت از ایجاد، ویرایش و خواندن فایلهای PDF میشود، Adobe Acrobat بازیکن طلایی این زمین است. اگر به سرعت OCR در کامپیوتر شرکت یا رایانه شخصی نیاز دارید، Adobe text recognition یک برنامه کاربردی برای استفاده است.
برای این کار مراحل زیر را دنبال کنید:
· Adobe Acrobat Pro DCرا اجرا کنید و فایل را باز کنید.
· در نوار کناری سمت راست، Scan and OCRرا انتخاب کنید.
· گزینه Recognize Textدر نوار ابزار شناور نمایش داده میشود.
· برای دسترسی به آن، آن را از منوی کشویی انتخاب کنید و سپس روی In This File کلیک کنید.
· برای دسترسی به نوار ابزار، Setting را انتخاب کنید.
· برای کاهش اندازه تصویر نهایی، 'تصویر قابل جستجو' را به عنوان 'Output' و 600 DPI' را به عنوان Downsample To' 'انتخاب کنید. پس از پردازش OCR، اندازه فایل کاهش مییابد.
· اگر اندازه فایل برایتان مهم نیست، از «Searchable Image (Exact)» استفاده کنید. پس از پردازش OCR، خروجی تا حد امکان به سند اصلی نزدیک خواهد شد.
· OCR را میتوان با کلیک کردن روی نماد آبی رنگ Recognize Text آغاز کرد.
· پس از اتمام، دوباره روی Recognize Textکلیک کنید.
· روی منوی کشویی کلیک کنید و گزینه Correct Recognized Textرا انتخاب کنید.
· در صورتی که آکروبات متنی را تشخیص دهد که فکر میکند ممکن است اشتباه خوانده شود، آن متن را با رنگ قرمز برجسته میکند.
· عدم دقت در تشخیص ممکن است خارج از کادر قرمز وجود داشته باشد. به جای نشان دادن تصویری از صفحه، Acrobat لایه متنی را نشان میدهد که ممکن است جستجو شود اگر گزینه انجام این کار را در بالا سمت چپ انتخاب کنید.
روش 3. نحوه استفاده از Bluebeam Text Recognition
ابزار طراحی حرفه ای Bluebeam Revu برای ایجاد، ویرایش، اندازه گیری و علامت گذاری آن را مورد علاقه معماران، مهندسان و سایر متخصصان در سراسر جهان است. رابط برنامه تاریک بوده و هنگام باز شدن توسط چندین ابزار طراحی احاطه شده است.
· برای بارگیری فایل قابل تشخیص، File Openرا انتخاب کنید.
· کادر گفتگوی OCR شامل تعدادی تب و تنظیمات مختلف است.
· 14 زبان و نوع سند برای انتخاب شما موجود است. علاوه بر این، میتوانید فایلها را با استفاده از برگه «file» آپلود کنید.
· سپس با کلیک بر روی دکمه OK میتوانید از ابزار تشخیص متن استفاده کنید.
· ویرایش محتوای PDF را انتخاب کنید تا متن را در PDFقابل جستجو پیدا کنید و آن را کپی کنید.
· اکنون، بیشتر متن در صفحه شما باید در دسترس باشد.
· اگر میخواهید دوباره تصویر صفحه را ببینید، علامت کادر بررسی را بردارید یا روی لغو کلیک کنید.
· کار را ادامه دهید تا متن به درستی مشخص شود. هر متنی که دقیقاً مشخص شده باشد با رنگ قرمز برجسته نخواهد شد.
با تمام این روشهای موجود برای تشخیص متن در PDF، توصیه میکنیم از UPDFاستفاده کنید. این روش بسیار سریع، ایمن و قابل اعتماد است. UPDF یک ابزار OCR را ارائه میدهد که به شما امکان میدهد با تبدیل یک سند PDF اسکن شده به یک سند قابل ویرایش، متن را در یک PDFتشخیص دهید. پویایی با ابزار OCR متفاوت است، که آن را به ویژگیهای UPDF اضافه میکند.
در پایان اگر برای انجام پروژه اسکن اسناد و مدارک سازمانتان به دنبال یک شرکت حرفهای، مجهز، ایمن و کاربلد میگردید، شرکت یگانه در خدمت شماست.
کافی است برای اسکن هر نوع سند از جمله:
با کارشناسان خبره این شرکت تماس بگیرید و درخواست خود را مبنی بر بررسی مجموعه و اسناد و مدارک آن مطرح کنید. کارشناسان یگانه در اسرع وقت به مجموعه شما آمده و تعیین میکنند که پروژه اسکن اسناد و مدارک در مجموعه شما چقدر زمان میبرد. سپس این کار را خودشان با تجهیزات مدرن شرکت یگانه از جمله مرغوبترین انواع اسکنر و تیمهای حرفهای و کاربلد در مجموعه شما و تحت نظارت دقیق ناظران معتمد شرکت شما، انجام خواهند داد.