شرکت نرم افزاری یگانه
شرکت نرم افزاری یگانه
خواندن ۶ دقیقه·۱ سال پیش

3 راه ساده برای تشخیص متن در PDF

نرم افزار تشخیص متن در PDF
نرم افزار تشخیص متن در PDF


خیلی پیش می‌آید که بخواهید بعد از اسکن اسناد و مدارک و تبدیل کردن آن به PDF، روی آن تغییراتی اعمال کنید. اما حتی اگر یک بار برای ایجاد تغییرات در فایل PDF اسکن شده اقدام کرده باشید، می‌دانید که این کار می‌تواند چقدر چالش برانگیز باشد.

تشخیص متن در PDF چند راه ساده دارد. با انجام این کارها به راحتی می‌توانید تغییرات دلخواه را روی فایل‌های متنی اعمال کنید. ما سعی می‌کنیم این پست 3 تا از کارآمدترین روش‌ها را برای تشخیص متن در PDFبه شما نشان دهد.

روش اول: تشخیص متن در PDF با UPDF

یکی از ساده‌ترین روش‌ها برای انجام این کار استفاده از UPDFاست. سازندگان این ابزار مدام آن را به روز رسانی می‌کنند و کارهای زیادی هست که بتوانید با این نرم افزار انجام دهید.

استفاده از نرم افزار UPDF ساده بوده و این ابزار دارای ویژگی‌های مفید زیادی است. UPDFفقط یک ویرایشگر PDFنیست، بلکه یک PDFخوان، ابزار حاشیه نویسی PDFو سازمان دهنده PDFنیز هست.

بهترین چیز در مورد UPDFاین است که تشخیص کلمات در PDFبا OCR را برای شما آسان‌تر می‌کند. علاوه بر این، بسیاری از ویژگی‌های دیگر نیز در این ابزار وجود دارد.

نسخه رایگان نرم افزار UPDF را در این لینک دانلود کنید.

https://updf.com/download-guide/?device=WIN

مهم‌ترین ابزارهای UPDF کدامند؟

اگر بتوانید فایل PDF خود را مثل شما یک سند Word ویرایش کنید یعنی به راحتی می‌توانید در محتوای فعلی آن تغییرات ایجاد کنید.

در ساده‌ترین حالت می‌توانید اسناد PDF خود را با بولد کردن، پاراگراف بندی جدید و تغییرات ظاهری تا حد امکان برجسته کنید.

می‌توانید به کمک UPDF بین صفحات خالی در یک فایل PDF صفحات دیگری از PDFرا درج کنید. همچنین می‌توانید با استفاده از UPDF، یک صفحه یا کل PDF را جایگزین کنید.

یکی دیگر از امکانات UPDF این است که می‌توانید چندین فایل PDFرا در آن به صورت هم زمان باز کنید. در این صورت امکان ویرایش چند فایل به صورت یکجا وجود دارد و حتی می‌توانید فایل‌های مختلف را با هم تلفیق کنید.

با استفاده از امکانات UPDF می‌توانید اسناد PDF خود را به راحتی و به صورت الکترونیکی امضا کنید.

تشخیص متن OCR با استفاده از UPDF

مرحله 1: به ابزار OCR بروید

سند PDF را باز کنید و به دکمه «تشخیص متن با استفاده از OCR» از پانل سمت راست بروید.

OCR در PDF
OCR در PDF


مرحله 2: تنظیم OCR

· در منوی از شده، گزینه «Searchable PDF» را در بخش نوع سند انتخاب کنید.

· می‌توانید «Layout» را که با ابزار OCR دنبال می‌شود، با گزینه‌های موجود در منو تعریف کنید. برای باز کردن تنظیمات طرح‌بندی پیشرفته، نماد «چرخ‌دنده» را انتخاب کنید. هر گزینه ای را که می‌خواهید در این فرآیند پوشش دهید علامت بزنید.

· پس از انجام تنظیمات طرح‌بندی، به «Document Language» بروید و هر زبانی را که می‌خواهید به‌طور خاص شناسایی کنید، از بین 38 گزینه موجود در UPDFانتخاب کنید.

· با گزینه‌های موجود در فهرست، «Resolution Image» را تنظیم کنید. اگر از وضوح به درستی آگاه نیستید، دکمه «Detect Optimal Resolution» را انتخاب کنید.

تنظیم OCR برای تهیه PDF
تنظیم OCR برای تهیه PDF


چطور می‌توان متن OCRرا در PDFانجام داد

· محدوده صفحه خاصی از سندی را که باید روی آن OCRانجام دهید، مشخص کنید.

· برای OCR کردن یک PDF، روی دکمه «Perform OCR» بروید.

· حالا باید مکان ذخیره‌سازی سند تبدیل‌شده را ارائه کنید و روی «save» کلیک کنید تا متن در PDFتشخیص داده شود.

روش 2. نحوه تشخیص متن در PDF با Adobe Acrobat

وقتی صحبت از ایجاد، ویرایش و خواندن فایل‌های PDF می‌شود، Adobe Acrobat بازیکن طلایی این زمین است. اگر به سرعت OCR در کامپیوتر شرکت یا رایانه شخصی نیاز دارید، Adobe text recognition یک برنامه کاربردی برای استفاده است.

برای این کار مراحل زیر را دنبال کنید:

· Adobe Acrobat Pro DCرا اجرا کنید و فایل را باز کنید.

· در نوار کناری سمت راست، Scan and OCRرا انتخاب کنید.

· گزینه Recognize Textدر نوار ابزار شناور نمایش داده می‌شود.

· برای دسترسی به آن، آن را از منوی کشویی انتخاب کنید و سپس روی In This File کلیک کنید.

· برای دسترسی به نوار ابزار، Setting را انتخاب کنید.

· برای کاهش اندازه تصویر نهایی، 'تصویر قابل جستجو' را به عنوان 'Output' و 600 DPI' را به عنوان Downsample To' 'انتخاب کنید. پس از پردازش OCR، اندازه فایل کاهش می‌یابد.

· اگر اندازه فایل برایتان مهم نیست، از «Searchable Image (Exact)» استفاده کنید. پس از پردازش OCR، خروجی تا حد امکان به سند اصلی نزدیک خواهد شد.

· OCR را می‌توان با کلیک کردن روی نماد آبی رنگ Recognize Text آغاز کرد.

· پس از اتمام، دوباره روی Recognize Textکلیک کنید.

· روی منوی کشویی کلیک کنید و گزینه Correct Recognized Textرا انتخاب کنید.

· در صورتی که آکروبات متنی را تشخیص دهد که فکر می‌کند ممکن است اشتباه خوانده شود، آن متن را با رنگ قرمز برجسته می‌کند.

· عدم دقت در تشخیص ممکن است خارج از کادر قرمز وجود داشته باشد. به جای نشان دادن تصویری از صفحه، Acrobat لایه متنی را نشان می‌دهد که ممکن است جستجو شود اگر گزینه انجام این کار را در بالا سمت چپ انتخاب کنید.

روش 3. نحوه استفاده از Bluebeam Text Recognition

ابزار طراحی حرفه ای Bluebeam Revu برای ایجاد، ویرایش، اندازه گیری و علامت گذاری آن را مورد علاقه معماران، مهندسان و سایر متخصصان در سراسر جهان است. رابط برنامه تاریک بوده و هنگام باز شدن توسط چندین ابزار طراحی احاطه شده است.

· برای بارگیری فایل قابل تشخیص، File Openرا انتخاب کنید.

· کادر گفتگوی OCR شامل تعدادی تب و تنظیمات مختلف است.

· 14 زبان و نوع سند برای انتخاب شما موجود است. علاوه بر این، می‌توانید فایل‌ها را با استفاده از برگه «file» آپلود کنید.

· سپس با کلیک بر روی دکمه OK می‌توانید از ابزار تشخیص متن استفاده کنید.

· ویرایش محتوای PDF را انتخاب کنید تا متن را در PDFقابل جستجو پیدا کنید و آن را کپی کنید.

· اکنون، بیشتر متن در صفحه شما باید در دسترس باشد.

· اگر می‌خواهید دوباره تصویر صفحه را ببینید، علامت کادر بررسی را بردارید یا روی لغو کلیک کنید.

· کار را ادامه دهید تا متن به درستی مشخص شود. هر متنی که دقیقاً مشخص شده باشد با رنگ قرمز برجسته نخواهد شد.

با تمام این روش‌های موجود برای تشخیص متن در PDF، توصیه می‌کنیم از UPDFاستفاده کنید. این روش بسیار سریع، ایمن و قابل اعتماد است. UPDF یک ابزار OCR را ارائه می‌دهد که به شما امکان می‌دهد با تبدیل یک سند PDF اسکن شده به یک سند قابل ویرایش، متن را در یک PDFتشخیص دهید. پویایی با ابزار OCR متفاوت است، که آن را به ویژگی‌های UPDF اضافه می‌کند.

نرم افزار revu برای تشخیص متن در PDF
نرم افزار revu برای تشخیص متن در PDF


در پایان اگر برای انجام پروژه اسکن اسناد و مدارک سازمانتان به دنبال یک شرکت حرفه‌ای، مجهز، ایمن و کاربلد می‌گردید، شرکت یگانه در خدمت شماست.

کافی است برای اسکن هر نوع سند از جمله:

با کارشناسان خبره این شرکت تماس بگیرید و درخواست خود را مبنی بر بررسی مجموعه و اسناد و مدارک آن مطرح کنید. کارشناسان یگانه در اسرع وقت به مجموعه شما آمده و تعیین می‌کنند که پروژه اسکن اسناد و مدارک در مجموعه شما چقدر زمان می‌برد. سپس این کار را خودشان با تجهیزات مدرن شرکت یگانه از جمله مرغوب‌ترین انواع اسکنر و تیم‌های حرفه‌ای و کاربلد در مجموعه شما و تحت نظارت دقیق ناظران معتمد شرکت شما، انجام خواهند داد.

متن pdfنرم افزارocrocr فارسیاسکن اسناد
17 سال فعالیت مستمر در زمینه طراحی و تولید نرم افزارهای اداری / ارائه دهنده خدمات اسکن اسناد و دیجیتال کردن سازمان‌ها
شاید از این پست‌ها خوشتان بیاید