Scanned PDF to Word OCR C#

فایل‌های PDF اسکن‌شده معمولاً شامل تصاویر هستند که باعث می‌شود متن غیرقابل انتخاب و غیرقابل ویرایش باشد. در سناریوهای مختلف، ممکن است نیاز داشته باشید تا فایل PDF اسکن‌شده را به اسناد Word تبدیل کنید. این مقاله شما را در مراحل تبدیل فایل‌های PDF اسکن‌شده به اسناد Word در فرمت DOCX یا DOC به‌صورت برنامه‌نویسی با استفاده از C# راهنمایی خواهد کرد.

فهرست مطالب

1. نصب API C# برای تبدیل PDF اسکن‌شده به DOCX Word

برای کار مؤثر با فایل‌های PDF اسکن‌شده، می‌توانید از شناسایی نوری کاراکتر (OCR) با استفاده از API Aspose.OCR for .NET بهره ببرید. پس از شناسایی متن، می‌توانید یک سند Word با استفاده از API Aspose.Words for .NET ایجاد کنید. می‌توانید این API‌ها را با دانلود فایل‌های DLL از نسخه‌های جدید یا با استفاده از دستورات نصب NuGet زیر نصب کنید:

PM> Install-Package Aspose.OCR
PM> Install-Package Aspose.Words

2. تبدیل برنامه‌نویسی PDF اسکن‌شده به سند Word

برای تبدیل فایل‌های PDF اسکن‌شده به اسناد Word، باید متن را با استفاده از OCR شناسایی کنید. این فرآیند فایل PDF اسکن‌شده را به متن قابل ویرایش تبدیل می‌کند که می‌توان آن را به یک سند Word در فرمت DOC یا DOCX قالب‌بندی کرد. مراحل زیر را برای دستیابی به تبدیل PDF اسکن‌شده به DOC در C# .NET دنبال کنید:

  1. یک نمونه از کلاس AsposeOcr را راه‌اندازی کنید.
  2. از کلاس DocumentRecognitionSettings برای شناسایی تصاویر از PDF استفاده کنید.
  3. یک شیء StringBuilder برای ذخیره متن شناسایی‌شده ایجاد کنید.
  4. یک سند Word با استفاده از کلاس Document راه‌اندازی کنید.
  5. فرمت‌بندی فونت و پاراگراف‌های لازم را مشخص کنید.
  6. سند Word خروجی را در فرمت DOCX یا DOC ذخیره کنید.

در اینجا یک قطعه کد وجود دارد که نحوه تبدیل یک فایل PDF اسکن‌شده به یک سند Word به‌صورت برنامه‌نویسی با استفاده از C# را نشان می‌دهد:

3. دریافت مجوز ارزیابی رایگان

می‌توانید با درخواست یک مجوز موقت رایگان از ظرفیت کامل API‌ها استفاده کنید.

4. نتیجه‌گیری

در این مقاله، شما یاد گرفتید که چگونه یک فایل PDF اسکن‌شده را به یک سند Word در فرمت DOCX یا DOC به‌صورت برنامه‌نویسی با استفاده از C# تبدیل کنید. علاوه بر این، می‌توانید با مراجعه به مستندات از ویژگی‌های مختلف مرتبط با OCR بهره‌مند شوید. اگر سوالی دارید، می‌توانید با ما در فروم تماس بگیرید.

5. منابع اضافی

نکته: اگر به‌طور تصادفی نیاز به تبدیل یک ارائه PowerPoint به یک سند Word داشتید، استفاده از تبدیل‌کننده Aspose Presentation to Word Document را در نظر بگیرید.

با استفاده از افزونه Aspose، می‌توانید به‌طور مؤثر فایل‌های اسکن‌شده را مدیریت کرده و برنامه‌های .NET خود را تنها با 99 دلار بهبود ببخشید. با بهترین کتابخانه C# برای تبدیل PDF به Word، می‌توانید تبدیل با کیفیت بالا از PDF به Word را انجام دهید و به‌راحتی جریان کار خود را بهینه کنید. چه به‌دنبال تبدیل PDF مبتنی بر تصویر به Word باشید و چه به‌دنبال یک تبدیل‌کننده کارآمد PDF به Word C# .NET، Aspose ابزارهای مورد نیاز شما را برای یکپارچه‌سازی و عملکرد بی‌نقص فراهم می‌کند.

این راهنما به‌عنوان یک منبع جامع برای کسانی که به تبدیل سند اسکن‌شده به Word با C# علاقه‌مند هستند، خدمت می‌کند و یک کد C# برای تبدیل PDF به Word را با استفاده از کتابخانه OCR .NET برای PDF به Word ارائه می‌دهد.