
فایلهای PDF اسکنشده معمولاً شامل تصاویر هستند که باعث میشود متن غیرقابل انتخاب و غیرقابل ویرایش باشد. در سناریوهای مختلف، ممکن است نیاز داشته باشید تا فایل PDF اسکنشده را به اسناد Word تبدیل کنید. این مقاله شما را در مراحل تبدیل فایلهای PDF اسکنشده به اسناد Word در فرمت DOCX یا DOC بهصورت برنامهنویسی با استفاده از C# راهنمایی خواهد کرد.
فهرست مطالب
- 1. نصب API C# برای تبدیل PDF اسکنشده به DOCX Word
- 2. تبدیل برنامهنویسی PDF اسکنشده به سند Word
- 3. دریافت مجوز ارزیابی رایگان
- 4. نتیجهگیری
- 5. منابع اضافی
1. نصب API C# برای تبدیل PDF اسکنشده به DOCX Word
برای کار مؤثر با فایلهای PDF اسکنشده، میتوانید از شناسایی نوری کاراکتر (OCR) با استفاده از API Aspose.OCR for .NET بهره ببرید. پس از شناسایی متن، میتوانید یک سند Word با استفاده از API Aspose.Words for .NET ایجاد کنید. میتوانید این APIها را با دانلود فایلهای DLL از نسخههای جدید یا با استفاده از دستورات نصب NuGet زیر نصب کنید:
PM> Install-Package Aspose.OCR
PM> Install-Package Aspose.Words
2. تبدیل برنامهنویسی PDF اسکنشده به سند Word
برای تبدیل فایلهای PDF اسکنشده به اسناد Word، باید متن را با استفاده از OCR شناسایی کنید. این فرآیند فایل PDF اسکنشده را به متن قابل ویرایش تبدیل میکند که میتوان آن را به یک سند Word در فرمت DOC یا DOCX قالببندی کرد. مراحل زیر را برای دستیابی به تبدیل PDF اسکنشده به DOC در C# .NET دنبال کنید:
- یک نمونه از کلاس AsposeOcr را راهاندازی کنید.
- از کلاس DocumentRecognitionSettings برای شناسایی تصاویر از PDF استفاده کنید.
- یک شیء StringBuilder برای ذخیره متن شناساییشده ایجاد کنید.
- یک سند Word با استفاده از کلاس Document راهاندازی کنید.
- فرمتبندی فونت و پاراگرافهای لازم را مشخص کنید.
- سند Word خروجی را در فرمت DOCX یا DOC ذخیره کنید.
در اینجا یک قطعه کد وجود دارد که نحوه تبدیل یک فایل PDF اسکنشده به یک سند Word بهصورت برنامهنویسی با استفاده از C# را نشان میدهد:
3. دریافت مجوز ارزیابی رایگان
میتوانید با درخواست یک مجوز موقت رایگان از ظرفیت کامل APIها استفاده کنید.
4. نتیجهگیری
در این مقاله، شما یاد گرفتید که چگونه یک فایل PDF اسکنشده را به یک سند Word در فرمت DOCX یا DOC بهصورت برنامهنویسی با استفاده از C# تبدیل کنید. علاوه بر این، میتوانید با مراجعه به مستندات از ویژگیهای مختلف مرتبط با OCR بهرهمند شوید. اگر سوالی دارید، میتوانید با ما در فروم تماس بگیرید.
5. منابع اضافی
نکته: اگر بهطور تصادفی نیاز به تبدیل یک ارائه PowerPoint به یک سند Word داشتید، استفاده از تبدیلکننده Aspose Presentation to Word Document را در نظر بگیرید.
با استفاده از افزونه Aspose، میتوانید بهطور مؤثر فایلهای اسکنشده را مدیریت کرده و برنامههای .NET خود را تنها با 99 دلار بهبود ببخشید. با بهترین کتابخانه C# برای تبدیل PDF به Word، میتوانید تبدیل با کیفیت بالا از PDF به Word را انجام دهید و بهراحتی جریان کار خود را بهینه کنید. چه بهدنبال تبدیل PDF مبتنی بر تصویر به Word باشید و چه بهدنبال یک تبدیلکننده کارآمد PDF به Word C# .NET، Aspose ابزارهای مورد نیاز شما را برای یکپارچهسازی و عملکرد بینقص فراهم میکند.
این راهنما بهعنوان یک منبع جامع برای کسانی که به تبدیل سند اسکنشده به Word با C# علاقهمند هستند، خدمت میکند و یک کد C# برای تبدیل PDF به Word را با استفاده از کتابخانه OCR .NET برای PDF به Word ارائه میدهد.