Scanned PDF to Word OCR C#

Scannade PDF filer består ofta av bilder, vilket gör att texten inte kan väljas eller redigeras. I olika scenarier kan du behöva konvertera scannade PDF-filer till Word-dokument. Denna artikel kommer att vägleda dig genom stegen för att programmera konvertering av scannade PDF-filer till Word-dokument i antingen DOCX eller DOC format med C#.

Innehållsförteckning

1. C# API-installation för konvertering av scannad PDF till Word DOCX

För att effektivt arbeta med scannade PDF-filer kan du utnyttja optisk teckenigenkänning (OCR) med hjälp av Aspose.OCR för .NET API. Efter att ha känt igen texten kan du skapa ett Word-dokument med hjälp av Aspose.Words för .NET API. Du kan installera dessa API:er genom att ladda ner DLL-filer från New Releases eller genom att använda följande NuGet-installationskommandon:

PM> Install-Package Aspose.OCR
PM> Install-Package Aspose.Words

2. Programmatisk konvertering av scannad PDF till Word-dokument

För att konvertera scannade PDF-filer till Word-dokument måste du känna igen texten med OCR. Denna process omvandlar den scannade PDF-filen till redigerbar text, som sedan kan formateras till ett Word-dokument antingen i DOC eller DOCX format. Följ dessa steg för att uppnå en konvertering av scannad PDF till DOC i C# .NET:

  1. Initiera en instans av AsposeOcr klassen.
  2. Använd DocumentRecognitionSettings klassen för att känna igen bilder från PDF:en.
  3. Skapa ett StringBuilder objekt för att lagra den igenkända texten.
  4. Initiera ett Word-dokument med hjälp av Document klassen.
  5. Specificera nödvändig teckensnitt och styckeformatering.
  6. Spara det utdata Word-dokumentet antingen i DOCX eller DOC format.

Här är ett kodavsnitt som demonstrerar hur man programmerar konvertering av en scannad PDF-fil till ett Word-dokument med C#:

3. Skaffa en gratis utvärderingslicens

Du kan testa API:erna till deras fulla kapacitet genom att begära en gratis tillfällig licens.

4. Slutsats

I denna artikel har du lärt dig hur man konverterar en scannad PDF-fil till ett Word-dokument antingen i DOCX eller DOC format programmatisk med C#. Dessutom kan du utforska olika andra OCR-relaterade funktioner genom att besöka dokumentationen. Om du har några frågor, tveka inte att kontakta oss på forumet.

5. Ytterligare resurser

Tips: Om du någonsin behöver konvertera en PowerPoint-presentation till ett Word-dokument, överväg att använda Aspose Presentation till Word-dokument konverteraren.

Genom att använda Aspose-pluginet kan du effektivt hantera scannade filer och förbättra dina .NET-applikationer för endast $99. Med det bästa C#-biblioteket för PDF till Word-konvertering kan du uppnå högkvalitativ PDF till Word-konvertering och effektivisera ditt arbetsflöde utan ansträngning. Oavsett om du letar efter att konvertera bildbaserad PDF till Word eller söker en effektiv PDF till Word-konverterare C# .NET, erbjuder Aspose de verktyg du behöver för sömlös integration och funktionalitet.

Denna guide fungerar som en omfattande resurs för de som är intresserade av konvertering av scannade dokument till Word C# och ger en praktisk C#-kod för PDF till Word-konvertering med hjälp av .NET OCR-biblioteket för PDF till Word.