Trích xuất hình ảnh từ tài liệu Word bằng C#

Hình ảnh rất quan trọng trong việc truyền đạt thông tin chính trong tài liệu Word, nâng cao cả sức hấp dẫn về mặt thẩm mỹ và độ rõ ràng tổng thể. Nếu bạn là một nhà phát triển đang tìm cách trích xuất hình ảnh từ tài liệu Word một cách lập trình, bạn đã đến đúng nơi. Trong hướng dẫn trích xuất hình ảnh Aspose.Words C# này, chúng tôi sẽ hướng dẫn bạn quy trình trích xuất hình ảnh từ tệp DOCX và DOC bằng cách sử dụng thư viện Aspose.Words mạnh mẽ. Bạn cũng sẽ học cách lưu các hình ảnh đã trích xuất vào vị trí mong muốn của mình.

Mục lục

Tổng quan về thư viện .NET cho việc trích xuất hình ảnh từ Word

Để trích xuất hình ảnh từ tài liệu Microsoft Word DOCX/DOC một cách hiệu quả, chúng ta sẽ sử dụng Aspose.Words cho .NET. API mạnh mẽ này được công nhận rộng rãi trong việc tạo và thao tác tài liệu Word và có thể được nâng cao với Plugin Aspose $99 để có thêm tính năng. Bạn có thể tải xuống DLL của API và thêm tham chiếu của nó vào ứng dụng của bạn, hoặc cài đặt trực tiếp từ NuGet bằng cách sử dụng lệnh sau trong bảng điều khiển quản lý gói:

PM> Install-Package Aspose.Words

Hướng dẫn từng bước để trích xuất hình ảnh từ tài liệu Word trong C#

Trong tài liệu Word, hình ảnh được đại diện dưới dạng các hình dạng. Để trích xuất hình ảnh từ tài liệu Word được bảo vệ hoặc các tệp DOCX tiêu chuẩn, bạn cần xử lý tất cả các hình dạng trong tài liệu. Đây là cách trích xuất hình ảnh từ tài liệu Word trong C# một cách lập trình:

  1. Tải tệp Word bằng cách sử dụng lớp Document.
  2. Lấy tất cả các hình dạng chứa hình ảnh vào một đối tượng IEnumerable<Shape> bằng cách sử dụng phương thức Document.GetChildNodes(NodeType.Shape, Boolean).
  3. Lặp qua các hình dạng đã lấy.
  4. Đối với mỗi hình dạng, trích xuất hình ảnh và lưu nó bằng phương thức Shape.ImageData.Save(string).

Dưới đây là một mẫu mã thực tế minh họa cách trích xuất hình ảnh từ tài liệu Word trong C#:

// Tải tài liệu
Document doc = new Document("input.docx");

// Lấy tất cả các hình dạng chứa hình ảnh
NodeCollection shapes = doc.GetChildNodes(NodeType.Shape, true);

// Trích xuất và lưu từng hình ảnh
foreach (Shape shape in shapes)
{
    if (shape.ImageData.HasImage)
    {
        // Trích xuất đường dẫn tệp hình ảnh
        string imagePath = $"Image_{shape.Name}.png";
        shape.ImageData.Save(imagePath);
    }
}

Thử Aspose.Words cho .NET miễn phí

Bạn có thể khám phá Aspose.Words cho .NET mà không có giới hạn nào bằng cách nhận giấy phép tạm thời miễn phí. Nhận giấy phép tạm thời của bạn ngay bây giờ.

Kết luận

Hình ảnh là một phần không thể thiếu trong tài liệu Word, làm cho nội dung trở nên hấp dẫn về mặt thị giác. Thư viện Aspose.Words cho .NET, cùng với thư viện .NET cho việc trích xuất hình ảnh từ tài liệu Word, cung cấp một giải pháp toàn diện cho việc thao tác hình ảnh trong các tệp Word.

Trong bài viết này, chúng tôi đã đề cập đến việc trích xuất hình ảnh từ tài liệu Word bằng C#. Với mẫu mã được cung cấp, bạn đã biết cách trích xuất tất cả hình ảnh từ tệp DOCX/DOC Wordlưu chúng vào một thư mục chỉ định. Để biết thêm thông tin, bạn có thể tham khảo tài liệu Aspose.Words cho .NET. Nếu bạn có bất kỳ câu hỏi nào, đừng ngần ngại liên hệ qua diễn đàn.

Xem thêm

Mẹo: Nếu bạn cần chuyển đổi tài liệu Word từ một bài thuyết trình PowerPoint, hãy xem xét việc sử dụng công cụ chuyển đổi Aspose Từ bài thuyết trình sang tài liệu Word.