Chuyển định dạng từ PDF sang HTML Format trên Windows, Mac và Linux

PDFtoHTML là một ứng dụng mã nguồn mở dùng để chuyển đổi các tập tin từ dịnh dạng PDF ( Portable Document Format ) sang các tập tin định dạng html. Quá trình chuyển đổi được thực hiện bằng các thực thi dòng lệnh ( CLI - Windows Command Line Interpreter ). Vì ứng dụng không có giao diện nên bạn cần phải xác định chính xác đường dẫn đến tập tin thực thi và các tài liệu PDF. PDFtohmtl hỗ trợ việc trích xuất hình ảnh từ tài liệu PDF. Là một chương trình đa nhiệm có thể chạy trên nhiều nền như Windows, Mac, Linux.

Để bắt đầu, hãy đặt tập tin pdf vào cùng thư mục chứa tập tin thực thi của pdftohtml và sử dụng Terninal để chuyển đến thư mục thực thi.



Nhập tên của tập tin thực thi sau đó là tên của tập tin PDF để chuyển đổi ( vd: pdftohtml filename.pdf )



Những tập tin PDF sẽ được chuyển sang định dạng HTML và lưu trữ lại. Tất cả những chuyển đổi được lưu trữ tại thư mục của file thực thi. Trong trường hợp mà file HTML không được ghi rõ ràng, pdftohtml.bin sẽ chuyển tập tin pdf sang định dạng html mà không chứa đựng hình ảnh. Nếu mà thuộc tính -c không được ghi, thì chỉ hình ảnh JPEG được lưu lại. Nếu thuộc tính -c được ghi rõ ràng thì một hình ảnh PNG được tạo ra ở mỗi trang. Để biên dịch pdftohtml thì sử dụng lệnh 'make'. Để biên dịch pdftohtml với thông tin debug thì sử dụng câu lệnh : make DEBUG=”-g -DDEBUG_MEM” .


pdftohtml hoạt động được trên Windows, Mac, Linux, FreeBSD, và Sun Solaris

Tải pdftohtml về tại đây

Nguồn Addictivetips

Tham Khảo Thêm