


Die Schwierigkeit, einen kostenlosen Excel-zu-PDF-Konverter zu finden: Meine Reise und Lösung
Viele Projekte erfordern die Konvertierung von Excel-Dateien in das PDF-Format, sei es beim Erstellen von Berichten, beim Teilen von Daten oder beim Erstellen von Dokumenten. Anfangs dachte ich, wie viele Entwickler, dass dies eine leicht automatisierbare Aufgabe sein würde. Der Weg zu einer kostenlosen und zuverlässigen Lösung ist jedoch mit Herausforderungen verbunden: Einschränkungen, Kompatibilitätsprobleme und teure kommerzielle Tools.
Schließlich habe ich diese Schwierigkeiten überwunden und meinen eigenen Excel-zu-PDF-Konverter erstellt und ihn als Open-Source-Tool anderen Entwicklern zur Verfügung gestellt, die möglicherweise vor dem gleichen Dilemma stehen.
Frustrierende Erfahrung
Business-Tools
Erste Suchergebnisse wiesen auf kostenpflichtige Lösungen wie Aspose.Cells, Syncfusion und andere hin. Obwohl sie leistungsstark sind, sind ihre Lizenzgebühren hoch, was sie für kleine oder persönliche Projekte unerschwinglich macht.
Online-Dienste
Kostenlose Online-Konverter scheinen eine gute Wahl zu sein, sind aber nicht für die Automatisierung geeignet. Diese Tools haben häufig Datenschutzprobleme (da Dateien auf Server von Drittanbietern hochgeladen werden), Dateigrößenbeschränkungen und bieten keine Programmier-APIs.
Open-Source-Bibliothek
Ich habe auch Open-Source-Bibliotheken ausprobiert, aber den meisten fehlte die Funktionalität zum Konvertieren von Excel-Dateien in PDF. Selbst Bibliotheken, die über diese Funktion verfügen, sind oft unzuverlässig oder unterstützen keine modernen Microsoft Office-Formate.
LibreOffice im Headless-Modus
Nach ein paar Wochen der Suche bin ich auf eine Möglichkeit gestoßen, LibreOffice im Headless-Modus zu verwenden. LibreOffice ist eine kostenlose Open-Source-Office-Suite, die mehrere Dateiformate, einschließlich Excel, in PDF konvertieren kann. Im Headless-Modus erfolgt die Bedienung über die Befehlszeile, was es ideal für die Automatisierung macht.
So funktioniert meine Lösung
Um Entwicklern die Verwendung zu erleichtern, habe ich einen leichten Go-basierten HTTP-Server erstellt, der als REST-API fungiert. Dieser Server kapselt die Funktionalität von LibreOffice und ermöglicht jeder Programmiersprache die Interaktion mit ihm über HTTP-Anfragen.
Hauptfunktionen
- Unterstützt mehrere Dateiformate: Unterstützt .xlsx, .xls, .csv, .docx, .pptx und andere Formate.
- Automatische Bereinigung: Temporäre Dateien werden nach einer Stunde automatisch gelöscht, um Speicherplatz zu sparen.
- Benutzerdefinierte Schriftarten: Benutzerdefinierte Schriftarten können durch Klonen des GitHub-Repositorys oder mithilfe eines Docker-Volumes installiert werden.
- Sprachübergreifende Integration: Funktioniert mit jeder Programmiersprache, die HTTP unterstützt.
Temporäre Verzeichnismethode
Anstatt mich auf das temporäre Verzeichnis des Systems zu verlassen, habe ich mich für die Verwendung eines benutzerdefinierten ./tmp-Verzeichnisses entschieden. Dies stellt ein konsistentes Verhalten sicher, da temporäre Systemverzeichnisse manchmal unvorhersehbare Berechtigungen haben.
Implementierungsdetails
Workflow
-
Datei-Upload: Der Client verwendet den
/convert
-Endpunkt, um Excel-Dateien über POST-Anfragen hochzuladen. - Temporärer Speicher: Der Server speichert Dateien im Verzeichnis ./tmp mit Dateinamen basierend auf Zeitstempeln.
- Konvertieren: Rufen Sie LibreOffice im Headless-Modus auf, um die Datei in PDF zu konvertieren und das Ergebnis im selben Verzeichnis zu speichern.
- Dateibereinigung: Goroutine im Hintergrund löscht Dateien, die älter als eine Stunde sind.
- Antwort: Geben Sie das konvertierte PDF als HTTP-Antwort zurück.
Erste Schritte
GitHub-Repository
Den Quellcode finden Sie unter https://www.php.cn/link/5b1add8961a1cfa07e60838ffd0f83e7.
Docker-Image
Dieses Projekt stellt auch ein Docker-Image bereit: wteja/pdf-converter.
Docker-Container ausführen
<code>docker pull wteja/pdf-converter docker run -p 5000:5000 wteja/pdf-converter</code>
Beispiele für die Integration mit anderen Sprachen
Da der Dienst über HTTP verfügbar gemacht wird, können Sie mit jeder Programmiersprache mit ihm interagieren.
C#
var client = new HttpClient(); var fileContent = new ByteArrayContent(File.ReadAllBytes("example.xlsx")); var formData = new MultipartFormDataContent { { fileContent, "file", "example.xlsx" } }; var response = await client.PostAsync("http://localhost:5000/convert", formData); var pdfBytes = await response.Content.ReadAsByteArrayAsync(); File.WriteAllBytes("output.pdf", pdfBytes);
Node.js
const axios = require("axios"); const FormData = require("form-data"); const fs = require("fs"); const form = new FormData(); form.append("file", fs.createReadStream("example.xlsx")); axios.post("http://localhost:5000/convert", form, { headers: form.getHeaders() }) .then(response => fs.writeFileSync("output.pdf", response.data)) .catch(console.error);
Python
import requests with open("example.xlsx", "rb") as f: response = requests.post("http://localhost:5000/convert", files={"file": f}) with open("output.pdf", "wb") as f: f.write(response.content)
Los
package main import ( "bytes" "io" "mime/multipart" "net/http" "os" ) func main() { file, _ := os.Open("example.xlsx") defer file.Close() body := &bytes.Buffer{} writer := multipart.NewWriter(body) part, _ := writer.CreateFormFile("file", "example.xlsx") io.Copy(part, file) writer.Close() req, _ := http.NewRequest("POST", "http://localhost:5000/convert", body) req.Header.Set("Content-Type", writer.FormDataContentType()) resp, _ := http.DefaultClient.Do(req) defer resp.Body.Close() out, _ := os.Create("output.pdf") defer out.Close() io.Copy(out, resp.Body) }
Herausforderungen und Kompromisse
Bildgröße
Aufgrund von LibreOffice-Abhängigkeiten beträgt die Docker-Image-Größe 2,67 GB. Obwohl ich kleinere Images wie Alpine getestet habe, enthielten sie ältere Versionen von LibreOffice, die nicht mit modernen Microsoft Office-Formaten kompatibel waren. Obwohl Debian das neueste LibreOffice bereitstellt, ist das generierte Image größer (ca. 3 GB).
Warum es sich lohnt
Die größere Bildgröße ist ein akzeptabler Kompromiss im Vergleich zu den Kosten kommerzieller Lösungen. Einmal eingerichtet, kann das Bild in mehreren Projekten wiederverwendet werden, ohne dass zusätzliche Lizenzgebühren anfallen.
Fazit
Die Frustration, einen kostenlosen Excel-zu-PDF-Konverter zu finden, veranlasste mich, meine eigene Lösung mit LibreOffice im Headless-Modus zu erstellen. Es ist zwar nicht perfekt, aber kostenlos, zuverlässig und flexibel. Wenn Sie vor der gleichen Herausforderung stehen, hoffe ich, dass Ihnen dieses Projekt Zeit und Mühe erspart.
Bitte schauen Sie sich das Projekt auf GitHub an oder laden Sie das Docker-Image von Docker Hub herunter. Bitte teilen Sie mir mit, wie es bei Ihnen funktioniert oder ob Sie Verbesserungsvorschläge haben.
Das obige ist der detaillierte Inhalt vonDie Schwierigkeit, einen kostenlosen Excel-zu-PDF-Konverter zu finden: Meine Reise und Lösung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

OpenSSL bietet als Open -Source -Bibliothek, die in der sicheren Kommunikation weit verbreitet sind, Verschlüsselungsalgorithmen, Tasten und Zertifikatverwaltungsfunktionen. In seiner historischen Version sind jedoch einige Sicherheitslücken bekannt, von denen einige äußerst schädlich sind. Dieser Artikel konzentriert sich auf gemeinsame Schwachstellen und Antwortmaßnahmen für OpenSSL in Debian -Systemen. DebianopensL Bekannte Schwachstellen: OpenSSL hat mehrere schwerwiegende Schwachstellen erlebt, wie z. Ein Angreifer kann diese Sicherheitsanfälligkeit für nicht autorisierte Lesen sensibler Informationen auf dem Server verwenden, einschließlich Verschlüsselungsschlüssel usw.

Wie kann man im Beegoorm -Framework die mit dem Modell zugeordnete Datenbank angeben? In vielen BeEGO -Projekten müssen mehrere Datenbanken gleichzeitig betrieben werden. Bei Verwendung von BeEGO ...

Backend Learning Path: Die Erkundungsreise von Front-End zu Back-End als Back-End-Anfänger, der sich von der Front-End-Entwicklung verwandelt, Sie haben bereits die Grundlage von Nodejs, ...

Das Problem der Verwendung von RETISTREAM zur Implementierung von Nachrichtenwarteschlangen in der GO -Sprache besteht darin, die Go -Sprache und Redis zu verwenden ...

Was soll ich tun, wenn die benutzerdefinierten Strukturbezeichnungen in Goland nicht angezeigt werden? Bei der Verwendung von Goland für GO -Sprachentwicklung begegnen viele Entwickler benutzerdefinierte Struktur -Tags ...

In der Bibliothek, die für den Betrieb der Schwimmpunktnummer in der GO-Sprache verwendet wird, wird die Genauigkeit sichergestellt, wie die Genauigkeit ...

Das Problem der Warteschlange Threading In Go Crawler Colly untersucht das Problem der Verwendung der Colly Crawler Library in Go -Sprache. Entwickler stoßen häufig auf Probleme mit Threads und Anfordern von Warteschlangen. � ...

In diesem Artikel wird vorgestellt, wie MongoDB im Debian -System konfiguriert wird, um eine automatische Expansion zu erzielen. Die Hauptschritte umfassen das Einrichten der MongoDB -Replikat -Set und die Überwachung des Speicherplatzes. 1. MongoDB Installation Erstens stellen Sie sicher, dass MongoDB im Debian -System installiert ist. Installieren Sie den folgenden Befehl: sudoaptupdatesudoaptinstall-emongoDB-org 2. Konfigurieren von MongoDB Replika-Set MongoDB Replikate sorgt für eine hohe Verfügbarkeit und Datenreduktion, was die Grundlage für die Erreichung der automatischen Kapazitätserweiterung darstellt. Start MongoDB Service: SudosystemctlstartMongodsudosysys
