[English Mode Available]
A desktop application that fetches web pages natively and converts them into high-quality PDF or EPUB files. It is highly optimized to preserve complex web formats like lazy-loaded images, SVG tags, and MathJax/MathML formulas securely.
Webページを自動で取得・巡回し、PDFやEPUBフォーマットの電子書籍として保存できるデスクトップアプリケーションです。遅延読み込み(Lazy-load)の画像やSVG・またMathJaxなど数式の保存に強く、レイアウトをきれいに維持したまま電子書籍化します。
- Bilingual UI (言語対応): Supports Japanese and English natively. UI language can be toggled inside the app. (日本語・英語の切り替え機能)
- Concurrent Scraping (並列処理): Employs multi-threading to speed up page fetching and generation without locking the GUI. Maximum workers can be adjusted with a slider.
- Smart Page Clean-up (レイアウトの最適化): Automatically strips massive headers, footers, ad-banners natively while safely preserving critical inner content like nested titles and formulas.
- MathJax to MathML Converter (数式保存): Solves the typical missing-math output generated by conventional readers! Executes injected JavaScript to evaluate pending MathJax formulas and render them natively into EPUB items.
- Lazy-load Image Fetcher (遅延画像取得): Evaluates infinite-scroll constraints to ensure no placeholder images are saved.
- Base64/Data URI Image Support (Base64画像対応): Can natively bundle Base64 directly into the generated zip architecture without breaking styling.
This tool depends on Python 3.8+ and Headless Chromium processing via Playwright.
# Clone the repository
git clone https://github.com/yourusername/web-to-ebook-generator.git
cd web-to-ebook-generator
# Install essential Python packages
pip install -r requirements.txt
# Install the Playwright headless browser component
playwright install chromium- ターミナルから
python ebook_gui.pyを実行します。- Run
python ebook_gui.pyfrom your terminal.
- Run
- 変換したいサイトのURLを入力し、「候補URLを取得 (Fetch URLs)」をクリックします。
- Input the desired website's URL and click "Fetch URLs".
- リストから保存したいページにチェック欄(
☑)を入れます。- Keep the checkboxes for the pages you want to download.
- 出力先・タイトル・並列数を指定し「変換して保存 (Convert & Save)」を押すとバックグラウンドで進行します(UI右側にキューが並びます)。
- Specify Output path, Max Workers, Format type, and hit "Convert & Save". A job bar will be stacked in the queue menu!
Open sourced under the MIT License (MITライセンスにて公開されています). Please use responsibly and ensure you respect the copyright and scraping guidelines of the websites you acquire data from. (※ 各ウェブサイトの利用規約および著作権法を遵守の上、常識的な範囲内でご利用ください).