内部链接无效 将 .HTM 转换为 .pdf
Internal Links Not Working Convert .HTM to .pdf
我正在尝试将 .htm
文件从 SEC 网站转换为 .pdf
并使内部链接正常工作。我使用 wkhtmltopdf
成功转换为 .pdf
,但所有内部链接都将我指向第一页。
wkhtmltopdf https://www.sec.gov/Archives/edgar/data/1594617/000119312514117433/d640354ds1a.htm test.pdf
似乎有一个 issue with wkhtmltopdf
dealing with anchor tags that have no content. There's a PR 在 2017 年打开来解决它,但它仍然打开。
事实证明,您的文档确实有空锚标记,所以这可能是根本原因:
<A NAME="toc640354_15"></A>
我建议使用 chrome 生成带有 --headless
和 --print-to-pdf
标志的 pdf。在您的 chrome 安装目录中,执行:
chrome.exe --headless --disable-gpu --print-to-pdf="C:\path\to\file.pdf" https://www.sec.gov/Archives/edgar/data/1594617/000119312514117433/d640354ds1a.htm
确保指定输出文件的绝对路径,否则无论出于何种原因,它似乎都不起作用。该命令将立即 return 而没有任何输出或成功指示。给它几秒钟的时间来检索、呈现和写入文件。
我用你的文档进行了测试,链接工作正常。
我正在尝试将 .htm
文件从 SEC 网站转换为 .pdf
并使内部链接正常工作。我使用 wkhtmltopdf
成功转换为 .pdf
,但所有内部链接都将我指向第一页。
wkhtmltopdf https://www.sec.gov/Archives/edgar/data/1594617/000119312514117433/d640354ds1a.htm test.pdf
似乎有一个 issue with wkhtmltopdf
dealing with anchor tags that have no content. There's a PR 在 2017 年打开来解决它,但它仍然打开。
事实证明,您的文档确实有空锚标记,所以这可能是根本原因:
<A NAME="toc640354_15"></A>
我建议使用 chrome 生成带有 --headless
和 --print-to-pdf
标志的 pdf。在您的 chrome 安装目录中,执行:
chrome.exe --headless --disable-gpu --print-to-pdf="C:\path\to\file.pdf" https://www.sec.gov/Archives/edgar/data/1594617/000119312514117433/d640354ds1a.htm
确保指定输出文件的绝对路径,否则无论出于何种原因,它似乎都不起作用。该命令将立即 return 而没有任何输出或成功指示。给它几秒钟的时间来检索、呈现和写入文件。
我用你的文档进行了测试,链接工作正常。