TinyMCE、Django 和 python-docx
TinyMCE, Django and python-docx
我正在考虑在我的 Django 项目中使用 rich text editor
。 TinyMCE 看起来是显而易见的解决方案,但我看到输出格式是 html (here)。目标是存储用户输入,然后使用 python-docx
(不是 html)在 word 文档中提供它。
你知道有什么解决办法吗? tinyMCE 的 feature 或保持样式的 html 到字格式转换器,或者 另一个富文本编辑器 类似于 tinymce?
UPDATE:
This is another option which i found to be working fine. Still at the point of trying to convert HTML to Word without losing styles. A solution for this may be pywin32
as stated here 但它对我帮助不大 + 它只是 Windows。
Update2
经过相当多的挖掘后,我发现 pandoc and pypandoc 似乎能够翻译成以下任何一种输出格式:
"asciidoc, beamer, commonmark, context, docbook, docbook4, docbook5, docx, dokuwiki, dzslides, epub, epub2, epub3, fb2, gfm, haddock, html, html4, html5, icml, jats, json, latex, man, markdown, markdown_github, markdown_mmd, markdown_phpextra, markdown_strict, mediawiki, ms, muse, native, odt, opendocument, opml, org, plain, pptx, revealjs, rst, rtf, s5, slideous, slidy, tei, texinfo, textile, zimwiki"
我还没有想出如何将这样的输入集成到 python-docx。
我遇到了同样的挑战。您需要使用 Python 的 Beautiful Soup 库来遍历 HTML 编辑器中的内容(我使用 Summernote,但任何 HTML 编辑器都应该可以)然后解析 HTML 标签转换为 python-docx 可用的格式。 Pandoc 和 Pypandoc 将为您转换文件(例如,您从一个 LateX 文件开始,需要将其转换为 Word),但不会提供需要与 xml/html.
相互转换的工具
祝你好运!
我正在考虑在我的 Django 项目中使用 rich text editor
。 TinyMCE 看起来是显而易见的解决方案,但我看到输出格式是 html (here)。目标是存储用户输入,然后使用 python-docx
(不是 html)在 word 文档中提供它。
你知道有什么解决办法吗? tinyMCE 的 feature 或保持样式的 html 到字格式转换器,或者 另一个富文本编辑器 类似于 tinymce?
UPDATE:
This is another option which i found to be working fine. Still at the point of trying to convert HTML to Word without losing styles. A solution for this may be pywin32
as stated here 但它对我帮助不大 + 它只是 Windows。
Update2
经过相当多的挖掘后,我发现 pandoc and pypandoc 似乎能够翻译成以下任何一种输出格式:
"asciidoc, beamer, commonmark, context, docbook, docbook4, docbook5, docx, dokuwiki, dzslides, epub, epub2, epub3, fb2, gfm, haddock, html, html4, html5, icml, jats, json, latex, man, markdown, markdown_github, markdown_mmd, markdown_phpextra, markdown_strict, mediawiki, ms, muse, native, odt, opendocument, opml, org, plain, pptx, revealjs, rst, rtf, s5, slideous, slidy, tei, texinfo, textile, zimwiki"
我还没有想出如何将这样的输入集成到 python-docx。
我遇到了同样的挑战。您需要使用 Python 的 Beautiful Soup 库来遍历 HTML 编辑器中的内容(我使用 Summernote,但任何 HTML 编辑器都应该可以)然后解析 HTML 标签转换为 python-docx 可用的格式。 Pandoc 和 Pypandoc 将为您转换文件(例如,您从一个 LateX 文件开始,需要将其转换为 Word),但不会提供需要与 xml/html.
相互转换的工具祝你好运!