使用 javascript 阅读 PPTX 的最佳方式
Best way to read PPTX with javascript
我一直在做一些研究,我试图了解在浏览器中用 JavaScript/Typescript 阅读 pptx
的标准方法是什么。
我发现的很多库主要用于像 textract . I found one library called JS-PPTX 这样的节点,但最后一次提交是在 2016 年进行的,所以这不是很有前途。
大多数图书馆都是关于创建 Power Point
演示文稿,但我真正需要做的是能够阅读文件并识别幻灯片的内容。
我很高兴阅读原始文件格式并尝试解析它(如果更好的话),但我只需要一种使用 FileReader Api.
上传和读取文件的方法
或者,如果有一种方法可以将 pptx 转换为另一种更易于阅读的格式,我会喜欢的。我找到了一个名为 PPTX2HTML 的库,但最后一次提交是从 2017 年开始的。
我发现了这个 Stack Overflow post,但它来自 2010
,所以我希望有思想的演变。
PPTX (see the spec here) 是一种基于 XML 的压缩文件格式,是 Microsoft Office Open XML(也称为 OOXML 或OpenXML) 规范,作为 Microsoft Office 2007 及更高版本的一部分引入。
浏览器可以解析 XML,因此您可能必须:
- 用FileReader、
读取文件
- 解压缩 somehow
- 用DOMParser
解析
- 也许用 XSLT 转换它
我一直在做一些研究,我试图了解在浏览器中用 JavaScript/Typescript 阅读 pptx
的标准方法是什么。
我发现的很多库主要用于像 textract . I found one library called JS-PPTX 这样的节点,但最后一次提交是在 2016 年进行的,所以这不是很有前途。
大多数图书馆都是关于创建 Power Point
演示文稿,但我真正需要做的是能够阅读文件并识别幻灯片的内容。
我很高兴阅读原始文件格式并尝试解析它(如果更好的话),但我只需要一种使用 FileReader Api.
上传和读取文件的方法或者,如果有一种方法可以将 pptx 转换为另一种更易于阅读的格式,我会喜欢的。我找到了一个名为 PPTX2HTML 的库,但最后一次提交是从 2017 年开始的。
我发现了这个 Stack Overflow post,但它来自 2010
,所以我希望有思想的演变。
PPTX (see the spec here) 是一种基于 XML 的压缩文件格式,是 Microsoft Office Open XML(也称为 OOXML 或OpenXML) 规范,作为 Microsoft Office 2007 及更高版本的一部分引入。
浏览器可以解析 XML,因此您可能必须:
- 用FileReader、 读取文件
- 解压缩 somehow
- 用DOMParser 解析
- 也许用 XSLT 转换它