Asp.net
如何使用 asp.net 將 .docx 轉換為 html?
Word 2007 將其文件保存為 .docx 格式,這實際上是一個 zip 文件,其中包含一堆內容,包括帶有文件的 xml 文件。
我希望能夠獲取一個 .docx 文件並將其放入我的 asp.net Web 應用程序的文件夾中,並讓程式碼打開 .docx 文件並將文件的(xml 部分)呈現為網頁。
我一直在網上搜尋有關此的更多資訊,但到目前為止還沒有找到太多。我的問題是:
- 您會 (a) 使用 XSLT 將 XML 轉換為 HTML,還是 (b) 使用 .net 中的 xml 操作庫(例如 3.5 中的 XDocument 和 XElement)轉換為 HTML 或 (c) 其他?
- 您是否知道我可以將其用作起點的任何開源庫/項目?
謝謝!
試試這個文章?我不知道,但可能是你正在尋找的。
我編寫了mammoth.js,這是一個將 docx 文件轉換為 HTML 的 JavaScript 庫。如果您想在 .NET 中進行伺服器端渲染,NuGet 上還有一個 .NET 版本的 Mammoth 。
Mammoth 試圖通過查看語義資訊來生成乾淨的 HTML——例如,將 Word 中的段落樣式(例如
Heading 1)映射到 HTML/CSS 中的適當標籤和样式(例如<h1>)。如果您想要產生精確視覺副本的東西,那麼猛獁象可能不適合您。如果你有一些已經結構良好的東西並且想要將它轉換為整潔的 HTML,那麼 Mammoth 可能會成功。