← 所有文章

DOCX 格式解密:Office Open XML 架構

2026 年 3 月 · 閱讀時間約 6 分鐘

每天有數十億份 DOCX 文件在全球被建立、編輯和分享。但你知道嗎?一個 .docx 檔案其實不是一個單一的文件,而是一個 ZIP 壓縮包,裡面包含了多個 XML 檔案和資源。

從 DOC 到 DOCX 的演進

在 Office 2007 之前,Word 使用的是二進位 DOC 格式,這是一個封閉、專屬的格式。2006 年,微軟推出了 Office Open XML(OOXML),並在 2008 年獲得 ISO/IEC 29500 國際標準認證。DOCX 的「X」就代表 XML。

DOCX 的內部結構

如果你將一個 .docx 檔案的副檔名改為 .zip 並解壓縮,你會看到以下結構:

路徑說明
[Content_Types].xml定義壓縮包中各部分的 MIME 類型
_rels/.rels定義各部分之間的關係
word/document.xml文件的主要內容(段落、文字、表格等)
word/styles.xml文件的樣式定義
word/fontTable.xml使用的字型清單
word/settings.xml文件設定(頁面大小、邊距等)
word/media/嵌入的圖片和媒體資源
word/numbering.xml項目符號和編號清單的定義
docProps/core.xml文件屬性(作者、建立日期等)

重點摘要:DOCX 本質上是一個 ZIP 壓縮包,內含結構化的 XML 檔案。這種設計讓 DOCX 成為一個開放、可解析的格式,任何程式都可以讀取和修改其內容。

document.xml:文件的核心

document.xml 是 DOCX 最重要的部分,它使用 XML 標記來描述文件的內容結構:

styles.xml:樣式系統

DOCX 的樣式系統非常強大,支援多層級的樣式繼承:

為什麼轉 PDF 有時會跑版?

了解 DOCX 結構後,就能理解轉換問題的根源:

立即使用 Word 轉 PDF 工具 →

結語

DOCX 的 Office Open XML 架構是一個精心設計的文件格式標準。理解它的內部結構不僅有助於解決轉換問題,也能讓你更有效地建立和管理文件。下次遇到轉換問題時,你就知道該從哪裡尋找原因了。

參考文獻

  1. ECMA International. "ECMA-376: Office Open XML File Formats." ECMA International, 2021. https://ecma-international.org/publications-and-standards/standards/ecma-376/
  2. Microsoft. "Open XML SDK documentation." Microsoft Learn, 2024. https://learn.microsoft.com/en-us/office/open-xml/open-xml-sdk
  3. ISO/IEC. "ISO/IEC 29500-1:2016 — Office Open XML File Formats." International Organization for Standardization, 2016. https://www.iso.org/standard/71691.html
  4. Microsoft. "Word file format reference." Microsoft Learn, 2024. https://learn.microsoft.com/en-us/openspecs/office_standards/ms-docx/