知识库

Python .docx 教程 | 创建、打开和转换 .docx 文件

在本文中,我们将向您展示如何使用 Python 轻松创建、打开或转换 .docx 文件!
我们将为您介绍 Aspose.Words for Python via .NET 库及其功能特性,帮助您快速、简便地操作 .docx 文件。

Python DOCX 教程

Aspose.Words for Python via .NET 是一套功能强大的 API,能够读取并处理多种文档格式,如 DOCX、DOC、PDF、RTF、DOTX、DOT、DOCM、DOTM、FlatOPC、FlatOpcMacroEnabled、ODT、XML、XAML、HTML、MHTML、TXT、XPS、PS、PNG、JPEG、BMP、SVG、EMF、GIF、EPUB 以及其他文件格式
我们的库包含超过 100 个 Python 类,为开发者提供了实现脚本化文档自动化的独特机会。

Aspose.Words for Python via .NET 提供了丰富的示例和演示,帮助开发者在开发过程中快速上手,并具备以下优势:平台无关、无需依赖第三方应用(如 Microsoft Word)、高性能可扩展、学习曲线平缓。

我们的 API 的一些高级功能包括:
文档转换 (支持多种流行格式)
页面渲染 (高保真)
文档比较
• 使用 邮件合并 字段设计 Microsoft Word 报表
文档克隆
文档拆分 为多个部分
查找与替换 文本
数字签名处理
表格操作
水印处理
• 以及更多功能,详见我们的文档

下面,我们将演示如何使用 Python 创建新文档或加载已有文档,以及如何进行文档转换。

使用 Python 创建新 .docx 文件

要创建新文档,首先调用无参的 Document 构造函数,然后使用 DocumentBuilder 类向文档添加内容。
下面的代码示例展示了如何使用 DocumentBuilder 创建文档:

doc = aw.Document()
builder = aw.DocumentBuilder(doc)
            
builder.write("Hello world!")

doc.save(docs_base.artifacts_dir + "out.docx")

使用 Python 加载 .docx 文件

要加载已有的 .docx 文件,只需将文件名或流传入任意一个 Document 构造函数,格式会根据扩展名自动识别。

从文件加载

将文件名字符串传入 Document 构造函数即可打开已有的 .docx 文件。

# 完整示例和数据文件请访问 https://github.com/aspose-words/Aspose.Words-for-Python-via-.NET
doc = aw.Document(docs_base.my_dir + "Document.docx")

从流加载
将包含文档的流对象传入 Document 构造函数即可从流中打开文档。

# 完整示例和数据文件请访问 https://github.com/aspose-words/Aspose.Words-for-Python-via-.NET
# 只读访问即可让 Aspose.Words 加载文档。
stream = io.FileIO(docs_base.my_dir + "Document.docx")

doc = aw.Document(stream)
# 现在可以关闭流,因为文档已在内存中。
stream.close()

此示例的模板文件可在 Aspose.Words GitHub 下载。

使用 Python 转换 .docx 文件

轻松可靠地将文档从一种格式转换为另一种格式是 Aspose.Words API 的核心功能之一。将 .docx 转换为其他格式非常简单,只需两步:

  1. 使用任意构造函数将文件加载为 Document 对象。
  2. 调用 save 方法并指定目标输出格式。

下面的示例演示如何将 .docx 文件转换为 PDF 格式。

将 .docx 文件转换为 PDF

# 完整示例和数据文件请访问 https://github.com/aspose-words/Aspose.Words-for-Python-via-.NET
doc = aw.Document(docs_base.my_dir + "Document.docx")

doc.save(docs_base.artifacts_dir + "BaseConversions.docx_to_pdf.pdf")

模板文件可在 Aspose.Words GitHub 下载。

转换为不同的 PDF 标准

我们的库提供 PdfCompliance 枚举,支持将 .docx 文件转换为多种 PDF 标准(如 PDF 1.7、PDF 1.6 等)。以下示例展示如何使用 PdfSaveOptions 将文档转换为符合 PDF 1.7 标准的 PDF:

# 完整示例和数据文件请访问 https://github.com/aspose-words/Aspose.Words-for-Python-via-.NET
doc = aw.Document(docs_base.my_dir + "Rendering.docx")

saveOptions = aw.saving.PdfSaveOptions()
saveOptions.compliance = aw.saving.PdfCompliance.PDF17 

doc.save(docs_base.artifacts_dir + "WorkingWithPdfSaveOptions.conversion_to_pdf_17.pdf", saveOptions)

您可以尝试我们的免费在线转换器 ,进一步了解 API 的强大功能。