使用Python更新MS Word .docx文档的目录(目录)


问题内容

我使用python包“ python-docx”来修改MS Word .docx文档的结构和内容。该软件包无法更新目录(目录)[
Python:使用python-docx /
lxml创建“目录”

是否有解决方法来更新文档的目录?我考虑过使用python程序包“ pywin32”
[https://pypi.python.org/pypi/pypiwin32]中的“
win32com.client”或为MS Office提供“ cli control”功能的类似pypi程序包。

我尝试了以下方法:

我将document.docx更改为document.docm,并实现了以下宏
[http://word.tips.net/T000301_Updating_an_Entire_TOC_from_a_Macro.html]:

Sub update_TOC()

If ActiveDocument.TablesOfContents.Count = 1 Then _
  ActiveDocument.TablesOfContents(1).Update

End Sub

如果我更改内容(添加/删除标题)并运行宏,则目录更新。我保存了文件,很高兴。

我实现了以下与宏等效的python代码:

import win32com.client

def update_toc(docx_file):
    word = win32com.client.DispatchEx("Word.Application")
    doc = word.Documents.Open(docx_file)
    toc_count = doc.TablesOfContents.Count
    if toc_count == 1:
        toc = doc.TablesOfContents(1)
        toc.Update
        print('TOC should have been updated.')
    else:
        print('TOC has not been updated for sure...')

在更高级别的脚本中调用update_toc(docx_file)(该脚本操纵与文档的TOC相关的内容)。此函数调用后,将保存文档(doc.Save()),关闭文档(doc.Close())和关闭单词实例(word.Quit())。但是,TOC尚未更新。

ms word是否在宏执行后执行了我未考虑的其他操作?


问题答案:

这是一个片段,用于更新单词2013
.docx文档的目录,其中仅包含一个目录(例如,仅标题的TOC,不包含图形的TOC等)。如果使用python的系统安装程序从命令promt(Windows
10,命令promt不“以管理员身份运行”)运行脚本 update_toc.py则会 在同一目录中python update_toc.py打开文件 doc_with_toc.docx
,并更新目录(在本例中为标题)并将更改保存到同一文件中。该文档可能不会在Word
2013的另一个实例中打开,并且可能没有写保护。请注意,此脚本与选择整个文档内容并按F9键不同

update_toc.py的 内容:

import win32com.client
import inspect, os

def update_toc(docx_file):
    word = win32com.client.DispatchEx("Word.Application")
    doc = word.Documents.Open(docx_file)
    doc.TablesOfContents(1).Update()
    doc.Close(SaveChanges=True)
    word.Quit()

def main():
    script_dir = os.path.dirname(os.path.abspath(inspect.getfile(inspect.currentframe())))
    file_name = 'doc_with_toc.docx'
    file_path = os.path.join(script_dir, file_name)
    update_toc(file_path)

if __name__ == "__main__":
    main()