niszetの日記

細かい情報を載せていくブログ

(Pandoc)複数のdocx/odtを結合する、をWordやLOWの機能でやるべきか…?(メモ)

検討中の話…。

docxはMS Word上で結合できます。リンク形式にする場合は下記のページの説明が分かりやすいです。

www.koikikukan.com

これをunzipして見てみると、_relsに実際のファイル名を入れているため、word/document.xml単体では処理できないので、Pandocの処理内でここもあわせて作成ということは難しそう。その代わり、事前に章ごとにファイルを決めておいて、このドキュメントのひな型の枠に入れるのは良さそう。ただし章番号がどうなるのかは不明。あと、TOCは生成できるのか?みたいなのもある。

odtの場合、LOW上で結合する方法はこちらのWikiに書いてある。LibreOfficeWikiに結構書いてあるので良いですね。ただし、日本語化したときの文字列はバージョンごとに揺らぎがあるかもしれないので、なんとなく雰囲気で理解する必要があるかもしれない。

help.libreoffice.org

こちらはcontent.xmlで閉じていそうなのだが、デフォルトの表示文字列も一緒に含まれているようなので、Pandocでこれを自動生成した場合には一度odtファイルをLOWで開いて更新という処理が必要になりそうだなと考えています。それ以外の章番号などの話はdocxと同様に問題になるかも。

どちらももう少し実例でやってみないとわからないので、「とりあえずやってみるぞ」という気持ちをここに書いておきます。いつまでもやってないようならだれかつついてみてください…。