niszetの日記

アナログCMOS系雑用エンジニアが頑張る備忘録系日記

Word

(Pandoc) docx出力の脚注の区切り文字をテンプレートから反映させる修正をしています。

マージされたら褒めてくれ。 issueはこれ。 github.com そういえば、テンプレートから反映されないなコレ…ってことでここ2-3日うにょうにょHaskell書いてPRを投げました。 github.com さてどうなるかなー… 今回のことでまた理解が深まったので、ODT形式の方…

(Word)脚注の区切り線は色々とカスタマイズできる

いらん知識な気はするが…。 現在、Pandocの脚注の区切り線をテンプレートから持ってこれるように更新をしています。それをどこまでやればよいのかを検討するために調べていたら思った以上に色々設定できることが分かったのでメモを残しておきます。 脚注の区…

(Pandoc) VerbatimChar文字スタイルはスタイル一覧に表示されないが、これはSourceCode段落スタイルのリンクスタイルなのであった。

linkスタイル死すべし慈悲はない 以前からPandocのdocxのスタイルについて調べていましたが、最近はHaskellのコードも読んでいるので以前よりもさらにわかってきました。 以前… niszet.hatenablog.com いつかちゃんとまとめたいですね…。 でもそれは大変なの…

(Pandoc) MS Word (docx) 出力でも --number-sections オプションに対応している(メモ)

仕様を追い切れていないが…。 Pandoc 2.10.1 から docx の出力で --number-sections オプションがサポートされました。 これをodtにも入れたいなぁと思ってコードを見ていましたが、Writerにべったり依存なのでコードをかなり追わないといけないなということ…

RMarkdownでODT形式で出力してもRStudioはMS Wordで開こうとしてくる…

どういうことなの…? RStudioはKnit後に出力されたファイルを自動で開いてくれます。コレは確かに便利なんですが、開いてほしくないときもアリ、これは制御できるようにしてほしいなぁと思う点ではあります。 さて、掲題の件です。問題は、odt_documentで生…

(OOXML/Word)w:themeFillTint とか w:themeFillShade とか(メモ)

現れたり消えたりするタグ theme系の情報の取得はちょっと癖がありますね。ついこの間テーマ色を使った方が良いと書いたとはいえ…。 テーマの色は、こんな感じで色選択で出てくるときに上の方に出てくる色のことを指しています。 で、縦方向に段々と色が濃く…

(OOXML/MS Word)各項目で取り得る値の対応を見る(メモ)

MS Word上で値を変更して、xmlから値を引き抜いてきて表示値との対応表を作る簡単なお仕事 各項目ごとにまとめないといけないのでキリがありませんね、これ。 でも、やっていきです。今はpPr下のshdの値をまとめています。特徴的な名前なのでどこかに定義済…

(Word/OOXML)Wordはテーマの色を使うと便利そう。テーマ色の内部での値について。

テーマを変更するだけで同じ設定した箇所は一括で変更されるので。 OOXMLの解析をしています。OOXMLのタグ構造は何かしらの資料で見ればいいものの、実際に何が値として設定されているかは実際に作ってみてみないとわからないなーという感じなのです(何か方…

(OOXML)w:pPr/w:spacingのw:beforeは表示値の20倍の値(メモ)

大きすぎませんかね…? 段落スタイルで、段落の前後にスペースを取ることができます。この値はMS Word上での表示値の20倍の値になっています。480が入っていたら24ptということです。 これも実際に動かしてみないとよくわかりませんね…。

(ooxml)w:sz の値はMS Word上の文字サイズ(pt)の2倍の数字が入っている(メモ)

こちらもメモレベルの話。 Wordがどのようにooxmlを解釈しているかはooxmlを直接書き換えて結果がどうなるかを見ていく必要がある。ドキュメント化されているものもあるだろうが、探すよりも見たほうが早い。xmlとしては箱の形は決まっているが、値をどのよ…

(R)ooxmlでxml2::xml_set_attrする場合はw:をつける(メモ)

私的メモがしばらく続きますが… ooxmlで書かれたdocxファイルのスタイルの一括修正が面倒なのでRでやろうと思ってコードを書いています。基本的にはxml2パッケージを使う。あとはofficerの関数を一部使わせてもらう形(処理そのものはofficerと異なるので全…

(Pandoc)Wordのスタイルでbold/italicを指定した場合に、明示的にoff出来ない件のPR

ようやくPandocのIssueウォッチが出来るようになってきた…(?) 最近追いかけているIssueがコレ。 github.com Pandocのdocxに関する質問は、MLやIssueで見かけてわかるものはコメントをしたりしています。直接問題解決には至ってないので実力が足りませんが…

(Word)Wordからpdfをエクスポートすると画像の解像度が落ちる問題

仕様? 小ネタです。Wordは手軽にpdfに変換できて良いですね。ツールバーの「ファイル」から、「エクスポート」、「PDF/XPSの作成」でpdfの作成ができます。 しかし、問題が少なくとも1つあり、画像の解像度が落ちてしまいます。今回は画像形式としてpngを使…

(Pandoc) docx -> md への逆変換のメモ。メタデータについて

メタデータに関して PandocによるMarkdownからdocxへの変換は、Titleなどのドキュメントの見た目やooxml中で定義されているタグがあるような項目だけでなく、任意のメタデータを出力ファイルに入れることが可能です。たとえば、RMarkdownで出力した場合はout…

(Pandoc) docx -> md への逆変換のメモ(4回目)

コード周りは一旦これでおしまい。 さて、前回はテンプレートファイルに"Source Code R"のようなスタイルを追加し、CodeBlockはその外側にこのスタイルを持ったDivを配置することで、生成されたdocxの見た目に影響なく、元となった言語情報を保存することを…

(Pandoc) docx -> md への逆変換のメモ(3回目)

まずはdocxにする際に細工をする。 さて、前回の考察の結果として、docx生成時にCodeBlockの言語情報が失われているので再生しようがないため、docx生成時になんとか情報を残す方法を考えねばならぬことがわかりました。 やろうと思えば色々とデータをdocxフ…

(Pandoc) docx -> md への逆変換のメモ(2回目)

CodeBlockまわりが面倒くさい… さて、前回の続きです。CodeBlock周りの扱いをどうにかしないといけないのですが…長くなりそうなので複数回にまたがる予定です。 前回の記事にも訂正を入れましたが、docxからMarkdownに変換する際、スタイルがSource Codeにな…

(Pandoc) docx -> md への逆変換のメモ(1回目)

可逆にしたい。 さて、塩漬けにしていた課題、PandocでMarkdownからdocxを生成した後、docxからMarkdownに再変換をする話です。 準備 ひとまずRMarkdownから生成することにします。rmarkdownでデフォルトで生成されるテンプレートからとりあえずdocxに変換し…

Wordをちゃんと使いたくて、スタイル周りがわからなかったら「疑問解消!しくみからよくわかるWord再入門」を読もう

タイトルで言いたいことを言い切りました。 そんなわけで、何度かTwitterの方では言及しているこの本ですが、Wordは出来ることが多い割に使い勝手、設定し勝手がよくわからず、スタイルを使えばいいのはわかるけど、具体的にどうすれば…みたいな学習コストが…

(Pandoc) Wordの画像の回り込みの処理を入れるのはちょっとしんどい(メモ)

部分的にWriterを書き換える必要がある。 出来ないと断言はできないものの、現状私の能力では難しいです。Pandoc's ASTでいうところのImageはdocx中では<graphics>タグに置き換わりますが、これが結構複雑で…。この中に回り込みの処理を入れることになりそうですが、こ</graphics>…

(Pandoc) PandocのWordテンプレートはテンプレート出力よりも通常のファイル出力結果を使った方が良い。

2020年初Pandoc記事です(前の2記事も実質Pandocですが) さて、PandocでWord形式の出力ファイルが必要な場合、素の出力では見づらかったり自分なりにカスタマイズしたいということがよくありますね。 これは、--reference-doc であらかじめ見た目を調整した…

(Word/ooxml) customStyleでないスタイルはWordの保存時にStyleIdが変更される(メモ)

これはおそらくWordの仕様 PandocのWordのテンプレートファイルを調べています。 Pandocが生成する、reference.docxには何点か注意しないといけない点があり、そのうちのひとつがStyleIdがWord文書保存時に変更されてしまう、というものです。これはそのスタ…

(Pandoc) Wordのカスタムプロパティを使う

Pandoc Advent Calendar 2019 この記事は Pandoc Advent Calendar 2019 7日目の記事です。 なお、Pandoc Advent Calendar 2019 のリンクはこちらです。 adventar.org まだまだ空きがありますので、皆様、是非ご参加ください1。 YAMLで定義した項目がWordのカ…

(R) R MarkdownからWord文書の作成を容易にするためのパッケージ開発を始めました。

といっても、ooxml吐くだけの関数群なわけですが…。 さて、12/1に行われたJapan.Rに参加してきました。 japanr.connpass.com 今回は登壇せず、先月もTokyo.Rに行っていないので近頃は全然R成分がなかったのですが、やはり行くと刺激を受けますね。 というわ…