niszetの日記

細かい情報を載せていくブログ

Word

(Pandoc)docx出力時、テンプレートのとじしろの設定が反映されるようになった

バグの解消 Pandocはテンプレートのスタイルなどを使って、生成するファイルの見栄えを制御出来ますが、Pandocがテンプレートとなるファイルからその情報を抜き出すように処理を書いているものだけが対応していて、全ての設定が反映されるわけではありません…

(Pandoc)docx出力形式でもsvgファイルを使うことが出来るようになった

Pandoc 3.1.10より。 以前から機能的には出来そうな雰囲気であったが、バグがありそれが対応された結果、docxファイルにsvg画像を使えるようになった。 対応するIssueはこれ。 github.com svgファイルを取り扱うにはpandoc本体とは別にrsvg-convertが必要に…

PowerShellでWord文書をpdfに変換する際に参考にしたサイト

少しだけトラブったのでメモを残します。 Wordからpdfファイルを生成する際、手でやるのは大変なのでバッチでやりたいと考えました。Windows上での使用が前提なので、PowerShellで記述例がないかを探していました。下記の記事のコードがほぼそのまま利用でき…

Pandoc作業(1/7)

ほぼZotero作業では? 色々と勘違いしていたようで、ちょっとまとめる。 ZoteroのBBT、zotero.luaを使う場合はZotero本体から文献情報を持ってくる。そのため、YAMLにあるbibliographyは無視される。Pandoc単体の場合は必須なので注意。Zoteroのスタンドアロ…

(Pandoc)Word脚注番号のルールはテンプレートを修正すれば対応出来る

意外と設定が残るものなのね。 Pandocはドキュメントのテンプレートを使用出来ます。Wordの場合、--reference-docで指定するファイルに書かれているスタイルを利用してドキュメント生成することが一般的だと思います。 このテンプレートのファイルに書かれて…

WordにZoteroアドインから引用文献の情報を入れる(メモ)

プラグインなのかアドインなのかアドオンなのかよくわかってない 現時点で、Wordにいい感じに参考文献を入れる方法の候補が2つある。Wordの文献管理機能は一旦忘れておく。 niszet.hatenablog.com Pandocの機能を使う 生成したdocxから文献情報を再度引き出…

Zoteroの日本語書籍文献のCitation KeyはZoteroの機能でつけなおせば良さそう(メモ)

悩みがひとつ消えた 昨日書いた、日本の書籍のbibをZoteroで管理するときにCitation Keyどうしようかという話です。これは既に解決策Qiitaの記事にあることを見つけたので備忘録的なメモということになります。 niszet.hatenablog.com ということで、こちら↓…

引用文献のスタイルを指定したPandocでの変換は可能ぽい(メモ)

単純な話だった。 Pandocは--csl=FILEの形式でCSLを与えることが出来る。そのため、単純に出力ファイルでの引用文献の体裁がCSLに定義されていれば(かつciteprocがちゃんと動けば。日本語版だと駄目とかがあったらすみません)これを使って出力すれば良い。…

Wordが持つ引用文献の管理機能よりZoteroの機能を使った方がよいかも(メモ)

といっても、そっちもまだ不十分かなぁと思っているが・・・ ちょっとZoteroがどのくらい使えるものかを調べ中です。その中でもWord向けの機能を中心に。 とりあえず、導入するのに難しいところはなかった。Windows以外の環境は知らないが・・・。 niszet.hatenabl…

PandocはZoteroでWordに埋め込んだ引用文献情報をnative pandoc citationsに変換できる(Pandoc 2.18~)

出力時に欲しいんだけど、外部コマンド使うのでPandocとしてはNGなんだよね。 ということで、今欲しい物の逆である、Word中にZoteroの機能で埋め込んだ引用文献情報をPandocの内部データ構造としてPandocが扱えるようになったようです。MS Wordのネイティブ…

Wordで引用文献の書式を設定するためにはxmlファイルを直接いじらないといけないのか?(メモ)

U.N.オーエンは彼女なのか?的なタイトルですね。 私は蓬莱人形のキーのバージョンも好き。 さて、Wordで引用文献を管理できることは把握しましたが、これを所望の形で表記するための方法(CSL的な奴)はないものか・・・と色々しらべていたんですが、Word本体…

ZoteroのWordアドインの中身を見ていく(メモ)

何やってんですかね・・・ Wordの引用文献の管理をもうちょっと理解したいので、寄り道でZoteroを調べています。WordのZoteroアドインは実体としてはZotero.dotmというファイルで、C:\Users\ユーザ名\AppData\Roaming\Microsoft\Word\STARTUP\Zotero.dotmにある…

WordのZoteroアドインはZoteroをインストールしたら勝手に入った模様(メモ)

作業メモ 文献管理ツールのZoteroはWordのアドインを持っているということで、調べてみるとインストールに難ありなのかな?という記事が見つかったのですが、実際にやってみると下記のページでダウンロードしてインストールしただけで、WordにZoteroのアドイ…

Wordには引用文献の管理の機能があるが、これはPandocで生成したdocxでは使われていない(メモ)

Wordの機能ってWordでしか使えないのが不便だよね タイトルのままです。PandocはCiteやCitationについて変換する機能を持っていますが、一方でWordにおける文献の管理は内部的にはWord固有のデータを使い、表示にフィールド(とフィールドコード)を使用して…

(Pandoc) docx出力の脚注の区切り文字をテンプレートから反映させる修正をしています。

マージされたら褒めてくれ。 issueはこれ。 github.com そういえば、テンプレートから反映されないなコレ…ってことでここ2-3日うにょうにょHaskell書いてPRを投げました。 github.com さてどうなるかなー… 今回のことでまた理解が深まったので、ODT形式の方…

(Word)脚注の区切り線は色々とカスタマイズできる

いらん知識な気はするが…。 現在、Pandocの脚注の区切り線をテンプレートから持ってこれるように更新をしています。それをどこまでやればよいのかを検討するために調べていたら思った以上に色々設定できることが分かったのでメモを残しておきます。 脚注の区…

(Pandoc) VerbatimChar文字スタイルはスタイル一覧に表示されないが、これはSourceCode段落スタイルのリンクスタイルなのであった。

linkスタイル死すべし慈悲はない 以前からPandocのdocxのスタイルについて調べていましたが、最近はHaskellのコードも読んでいるので以前よりもさらにわかってきました。 以前… niszet.hatenablog.com いつかちゃんとまとめたいですね…。 でもそれは大変なの…

(Pandoc) MS Word (docx) 出力でも --number-sections オプションに対応している(メモ)

仕様を追い切れていないが…。 Pandoc 2.10.1 から docx の出力で --number-sections オプションがサポートされました。 これをodtにも入れたいなぁと思ってコードを見ていましたが、Writerにべったり依存なのでコードをかなり追わないといけないなということ…

RMarkdownでODT形式で出力してもRStudioはMS Wordで開こうとしてくる…

どういうことなの…? RStudioはKnit後に出力されたファイルを自動で開いてくれます。コレは確かに便利なんですが、開いてほしくないときもアリ、これは制御できるようにしてほしいなぁと思う点ではあります。 さて、掲題の件です。問題は、odt_documentで生…

(OOXML/Word)w:themeFillTint とか w:themeFillShade とか(メモ)

現れたり消えたりするタグ theme系の情報の取得はちょっと癖がありますね。ついこの間テーマ色を使った方が良いと書いたとはいえ…。 テーマの色は、こんな感じで色選択で出てくるときに上の方に出てくる色のことを指しています。 で、縦方向に段々と色が濃く…

(OOXML/MS Word)各項目で取り得る値の対応を見る(メモ)

MS Word上で値を変更して、xmlから値を引き抜いてきて表示値との対応表を作る簡単なお仕事 各項目ごとにまとめないといけないのでキリがありませんね、これ。 でも、やっていきです。今はpPr下のshdの値をまとめています。特徴的な名前なのでどこかに定義済…

(Word/OOXML)Wordはテーマの色を使うと便利そう。テーマ色の内部での値について。

テーマを変更するだけで同じ設定した箇所は一括で変更されるので。 OOXMLの解析をしています。OOXMLのタグ構造は何かしらの資料で見ればいいものの、実際に何が値として設定されているかは実際に作ってみてみないとわからないなーという感じなのです(何か方…

(OOXML)w:pPr/w:spacingのw:beforeは表示値の20倍の値(メモ)

大きすぎませんかね…? 段落スタイルで、段落の前後にスペースを取ることができます。この値はMS Word上での表示値の20倍の値になっています。480が入っていたら24ptということです。 これも実際に動かしてみないとよくわかりませんね…。

(ooxml)w:sz の値はMS Word上の文字サイズ(pt)の2倍の数字が入っている(メモ)

こちらもメモレベルの話。 Wordがどのようにooxmlを解釈しているかはooxmlを直接書き換えて結果がどうなるかを見ていく必要がある。ドキュメント化されているものもあるだろうが、探すよりも見たほうが早い。xmlとしては箱の形は決まっているが、値をどのよ…

(R)ooxmlでxml2::xml_set_attrする場合はw:をつける(メモ)

私的メモがしばらく続きますが… ooxmlで書かれたdocxファイルのスタイルの一括修正が面倒なのでRでやろうと思ってコードを書いています。基本的にはxml2パッケージを使う。あとはofficerの関数を一部使わせてもらう形(処理そのものはofficerと異なるので全…

(Pandoc)Wordのスタイルでbold/italicを指定した場合に、明示的にoff出来ない件のPR

ようやくPandocのIssueウォッチが出来るようになってきた…(?) 最近追いかけているIssueがコレ。 github.com Pandocのdocxに関する質問は、MLやIssueで見かけてわかるものはコメントをしたりしています。直接問題解決には至ってないので実力が足りませんが…

(Word)Wordからpdfをエクスポートすると画像の解像度が落ちる問題

仕様? 小ネタです。Wordは手軽にpdfに変換できて良いですね。ツールバーの「ファイル」から、「エクスポート」、「PDF/XPSの作成」でpdfの作成ができます。 しかし、問題が少なくとも1つあり、画像の解像度が落ちてしまいます。今回は画像形式としてpngを使…

(Pandoc) docx -> md への逆変換のメモ。メタデータについて

メタデータに関して PandocによるMarkdownからdocxへの変換は、Titleなどのドキュメントの見た目やooxml中で定義されているタグがあるような項目だけでなく、任意のメタデータを出力ファイルに入れることが可能です。たとえば、RMarkdownで出力した場合はout…

(Pandoc) docx -> md への逆変換のメモ(4回目)

コード周りは一旦これでおしまい。 さて、前回はテンプレートファイルに"Source Code R"のようなスタイルを追加し、CodeBlockはその外側にこのスタイルを持ったDivを配置することで、生成されたdocxの見た目に影響なく、元となった言語情報を保存することを…

(Pandoc) docx -> md への逆変換のメモ(3回目)

まずはdocxにする際に細工をする。 さて、前回の考察の結果として、docx生成時にCodeBlockの言語情報が失われているので再生しようがないため、docx生成時になんとか情報を残す方法を考えねばならぬことがわかりました。 やろうと思えば色々とデータをdocxフ…