niszetの日記

細かい情報を載せていくブログ

Pandoc

RStudio IDE 2022.07.2の時点ではExample Listがある場合にVisual Editorが警告を出す

今見つけたのでメモを残す。 RStudio IDEのVisual Editor、便利なので普通のMarkdownを書くときでもつかいはじめています。みなさんはどうですか?参考/引用文献の管理とか便利なので、そのためだけでも使うといいんじゃないかと思ってます。 さて、掲題の通…

ブログ記事もZoteroで引用文献に追加して管理しておく(メモ)

整備するのが大変・・・ Zotero上で文献を追加する際にブログ記事として追加することが出来そうです これをR MarkdownのInsert Citationで追加した場合、拡張子bibではこれがブログ記事由来である情報は消えてしまいますが、CSL-YAMLやCSL-JSONであれば、この情…

RStudioのVisual EditorのInsert CitationでZoteroから文献情報を入れるときはCitation Keyの被りに注意(メモ)

現時点の挙動から確認。 RStudio IDEでVisual EditorのモードではCitationの挿入が簡単にできるようになっている。このうち、Zoteroから文献情報を持ってくるときに注意しないといけないのが、一度Zoteroの文献情報を見に行くとCitation KeyをZotero側で修正…

引用文献のスタイルを指定したPandocでの変換は可能ぽい(メモ)

単純な話だった。 Pandocは--csl=FILEの形式でCSLを与えることが出来る。そのため、単純に出力ファイルでの引用文献の体裁がCSLに定義されていれば(かつciteprocがちゃんと動けば。日本語版だと駄目とかがあったらすみません)これを使って出力すれば良い。…

rmarkdownではYAMLにbibliographyがあるとciteprocが有効になるようだな(メモ)

逆にdisableにする--no-citeprocはなかった。 タイトルに書いた通り。ZoteroのBBTを使う際、citeprocが悪さをしないように…ということでこれをdisableにしようと思ってちょっと調べたが、現時点のrmarkdownはYAML中にbibliographyがあるとciteprocを有効にす…

PandocはZoteroでWordに埋め込んだ引用文献情報をnative pandoc citationsに変換できる(Pandoc 2.18~)

出力時に欲しいんだけど、外部コマンド使うのでPandocとしてはNGなんだよね。 ということで、今欲しい物の逆である、Word中にZoteroの機能で埋め込んだ引用文献情報をPandocの内部データ構造としてPandocが扱えるようになったようです。MS Wordのネイティブ…

Wordには引用文献の管理の機能があるが、これはPandocで生成したdocxでは使われていない(メモ)

Wordの機能ってWordでしか使えないのが不便だよね タイトルのままです。PandocはCiteやCitationについて変換する機能を持っていますが、一方でWordにおける文献の管理は内部的にはWord固有のデータを使い、表示にフィールド(とフィールドコード)を使用して…

(Pandoc)PowerPointのソースコードのフォントをmonofont変数で指定できる

結構前から出来ますが。 マニュアルの対応する箇所はこちら。 pandoc.org 他の形式にもあるのですが、変数を設定することによって出力を制御できます。PowerPointは現在はmonofontだけのようですが、これを使うとスライド中のコードのフォントを指定すること…

(Pandoc) PowerPointに背景画像を使える

使用するテンプレートのスライドマスターに背景画像をセットしておこう 以前から使えたような気もしますが、最近のPandocの話だけじゃなくても良いので書いておきます。 マニュアルの対応する箇所はこちら。 pandoc.org reveal.js, beamer, and pptxとあるよ…

(Pandoc) PowerPointで選択できるレイアウトが7つに増えています。

意図したスライドにするの難しい。 これも最近の機能増強で出来るようになりましたが、Pandocで選べるレイアウトが増えています。 pandoc.org 以下抜粋。 When creating slides, the pptx writer chooses from a number of pre-defined layouts, based on th…

(Pandoc)PowerPoint出力でインクリメンタルリストが実装されていた

ずいぶん前に・・・ 別件の調べごとをしていたら見つけました。commit自体は結構前になっていたようです。 github.com インクリメンタルリストについてはマニュアルの、このあたりになります。 pandoc.org 地味ですが、役に立つ人も居るかも知れないので、一応…

(Pandoc)--no-highlightオプションは--highlight-styleオプションを打ち消せない

明記されていないが仕様と思われる。 横着して、pandoc_argsでno-highlightを指定したらhighlightが残っていて気付いた。Pandocは--no-highlightと--highlight-styleを同時に使用すると、highlight-styleの方が勝つようである。そのため、明示的に--no-highl…

(R)(Pandoc)revealjsでpluginを使う場合はself-containedをfalseにして使う理由

対策、対応できなくはないけどとてつもなく面倒くさいのでやらない。 色々調べてにっちもさっちもなのでメモ。 revealjsパッケージやrmarkdownパッケージ、その大本のPandocの仕様として、htmlなどのファイル形式に出力するときに使用するファイル、例えば画…

(Pandoc)revealjsのテンプレートに含まれる変数の一覧(仮)

-t revealjsの場合はhtml writerにrevealjsテンプレートを食わせているだけのはず ということで、ひとまずデフォルトのテンプレートから、使われている変数を目の子で引き抜いてきた。足りていないものがあるかもしれない。 Pandoc 2.14.0.3のものである。あ…

(R)revealjsパッケージが古い

CRANにあるものは4年前のリリースのもの。 まえがき 久々にPandocのことをやろうと思って。Pandocの変遷はissueを読むと大変なので、取り込まれたPRを見るか、release noteを追うのが良い。今回は後者。 最近はpatchがぽつぽつ出ているが、2.14になったとこ…

(Pandoc) Pandocのtest時に出るエラーメッセージについて(開発者向けメモ)

まずは過去issueを検索しろって言うよね。それね。 Pandoc はstack testでテストが一式走るので、手元でFAILが出ないことを確認してからcommitします(当たり前だ…) が、test時のlogを見るとこんなメッセージが。 Error: Circular defaults file reference …

(Pandoc) ODT Readerでtabが無視される問題の対応をしています

PRは出した。 元になるissueはこれ。 github.com これによると、ODTを入力ファイルとしたときにtabが全部無視されてしまうということでした。 コードを読んで対応する場所がわかったのでいじってたら出来たのでPRを出しました。 github.com 年度末なので(な…

(Pandoc) docx出力の脚注の区切り文字をテンプレートから反映させる修正をしています。

マージされたら褒めてくれ。 issueはこれ。 github.com そういえば、テンプレートから反映されないなコレ…ってことでここ2-3日うにょうにょHaskell書いてPRを投げました。 github.com さてどうなるかなー… 今回のことでまた理解が深まったので、ODT形式の方…

(Pandoc) Pandocでdocxなどのバイナリ形式のファイルのテンプレートを出力するときは>ではなくて-oを使おう

一応書いておく ちょっと前のissueですが、Pandocでテンプレートを出力する--print-default-data-fileを使う際に pandoc --print-default-data-file reference.docx > custom-reference.docxで出力するとファイルが壊れることがあります(下記issue) github…

(Pandoc) Emojiは外部のライブラリに切り出されていた(メモ)

収録している(?)絵文字の数が格段に増えてました 以前Pandocのemojiについて調べていた時は、Pandoc本体に取り込まれていて対応する文字の数も少なかったのですが、下記のcommitで外部のパッケージに切り出されていたようです。 github.com そのライブラ…

(Pandoc) Pandocは脚注の設定をreference.docxから持ってこれない

...と思う。 Pandocのバージョンは2.11.4です。いつの間にこんなにバージョン上がってるの…。 久々にPandocのissueでも見るかーって見た一個目がこれだったので、これをやることにした。 github.com Wordの脚注の線と脚注の文字の間のスペースを詰めたいとい…

Pandocの情報収集、どうする?

遅刻です。 この記事はPandoc Advent Calendar 2020の19日目の記事です。 adventar.org 今回はPandocの情報収集、どうやっていく?というお話です。あんまりまとまりのない記事になりますが…。 マニュアル類 まずは基本から。他のソフトウェアと同様に、まず…

Japan.R で 日本Pandocユーザー会の紹介LTをしてきました

あっさりした内容で申し訳ない…。 12/5のJapan.R 2020で"日本Pandocユーザー会の紹介" というタイトルでLTしてきました。 connpassのページはこちらに、 japanr.connpass.com 資料はこちらにあります。 niszet.github.io 今回は特に変態芸(?)もなく普通に…

(Pandoc) docx 出力の場合、BlockQuote 中の HorizontalRule は別段落になる

コード読んだけどまだよくわかってない。 HRはそもそもBlock要素なんですが、ParaなどのBlock要素は正しくBlockQuote中に取り込まれるので、段落要素であることが原因ではないとはわかっていますが、コード見てもまだよくわかってません。docx形式で出力する…

(Pandoc)Pandoc内では`--to asciidoc`と`--to asciidoctor`が区別されている件

そういえばそんなこともあったわね…。 先の記事に書いた通り、Pandocは拡張子を見ているんですが、asciidoctorにはならないようです。 しかし、この形式たちは内部で差異があり、出力ファイルの文法が異なるので注意です。ていうかasciidoctorの方が標準でい…

(Pandoc)Pandocはファイルの拡張子を見ている

でも明示されていなくない? いつものことデスね…。 対応するコードはここにあります。 github.com で、変換対応を抜粋。以下が対応関係になっています。なお、docとpdfの拡張子はサポート外なので、エラーとなります。また、--toや--fromを指定していればそ…

(Pandoc)2.11が出ましたね!

一応書いておこうかなと。 ずっとリリース待ってたんですが、(日本時間の)深夜になるとは読みが浅かったけど、リリース直後に反応できたので、ヨシ! 今回の一番大きな変更は、citeprocのPandoc内部への取り込みでしょう。今まではフィルタで動いていたも…

(Pandoc)出力ファイルのチェックをするならテストに使っているファイルを使うのが一番。

そらそうだ。 PandocもCI使ってテストをしています。手元でもstack testとかでテストできますけどね。 この際に使っているファイルがコレ。native形式で書かれているので、native parserがしくじってなければ、コレが一番Readerに依存しない形ですね。賢い。…

(Pandoc) VerbatimChar文字スタイルはスタイル一覧に表示されないが、これはSourceCode段落スタイルのリンクスタイルなのであった。

linkスタイル死すべし慈悲はない 以前からPandocのdocxのスタイルについて調べていましたが、最近はHaskellのコードも読んでいるので以前よりもさらにわかってきました。 以前… niszet.hatenablog.com いつかちゃんとまとめたいですね…。 でもそれは大変なの…

(Pandoc)OpenDocument形式出力でsyntax highlightingを(ただしインラインCodeかつODTではない)

簡単とは思っていなかったけどやっぱり大変…。 ODT形式の出力はシンタックスハイライトに対応できていません。そのため、これに対応するべくPandocの修正を試みています。 とりあえずissue建てた。 github.com PRを1個出していて、これはOpenDocument形式で…