2020-09-01から1ヶ月間の記事一覧
修正は2行だけ Pandocの、ODT形式での出力をdocx形式での出力と同程度のコトが出来るようにしたく、調査等をしています。 とりあえず手が付けられそうなtoc-depthの修正を試みました。 修正自体は2行だけなのですが、PR出すのは初めてなので色々手間取りまし…
見落としていた… ODT Writerに関するPRを投げるために、CONTRIBUTINGのページを見ていたのですが、そこの最後の方にPandoc のソースコードの各ファイルについて簡単な説明が書いてありました。 pandoc.org 最初に概観するときに知っておきたかった…。 まぁ今…
仕様を追い切れていないが…。 Pandoc 2.10.1 から docx の出力で --number-sections オプションがサポートされました。 これをodtにも入れたいなぁと思ってコードを見ていましたが、Writerにべったり依存なのでコードをかなり追わないといけないなということ…
検討中の話…。 docxはMS Word上で結合できます。リンク形式にする場合は下記のページの説明が分かりやすいです。 www.koikikukan.com これをunzipして見てみると、_relsに実際のファイル名を入れているため、word/document.xml単体では処理できないので、Pan…
簡単なことだったね(?) Pandocは日々進化しています。自分が使うファイル形式の更新はなくてもそれ以外の形式に対しては後進が入っていたりするので、マニュアルは日々更新されて行きます。 これを、releaseのたびに見ていくと大変なんですが、よくよく考…
CRANから落ちてしまったらどうしようかねコレ…。 先日、色々見ていたら気づいたのですが、captionerパッケージがArchivedになっていました。 github.com ので、さっそくFork... github.com このパッケージはRMarkdownでWord文書を作ろうのときに使っていたの…
という気付きが結構前にあったらしい… 下書きのまま放置していたので、忘れてしまわないうちに書く。 stylexパッケージ、docxのstyleをR上で加工しやすくしようと思って作っていたのですが、docxファイルを記述しているOOXMLは、w:nameのようにw:のnamespace…
考えてみれば当たり前なんだけども… こちらの記事とまったく同じモチベーションで、エラーメッセージを英語にして報告したいな、と。 dichika.hateblo.jp で、これを設定すると以降は英語でエラーメッセージが出てきて便利。 Sys.setlocale("LC_CTYPE","Engl…
読み解くの大変っす…。 Pandocのシンタックスハイライトはskylightingが担っています。これはPandoc内に埋め込まれているので、フィルタ等で制御できる奴ではないです。 github.com で、Pandocは特定の出力形式にのみハイライト対応しています。 Currently h…
先人に感謝… ODT形式について調べていると、Wordのそれに比べるとすべてがスタイルで作られている、という設計思想が垣間見えるのでLibreOffice関係でスタイル関係の資料がないか検索したところ、いくつか良い資料が見つかったのでここにまとめておきます。…
ODT出力の場合に出来ることがどこまであるかを全部チェックしていく 他のファイル形式の出力と同様に、PandocでODT形式で出力する場合にも、generic-raw-attributeを使用して出力ファイルに直接文字列を埋め込むようなことが可能です。これは対象のファイル…
マニュアルに書いてあるけど実際やってみてダメなのを確認。 docx出力では出来るがODT出力ではできないことのひとつに、シンタックスハイライトの対応があります。ODT出力では未対応。 マニュアルのシンタックスハイライトの箇所、 pandoc.org より引用。対…
段々わかってきましたね…。 ODT形式は基本的に全てスタイルでやってしまおうという感じがありますが、改ページも改ページを指定したスタイルを使うことで実現しているようです。 PandocのpagebreakのLuaフィルタを使うことで、改ページを簡単に挿入できるこ…
根本的な解決をまだしていない…。 LibreOffice6.0のころから、下記のページにあるようにODTファイルをunzipしてzipしなおすとLOWで開けないよ~という話があったようです。 ask.libreoffice.org これは、ドキュメント内のmimetypeというファイルがStoreで他…
対処法?があるかは確認中ですが…。 docx形式の場合、目次はフィールドコードが入ってます。一部抜粋するとこういうタグが…。 <w:fldChar w:fldCharType="begin" w:dirty="true" /> <w:instrText xml:space="preserve">TOC \o "1-3" \h \z \u</w:instrText> <w:fldChar w:fldCharType="separate" /> <w:fldChar w:fldCharType="end" /> ODT形式の場合は全てがstyleになっているようです。値はひょっ…</w:fldchar></w:fldchar></w:fldchar>
先月は読書量は増えたが、手を動かす時間が減っていたので今月は手を動かす方を重視したい。 今月は忘れずに目標を立てる。 技術同人誌 ODTについて書く。RMarkdownでODTを作ろう、かな? docxについて書く。スタイルを設定して書く、という話。 Rのパッケー…
とりあえずわかるところを増やしていく。 今日読んでいるのはコレ。 github.com コレはreference.docxなどのテンプレート(正確にはtemplateは別にあるので、referenceと呼んだ方が良さそうだが)を作るためのHaskellのコード。 これは単体で実行できる(mai…
各ファイル形式に対応している。 Pandocは、内部的にはファイルを読み込むReaderと書き出すWriterに機能が分けられており、Readerで読んだ文書は内部的にはPandoc's ASTというPandocが扱いやすくするためのデータ構造に一旦データを持ち直します。この中間デ…
目標も立てずに…? 8月は目標を立てるのを放置していましたが、結果だけは振り返ります。 今月は暑かったものの、先月に比べればやりやすかった。低気圧による頭痛がなかったので。 今月は自分の身の回りのことを結構やらねばならなかったのであまり本を読ん…