niszetの日記

アナログCMOS系雑用エンジニアが頑張る備忘録系日記

(R)captionerパッケージがArchivedになっていたのでForkしておいた(メモ)

R

CRANから落ちてしまったらどうしようかねコレ…。 先日、色々見ていたら気づいたのですが、captionerパッケージがArchivedになっていました。 github.com ので、さっそくFork... github.com このパッケージはRMarkdownでWord文書を作ろうのときに使っていたの…

(R/OOXML)namespaceがないとw:を入れられない…

という気付きが結構前にあったらしい… 下書きのまま放置していたので、忘れてしまわないうちに書く。 stylexパッケージ、docxのstyleをR上で加工しやすくしようと思って作っていたのですが、docxファイルを記述しているOOXMLは、w:nameのようにw:のnamespace…

(R)Localeを英語設定に変更すると日本語を扱うとabortするので注意…(メモ)

R

考えてみれば当たり前なんだけども… こちらの記事とまったく同じモチベーションで、エラーメッセージを英語にして報告したいな、と。 dichika.hateblo.jp で、これを設定すると以降は英語でエラーメッセージが出てきて便利。 Sys.setlocale("LC_CTYPE","Engl…

(Pandoc)PandocのシンタックスハイライトはWriter依存

読み解くの大変っす…。 Pandocのシンタックスハイライトはskylightingが担っています。これはPandoc内に埋め込まれているので、フィルタ等で制御できる奴ではないです。 github.com で、Pandocは特定の出力形式にのみハイライト対応しています。 Currently h…

LibreOfficeのスタイルに関係する資料が分かりやすそうなので収集中…(メモ)

先人に感謝… ODT形式について調べていると、Wordのそれに比べるとすべてがスタイルで作られている、という設計思想が垣間見えるのでLibreOffice関係でスタイル関係の資料がないか検索したところ、いくつか良い資料が見つかったのでここにまとめておきます。…

(Pandoc)ODT形式での出力はraw記法もフォローしているのでやりたいことが大体出来る

ODT出力の場合に出来ることがどこまであるかを全部チェックしていく 他のファイル形式の出力と同様に、PandocでODT形式で出力する場合にも、generic-raw-attributeを使用して出力ファイルに直接文字列を埋め込むようなことが可能です。これは対象のファイル…

(Pandoc)PandocのODT出力はシンタックスハイライト未対応

マニュアルに書いてあるけど実際やってみてダメなのを確認。 docx出力では出来るがODT出力ではできないことのひとつに、シンタックスハイライトの対応があります。ODT出力では未対応。 マニュアルのシンタックスハイライトの箇所、 pandoc.org より引用。対…

(Pandoc)ODT形式は改ページ挿入のためのスタイルの指定が必要。

段々わかってきましたね…。 ODT形式は基本的に全てスタイルでやってしまおうという感じがありますが、改ページも改ページを指定したスタイルを使うことで実現しているようです。 PandocのpagebreakのLuaフィルタを使うことで、改ページを簡単に挿入できるこ…

ODT形式のzipがちょっと特殊なので気を付けること…

根本的な解決をまだしていない…。 LibreOffice6.0のころから、下記のページにあるようにODTファイルをunzipしてzipしなおすとLOWで開けないよ~という話があったようです。 ask.libreoffice.org これは、ドキュメント内のmimetypeというファイルがStoreで他…

PandocのODT形式のTOC出力は「目次と索引の更新」をしないと中身が空になる

対処法?があるかは確認中ですが…。 docx形式の場合、目次はフィールドコードが入ってます。一部抜粋するとこういうタグが…。 <w:fldChar w:fldCharType="begin" w:dirty="true" /> <w:instrText xml:space="preserve">TOC \o &quot;1-3&quot; \h \z \u</w:instrText> <w:fldChar w:fldCharType="separate" /> <w:fldChar w:fldCharType="end" /> ODT形式の場合は全てがstyleになっているようです。値はひょっ…</w:fldchar></w:fldchar></w:fldchar>

9月の目標

先月は読書量は増えたが、手を動かす時間が減っていたので今月は手を動かす方を重視したい。 今月は忘れずに目標を立てる。 技術同人誌 ODTについて書く。RMarkdownでODTを作ろう、かな? docxについて書く。スタイルを設定して書く、という話。 Rのパッケー…

(Haskell)Pandocコード読み: make-reference-files.hs

とりあえずわかるところを増やしていく。 今日読んでいるのはコレ。 github.com コレはreference.docxなどのテンプレート(正確にはtemplateは別にあるので、referenceと呼んだ方が良さそうだが)を作るためのHaskellのコード。 これは単体で実行できる(mai…

いつの間にかrmarkdownでpagebreakのlua filterが使われていたので簡単に紹介する。

各ファイル形式に対応している。 Pandocは、内部的にはファイルを読み込むReaderと書き出すWriterに機能が分けられており、Readerで読んだ文書は内部的にはPandoc's ASTというPandocが扱いやすくするためのデータ構造に一旦データを持ち直します。この中間デ…

8月の振り返り

目標も立てずに…? 8月は目標を立てるのを放置していましたが、結果だけは振り返ります。 今月は暑かったものの、先月に比べればやりやすかった。低気圧による頭痛がなかったので。 今月は自分の身の回りのことを結構やらねばならなかったのであまり本を読ん…

Pandoc 2.10からODT形式の出力でもcustom-styleが使用可能になっていた!

タイトルで言い切ったとおりです。 すっかり見逃していましたが、Pandoc 2.10から(現最新バージョンは2.10.1)docx形式と同様に、odt形式でもcustom-styleの使用が可能となりました。 以下リリースノートからの引用。 OpenDocument (and ODT) writer: Add c…

RMarkdownでODT形式で出力してもRStudioはMS Wordで開こうとしてくる…

どういうことなの…? RStudioはKnit後に出力されたファイルを自動で開いてくれます。コレは確かに便利なんですが、開いてほしくないときもアリ、これは制御できるようにしてほしいなぁと思う点ではあります。 さて、掲題の件です。問題は、odt_documentで生…

RStudioでもodt形式のファイルが出力できる(メモ)

新規作成時の画面には出てこないので自分で書きかえる必要がある点に注意 ちょっとODT(OpenDocument)形式について調べていて、RStudio上から出来たら便利なのになぁ…ないなら作るかぁ…と思ってちょっと調べたらrmarkdownパッケージに含まれていたのでその…

今年は日傘とサングラス装備したら少し楽だった

マスクも装備しているので完全に不審者 割と浸透しつつある気もしますが、今年は長雨からの急に本気の夏の天気となって体が追い付かなかったため、日傘とサングラスを購入して装備していました。 どちらもAmazonで2000円くらいのものなので、すごい性能が良…

(R)connpassのAPIを使って、過去自分が履修したセミナーの一覧をチェックする

R

書きなぐりメモ… 最近は時間があるので色々と受講しているのですが、タイミングがあって気になったものを気ままに受けていたので、どれを受けて受けてないのかが分からなくなってしまったので、じゃあRで確認するか…というのがモチベーションです。 というこ…

(Pandoc)BulletListの探索順序(メモ)

Lua filter特有かもしれないが… Lua filterでBulletListの処理順序を確認するために、下記のようなコードを書いた。 function BulletList(el) print(pandoc.utils.stringify(el)) end 子要素が全部潰されて1つの文字列になってしまうが、そこは目をつぶると…

(Pandoc)BulletListの挙動についてメモ

仕様を理解すれば怖いことはない(はず) なんかタイトルが記事内容とあってないので変えました…。元は Pandoc 2.7以前/以降でBulletListの挙動が異なるので注意 でした。が、実際2.7より前では挙動が違うので、この記事の結果と違う挙動のはずです。 なお、…

(生活)`stylex` パッケージが大体完成したので次のことをやるです

整備はまだ必要 ひとまず、作ろうと思っていた関数は一通り作り、現時点で出来るテストのコードを書き、covrパッケージでテストのカバレッジをチェックし、travisでGitHubにupしたときにテストが走るようになったので、ひとまず形になったかな…という感じで…

(R)xml2のツリー表示(メモ)

R

2種類。 xml2パッケージでタグの構造を見るには、xml2::xml_structure()を使いますが、これはcatしているのでその文字列を再利用できない点が残念。 以前、data.treeパッケージで木構造のデータの表示を確かめていたのでxml2でも出来るはずと思って確認。ち…

(R)Travis CIでRcppに依存したパッケージを使う場合は注意が必要?

R

よくわからないけど動いたのでヨシ! 粛々と進めています。使いにくいので沢山書き直し。テストがあると失敗して警告が出るので安心ですね(テストで見ている範囲は) github.com で、Travis CIもやってみるか…ってことで使ってみたんですが、テスト用のデー…

7月の振り返り

8月ももう2日になってしまいましたが、先月の振り返りをします。 先月はなんだかんだで進捗がほとんどないのですが、これはいろんなものに手を出してしまったため。あと、梅雨時はどうしても体調が悪くなってしまう。この辺りを加味して予定をたてておくべき…

(R)xmlのツリー表示にhtmltidyパッケージが良さそう(メモ)

R

…が、表示できないタグもある…。 stylexパッケージ中ではxml2パッケージを使用してdocx中のxmlファイルを加工しています。標準の設定では存在しないタグが、MS Word上で設定を更新すると現れたりする(w:valの属性値が変わるだけであればいいんですがね…)の…

(R)xml2 のxml_nodeはデータが共有されているので注意が必要…(めも)

R

既にxml_set_attrで使ってるけども…。 xml2パッケージで切り出したnodeオブジェクトは元々のxml_documentのオブジェクトとデータが共有されています。そのため、node側を更新すると元の方も更新される。 そのため、自作の関数で値を更新したnodeとオリジナル…

(OOXML/Word)w:themeFillTint とか w:themeFillShade とか(メモ)

現れたり消えたりするタグ theme系の情報の取得はちょっと癖がありますね。ついこの間テーマ色を使った方が良いと書いたとはいえ…。 テーマの色は、こんな感じで色選択で出てくるときに上の方に出てくる色のことを指しています。 で、縦方向に段々と色が濃く…

(OOXML/MS Word)各項目で取り得る値の対応を見る(メモ)

MS Word上で値を変更して、xmlから値を引き抜いてきて表示値との対応表を作る簡単なお仕事 各項目ごとにまとめないといけないのでキリがありませんね、これ。 でも、やっていきです。今はpPr下のshdの値をまとめています。特徴的な名前なのでどこかに定義済…

(Word/OOXML)Wordはテーマの色を使うと便利そう。テーマ色の内部での値について。

テーマを変更するだけで同じ設定した箇所は一括で変更されるので。 OOXMLの解析をしています。OOXMLのタグ構造は何かしらの資料で見ればいいものの、実際に何が値として設定されているかは実際に作ってみてみないとわからないなーという感じなのです(何か方…