2019-10-24

(Pandoc) docx出力のテンプレートにある透かしはそのまま出力される（メモ）

Pandoc

一応確認できたのでメモだけ。

Wordファイル形式で出力する必要がある場合、テンプレートが準備されていることが多いのではと思います。

その際、透かしが入っているものが使えるのか？を今まで調べていなかったのですが、ちゃんと使えることを確認できたのでメモとして残しておきます。ただし、透かしにはフィールドコードをいれることが出来ないので、透かしの文字を変える必要があるならばその都度テンプレートのファイルを修正する必要があるので注意です。

ちゃんと意図したものになっているかは目視で確認した方が良いですね。ヘッダやフッタはフィールドコードが入れられたと思うので、リビジョン等はそれで管理できるわけですが…悩ましい。

2019-10-22

(Pandoc) 次のバージョンは2.8になりそう（メモ）

Pandoc

手元ビルドして気づいた。

Pandocはたまにマイルストーンが示されているのですが、そこを見るとバージョン番号が2.8に変わっています。

github.com

今回、かなり大きく変更が入っているので、納得感ありますが。残件10個。まだまだかかりそうですが…

何かしら貢献できるようになりたいなぁと思う次第です…

2019-10-21

(Pandoc) Luaフィルタを書くときはコンストラクタの定義順に気を付ける（メモ）

Pandoc Lua

Luaフィルタのマニュアルではわかりづらいのですが…

前回の記事でLuaのフィルタを書いていて実際に自分がハマったのでメモ。

Luaフィルタのマニュアルには各要素（BlockとかInlineとかのアレ。適切な訳語わからず）について、「Lua type reference」と「Module pandoc」2か所にわけて書かれています。前者が各要素が持つプロパティに相当するもの（これもなんていえばいいんだろう）とその説明。後者はモジュールに含まれている各要素のコンストラクタとしての使い方になります。

ここで、前の方に書かれている各要素の説明の順序とコンストラクタで定義するときの順序は異なります。これを間違えてもPandocはエラーを出さないことがあるので注意です。nilを与えるとエラーになったりするのですが…。正確な挙動は今ちょっとよくわからん…。

pandoc.org

Luaフィルタのマニュアルの読み方をまとめた方が良いかもしれないですねぇ…ダレカカイテ

2019-10-19

(Pandoc) CodeをSpanに置き換えてスタイルをあてるLua filter

Lua Pandoc

ただし、custom-styleがない場合はそのまま出力する。

Codeに対してもattributeをあてられるので、idとかclassとかattributesをつけられるので、こんな感じで、標準入力からpandocに送ってみる。今回使うのはcustom-styleのみだけども、idとかで処理を追加することも当然できる。

echo `r hoge`{.hoge .fuga #piyo poke=1.234 custom-style="ErrorTok"} `fuga` | pandoc  -f markdown -t docx --lua-filter code2span.lua -o test.docx

ここで、Luaフィルタはこんな感じで書けばよい。custom-styleを持つ場合のみSpanに置き換える。それ以外は何もせずに返す。

function Code (s)
  for k, v in pairs(s.attr.attributes) do
    if k == "custom-style" then
      x = pandoc.Span(s.text, s.attr)
      return x
    end
  end
  return s
end

出力はこんな感じ。

f:id:niszet:20191019221608p:plain

ErrorTokはコードハイライト時のエラー部分のテキストにあてられるスタイル。

自分以外に使い道ある人いなそうですが、備忘録として。

Enjoy!!

2019-10-01

(Pandoc) Jira Writerを読む（自分用メモ）

Pandoc Haskell

これが一番シンプルなのでは？と思ったので。

docxは仕様が複雑なので、もっと簡単なファイルフォーマットでReader/Writerを学ぼうと思ったところ、最近追加されたJiraのWriterがわかりやすそうだったのでこれにした。Readerはまだない。

たぶん、ほかのtext系のファイルフォーマットでも良いと思う。docxみたいなバイナリ（といっても実態はxmlだが）を読むのはやめよう。あれは沼。あれは闇。あれは全てを飲み込む狂気の形式。。。

JiraのWriterのコードはここにある。

github.com

これを読む前に、Pandoc's native ASTについてはある程度理解している必要がある。ここでは説明しない。

あと、Haskellの基本的な文法もある程度さらっている必要がある。具体的な処理がわからなくても、モナドってなんだっけ…もにゃもにゃ…くらいのことはわかってないと当然読めない。これもここでは説明しない。なぜなら説明できるほどわからないから。

というわけで、多分間違ってる箇所があるのだが、Haskellは難しいしPandocのコードは長いしで、ちゃんと理解してから書こうとするといつまでも書けないのでとりあえず、読んだ記録ぐらいのつもりで書く。なので、あまり参考にならないししないでくださいな。

module Text.Pandoc.Writers.Jira ( writeJira ) where ... から、このモジュールからはwriteJiraだけが外に出ていることがわかる。つまり、ほかの関数は中で自由にしている。ただし、ほかのファイルを読むと同名の関数が定義されていたりするので、必要な処理はどの形式でもおおむねかわらないのではということがなんとなーく見れる。

肝心のwriteJiraはこんな感じの定義。

writeJira :: PandocMonad m => WriterOptions -> Pandoc -> m Text
writeJira opts document =
  evalStateT (pandocToJira opts document) startState

WriterOptions と Pandoc を受け取っているが、PandocはLuaで扱ったとき、documentのtop階層だったはずなので、たぶんそれ。実体もdocumentってなってるので多分。ここで、Textは import Data.Text (Text, pack) のTextだろう。

で、pandocToJiraは直後に定義がある。

pandocToJira :: PandocMonad m
             => WriterOptions -> Pandoc -> JiraWriter m Text

ここで、JiraWriterは

type JiraWriter = StateT WriterState

とあって、

data WriterState = WriterState
  { stNotes     :: [Text]      -- Footnotes
  , stListLevel :: Text        -- String at beginning of list items, e.g. "**"
  }

とあるので、状態を持ちながら、Writerのオプションと文書を受け取ってPandocMonad Textを返している、というなる、のかな？ということは、ファイルへの書き出しはここではしておらず、あくまでPandoc's ASTをうけとって、Jiraの形式に変換して返しているのだろうということになりますね。

他に、escapeCharForJira :: Char -> TextとescapeStringForJira :: Text -> Textから、エスケープするべき文字を変換していることがわかり、メインの変換処理はblockToJira、blockListToJira、inlineListToJira、inlineToJiraで行っていて、Listの入っているものはmapMでListなしの関数を呼び出して処理、それぞれの処理は要素毎に定義してある、ということが見て取れる。つまり、Pandoc's ASTのすべての型に対して、blockToJiraとinlineToJiraの処理を書き、それのList版を書き…とやっていけばよいということがわかる。

あとは補助関数っぽいので、これらはフォーマットごとに違うだろう。

あとはstateがどのようにふるまっているのかが追い切れていないのでいずれ読む…のと、個別の関数の挙動が(Haskellの理解が浅いために）把握しきれていないので、これを順次追いかけていく予定…。

ということで、Pandoc's ASTを把握したら次はWriterを見てみるのが良さそう、という考えは良さそうです。

概略がわかれば、あとはひとつひとつ追っていけばよいので気が楽ですね（楽ではない）

という、メモでした。

2019-09-22

技術書典7で入手した技術同人誌の感想置き場

恒例の。

まぁもはやどのタイミングで入手したのかわからなくなってきましたけどね。

1～

綿を育てて布を作る。【栽培編】～明日から始める綿栽培～読了。技術書典では少数派のレトロ技術系の、綿から布を作る本の前半の育てる部分。意識したことなかったけど思ったより育成条件が難しそう…。初めて作ったってあるけどいきなり耕運機で耕した写真で笑った。ガチでは？ #技術書典 #技術書典7
— niszet⋈ (@niszet0) September 22, 2019

綿を育てて布を作る。【紡糸編】～ワタから糸へ～読了。前作の続き、綿から布を作る話。これもノウハウが結構ありそう。玉にならないようにするのが難しそうだなと。現地では実際に編んだものもあって、ちゃんと？布になってました。手間かかって大変そうだけど面白そうですね #技術書典 #技術書典7
— niszet⋈ (@niszet0) September 22, 2019

はじめてのケーブル・ハーネスの作り方読了。ありそうでなかったケーブルとハーネスの技術同人誌。ロボ屋さんが書いただけあって、ロボ用の場合はといった補足説明がある。読んでみて自分はあまりこのあたり知らないんだなと全体を見渡せてよかった。表紙のイラストがかわいい #技術書典 #技術書典7
— niszet⋈ (@niszet0) September 28, 2019

エンジニアのための日本語文章テクニック読了。本書では読みやすい=流し読みが出来る、と定義していて、読点や漢字の開きについて説明している。読点は自分が普段気にしているところと大体同じかな。私も、気を抜くとくどい文章にしがちなので、意識して読みやすい文章にしていきたい… #技術書典
— niszet⋈ (@niszet0) September 29, 2019

ハマって覚えるデータ分析・機械学習の罠読了。機械学習を実際の業務で使う際にはまりそうな例を個人レベルやチームで結果を共有する際などに気を付けないといけないことまで、具体的な例とともに簡潔にまとまっている。失敗事例を事前に知ることで回避できるもの、沢山ありそうですね #技術書典
— niszet⋈ (@niszet0) October 3, 2019

台湾西部の駅チカ電子パーツ店を縦走してみた Vol.1 読了。このシリーズ、ついに自ら電子パーツ店を探して1日かけて台湾を回りはじめた…。下調べして行ってみるも電子パーツ店ではなかったり、やっていきがすごい。台湾は結構電子パーツ店がある印象ですね。毎回写真が綺麗だなって思います #技術書典
— niszet⋈ (@niszet0) October 4, 2019

ゼロから作るBLEデバイス nRFマイコンとSEGGER Embedded Studioでやってみた！読了。開発環境が良好でサンプルコードが多いと敷居が低そうな印象ですが、はまりどころが随所にあるらしくそれらもまとめられてて、ひとまずこれを読みつつ手を動かしてみると色々出来そう。やってみようかな… #技術書典
— niszet⋈ (@niszet0) October 4, 2019

無水アルコールの美味しい飲み方読了。無水アルコールは本当に飲めないのかをいろんな方面から調べてて面白い。本書では無水アルコールを飲むことを勧めているわけではないですが、なぜかカクテルのレシピが載っている。興味深い。無水アルコールを取り巻く法律に詳しくなってしまった…。 #技術書典
— niszet⋈ (@niszet0) October 4, 2019

Nutanix CEの一般的な機材を考察する読了。それほど逸般ではなかった…と思ったけど自宅サーバの時点で、ですね。各パーツ選びの指針を著者の経験を交えて解説している。Nutanix自体も便利そうな印象ですが、私にはちょっとまだ早いかな…。改訂して厚くしたいとあとがきにもあり、期待。 #技術書典
— niszet⋈ (@niszet0) October 4, 2019

泥臭い組込みの話読了。タイトル通り泥臭い話がメインで、異常系やデバッグ、ワークアラウンドの話など。実製品だと正常系、普通に動くのは当たり前で、想定外の動作をどこまで考えられるのかをコスパも考えて実装できるかは大事ですが、一般書籍ではあまり触れられない話なので参考になる #技術書典
— niszet⋈ (@niszet0) October 6, 2019

11～

2019-09-22

技術書典7に一般参加してきました。

技術書典

久々の一般参加です。

前回、前々回はサークル参加だったので、一般参加は1年以上ぶりになります。今回は初の会場が2フロアあるという今までで一番大きな回となってました。

私は11時からのチケットを購入して、10:50～くらいに並びましたが入れたのは11:30くらいで、40分くらい並んだことになりますね。今日は日差しが強く（昨日に比べ）、日向にいると結構厳しいのですが、待機列は日影となる場所にいる時間が長かったのでそこまで大変ではなかったです。夏コミのときもそうだけど、何かしら日差しを遮るものが必要ですね。コミケだと待機列で日傘NGでしたが、今回は特に注意されていないようでした。私はとりあえずタオルをあたまにかけてました。見栄えより機能重視ということで。

戦利品はなんか60cmくらいあるんですが、まぁそれはいつも通りなので良いかな。

今回、フロアが分かれていてジャンルが分かれていた関係で主に2階で色々物色しました。毎回、前日にサークルチェックしていくのですが、それでも当日見つけられなかったり、抜けてたり、軍資金が足りなかったり体力がなくなったりで思った通りには行かないのですが、それでも大部分を入手できたので良かったです。読もう。もう2冊読んだけど。まだまだたくさんある。感想はまた別の記事にします（Twitterの投稿を張り付けるだけ）

やはりフロアをまたぐ運用は混乱がちょっとあったようで、どこから2F<->3Fへ抜けるのかはぱっと見ではわからなかったかもですね。あと、3Fに行く列が結構並んでてそれが精神的にブレーキになったかもしれないですが、実際はサクサク移動できたので、あれは待機列をあまり伸ばさずに、すぐに行けると思わせる方が良かったかもしれないですね。いやそもそもあそこで移動とわかってない人はいたみたいなんだけど。ただ、導線を考えると今回の動き方は良かったと思うので、次回以降またよくなるんじゃないかな。技術書典は毎回良くなっていくってイメージが持てるのはよいですね。それ以上に規模が拡大しているのだけど。

混雑度は、やはり2F入り口がちょっと混雑し気味で、うまく流れにくい感じがありましたね。なので、一旦そこを抜けてしまうと戻るのが難しい…。トートバックを最後に買う力がなかった…。

それ以外は結構制御された混雑だったので、そんなに混乱はなかったのでは。アナウンスはあまり聞き取れなかったかなぁ。まぁ難しいっすね…。

あと、後払いのやつは前日にでもアカウント作っておかないとダメっすね…。今回、後払いのみのところで購入できなかった…。痛恨のミス…。まぁ、電子版とかもあるのでそこに期待しよう…。

最終的に15:30くらいまでいたので、割といろんな知り合いに声をかけることができたのが良かったですね。とはいっても混んでる間はあまり話せないので、それが出来たのは14時以降かな…。あまり長時間滞在できない人は2言3言がせいぜいか。まぁこれも規模で決まってしまうからなぁ…。

さて、今回はサークル参加見送ってしまいましたが、今回またやる気をチャージしたので次回、チャンスがあればサークル参加で臨みたいですね。今回もとても楽しかったです。

niszetの日記

細かい情報を載せていくブログ