niszetの日記

アナログCMOS系雑用エンジニアが頑張る備忘録系日記

このブログについて

ライセンスを明記するだけの記事。 このブログは別に注記がない場合、文章、画像、コードについてはクリエイティブ・コモンズ・ライセンス(CC-BY-SA)で公開されています。 明記していなかったので書きました(2021/1/14)

(雑記)R MarkdownでWord文書を作ろうを自宅発送に切り替えてBoothに置いています

今更の告知。 年明けくらいだったか、Boothの自宅から発送で送るのでも問題なく送れることに気づいた?ので、対応しました。 ただ、倉庫から発送でウォッチしていた方には通知が行かないと思うのでどうしたものか…。ということで今更ながら告知です。 こちら…

(Pandoc) Pandocのtest時に出るエラーメッセージについて(開発者向けメモ)

まずは過去issueを検索しろって言うよね。それね。 Pandoc はstack testでテストが一式走るので、手元でFAILが出ないことを確認してからcommitします(当たり前だ…) が、test時のlogを見るとこんなメッセージが。 Error: Circular defaults file reference …

明日から放送大学

書いてなかったので そんなわけで、明日から?放送大学で専科履修生としてやっていきます。 やっていきますと言ってもどうやっていくのかまだよくわかってない気がするけども…。 色々あり、情報系の大学院に社会人大学院生として入ろうと思っていた時期があ…

(Pandoc) ODT Readerでtabが無視される問題の対応をしています

PRは出した。 元になるissueはこれ。 github.com これによると、ODTを入力ファイルとしたときにtabが全部無視されてしまうということでした。 コードを読んで対応する場所がわかったのでいじってたら出来たのでPRを出しました。 github.com 年度末なので(な…

(Pandoc) docx出力の脚注の区切り文字をテンプレートから反映させる修正をしています。

マージされたら褒めてくれ。 issueはこれ。 github.com そういえば、テンプレートから反映されないなコレ…ってことでここ2-3日うにょうにょHaskell書いてPRを投げました。 github.com さてどうなるかなー… 今回のことでまた理解が深まったので、ODT形式の方…

(Word)脚注の区切り線は色々とカスタマイズできる

いらん知識な気はするが…。 現在、Pandocの脚注の区切り線をテンプレートから持ってこれるように更新をしています。それをどこまでやればよいのかを検討するために調べていたら思った以上に色々設定できることが分かったのでメモを残しておきます。 脚注の区…

(Pandoc) Pandocでdocxなどのバイナリ形式のファイルのテンプレートを出力するときは>ではなくて-oを使おう

一応書いておく ちょっと前のissueですが、Pandocでテンプレートを出力する--print-default-data-fileを使う際に pandoc --print-default-data-file reference.docx > custom-reference.docxで出力するとファイルが壊れることがあります(下記issue) github…

(Pandoc) Emojiは外部のライブラリに切り出されていた(メモ)

収録している(?)絵文字の数が格段に増えてました 以前Pandocのemojiについて調べていた時は、Pandoc本体に取り込まれていて対応する文字の数も少なかったのですが、下記のcommitで外部のパッケージに切り出されていたようです。 github.com そのライブラ…

(Pandoc) Pandocは脚注の設定をreference.docxから持ってこれない

...と思う。 Pandocのバージョンは2.11.4です。いつの間にこんなにバージョン上がってるの…。 久々にPandocのissueでも見るかーって見た一個目がこれだったので、これをやることにした。 github.com Wordの脚注の線と脚注の文字の間のスペースを詰めたいとい…

(R) Windows上で parzer パッケージが動かないやつの暫定対応

R

なんでしょうね ちょっとkuniezuパッケージを試してみたかったんですが、 github.com 内部で使ってるparzerパッケージがエラー吐いて止まる(Win、32bit版)か止まってしまって処理が返ってこない(Win, 64bit版)という挙動をしていました。 再現できるコー…

(R) Ubuntu 20.04 LTS に RStudio Server をインストールしようとしたらlibssl.so.1.0.0がないと怒られたので対応してインストールするやつ

R

絶対忘れるのでメモ。 Ubuntu18の方で普通にRをインストールするとR3.xが入ってしまうので、Ubuntu20.04LTSに移行しようとした。 で、Rを入れた後にRStudioをこのページに書かれているコマンドで入れようとしたのだが、 rstudio.com 以下のようなエラーが出…

(R)震源レコードフォーマットを読み込む

R

固定文字長フォーマットの読み込み。 各日のページからデータを読み込むことが出来たので不要になったが、これが出来ないと思っていたので過去の震源データを下記から入手して確認しようとしていた。 www.data.jma.go.jp 欲しい年を選択すると、例えば2016年…

(R)気象庁の震源リストからスクレイピング(コード一部更新した)

R

robots.txt とかも自分で一度は目を通しておこうね。 さて、以前の日記で気象庁の各日の震源データが消えていると思ったら見つかりました~ってのを書きました。 niszet.hatenablog.com 今回はそのページからデータを取ってくる作業をします。手作業でも良い…

GISに手を付け始めた(メモ)

2021年内にある程度出来るようにしたいものの1つ 防災意識を高める 昨年末、ふと防災情報について気になり、自衛隊防災BOOKを買ってパラパラと読んでみた。 magazineworld.jp magazineworld.jp まだ読み終わっていないが、日本に住んでいる以上は自然災害で…

気象庁の震源ファイルをdata.frameにしたいと思っていたのだが…(メモ)

やっていたのだが… 背景 去年からGISに興味が出てひそかに勉強しているのだが、手元に岩波データサイエンスシリーズのvol.4があることを思い出し、これもやってみるか…と年始に読んでみて、Rのコードが公開されていることが分かったので試してみようと思った…

Pandocの情報収集、どうする?

遅刻です。 この記事はPandoc Advent Calendar 2020の19日目の記事です。 adventar.org 今回はPandocの情報収集、どうやっていく?というお話です。あんまりまとまりのない記事になりますが…。 マニュアル類 まずは基本から。他のソフトウェアと同様に、まず…

(R) Rでe-Statのデータを触っていきたい

e-Statの使い方、Japan.R 2020の動画が一番わかりやすいのでは? さて、先日のJapan.Rでは私もLTを行いましたが、前半の方でスペシャルゲストとして独立行政法人統計センターの西村さんが「政府統計の総合窓口(e-Stat)の概要」というタイトルでe-Statの使い…

Japan.R で 日本Pandocユーザー会の紹介LTをしてきました

あっさりした内容で申し訳ない…。 12/5のJapan.R 2020で"日本Pandocユーザー会の紹介" というタイトルでLTしてきました。 connpassのページはこちらに、 japanr.connpass.com 資料はこちらにあります。 niszet.github.io 今回は特に変態芸(?)もなく普通に…

引っ越しました

久々に色々落ち着いた ということで、中の人がここ1か月ほど引っ越しでバタバタしていました。結局時間もお金も結構かかったけども、とりあえず生活を移行できたのは幸いですね。 ということで、色々止めていたものを再開して行こうと思います。頑張らなくて…

(Pandoc) docx 出力の場合、BlockQuote 中の HorizontalRule は別段落になる

コード読んだけどまだよくわかってない。 HRはそもそもBlock要素なんですが、ParaなどのBlock要素は正しくBlockQuote中に取り込まれるので、段落要素であることが原因ではないとはわかっていますが、コード見てもまだよくわかってません。docx形式で出力する…

asciidoctor出力結果のチェックのために環境を整える

先人がいるのはありがたいことです。 asciidoc/asciidoctor形式の出力ファイルを見るために、指定したツールで正しくレンダリングされるかどうかが判断基準になるため、環境を作っていました。以下はメモ。 環境そのものは下記のブログの記事を参考に入れま…

(Pandoc)Pandoc内では`--to asciidoc`と`--to asciidoctor`が区別されている件

そういえばそんなこともあったわね…。 先の記事に書いた通り、Pandocは拡張子を見ているんですが、asciidoctorにはならないようです。 しかし、この形式たちは内部で差異があり、出力ファイルの文法が異なるので注意です。ていうかasciidoctorの方が標準でい…

(Pandoc)Pandocはファイルの拡張子を見ている

でも明示されていなくない? いつものことデスね…。 対応するコードはここにあります。 github.com で、変換対応を抜粋。以下が対応関係になっています。なお、docとpdfの拡張子はサポート外なので、エラーとなります。また、--toや--fromを指定していればそ…

(Pandoc)2.11が出ましたね!

一応書いておこうかなと。 ずっとリリース待ってたんですが、(日本時間の)深夜になるとは読みが浅かったけど、リリース直後に反応できたので、ヨシ! 今回の一番大きな変更は、citeprocのPandoc内部への取り込みでしょう。今まではフィルタで動いていたも…

(Pandoc)出力ファイルのチェックをするならテストに使っているファイルを使うのが一番。

そらそうだ。 PandocもCI使ってテストをしています。手元でもstack testとかでテストできますけどね。 この際に使っているファイルがコレ。native形式で書かれているので、native parserがしくじってなければ、コレが一番Readerに依存しない形ですね。賢い。…

(Pandoc) VerbatimChar文字スタイルはスタイル一覧に表示されないが、これはSourceCode段落スタイルのリンクスタイルなのであった。

linkスタイル死すべし慈悲はない 以前からPandocのdocxのスタイルについて調べていましたが、最近はHaskellのコードも読んでいるので以前よりもさらにわかってきました。 以前… niszet.hatenablog.com いつかちゃんとまとめたいですね…。 でもそれは大変なの…

(Pandoc)OpenDocument形式出力でsyntax highlightingを(ただしインラインCodeかつODTではない)

簡単とは思っていなかったけどやっぱり大変…。 ODT形式の出力はシンタックスハイライトに対応できていません。そのため、これに対応するべくPandocの修正を試みています。 とりあえずissue建てた。 github.com PRを1個出していて、これはOpenDocument形式で…

(Pandoc)Docx/ODT Writer中の文字コードの確認処理

時間を無駄に溶かしたのでメモをする。 はじめにPandocじゃない話を書いておくと、Rは"\uxxxx"でunicode文字を入れることが出来る。"\u2603"とかやれば☃だ。大文字のUを使えば、4桁で済まない文字も入れられるし、上4つを0で詰めておけば先と等価な文字コー…

(Pandoc)Span記法を使うとdocx出力にコメントを残すことが出来る

誰得だよ… マニュアルの何処にも書いてないと思いますが、docxに出力するときにSpanに特定のclassを与えることでWordのコメント機能を使えるということに気づきました。 入力にこんな感じの文を与えてdocxに変換します。 aaa[bbb]{.comment-start}ccc[ddd]{.…