niszetの日記

10年目エンジニアが最近勉強したことを忘れないようにメモをする

書き始める。

去年、とりあえずブログのアカウントだけ作って放置していましたが、年度の変わりにあわせて始めてみようと思います。
テーマは特にコレと決めずに色々書いていこうかな、と。そろそろまともに文章書けるようにするという練習もかねて。

最近はR使いを目指しているので、調べたこと疑問に思ったことなどを書いてみます。

R使い始め

履歴を調べると去年の7月ごろから使い始めたようです。当時はRの文法がとっつきにくく、「RStudioではじめるRプログラミング入門」を買って一通り読みました。コードの写経はしなかったかな。ネットでも色々調べることはできるのですが、やはり最初の一歩は良い入門書があるとなお良いです。

その後、奥村先生の「Rで楽しむ統計 (Wonderful R 1)」を読んだり紆余曲折し、今年に入ってから「R for Data Science: Import, Tidy, Transform, Visualize, and Model Data」を読み始めて今に至る。この辺はまたどこかで書こう。

統計のお勉強

統計は統計で2009年に「完全独習 統計学入門」を購入、「データ解析のための統計モデリング入門」を2013年に購入してそれぞれ独習しました。
ただ、2013年時点ではRを触ろうとは思わなかったようです。触れよ・・・。

きっかけ

アナログ回路設計では製造ばらつきを考えるためにモンテカルロシミュレーションを行うので、その理解のために統計を勉強しよう…となったのが事の始まりでした(たぶん)
久保先生のモデリングの本は、たぶん回路特性をモデリングしたかったんだろうな、と。今はちょっとだけやっていますが当時はRという道具を使えなかったのでほぼ読んだだけですね。そろそろ再読したい時期。

最近のトピック

  • 分散分析
    t検定まではなんとか理解できてきたんだと自分では思っているのですが、問題は分散分析。というよりは効果量について。
    差異があることは検定するまでもなくわかっているので、その効果を定量的に見たいのです。最小二乗法でフィッティングして、信頼区間なんて知らないです~得られたデータから出したせんだから最尤なんです~で良いのなら良いのですけどね(実際、そんな感じになっている)
    これをもうちょっとちゃんと統計のお作法に則ってやってみようということです。

  • 時系列分析 時系列系は結構毛色が違うので別途勉強することに。状態空間とかも。カルマンフィルタはちょっとだけ勉強しましたが…まだまだ…

  • 機械学習 いわずと知れた…。今また次のステップに行こうとしている気がしますね。とりあえず乗っかっておかないと…

  • その他 ほかにも色々やろうとしていることはありますが、発散するのでまずはここまで。