メロスラヂオのブログ

まずは備忘録を書いています

趣味の話をするとき(2021.10.17)

私は自分の趣味を人から共感されることが少ない。

まずは趣味をインプットの趣味とアウトプットの趣味に分け、自分の趣味を俯瞰する。

まず、インプットの趣味について映画・音楽・絵・漫画・本は好きなものが多くドはまりするものもある。ただ、収集癖は無いためマニアレベルで何かの作品にはまったことがない。そのため、マニアよりは浅く平均的な人間よりは深いという最も人と趣味を会話しづらいレベルに存在する。

例えば、平均的な人間に趣味の話をすると”へーそんなんだ”、となる一方でマニアとなると会話についていけない。また、”その映画めっちゃ好き!”、と言っている人の感想が浅いと話す気がなくなってしまう顛末である。

ちなみに映画は毎日1本約1年見てた時期があり、その結果感受性が失われ審美眼ハードルが上がっているため、ラース・フォントリアー、ミヒャエル・ハネケ園子温コーエン兄弟といったやや外れている映画が好きになってしまった。また、クリストファー・ノーランの時間をいじくるコンセプトの映画は面白いものが多いため好んで見ており、唯一多くの人と会話が合う映画である。そういう意味でクリストファー・ノーランはマニアと平均的な人間とを媒介する媒体として能力がかなり高く、コミュニケーションの活性化に大きく寄与しているのではないかと思う。

また、流行りものにはハマったことが人生でないため、本当に会話が合わない時間が生まれるためたまに辛くなり、流行りものに手を出してみるが好きではないものは好きではないためやはりはまれないしハマっている人間を見ると本当にこれが好きなのか?

と疑いたくなることがある。

 

次いで、アウトプットの趣味についてなのだが無い。

正確に言えば無いというと嘘になり仕事になる(大学時代は研究)。

自分でもどうかと思うが、仕事関係の本・論文を読んで課題の一般的なメカニズムや解法をインプットした後に、そこから仮設を立て実行したりメカニズムを妄想するときがかなり楽しい。周囲の人間には承認欲求を過度に欲している感が出るような気がするかつ、実際経験則的に本情報を開示している人間の99%は承認欲求を欲しているいるように見えるので言ったことがない。

よって、私は趣味は何か?という質問をされると盛り上がるネタが無いのでやめてほしい。

データサイエンス学習記録#1 (2021.10.17)

テーマについて

8月より化学メーカーの研究開発職から転職して、データサイエンティストとしての一歩を踏み出しています。

今回から自分の学習棚卸のために定期的にブログを書いていこうと思います。

(たまに好きな本や映画等の紹介もしたいと思います。)

私のバックグラウンドとして、大学時代は有機化学を専攻しており、実験系の研究室に所属していました。就職後も業務としては実験を行う毎日で、データの統計的な解析やプログラミングは興味があったものの趣味の自己学習レベルでしか触れていませんでした。

ただ、自身の業務とはまったく異なる内容であったため、学習への本気度が足りず、あまり何かが身についたとは思えない状況でした。

転職後現在までに習得したスキル

上記のように今までは趣味レベルでしか取り組んでこなかったデータサイエンスなのですが、仕事にすることとしたので、真剣に取り組むことにしました。

ただ、データサイエンスは発展が速く(例えば深層学習だと毎年ベンチマークのモデルが変わる等)、また範囲も広い(扱う対象データ形式でいうと時系列、画像、テーブル、グラフ等)ので、まずは基礎固めをすることとしました。

以下、約2か月で進めてきた学習です。

  1. Pythonと付随のデータ分析ライブラリ(Pandas等)の基礎的な構文理解と機械学習における前処理・モデルに必要となるコーディング力
  2. SQLの基礎構文(データベースを作成するというよりは、データウェアハウス上で必要な集計を行う)
  3. 古典的(非深層学習)な機械学習の仕組みと実装(線形、ロジスティック、サポートベクターマシン正則化手法、k-meansクラスタリング、決定木と勾配ブースティング法)←仕組みに関しては復習が必要かつもう少し深堀が必要(ex. カーネル法における相対問題を結論レベルでしか理解していない、勾配ブースティング系のアルゴリズムの差を理解していない)
  4. 深層学習の仕組みと画像分類の実装(誤差伝播法によるニューラルネットワークの最適化、畳み込み・プーリングによる畳み込みニューラルネットワーク、最適化関数)

こうして振り返ると、機械学習と呼ばれるものに必要な学問は確率統計論と最適化数学であり、さらにその前工程としてデータ設計の理論的な理解とデータをデータベースに格納するスキルが必要なのではと思いました。

また、データサイエンスは広く見るとITの1ジャンルと捉えることができると思います。

今後は確率統計論とITの基礎的な知識をインプットを進め、更にアウトプットとしては、kaggleやAt corderに取り組み、分析対象に対するアプローチの学習と検証・コーディング能力アップを試みたいと思います。

 

また、随時ブログを更新していこうと思いますので今後ともよろしくお願いします。

読書記録2-ファストアンドスロー

人間の思考はシステム1とシステム2で制御されている。

システム1は直感的・感覚的な決定を下す。システム1は慣れ親しんだものが好き。

また、システム2の決定に大きな影響を及ぼす。

一方、システム2は論理的・合理的な決定を下す。また、システム2の決定を監視する。しかし、人間にとってシステム2を稼働させるのは忍耐が必要となるため、常にシステム2に基づき判断を下せるわけではない。

システム2を稼働させるためには、自身の判断がシステム1に依存している自覚を持つことが必要。特に、因果関係を正しく認識したいときは、基準とそこからのズレを合理的に説明する。

実験の進め方(古典物理学を対象とする場合)

実験の進め方を書いた本は少ない。

効率的に研究を進めるためには規則に基づき実験を行う必要がある。

以下、要点をまとめる。

 

研究活動とは

事実は誰もが理解できるが、妄想は自身にしか理解できない。

事実からどれだけ妄想の幅を広げることができるか、その後それを如何に事実として万人に理解させるかが研究活動である。

また、ある現象は異なる物理現象の組み合わせである。そのため、妄想を広げるには対称の現象を物理現象の組み合わせに分解し、各物理現象を記述している理論を頭に詰め込むことが必須である。

 

前準備

  • 分野の基礎理論を理解する
  • 徹底的に過去文献を調査する
  • 得られた情報を基に各パラメータを振った際に、頭の中で事象がアニメーションとして動くまで最大限妄想する

 

実験計画

  • 妄想をする≒仮説を立てる
  • 一つの実験につき一つの目的を定める
  • 動かすパラメータは一つ
  • まずは、大きくパラメータを振る(3点以上)
  • 結果を予想する

 

実験

  • 計画通りに遂行する
  • ネガティブデータが出ても途中で辞めない
  • 事象を詳細に記録する

 

結果の考察

  • 記録を詳細にまとめる
  • 仮説と異なる結果となった場合は原因を考える。その際、まず実験が正しく行われたかを確認

 

 

読書記録1-ティール組織

ティール組織の特徴

・上下関係が無いチーム単位で責任が付与された組織

・組織図は無い

・責任者を明示しない

・チーム間の業務を正確に把握

・プライベートの人間性と職場での人間性が一致(自身のポリシーを職場で発揮

・意思決定は少人数で、トップダウンはしない

対称性を持つモノに対する畏怖感

人間は対称性を持つモノに畏怖の念を抱く。

マクロなレベル、つまり人間が視認可能なレベルでの自然世界は非対称である。

また、人間が視認できないレベル(例えば電子のスピン)でも自然世界は非対称である。

つまり、人間が対称性の高いモノに接する機会は通常無い。

そのため、人間は対称性が高いモノ(タージマハル、バッハの譜面等)に接した際にそれが自然世界には存在しない、つまりイデア的な世界に存在するモノであると感じるのであろう。