​ ​

ぼくの酪農統計日誌

はじめまして。ファームノートデバイス開発グループの河野です。

ファームノートに入社して早3ヶ月、その前は B to C の Web サービスのエンジニアをやってました。
今はファームノートで数値分析システムを作っています。

もともとは数理科学の一分野としての確率論が専門だったものの、
実際の統計的な調査や実験の実施については絶賛修行中の身であります。

例えば以前の会社でも数値分析をやっていたのですが、そこでの Web の数値分析と
ファームノートでの農業 IoT の数値分析ではいろいろと勝手の違いをひしひしと感じています。

というわけで今回は僕個人の仕事の中で感じた違いの中からからタイムスパンに関係する部分に絞って簡単な一例を並べていきたいと思います。
ファームノートの強みとしてそういった部分で困難に立ち向かっていることをお伝えできればと思います。

想定する調査

まず何も前提を置かないのもなんですのでどういう調査の場合に比べるのかイメージを書いておきます。

農業 IoT の場合

ある統計量(移動量とか)と乳牛の発情徴候の関係を調べる。

B to C Web サービスのユーザ行動の場合

有料機能(映画の視聴とか)が誰にどのくらい使われているか調べる。


集計期間の単位

調査をする際、十分な量のデータが集まるように期間をとるのも重要ですが、
集計データが偏らないことを意識してきっちりとある単位で集計期間をとることがあります。

農業 IoT の場合

基本的に21日間。
平均的な発情周期が21日間なので、周期の各段階が入るように21日単位でデータがあると嬉しい。

ちなみに乳牛の生産サイクルを一周分とろうとすれば400日以上になる。

B to C Web サービスのユーザ行動の場合

基本的に7日間。
ユーザの行動は曜日と時間帯で変わると思われるので、すべての曜日と時間帯が入るように7日単位でデータがあると嬉しい。
月額サービスでは月初と月末で行動が変わるので月単位でほしいこともある。
毎年決まった時期に失効するポイントをユーザが購入し、消費するサービスの場合も同様。

上記のような周期がない場合もある。たとえば農家向けのサービスなら一般的な平日や休日は関係ない。

調査対象の主な区分

農業 IoT の場合

産次(乳牛が出産を経験した回数)。
産次が上がるには400日以上かかる。

B to C Web サービスのユーザ行動の場合

新規ユーザ/既存ユーザ。
長くても月次で出すことが多く、(前月までに使っていたかどうかで分ける)
だいたいはアクセスなり機能の利用なりの時点で
過去にアクセスしたことなり、機能を使ったことがあるかを判定して集計する印象。
ユーザの変遷は(するのであれば)期間は短い。

実施費用/規模

間接的にタイムスパンに大きく関係する部分なので書いておきます。

農業 IoT の場合

たとえばセンサーなどの機械を個体ごとにつける場合、

  • 機械1台ごとの価格が 2万円
  • 同時に100個体調査する

としただけで 200万円かかります!(人件費や協力先のコストを含めず)

機械の新調の他にも以下のような作業が発生する可能性があります。

  • 機械の全てのソフトを書き換える
  • 機械の取り外し、取り付け
  • 分析アプリケーションの実装

というわけでなかなか同時に行う実験対象の母数や多様性は確保しづらく、
データを増やしたり偏りを無くすためには時間がかかります。

B to C Web サービスのユーザ行動の場合

すでに軌道に乗ったサービスにおける調査として、

  • エンジニアの人件費
    • 90万円/人月
    • 20営業日/月
  • 分析アプリケーションの実装
    • 5人日

と仮定すれば、22.5万円かかることになります。
もしそのサービスが 100万 WAU で集計期間が1週間なら1ユーザあたり0.225円。。。
なんという圧倒的な差。
さらに言えば母数が多くとりやすいので必要な場合には多少集計期間を短縮してもその間に十分偏りのないデータが取れるだろうという判断もできます。

まとめ

どうだったでしょうか?細かいことはいろいろとぶっ飛ばしているので、
お前は甘い!と憤りを覚える皆様もいらっしゃるでしょうが、そんな熱く語りたいエンジニアの方のご応募先はこちらです

このエントリーをはてなブックマークに追加