「Tableauの基礎は理解したけどLODの意味が分からない」
「FIXEDとか使える便利って聞くけど、いつ使えばいいの…?」
Tableauの使い方を教えていると、こんな質問を受けることがとても多いです。
初めは使いやすいと言ってサクサク理解してくれるのですが、ほとんどの人がこの”LOD表現”で止まってしまいます。
理解してしまえばとっても簡単なことなのですが、イメージが付きづらいんですよね…
すぐ理解できるようなるから安心してね!
今回は、LOD表現とはなにかを解説するとともに
その使い方を説明させていただきます!
そもそもLODってなんなの?
そもそもLODとはなんなのでしょう。
言葉自体はややこしいですが、意外と簡単なことなんです。
ざっくりいうと
どのくらいの詳しさでデータを見るのか
これだけです。
日付け目線か、時間目線かその違いと一緒です。
日本語で言うと詳細レベル
LODとはLevel of Detailの略称です。
日本語に略すなら詳細レベルとなります。
??
正直、詳細レベルとだけ言われてもよくわかりませんよね。
詳しい人は粒度なんて言いますが、細かいことは気にしなくていいです。
そのデータに関してどれだけ詳しいかを表しているだけなんです。
データについてどれだけ知っている?
下記図は、Tableauのサンプルデータ「夏のオリンピックメダリスト」です。
左から見ていくと、国、種目、名前、性別、競技、年齢、メダルの色、個数と並んでいます。
もし、一番左の欄しか見えなかったら、あなたが知れるのは国についてだけです。
2つ見れたら国と種目が、3つなら名前も知れます。
つまり、知れる情報が多くなるにつれて、そのデータを細かく判別することができるようになりますよね。
データを深堀していくと見えるものが変わる
国という目線でしかデータを見れないと、国がとった合計メダル数しかわかりません。
国と種目というデータまで見れると、その国がどの種目でどれだけメダルを取ったかがわかります。
さらに選手名までわかると、その国のどの種目で誰がメダルを何個取ったのかがわかります。
これが粒度の高い (細かい)ディメンションで見ていくということなんです。
データが深堀されていき、詳しくなっていく、それが詳細レベルなんです。
2022年1月1日の売上と
2022年1月1日1時の売上は同一ではないでしょう。
日を24分割したものが時の粒度ということです。
つまり、時の方が細かいと言えるわけです。
LOD表現とは?
詳細レベルがわかってしまえば、LOD表現は理解したも同然です。
ざっくりいうと
どの目線でデータを表現させたいのか
これだけ、簡単なんです。
見たい目線の表を個別に作る
国だけの目線でメダル数が見たいのなら
国 | 国別総獲得メダル数 |
---|---|
イタリア | 10 |
ドイツ | 14 |
フランス | 12 |
↑のような表を別個に作っておいて、いつでもメダル数を参照できるようにしておくわけです。
より細かい粒度で見たとしても、引っ張てくる数値は別個に作った表なので影響を受けません。
国 | 種目 | 選手名 | 獲得メダル | 国別総獲得メダル数 |
---|---|---|---|---|
イタリア | 野球 | ピルロ | 金 | 10 |
ドイツ | フェンシング | ミュラー | 銀 | 14 |
フランス | 陸上 | ジダン | 金 | 12 |
↑のようなことが可能です。
LOD表現の使い道
さっきのデータと同じものです。
国→種目→人と進むごとにデータに詳しくなっていきますよね。
詳しくなれば見えてくるものが違ってきますが、あえて大まかに見たい時もあります。
選手目線で見ていくとメダル数は1個と2個、その人がとった数しかわかりません。
同じ列で、その国が何個取ったのかも見たいとなったらどうしますか?
国→選手と国だけの2つの目線でデータを見ないといけませんよね。
1つの表現の中に、複数の目線でデータを出したい時にLOD表現が使えます
1列の中で、国目線、種目目線、選手目線のように幅広い角度からデータが出せたらすごく便利なんです。
LOD表現がわかるとデータの活用幅がぐっと広がるよ!
TableauのLOD表現
Tableauでは、LOD表現のために3つの関数が用意されています。
- EXCLUDE
- INCLUDE
- FIXED
また別記事で一つ一つ詳しく解説しますね。
まとめ
LOD表現とはなにか?
LOD表現はデータの表現方法のひとつで
どの角度から見たデータが欲しいのかを伝える方法です。
続く
次回はFixed関数についてです!
コメント