2022情報I 3学期
第9回 授業の振り返りより
質問より
無印は皆さんの回答、☆は先生の回答です
- グラフを昇順に並び替えたとき他の項目はその項目に合わせて並び替えるにはどのようにしたら良いでしょうか
- ☆グラフを並び替えるというのがよくわからないのですが、並び替えの範囲が適切であれば、適切に並び替えができるはずです。グラフを作成するときは、必要なデータだけ取り出した表を作り、見出しも含めて範囲設定してグラフを作成します。
- 偽Excelで関数がうまく機能しないのはなぜか
- いつも「偽」と呼んでいますが、Web版Excelは簡易的なものです。ブラウザ(ChromeやEdge)の上で動くので、複雑で多機能なExcelの完全なプログラムを動かすことができません。ブラウザ上でExcelのように振る舞うことができること自体が、技術的にはスゴいことなのですが、本物のExceと同じだと勘違いする人がいるので、「偽」と呼ぶようにしています。
- 相関係数、色分け以外に関係性を見る良い方法はないのか。
- 仮説検定や代表値を求め、データの傾向を知るという方法もありました。
☆散布図やヒストグラムなど、グラフにして関係性を見る方法もあります。代表値を求めるのもいい方法ですよね。データによっては並べ替えてみたり、分類してみたりする方法もあります。思いつくものを、いろいろやってみる経験ができるように、グループで取り組んでもらいました。
- 反比例のような形の相関関係が見られたのですか、相関の種類において正と負以外にも統計学的な分類はあるのでしょうか?
- 相関係数はどれくらい「比例的な」関係を持っているかを計る指標なので、1次関数のような関係を持っているかを見るものです。そのため、相関係数ばかりにとらわれず、目視で散布図を確認することも大切です。「反比例のような形の相関関係」を見いだしたのはいい発見ですね。
- もっとエクセルを使いこなせるようになるにはどうしたらいいですか。
- いろいろな場面で使ってみることだと思います。Excelは利用者も多いため、「こんなことができないかなぁ」と思ったら、検索するとやり方が見つかります。ちなみに、Excelは便利ですが、使い方を覚えても「共通テスト」には出てきません。
- ある年度のデータだけを収集したいときにどう選択すればいいんですか。北海道2016北海道2017北海道2018…青森2016青森2017…のように上から並んでます。
- ☆フィルターという機能を使います。表を選択して[フィルター]をクリックします。見出しに[▽]が表示されるので、クリックして、[テキストフィルター]→[指定の値を含む]をクリックします。表示したい年度を入力すると、その年度だけのデータが表示されます。この質問、授業中困っていたらその場でしてくださいね。
- 擬似相関ではないというには何を示せばよいですか?
- ☆chatGPTに聞いてみました。擬似相関ではないことを示すには、以下の方法を組み合わせるそうです。(1)因果関係を検証する(2)データの質を確認する(3)別のデータセットを用いる(4)統計的仮説検定を行う
因果関係となる原因を探り当てることが一番重要ですね。
- 複数の観点を可視化するグラフを作るときのコツはありますか。おすすめの方法があれば教えてください。
- もちろん表したいことによって変わりますが、個人的には1個のグラフに執着しないことがポイントだと思います。例えば片方が折れ線だからもう片方も折れ線じゃなきゃいけないみたいな謎ルールを勝手に作らないみたいな。きっと単位が違うものを一つのグラフにしようとしていると思うので単位の間隔とかも調節しなきゃいけないので大変ですが。2つのことに相関があることを強調するのに適しているということとそれを相手にどうわかりやすく表現するかを念頭に置いてグラフづくりしてます。参考までに…
☆まぁ、データにはそれに適したグラフがあるので、必ずしも一つにまとめる必要はないですよね。単位が違う2種のデータを一つのグラフに表したいときは、複合グラフという方法があります。
感想より
- 関連性が分かった後、ではなぜその関係性があるのかについてのproblemを立てれば良いと思った。
- そうです。PPDACサイクルですから、二回り目に入って、Cの後にPが続くんです。
- データを分析しているうちに、自分たちが立てた仮説とすこしズレたところを計算してしまっていて、目的に忠実に分析することが難しかった。また、自分たちの仮説をデータで検証していくには、不足しているデータがあることを発見できた。四人でデータ分析をしていると、県別の方がいい、男女で比べた方がいい、といったいろんな方面から考えて、試してみることができた。データを分析する中で、意見を出し合うことは楽しかった。
- そういった多様な視点に気づいたり、データをもとに試行錯誤したりした経験が、今後データを見るときに活きてくると思います。
- 前回の授業で立てた仮説が今回のデータでは検証することが出来ないことが分かったので、テーマ変更から行いました。データを分析する上で、最初に大まかな予想を立てますが、それが実証することが出来るのかどうかを先に考えてから分析を行うことが大切だと思いました。
- 検証できないことが分かったということはPPDACが一回りし、次のサイクルのPPに入ったという事ですね。繰り返しながら各ステップを意識するようにして進めると、何をしたらよいかが見えてきます。
- 前回までやっていたグラフだと、今までやっているテーマだと合わないと気がついて、新しいグラフを作った。前回までは自分がやっていることに何も疑問を感じていなかったけど、少し時間をおいて見返すと、あっ、ここ少し変だ~って気がついて、自分自身の新たな発見ができて楽しかった。
- おっ。成長してますね。実際にデータをいじってみるとわかることってやっぱりあるんですね。この授業やってよかったです。
- 2つのデータから分析する時には項目を完全に一致させる必要があると分かった。「漁業が発展している」というテーマでも、漁獲量のデータか漁業従事者数をとるかで意味が少し変わってしまうと思ったので、データの項目に忠実にテーマ設定することが大切だと思った。
- PPDACの過程を踏まえてデータを分析することが大切だということもよく分かったが、それ以上にグループで取り掛かる時にはコミュニケーションを取ることが何よりも大事だということが分かった。仮説を立てる時や役割を分担する際に定義が曖昧になっていると、後から大きなズレが生じて分析にならないことがあるということに気がついた。
- データの分析にはさまざまな正確なデータが必要であるとわかった。
- データの分析には数学がどうしても必要になってくるためできるだけExcelで楽をできるときには楽をすることが大切だと考えました。
- 仮説と反対の分析結果が出たけれど、案外結論がきっちりつけられて、今まで仮説と異なる結果が出ることを恐れていたけれど、それでも大丈夫だと分かりました。仮説と結果が異なる貴重な経験ができてよかったです。
- 今回、グラフをどんなものが適切か考えることができたので良かったと思う。対象の2つのどちらが多いかという考察をしていた。はじめ、比べる2つのものを棒グラフで表現していた。しかし、それぞれ地域ごとに全体の数がちがうのでこれは比べにくく、適切ではないのではないかと考えた。その後に帯グラフに変更すると、割合の違いがわかりやすくなった。分析したり、その結果を表現するときにどんなグラフを用いるかということはとても大切なことなのだと感じた。グラフを用いるときはどんなグラフが適切かを正しく考えられるようにしたい。
- 四人のグループでやっているがいつもとは違う人と組んだのでその人たちから、いつもは自分では考えたかなかったようなアイデアが出てきて面白かったです。データの分析の仕方がよくわかりました。自分が思っていたよりも楽しくできたのでよかったです。
- 酒類の購入金額と死亡率について散布図を作ってみたところ、一見、正の相関関係があるように思えたが、相関係数を出してみるとほとんど関係がなかった。おそらく正の相関関係があってほしいと思っていたからそういうバイアスがかかっていたのだと思う。なんんら、一度落ち着いて見てみると、負の相関関係ががあるようにも見えた。母の学生時代の話で、実験の統計をとってみると、数学の問題で出てくるようなある程度まとまりのあるグラフはできず、点があっちこっちに散らばっているような結果になることも多く、そういう場合好きなように結論付けることもできるよなと感じた、といったものを思い出した。
- 数学でのデータ分析の勉強はただ機械的に問題を解くだけで正直なんのためにやってるのか分からなかったが、今回データ分析を実際にやってみることでその実用性が分かった。また、データから読み取ったことを掘り下げるのがおもしろかった。
- 折れ線グラフは変化を表す時に、というのを今までは強く意識したことは無かったけれど、いざ変化を表していないデータを折れ線でグラフ化してみると点と点をつなぐ線の傾きばかり気になって仕方がなく、データの量より変化に嫌でも目がいってしまうということに気付かされた。今まではグラフは何となく適当に使っていた所があったけれど、どんなデータをどんなグラフで表すかは思ったより視覚的に重要なことなのだと痛感した。逆に言えば、変なグラフで表すことで相手の頭を混乱させてデータを想定した結果に合うものらしく見せることもできてしまうなと思った。
- 前回まとめたデータを用いて散布図を作ったが、結局外れ値の影響が大きくなってしまったので、数学で習った外れ値の基準に基づいて外れ値を除去して相関係数を求めた。(見た目では明らかに外れ値っぽいデータも計算すると意外とそうじゃなかったりしたので、ちゃんと計算するのって大事) また、得られた相関係数は予想と正反対のものだったので仮説は覆されたが、そのぶん考察も深めることができた。
- 前回取捨選択したデータの中から、さらに分類をしたり片側検定を行ってみると、事象同士の相関が見えるようになり、仮説に対する答えもあらわれてきて、データ分析のおもしろさと意義を学べた。最初にデータを分析したときは、相関は見られなかったけれど、そこから出たほかの情報をもとにして、そこから新たな仮説を導いて2段階めとして仮説検定をしたことにより、第1段階では分からなかった関係が出てきて最終的に最初に立てた問いにつながったので同じデータでも、違う手法で検証してみたり、ほかの角度からアプローチしてみることの大切さが分かった。情報だけでなく数1の授業でこれまでに学習した知識を活かして、それをどう使うかなどを自分の頭でできるだけ考えて積極的に授業に取りくめた。
- 地価と人口密度のグラフを同時に表現する方法に悩んでいたが、チームメイトが解決してくれ、折れ線の点と棒グラフの頂点がほぼ重なっていることから関係性を見つけることができた。散布図で相関関係を見る以外にも、グラフを照らし合わせることで一致か不一致かを見ることができるという、新しい方法を学んだ。
- 途中、緯度とウォーキング人口の多さの関係を調べようとしていた。しかしそれは疑似相関だと思うが、途中まで全く気付かなかった。疑似相関の話を聞いたときはそんなことをまさかするわけないと思っていたが、無意識に疑似相関のことについて考察していた。データの分析を今後やるときはこの経験を生かして因果関係がそこにはきちんとあるのか一回考えてから仮説を立てて分析をしていきたいと思った。
- 都道府県別の高齢者の割合と、介護率に相関があるか実際に調べたところ強い相関はなかったが、それも一つの結果だと思った。分析すると自分の理想と違うことも多々あって満足にいかない部分が多いと感じることも多いが、それも一つの結果であるという考えに変わった。探求などでも生かしていきたい
- 複数人のチームで協力して問題を解決する事は困難だが、PPDACサイクルに則ると計画を進めやすく連携しやすい事が分かった。
- 本日の授業ではふたつのデータを整理して、まとめたいカテゴリーを明確にし再度確認した上で、グラフにすることが出来た。しかし結論を絞っていく上で、このひとつの相関だけでその結論と予測していいのかとかなり不安になり、何度も表現を調整した。
自己評価集計
ワードクラウド
- 3つのキーワード
- 感想や気づき
テキストマイニング 無料ツール by ユーザーローカル
前のページに戻る