2022情報I 3学期
第8回 授業の振り返りより

質問より

無印は皆さんの回答、☆は先生の回答です

SSDSEを提供している団体の目的は何か?何のメリットがあるのか?
☆スライドにも書きましたが、独立行政法人統計センターというところが提供しています。SSDSEのページにも「データサイエンス演習、統計教育などにご活用ください。」と書かれています。政府統計等を活用した学習を支援する団体なんです。
クラスメイトに質問で、仮説を考えるうえで大切なことって何だと思いますか? 
☆クラスメイトは誰も答えてくれませんでしたね。関係性を見いだそうという分析しようとする気持ちと、自由な発想によるひらめきが大切なんじゃないでしょうかね。
データ分析のために関連するほかの調査データを調べる際に留意すべき点は何でしょうか。 
☆ChatGPTに聞いてみました。適切な回答でした。
他の調査データを利用する際には、以下の点に留意する必要があります。
データから仮説を立てて検証するときに、データのグラフを取って、そこから、視覚的・数値的に傾向を求める以外の方法をやっていたら、教えてほしいです。 
☆そこは仮説検定や相関係数を求めるといった手法がありますよね。ほかにも回帰分析やt検定など、統計的手法はたくさんあるのですが、高校の範囲を超えてしまいます。
いまから情報の知識系の復習をしたら役立ちますか 
☆何に役立つかはわかりませんが、役立ちます。情報はある意味生活に密着している(というか、情報で学ぶ事柄が身の回りに蔓延している)ので、生きる上で役立つでしょう。共通テスト対策としては、まだ早いかもしれません。おそらく来年1年間で知識事項はほとんど忘れてしまうでしょう。今は知識をどう使うか、どう組み合わせるのか、体験を重視する時期で、知識は必要最低限でもかまいません。必要になったら、皆さん上手に詰め込んでくれることを期待しています。
SSDSEは教育のために用いることができるデータベースとのことですが、食べ物の消費量など算出の難しいデータも事実に正しいものが使用されているのでしょうか。もしそうならかなり使い勝手の良いデータベースになると思うのですが実際に教育以外に使用することはあるのでしょうか。 
☆正しいものです。教育以外にも活用してかまいません。データは総務省統計局が提供しているもので、SSDSEでなくても、e-Statから同じデータを入手することができます。SSDSEは様々なデータを探さなくても使えるように、データセットとしてまとめたものです。
擬似相関と普通の相関はどうやって見分けるのですか?
☆ChatGPTに聞いてみました。それを要約すると、因果関係の理解と他の変数の影響の理解が必要になるとのことです。一方の変数がもう一方の変数を引き起こしていない場合や、他の変数が二つの変数の関係に影響を与えている場合が考えられるとのことです。

感想より

いつもアホっぽいことを考えて口にしてしまうことがあったが、今日はそういったことが役に立ったと感じた。牛乳と平均身長について調べようと思ったり(データがなかったので諦めたが)酒と死亡率について調べようとすることに繋がった。
発想力が豊かだということですね。
資料を見ていくうちにおもしろくて時間だけがすぎていってしまいました。考えれば考えるだけ、様々な相関が見えてくるので、早いうちにテーマを絞って作業を始めないといけないなと思いました。班の人の視点から、自分の見えてこなかった視点が見れて、なかなか興味深かったです。申し訳ないですが、いつもペアでやる必要のない授業ばっかでこの形態の授業に意味があるのかなと思っていましたが、今回の授業を通して様々な視点の意見を持つことの大切さが分かりました。これからはもっと普段の授業でも意見を伝えることを大事にしたいと思います。
見ていると、ペアで座ってもらっても、コミュニケーションとらないことが多いんですよね。こちらが説明しているとき、よくわからないことがあったら、ペアの人と教えあったり、二人ともわからなかったら質問してみるなどの、授業の活性化を狙っています。でも、皆さんいい子に聞いているんですよね。もっとザワザワしてくれると楽しい授業になるのになぁ..と思っています。
SSDSEのBの中のデータを使うことは序盤に決まりましたが、お互いに遠慮してしまって、かつ即座に否定してしまうなど、意見がなかなか出ず、ギリギリで仮説と具体的なデータが決まりました。今回はブレインストーミング形式で、班の中でどんどん意見を出してそれをメモしておいて、意見が全て出たらそれらをまとめるなどして決める方が早かったと思いました。
SSDSEでPPDACをやる上で、最初のPの段階で進め方の問題を発見して、PDCAの考え方で問題を解決していこうということですね。略語ばかりですが、何を言っているかわかりますよね。学んだことをいろいろな形で活かしてください。
パワーポイントを配布したいときは、書いて欲しいことを適切な場所に書いておけば、わかりやすいし作る側の書き漏らしやミスが防げるのでいいなと思った。
今回配布のテンプレートはそれぞれのページにPPDACのステップと書くべき内容がわかるようなものにしました。指示に従い素直に作ると、スライドが完成する仕組みです。2回の授業で効率よく進めるための工夫です。
仮説を立てる際は、データ項目を見ながら考えていたので、PPDACのproblemと planは今回の授業では同時進行の部分があったほうがやりやすいのではないかと思った。データの収集までは終わらなかったが、必要なデータを抜き出してわかりやすく使用しやすい表にまとめる部分は丁寧に行いたい。
あらかじめデータセットが用意されていて、それを分析する場合はProblemとPlanは並行作業になりますよね。一般的な分析ではDataをどう集めるかを考える必要があるので、PとPは別々になるんですね。
「明らかにできないということが明らかになる」こともあるということが、この授業に限らず探究などの他のことにおいても結構大事なのではないかと思った。特にデータの情報量が少ないと起こりうるし、相関を明らかにするためにデータを収集したのでモヤモヤするかもしれないけれど、そこで無理に誇張や捏造をすることなく「明らかにならなかった」とするのを悪いことだと思わないようにしたい。今回は時間がないのでできないと思うけれど、探究などではさらに別のデータとも比べてみる手があると思う。ただデータを増やしすぎるとどれが何かわからなくなったり自分の出したい答えが不明瞭になったりする可能性もあるのではないかと感じた。情報量が多ければいいという話ではなさそうだなと思った。データとデータを照らし合わせて仮説をたてるのは確かに妄想がふくらんで楽しかった。(笑)
ある事象と他の事象に関係がないということがわかることも大切だと知り、これは課題研究も同じだと思いました。分析に失敗は存在しないということも課題研究と同様であった。データはさまざまな視点から違った焦点で見ることができるので、見る人によって、見方が変わるし、いつまで見ていられます。これがデータ分析の面白いところだと思いました。
エクセルの関数をググる力は大切だと感じた
グループで話し合うと色々な意見が出て面白かったし参考になる意見もたくさんあったが、その分一つに絞るのも難しいと感じた。データを使ってこれが成り立つ、ということでなく、これが成り立たない、というデータ分析もできるんだなと学んだ。
たとえ明らかにならなかったとしても、明らかにならなかったという事実が明らかになったことに意味があるので、分析において重要なのは、結果の内容ではなく課題に必要なデータは何かを考え、それだけを集めたデータに忠実に基づいて目的や課題に対する答えを示すことだと思った。SSDSEのデータの種類の多さと量に加えて、使うデータの組み合わせ方や、着目するポイントまで考えると分析結果は無限大にあると思った。データはただの数字だけれど、データ同士を組み合わせたりグラフに示したりと、効果的に分析しデータを加工することで、ひとつの意味を持つ説が出来上がることが面白いと思った。4人で同じデータとセットを見ていても、一人一人着目する点が異なり、様々なアイデアが出てきて楽しかった。
データが膨大だとかえって何から手をつけていいかわからなくなって路頭に迷ってしまうので、明確な目的意識を持って必要なデータだけをピックアップして分析するのが大事だとわかった。最初に比較するスケール(市区町村か都道府県か)を決めると考えやすかった。
データの分析ではただやみくもにデータを集まるのではなくテーマを決めて、仮説を立て必要なデータを決めるという準備がとても大切だと感じた。結論は答えを出すものだと思っていたけれど、授業を受けてみて、仮説の真偽を明らかにするものだとわかった。
データを見るときはまず詳しい内容を見るのではなく、フィールドからこんな関係があるんじゃないかと妄想することが大事だと分かった。実際に妄想してみると結果はどうなるか分からないけど調べたら面白そうな関係がいくつも見つかって良かった。また、仮説の証明に必要なデータを集める時にはグループだからこそ自分の中にはなかった視点があり、見逃していたデータをカバーすることができた。次回の授業では分析、結論にもこのグループでの利点を活かして行いたい。
データを見れば見るほど謎の値(ゲーム禁止条例がある香川県がなぜかゲーム時間多い点など)が出てきたため面白かった。次回までにデータを集めておきたい。
みんなそれぞれの席についてそれぞれ話し合うよりも、一か所に集まって話し合ったほうが話がわんさか進んだ。やっぱり声に出してみることが大事なんだなと思った。
一つのデータだけでは意味が無いようなデータでも、複数のデータを組み合わせることで、普段とは違う視点で考えることが出来るのは面白い。実際にデータを扱ってみると、PPDACの流れをはっきりと理解できた。グラフに表したときに、データにどんな関連性が出てくるのかが楽しみ。
仮説を考えても、与えられたデータの内容だけではわからないことが分かり、最初のPを決めることが思っていたよりも時間がかかった。データ分析の経路がPPDACであることを学びよりも、自らPPDACを体験した方がより理解できた。SSDSEのデータの解説書を読み下すのに、時間がかかってしまって、自分はまだまだ情報での考え方ができてないんだなと感じた。すぐにデータの概要をつかめなかったが、よく考えたら、ローマ字で分類していただけでそれほど難しくなかった。だから、解説書でしくみを理解することが先なんだと思った。
家計消費のデータは量ではなく金額ということに気が付かずに仮説を立ててしまい、うまくいかずに時間を使ってしまった。このことから、データの単位には注意しなくてはいけないなと思った。また、班で話し合うことでどのようなデータを集めるのが適切かというのが分かりやすくなった。複数の視点を持ち、検討することで適切な手法が見えてくると今回の活動で感じたので、データを分析する際には先行研究などを通して多様な分析の方法を学んでから実際に分析を始めるようにしたい。
郷土料理の材料となる食料の消費量を比べようとしたが、その食料が多いからといってその郷土料理に全て使われているかと言うとそういう訳でわないことに気づきました。データの分析の難しさを感じた。
先にPPDACの過程を考えてそこから必要なデータを考えると、大量のデータをすべてチェックする必要がなくなった
多様性を大切にグループ組んでと言われた意味が分かった。データが多種多量にある分、分析の幅も拡がり視点を決めるのが難しかった。SSDSEというような情報学教育をサポートする存在がどんどん増えて言ったらいいなと思った。
探究にも役に立つが問いを立てる大切さを実感した。問いをしっかり立てないと、自分が何を知りたいかが明確にならないため、資料集めに苦戦する。また、その時にいらないデータを早めに削除しておくことで、自分が何を知ろうとしているのかがわかり、分析がしやすくなる。
班で比べたいデータを話し合ったが、その中で都道府県別に考える必要がないものも出てきて、データを活用するにはそのデータの特徴を考えて比較する必要があると思った。また実際にデータを見て特徴的なデータを見つけ、その理由を考えることもデータの分析方法として出来そうだと思った。
北側にある国はお酒の消費量が多いことを参考に、日本でも似たような傾向が見られるのではないかと仮説をたてて都道府県、お酒、気温を見比べてみたら相関が見られて面白かった。数値と項目を交互に見て比較したり相関を探したりするということが、実践してみてよく分かった。
予想するだけなら簡単なのに、仮説を立ててデータを検証するためには、定義付けや使うデータの絞り込み、効果的なグラフの使い方などたくさんの手順を踏まなければならないことを実感した。時間が限られているから簡単な仮説なのに細かく分析していくのは少し面倒くさく感じるけど、正確にデータを分析することは、もっと複雑な分析をするときに役に立つし、もし適当にやって分析が間違ったまま結論を出してしまったら困るから、今回授業で習ったことは、今後探求などでデータを分析するときにもとても役に立つと思った。

自己評価集計

自己評価集計

ワードクラウド

3つのキーワード

3つのキーワード
感想や気づき

感想や気づき
テキストマイニング 無料ツール by ユーザーローカル
前のページに戻る