2023情報I 3学期
第1回 授業の振り返りより

質問より

クラスの出席番号は、誰かがつけた質的データといえますが、あいうえお順で数えれば、分かるということで量的データともいえませんか?そこらへんの違いが少し良く分からなく……。
あいうえお順とは限らないですよね。例えば、転入生がいたら、おそらく後ろの番号になりますよね。その人が持つ特性ではないので、その人を測ってもわかりません。
データを尺度とかの言葉で分類する利点って何ですか/なぜデータを細かく分ける必要があるのですか?
名称はどうでもいいのですが、データの持つ特性を理解しておかないと、データの処理が正しくできないからです。「1.はい・2.いいえ・3.どちらでもない」のアンケートを集計するとき、集まった数を平均しても意味が無いですよね。それは「名義尺度」だからなんです。
円グラフを用いると、だまそうとしていると受け取られるのはなぜですか
円グラフで表されたデータは正確に読み取りにくいからです。こちらの記事がわかりやすいと思います。
音楽や動画はデータとしてはどちらに分類されますか?
ここでいう分析対象のデータではありません。
質的データの順序尺度に当たる満足度アンケートなどは測ってわかる数字ではないため、回答者によってかなり個人差が出ることがわかりました。その個人差が結果に影響しないようにされている工夫はどのようなものですか。
平均を求めるなどの計算をしないで、集計数の割合を見るようにしませんか?そういった一般的な、言ってみれば当然の工夫が必要です。
質的データは数値を選択する。量的データの数値を入力する。というイメージでいいですか?
なるほどね。そういった感じでもだいたい正しいと思います。
質的データは必ず数字でないといけないのですか?
識別に使う記号なので、A・B・Cでもあ・い・うでも構いません。
授業中に先生がおっしゃっていた、年齢は身体からデータが取れるのかということを調べたら、骨からわかるらしいです。
骨の情報を得るには、分解しないとダメですね。それはできないので、誕生日からの日数を測って年齢を出していると考えると良さそうです。
西暦0年はキリストが生まれた年と人が定めたのなら量的データではなく、質的データだと思うのですがどうなのでしょうか?
基準を決めなければ測れないので、0はそのように決めましたが、そこからの期間を測って何年と決めているので、量的データです。
先生は授業中、質的データと量的データの違いについて、前者は作為的に番号が振られていて、後者は測ったらその値になったと言っていたが、前者を相対的な数値(出席番号で言ったら前に何人いるかによって自分の質的データは変化する)、後者を絶対的な数値(身長や体重などの数値は他がどうであろうと変わることのない値)ととらえることもできるのでしょうか。
質的データは恣意的につけることも可能なので、相対的であるとは限りません。紹介したのは簡単な見分け方であって、識別に使われる質的データと数値として意味のある量的データという考え方が基本です。
日本の電話番号+81であることも名義尺度に入るのか気になった
電話番号は分析の対象となるデータではないですよね。単に付番しただけのことですね。

感想より

質的データは誰かが決めたもので量的データは測ることができるって言うけど、物によっては人が定めたものを起点として考えて測っているのかもしれない…!気温を比例尺度として考えると不自然さがよくわかる!!
測るといっても、長さも誰かが決めたものですから、基準の問題じゃないのです。物理量とも説明したとおり、そのものが持つ「量」を測ったデータが量的データなのです。
人がつけたものか測ったら分かるものかというのがとても分かりやすくて腑に落ちる判別の仕方だった。
人がつけたものが質的データ、測ればわかるものが量的データという説明ですね。だいたいこれで正しいのですが、迷うときは定義に戻って考えてみましょう。測ればってよく考えると人が基準を作っているので、測った結果も人が付けたものだったりしますよね。
普段YouTubeやインスタグラムなどを見る時に無意識に利用していた#(ハッシュタグ)などのタグ付けが、いざ「データを分類する方法」であると言語化されるとすぐに思い浮かばなかった。そのため、日常生活を送る際に物事の仕組みや構造を理解しようとしていないことが自分のなかで明らかになってしまい、知識を増やせる場面があったとしても無駄にしてしまっているのではないかと考えられた。これからは今までの当たり前にも目を向けて、疑問を抱き解決することで新しい知識や考え方を増やし、これからの生き方をより有意義なものに変えていきたいと感じた。
情報の見方、考え方を身につけると、日頃の生活の中で学んだことが活かされている場面や、上手に活用できる場面が見つかると思いますよ。そうやって共通テストまでの間、「情報の力」をキープするようにしてください。
誕生日は順序尺度と名義尺度のどちらに分類されるのか気になりました。
どちらも違います。誕生日からの日数を数えているので、間隔尺度です。
質的データは計算をしても意味がないとあったが、質量データのなかでも満足度などは平均値を計算すると意味をもつのではないかと思った。また、質的データは計算しても意味がないのなら食べログなどの☆も意味がないのかなと思った。
5段階で(悪い-普通-良い)なのか、5点満点なのかによって違いますが、5点満点だって大して意味がないので、参考程度に考えるのがいいんでしょうね。
例えば、感染者数のデータを取り上げたとき、○倍になった、○人増えた、のどちらでも言えるので、比例尺度と間隔尺度のどちらが適切なのか気になりました。
○倍になったといえるのであれば、比例尺度ですね。比例尺度⊃間隔尺度なので、比例尺度であれば、間隔尺度でもあるのです。
グラフを利用するとき、それぞれの比較したいことを考え、それぞれの用途に合ったものを利用することが大切だと分かった。質的データと名義尺度の理解が少し難しかったが、友達と共有したり、先生に質問することで解決できたので良かった。
間隔尺度と比例尺度の違いがぴんときていなかったが、絶対的な数値で何倍などの表現がされず、してもどこか不思議になってしまうものは間隔尺度、0が絶対的に原点として意味を持つものは比例尺度だと友達との会話で落とし込むことができた。また、Excelでデータから適切なグラフを作り出す作業が、グラフごとのいろいろな見方が試せて楽しかった。
データの分類について学んで、データの本質に触れられた気がする。データときくと今まで難しい言葉のように感じていたが満足度など数値でないものもあって改めて知ると新鮮だった。
間隔尺度と比例尺度の違いが分かりにくかったけれど、2倍にしたらおかしいのは間隔尺度という考え方はとてもわかりやすかった。
間隔尺度は何倍するというのを使うと不自然になるとあったが、例えば気温なら前日比で+、-で表現することはよくあるし、それは別に気にならないので間隔尺度は足し引きはできるのだと思った。
今回の授業では、データについて細かい知識を増やせた。普段あまり意識せずに利用しているものなので質問などが浮かびづらかった。「知っているつもり」にはならないようにしたい。
グラフは数値を図化してわかりやすくしているものかと思いきや、事実誤認を誘い、作成者の都合の良い印象を与え騙すために使うことができるため、注意が必要だと思った。特に、3Dグラフは、遠近感を2Dの画面から認識しないといけないので、塾の広告など、日常にあふれているが気を付けるべきだと思った。また、円グラフは、異なる形の大小を正確に比較することや、割合を読み取ることが難しいので、単純な選択肢の時(2択など)のみ、使うべきだと思った。
データは得るだけで無く、加工して比較したりすることでより価値が出ることが分かった。そのときに量的データと質的データなど、データの種類が分かっていると適切な処理ができそうだと思った。
pcは画像などの質的データの判断がつかないため、人間か機械かを判断するテストに使われているのだなと思った。また、その欠点を克服しようとAIを開発している人々は人間にしかできないことを機械にできるようにしているのだと思うと技術の進化は早いなと感じた。
テキストマイニングはとても興味深く面白そうだったので、自分でもやってみたいと思った。早速、演劇部の公演でお客さんから頂いた意見・感想をテキストマイニングして、よかったこと、悪かったことをあぶりだしてみたいと思う。
教科書を自分で読んだときは質的データと量的データの違いがいまいちよくわからなかったが、授業で出席番号の例と「物理量としての数値」という説明で完全に理解できた。自分がこれから何かのデータを整理するときは、計算可能かどうかや、データの整理の仕方において、データの種類を区別することは重要だと実感できた。
Excelではグラフの縦軸と横軸が簡単に入れ替えることができて感動しました。

自己評価集計

自己評価集計

ワードクラウド

3つのキーワード

3つのキーワード
感想や気づき

感想や気づき
テキストマイニング 無料ツール by ユーザーローカル
前のページに戻る