データとデータの分布

データとは?

分布とは?


データとは:

物事や事象を人間が5感で感覚・知覚し、認識しうる形式で表したものであり、

伝達、解釈、処理などに適するように形式化、符号化、数値化したものをいう。

また、再度情報として解釈できるものである


Q 情報とデータの違いは?

直面している問題の解決や、意思決定に役立つか否かという観点から、データと情報を区別する場合もある。データは意味を生み出す素材である。データから意味を見出した場合に情報という。

データのなかの問題解決に役立つ材料のみを、情報とよぶ。

Q 同じデータでも意味が異なることがある、理由は?

データを受けとった人によって、さらにはその人の状況によって、データであるか、情報であるかは変化することになる。

 

Q 理学療法の中でデータと言えるものを挙げてみよう

(ヒント、数値化)


情報とは:

意味のあるデータのこと。


直面している問題の解決や、意思決定に役立つか否かという観点から、データと情報を区別する場合もある。その場合においてデータとは、情報を生みだすための素材のこと。データのなかの問題解決に役立つ材料のみを、情報とよぶ。データを受けとった人によって、さらにはその人の状況によって、データであるか、情報であるかは変化することになる。

 

 

データは、関連するものがひとまとまりにされ、整理されて保管されることが多い。

これをデータ保管とよぶ。そこで保管されたデータの集まりをファイルと呼ぶ。

データの流れは、データフローと呼ばれ、データフローダイアグラムなどを用いて記述される。

処理の対象にされるデータの集合のことを、データベースとよぶ。


分布とは:

数値を何らかの順序で並べ、座標上に置いたの時の形(ばらつき)のこと


星座を見つける作業と同じ・・・

 数値化できるデータで、その取りうる値の幅が大きいとき、人間が恣意的にならない限り、そのデータの最大頻度が中心にくる山形の形をとる。この形のことを確率分布と呼ぶ。

 

代表例に正規分布、Normal Distributionがある。

Normal Distributionは、ド・モアブル二項分布の近似として発見した確率分布である。 その後、ラプラスルジャンドル等の誤差最小二乗法に関する研究を経て、ガウスの誤差論で詳細に論じられた。ガウス分布(Gaussian Distribution)とも呼ばれる。


自然界で最も多く見られるデータの分布とは:

正規分布


"自然界"の事象(無機的なそれ)の中には、正規分布に従う数量の分布をとるものがある事が知られている。しかしそれは"多数派"という訳ではない。19世紀ではさながら正規分布万能主義といったものがまかり通っていたが、20世紀以降そういった考え方に修正が見られた。社会現象、生物集団の現象等々、種別から言えば、正規分布に従うものは少数派であることが確認されている。
何らかの事象について法則性を捜したり理論を構築しようとしたりする際、その確率分布がまだ分かっていない場合にはそれが正規分布であると仮定して推論する事は珍しくないが、誤った結論にたどりついてしまう可能性がある。
本当にその事象が正規分布であるかどうかは実際のデータから確認するしかない。

 

 http://ja.wikipedia.org/wiki/%E6%AD%A3%E8%A6%8F%E5%88%86%E5%B8%83

>データの分布・代表値・ばらつきが重要


統計の基本は でぶだば


 

最終更新:2012年04月24日 10:02