データレベルと測定

概要

このページでは、測定の四つのデータレベル(公称、順序、間隔、比)とそれらが重要な理由につ 重要性の部分を最初に取扱わせて下さい。

変数の測定レベルを知ることは、2つの理由から重要です。 測定の各レベルは、異なる詳細レベルを提供します。 Nominalは最小の詳細量を提供し、ordinalは次に最大の詳細量を提供し、intervalとratioは最大の詳細量を提供します。

ノミナルレベル変数では、値は意味のある順序を持たないカテゴリにグループ化されます。 たとえば、性別と政治的所属は名目上のレベル変数です。 グループ内のメンバーには、そのグループ内のラベルが割り当てられ、階層はありません。 ノミナルデータに関連する典型的な記述統計は、頻度とパーセンテージです。

ご相談ください

私たちはあなたの論文の章を編集するために支援する方法を発見

理論的な枠組みを整列させ、記事を収集し、ギャップを合成し、明確な方法論とデータプランを明確にし、あなたの研究の理論的かつ実践的な意味について書くことは、私たちの包括的な論文編集サービスの一部です。

  • 論文編集の専門知識を第1-5章にタイムリーにもたらします。
  • すべての変更を追跡し、学術的な執筆をもたらすためにあなたと協力してください。
  • 委員会のフィードバックに対処し、改訂を削減するための継続的なサポート。

序数レベル変数は、意味のある順序を持つノミナルレベル変数です。 例えば、競馬の勝者には、第一、第二、第三、第四などのラベルを割り当てることができる。 そして、これらのラベルは、それらの間に順序付きの関係を持っています(すなわち、firstはsecondよりも高く、secondはthirdよりも高く、など)。 ノミナルレベル変数と同様に、順序レベル変数は通常、頻度とパーセンテージで記述されます。

間隔および比率レベル変数(連続レベル変数とも呼ばれます)には、それらに最も詳細が関連付けられています。 加算、減算、乗算、除算などの数学演算は、これらの変数の値に正確に適用できます。 例の変数はクッキーの調理法で使用されるミルクの量である(コップで測定される)。 この変数は、2カップの牛乳が1カップの牛乳の2倍になるような算術的性質を持っています。 さらに、1カップと2カップのミルクの違いは、2カップと3カップのミルクの違いとまったく同じです。 区間および比レベル変数は、通常、平均および標準偏差を使用して記述されます。

測定のレベルが重要である第二の理由は、測定のレベルが異なる変数には異なる統計的検定が適切であるためです。 たとえば、独立性のカイ二乗検定は、公称レベルデータに最も適しています。 Mann-Whitney U検定は、順序水準従属変数と公称水準独立変数に最も適しています。 ANOVAは、連続水準従属変数および公称水準独立変数に最も適しています。 どのテストがどのタイプの変数を使用するかを知るには、無料のホワイトペーパーをダウンロードしてください。

測定の公称データレベル

公称変数は、値が数値であっても、値がラベルとしてのみ機能する変数です。 たとえば、男性と女性の回答者を分類する場合、男性には1、女性には2の数を使用できます。 しかし、この場合の1と2の値は意味のある順序を表したり、数学的な意味を持ったりするものではありません。 それらは単にラベルとして使用されます。 公称データは、平均値や標準偏差などの多くの統計計算を実行するために使用することはできません。

ただし、ノミナル変数を使用してクロス集計を行うことができます。 カイ二乗検定は、公称データのクロス集計で実行することができます。

測定の順序データレベル

順序変数の値は、それらにとって意味のある順序を持っています。 たとえば、教育レベル(high school、undergraduate degree、およびgraduate degreeの可能な値)は序数変数になります。 カテゴリには決定的な順序があります(つまり、大学院は学部よりも高く、学部は高校よりも高い)が、それを超えた他の算術仮定はできません。 例えば、学部と高校の教育レベルの違いが、大学院と学部の違いと同じであるとは仮定できません。

頻度、パーセンテージ、および特定のノンパラメトリック統計を順序データで使用できます。 ただし、平均、標準偏差、およびパラメトリック統計検定は、通常、順序データで使用するのには適切ではありません。

間隔スケール測定のデータレベル

間隔変数については、値の差の程度について算術的な仮定を行うことができます。 間隔変数の例は温度です。 私たちは、70度と80度の差が80度と90度の差と同じであると正しく仮定することができます。 しかし、乗算と除算の数学的演算は、区間変数には適用されません。 たとえば、100度が50度の2倍の高温であるとは正確には言えません。 さらに、区間変数には意味のあるゼロ点がないことがよくあります。 例えば、(摂氏と華氏のスケールで)ゼロ度の温度は、熱の完全な欠如を意味するものではありません。

一部の研究者は、Likertスケールで測定された変数(例えば、1=強く同意しない、2=同意しない、3=中立、4=同意する、5=強く同意するなどのラベルを持つ)を区間変 ただし、Likertスケール応答を区間データとして扱うには、スケール上の点間の差がすべて等しいという前提があります。 つまり、5点リッカートスケールを間隔スケールとして使用すると、強く同意すると同意するの差は、中立と同意するのと同じ相対差であると仮定します。 これはしばしば安全な仮定ではないので、Likertスケール応答は通常序数として扱われる方が良いです。

間隔変数は、平均(平均)、標準偏差、ピアソン相関係数などの一般的に使用される統計的尺度を計算するために使用できます。 他の多くの高度な統計的検定や手法にも、間隔または比率データが必要です。

比スケール測定のデータレベル

すべての算術演算は、比変数に対して可能です。 比率変数の例は、重量(例えば、ポンド)であろう。 私達は正確に20ポンドが10ポンド二度重いと言ってもいい。 さらに、比率変数には意味のあるゼロ点があります(たとえば、正確に0ポンドはオブジェクトに重みがないことを意味します)。 比率変数の他の例には、会社の総売上高、会社の支出、会社の収入などが含まれます。

比変数は、t検定、F検定、相関、回帰などのほとんどのパラメトリック統計検定の従属変数として使用できます。

コメントを残す

メールアドレスが公開されることはありません。