Excel で度数分布を作成する方法

コンサル

序章

Excel で度数分布を作成することは、プログラムのユーザーがグループ数に関連するデータをまとめて表示できるようにする分析ツールです。つまり、ユーザーは、特定のデータ セット内でさまざまなカテゴリに分類されるアイテムの数を判断できます。度数分布は、性別、年齢、その他のカテゴリ データなどの変数を分析する場合に役立ちます。このガイドでは、いくつかの簡単な手順を使用して、Excel で度数分布を作成する方法について説明します。

度数分布を作成する最初のステップは、データを Excel ワークシートに入力することです。データを入力したら、分析する変数を含む列を特定する必要があります。たとえば、性別と年齢を調べている場合、それらの列を特定し、それらの横にさらに 2 つの列を挿入します

次に、分析している変数 (年齢層など) に基づいてカテゴリを作成する必要があります。性別と年齢の例では、18-25、26-35、36+などのカテゴリを作成できます。これを Excel で効率的に行うには、COUNTIF 関数を使用します。COUNTIF($A$1:$A$50,“<18”)という式を下にドラッグします。ここで、A1 から A50 までが年齢の範囲です。この数式は、指定された範囲 ($A$1: $A$50) 内の 18 歳未満の人数をカウントします。範囲を指定するための構文は、Excel のバージョンによって若干異なる場合があります。お使いのバージョンのプログラムに固有の手順については、数式と関数の使用に関する Microsoft のドキュメントを参照してください。

最後に、すべてのカテゴリ範囲が特定され、範囲内 ($A$1: $A$50) のカテゴリ タイプごとにカウントが集計されたら、ピボット テーブルまたはMicrosoft Powerなどの別のツールを使用して、調査結果を 1 つのテーブルにまとめることができます。必要に応じて、デバイスまたはコンピューター システムにインストールされている Excel のバージョンに応じて、[挿入] > [ピボット テーブル]または[挿入] > [チャート/グラフ/ビジュアライゼーション]をクリックして、ビューまたは Tableau Public を表示します。

度数分布について

度数分布は、データを提示および視覚化する体系的な方法を提供し、分析結果の理解と解釈を容易にします。度数分布を使用して、特定の範囲の値における母集団の分布を示すことができます。

この記事では、Excel で度数分布を作成する方法について、ステップバイステップ ガイドと例を使用して説明します。

度数分布とは

度数分布は、間隔またはクラスで度数を表示する一種の数学的表現です。簡単に言えば、特定の期間に何かが発生した回数を示します。このデータは、統計やビジネスなどで、研究分野への洞察を得るために役立ちます。

度数分布は、グループ化されていない形式またはグループ化された形式のいずれかを使用してデータを要約できます。グループ化されていない度数分布は、個別にリストされた各値の度数を使用して、データ セット全体の概要を提供します。グループ化された形式を使用して、集計された範囲を表示します。各間隔には複数の値が含まれ、それぞれの頻度が集計されます。

Excel で度数分布を作成するには、次のことを行う必要があります。

  • データの範囲を指定する
  • グループ化の目的で使用するクラスの数を決定します (例: 10 クラス間隔)
  • それに応じて列の合計を計算します
  • 各クラス間隔の累積数に対応する列の高さでグラフを生成します
  • 視覚要素をカスタマイズして、統計情報をより明確に伝えることができます。たとえば、軸ラベルやタイトルを追加したり、必要に応じて色を付けたりできます。

度数分布の種類

度数分布は、データ値をパターンに配置する統計ツールです。最高度数 (特定の変数の出現回数) を一番上に、最低度数を一番下に配置します。一般に、度数分布は、値の範囲に基づいて変数をグループ化することによって作成されます。さらに、度数分布により、さまざまなレベルでデータをグラフと数学の両方で分析できます。

度数分布には、離散分布連続分布の 2 種類があります。個別のデータは個々のユニットで発生し、それらの間で結果が生じる可能性はありません。たとえば、クラス内の生徒数は離散分布の例です。正確な値は、6、7、または 8 としてのみ示すことができますが、6.5 または 7.5 などではありません。連続データは、特定の測定値または時間である人の身長や体重などの特定のパラメーター内で任意の値を持つことができますとある出来事これには、指定されたパラメーター間に存在する時間値があります。たとえば、開始時間と終了時間はそれらの間で異なる値を持つことができますが、それぞれ午前 8:30 と午前 10:00 のように指定された開始時間と終了時間を超えることはできません。すべての分が午前 8:30 の間にあります– 午前 9 時 29 分 & 午前 9 時 30 分~午前 10 時。

データの設定

度数分布は、データを分析するための非常に便利なツールです。Excel で度数分布を作成するには、まずデータを設定する必要があります。これには、列と行へのデータの整理、ラベルの追加、各列のデータ型の設定が含まれます。これらの手順に従うことで、使用しているデータが正確で最新であることを確認できます。データを設定する手順について説明します。

  1. データを列と行に編成します。
  2. ラベルを追加します。
  3. 各列のデータ型を設定します。

データの準備

Microsoft Excel で度数分布を作成する前に、データを数値順に並べ替えて準備する必要があります。これは、ページ上部の[データ]タブをクリックし、 [並べ替え]を選択することで、すばやく簡単に実行できます。次に、並べ替える値を含む列を選択し、その列を昇順または降順で並べ替えるかどうかを決定するよう求められます。データの並べ替えが完了したら、[OK]をクリックして終了します。

度数分布表を作成する前に、データ ラベルをすべて削除しておくことも重要です。これを行うには、次のことができます。

  • テキストを含むセルを強調表示して削除します
  • [データ]タブにある Excel のフィルター機能を使用します。

数値が数値順に並べ替えられ、ドキュメントから余分なテキスト ラベルが削除されたら、Excel で度数分布表を作成する準備が整いました。

データのフォーマット

Excel で度数分布を作成するには、データをスプレッドシートの列と行に配置します。データに含まれているテキストはすべて削除する必要があるため、残るのは数値だけです。さらに、データが複数の列または行にまたがる場合は、関連するセクションを強調表示し、ツールバーの [ホーム] タブから[検索と選択]をクリックし、[移動] を選択してそれらを 1 つの列に移動します。

データが Excel で使用できるようにフォーマットされたら、各グループを識別するための追加の列を作成します。1 つの列に[頻度] (各グループの値の総数)、[グループ] (各グループにラベルを付けるためのテキスト)、[範囲] (各グループの最小値から最大値まで)、および [中間点] (範囲の平均) にラベルを付けます。表の上部に「Describe Frequency Distribution」というラベルの付いた行も含めます。これには、サンプルサイズ、クラス間隔、および分布の形状に関する情報が後で含まれます。

数式や関数を使用する前に、データを正しくフォーマットすることが不可欠です。行や列に空のセルがなく、正確な番号順に入力されていることを確認してください。また、複数のタイプのデータで度数分布を作成する場合は、さまざまなグループまたはカテゴリに適切なラベルを付ける必要があります。これらの簡単な手順を実行すると、後で分析結果を解釈しやすくなります。

度数分布の作成

Excel で度数分布を作成すると、データ分析に非常に役立つツールになります。度数分布を作成すると、特定のデータセットで最も一般的な値をすばやく簡単に判断できます。これは、傾向を特定し、さまざまなデータ グループを比較するのに役立ちます。

この記事では、 Excel で度数分布を作成する方法を説明します。

FREQUENCY 関数の使用

Microsoft Excel の FREQUENCY 関数は、数値データの度数分布を計算するために使用できる統計関数です。つまり、データセット内の数値の数をカウントし、それらをビン (グループ化された間隔) に表示します。この関数には、data_arraybins_array、およびcumulative の3 つの引数があります。

data_array引数はセルの範囲、または度数分布を計算する数値を含む配列定数です。bins_array引数は data_array の要素がグループ化される重複しない間隔 (ビン) の上限を含む範囲です。最後に、累積引数はTRUEまたはFALSEのいずれかで、度数と累積度数の両方を含む配列形式を返すかどうかを示します (既定では False に設定されています)。

この関数を使用すると、ユーザー定義ビンの数値間隔として表示される各ビンの度数に対応する値の配列が返されます。こうすることで、チャートやその他の視覚化を簡単に使用して、独自のデータまたは外部ソースを使用して複数レベルの度数分布を表すことができます。

COUNTIF関数の使用

データに関する質問に答えようとしている場合、たとえば「9 から 11 の間にある項目はいくつありますか?」などです。または「メンバーが最も多いグループはどれですか?」頻度分布は、パターンや傾向をすばやく特定するのに役立ちます。頻度分布は、サンプル内のさまざまな結果の頻度を示す要約テーブルです。値の範囲全体を相互に排他的な間隔 (ビン)に分割し、これらの間隔を対応する頻度で表示します。

Excel で度数分布を作成する 1 つの方法は、COUNTIF 関数を使用することです。この関数は、範囲と基準の 2 つの引数を取り、指定された基準を満たす範囲内のセルの数を返します。ビンを作成するには、すべての値を 1 つの列に入力し、最終値の下のセルを選択して、[挿入] > [関数] > [COUNTIF] をクリックし、次の式を使用します: COUNTIF( Window 1:Window n,”>= LO && < HI”) . LO はビンの下限、HI は上限です。この式を n 回繰り返し、必要に応じて各ウィンドウの LO と HI を調整します。最後に、これらすべての COUNTIF 関数を合計して、各ビンの合計数を取得します。

ピボット テーブルの使用

ピボット テーブルは、集計データを作成し、度数分布を作成する最も簡単な方法の 1 つです。ピボット テーブルを設定するには、データ範囲内のセルを選択し、[挿入] > [ピボット テーブル]に移動します。既定では、選択した範囲内のセルがピボット テーブルのソース データとして提案されます。

ピボット テーブルを使用して度数分布を作成するには:

  1. 分析に使用するフィールドを[行ラベル]ボックスにドラッグします。これにより、データがそのフィールド内の個々の項目またはカテゴリに分類されます
  2. 数値または「カウント」フィールドを「値」ボックスに重ねてドラッグし、それらの集計関数を「カウント」に変更します。
  3. ピボット テーブル内の任意のセルを選択し、[挿入] > [ピボット グラフ]に移動して、度数分布のグラフ ビューを生成し、すばやく視覚化できるようにします。

結論

度数分布を作成する方法は多数ありますが、Python と Excel を併用すると効果的です。このチュートリアルで概説したように、Python を使用してデータ セットを読み取り、それを .xlsx ファイルとしてエクスポートできます。Excel は、エクスポートされたデータ シートを取得し、単純な度数分布を取得できるようにセルを書式設定できます。Python と Excel の両方を併用することで、度数分布を作成するプロセスを自動化できます。

度数分布を作成すると、Python と Excel の両方で分析のオプションが提供されます。Python でさまざまな記述統計関数を使用して、中心傾向 (平均、最頻値、および中央値) を測定したり、分散を計算して、変数の値が互いにどのようにずれているかを確認したりできます。記述統計関数に加えて、レポートを作成する前に対処しないと、レポートをゆがめたり、不正確な結果を示したりする可能性のある外れ値欠損値を探すために、データ セットを解析することもできます。

全体として、Python と Excel を一緒に利用すると、目的の結果を得る時間を節約する方法と、外れ値や複数の変数にわたる傾向などのデータセットの結果を調べるための新しい方法が提供されます。個人の財務または事業運営情報を分析するかどうか。組織化された方法でデータをメッセージングすることで、数値が実際に何を言っているのかを非常に理解することができます!