Excel ヒストグラムの作成方法

コンサル

データの設定

Excel ヒストグラムのデータの設定は簡単なプロセスです。まず、ヒストグラムに表示するデータを選択する必要があります。次に、データをチャートに編成し、データを最小値から最大値の番号順に並べる必要があります。データ選択に空白のセルがあってはなりません。データが整ったら、次のステップに進むことができます。

視覚化するデータを選択します

Microsoft Excel でヒストグラムを作成すると、データを簡単に視覚化できるため、情報から明確な結論を導き出すことができます。

これを行うには、まず、視覚化するデータが Excel ドキュメントに含まれていることを確認します。データの 2 つの列が必要です。1 つはデータ セットに表示される値の範囲を含み、もう 1 つはそのセット内の各値の頻度、つまり出現回数を含みます。ヒストグラムを作成するときに簡単に選択できるように、隣接するセルに頻度をリストする必要があります。

次に、 x 軸(横軸)に表示する数値の範囲を決定します。これは、グラフ化する前に頻度がグループ化されるビン(または間隔)を表します。範囲 (0 ~ 10 など) を選択したら、その範囲に含まれるすべての値が両方の列に表示されていることを確認して、グラフ作成後に x 軸に正しく表示されるようにします。

データを選択して整理したら、ヒストグラムを作成する準備が整いました! Microsoft Excel は、同じファイル内のワークシートからの選択に基づいて、このようなグラフをプロットするための直感的で使いやすいツールを提供します。あとは、作成するグラフの種類を選択し、その設定を調整して、最大限の明瞭さと正確さを実現するだけです。

頻度表を作成する

Excel ヒストグラムを作成するときの最初のステップは、頻度表を作成することです。度数分布表を使用すると、特定の値または項目がデータ セットに出現する回数を簡単に強調できます。

これを行うには、データを最小から最大の順に並べ替えるか、文字列を扱っている場合は AZ から並べ替えます。次に、データセット内の値を数え、「Frequency」というタイトルの独自の列に入力します。データセット内の各アイテムの頻度を見つけるには、最後の選択のすぐ下のセルをクリックし、「=COUNTIF (‘[Range]’,'[Value]’)」と入力して、範囲と値の単語を該当する単語に置き換えます。あなたのデータセット。これは、1 つの値がセットに出現する回数を返します。

各項目についてこれが完了したら、以下に示すように、[頻度] の下の数値を含む各セルをクリックし、それをコピーして独自の列に貼り付けます。

これが完了したら、頻度データをフォーマットしてヒストグラムの作成に使用するだけです。

ヒストグラムの作成

Excel でヒストグラムを作成すると、データを視覚化するのに役立ちます。これは、データの分布を理解し、外れ値や傾向を特定するための優れたツールです。

このセクションでは、Excel でヒストグラムを作成する手順を見ていきます。適切なヒストグラムを作成するために必要なデータの選択、フォーマット、レイアウトについて説明します。

  1. データ選択
  2. 書式設定
  3. レイアウト

ヒストグラム チャート ウィザードを開く

ヒストグラムチャート ウィザードは、Microsoft Excel の分析ツール パックに含まれています。起動するには、ヒストグラムの作成に使用するグラフ データを含むセルの範囲を選択することから始めます。不要な行や空の行や列を削除するなど、分析用のデータを準備するために必要な手順をすべて行っていることを確認してください。

セルを選択したら、チャート ウィザード アイコンをクリックするか、[挿入] メニューから [ヒストグラム] を選択します。グラフ作成に使用するスプレッドシート要素など、データについて尋ねるポップアップ ウィンドウが表示されます。精度を確保するために必要な数のパラメーターを選択し、[次へ] をクリックします。

次に、Excel は、ヒストグラムに必要なグラフの種類と、それを範囲に分類するために使用するビンまたはバケットの数について尋ねます。この画面の左側にある[bins]をクリックして、自動ビン設定を選択するか、カスタム ビニング オプションを作成することもできます。完了したら [次へ] をもう一度クリックし、表示するグラフの種類 (棒グラフ、折れ線グラフなど) を選択して、[完了]をクリックします。結果のグラフは、より詳細に分析できるように、独自のウィンドウに表示されます。

データ範囲を選択

データを収集して Excel を開いたら、リボンの [分析] グループから[データ分析] ツールを選択します。これが表示されない場合は、[挿入] をクリックしてから [データ分析] をクリックします。

使用可能なツールのリストで [ヒストグラム]を選択し、ヒストグラムの作成に使用するデータを含むスプレッドシートのデータ範囲を選択します。これを行うには、データのすべての列を選択するか、必要に応じてセル範囲を入力します。

データ分析の [複数のヒストグラム]オプションをクリックして、複数の一連のデータからヒストグラムを作成することもできます。このオプションを選択すると、個別のヒストグラムを生成する一連のデータに関する詳細情報を入力するための追加のダイアログ ボックスが表示されます。このオプションを選択した場合は、残りのすべての手順を通常どおり実行しますが、特に指定がない限り、各シリーズを個別に実行してください。

ビン範囲を選択

ビン範囲は、ヒストグラムを作成する目的でデータをビンまたは間隔にグループ化するために使用される値の範囲です。一般に、ビン間隔の範囲をデータの範囲内に設定することをお勧めします。自動ビン オプションが選択されている場合、Excel は通常、間隔を動的に計算して調整します。

ヒストグラムを作成するには、[データ]タブを選択し、 [分析]グループにある[データ分析]をクリックします。リストから[ヒストグラム]を選択し、 [OK]をクリックします。Excel はウィザードを起動して、ヒストグラム チャートを設定します。

ウィザードの最初のページには、ソース データ、ビン、および出力オプションを設定するためのオプションが含まれています。ビン範囲を選択するためのダイアログ ボックスが開き、ユーザーはビン範囲の数値を入力したり、10 ~ 20、21 ~ 30などの手動範囲を指定したりできます。完了したら[OK]をクリックし、ヒストグラムを作成するために他の手順に従います。エクセル。

ヒストグラムのカスタマイズ

ヒストグラムは、データを視覚化して解釈するための優れた方法です。Microsoft Excel を使用すると、ヒストグラムをすばやく簡単に作成して、特定のニーズに合わせてカスタマイズできます。Excel ヒストグラムをカスタマイズするには、次のようなさまざまな方法があります。

  • ビンサイズの設定
  • カラーパレットの変更
  • タイトルとラベルの追加

Excel ヒストグラムをカスタマイズする方法を詳しく見てみましょう。

グラフの種類を変更する

すべてのデータを入力して調整したら、ヒストグラムのカスタマイズを開始できます。既存のヒストグラムのチャート タイプを他のチャート タイプのいずれかに変更すると、尖度と歪度をより適切に視覚化できます。これをする:

  1. ヒストグラム データを選択し、リボンの [挿入] タブに移動して、[グラフ] グループから他のグラフ タイプのいずれかを選択します。
  2. グラフを右クリックし、ドロップダウン メニューにある [グラフの種類を変更]を選択します。
[チャート タイプの変更] ダイアログ ボックスに移動すると、ヒストグラムを別のチャート タイプ (縦棒、折れ線、面、棒など) に変更するためのオプションがいくつか表示されます。ヒストグラムを作成する目的 (尖度または歪度を調べる) に最も適したものを選択します。たとえば、データ セットに多数のカテゴリまたはビンがあり、それらを簡単に比較したい場合は、従来のヒストグラムではなく、線または面タイプのグラフを選択します。

さらに、一部のグラフ (縦棒グラフなど) には、「クラスター化」というラベルの付いた「グラフのサブタイプ」に表示されるオプションがあります。有効にすると、重複するのではなく、各ビン内に 2 つの測定値を並べてプロットし、異なるシリーズ間でより正確な測定値を作成できるようにします (たとえば、特定の年の四半期内の製品間の売上を比較します)。このサブタイプを変更すると、Excel が数値データ ポイントを視覚化する方法をさらに絞り込むことができます。これにより、従来のヒストグラムと連続して比較したときに、尖度または歪度をより正確に解釈できます。

軸ラベルを編集する

Excel ヒストグラムを作成するときは、各軸に適切なラベルを付けて、グラフを見ている人が何を表しているかをより簡単に理解できるようにすることが重要です。これを行うには、横軸または縦軸をダブルクリックします。これにより、 Format Axis Menuが表示されます。ここでは、横軸縦軸の両方のラベルのテキストをカスタマイズしたり、フォント サイズと色をカスタマイズしたりできます。

経時的な測定値をグラフ化する場合は、 X 軸ラベルとして必ず年または日付を使用し、 Y 軸にラベルを付けるときにグラム/mLなどの測定単位を含めてください。これらのラベルを、提示している他のグラフと一致させることで、データ ポイントを明確に理解できるようになります。

ビンの幅を調整する

Excel でヒストグラムを作成すると、入力したデータに対する貴重な洞察が得られます。データはグラフィカルに表現できるため、より迅速に解釈できます。ヒストグラムをより意味のある正確なものにするには、ビンの幅を考慮することが重要です。各ビンの幅は、その範囲内のすべての値を含むデータの範囲を表します。

たとえば、データが0 から 5 の間で 10%、5 から 10 の間で 15%、10 から 20 の間で 20%、20 から 30 の間で 30%、30 から 40 の間で 25% で構成されている場合。これらの 5 つの範囲は、0 ~ 5、5 ~ 10 などの 5 の幅を持つ 5 つのビンとして分類できます。ビンの幅を設定するための選択は、ヒストグラムをどれだけ正確にする必要があるかによって異なります。

Microsoft Excel でヒストグラムをカスタマイズするときは、上部の[積み上げ列] をクリックして、ビンの幅の設定を変更するためのダイアログ ボックスを開きます。この設定ウィンドウでは、任意の整数値を手動で入力するか、ドロップダウン リストから使用可能な値を 1 つ選択することにより、 「 Bin Size 」を変更できます。さらに、このウィンドウには、ヒストグラムの作成中にギャップ オプションを選択するかどうかを選択するためのオプションもあります。この構成プロセスを完了するには、[OK] ボタンをクリックします。これにより、選択した設定パラメーターに従って最終的にヒストグラムが更新されます。

ヒストグラムの分析

Excel ヒストグラムを作成したら、それを分析して結果を理解します。ヒストグラムは、データの分布を評価し、傾向を特定するために使用されます。ヒストグラムを使用して、2 つの異なるデータ セットを比較することもできます。このデータ視覚化ツールを使用すると、経時的にデータを追跡および比較できます。

ヒストグラムを分析する方法を見てみましょう:

ヒストグラムの形状を解釈する

ヒストグラムの形状は、データの分布を判断するのに役立ちます。ヒストグラムの形状が右に歪んでいる場合は、データに小さい値よりも大きい値が多いことを示しています。逆に、左に歪んでいる場合は、大きい値よりも小さい値の方が多いことを示しています。対称ヒストグラムは、値がlarge と small の間で均等に分布していることを示しています。

また、データの形状に複数のピークまたはディップが存在する場合や、さまざまな個別の分布を示すさまざまなクラスターが存在する場合があります。

その形状を解釈するだけでなく、データのヒストグラムを見て、データが正規分布に従っているかどうかを識別することもできます。正規分布とは、ピークが 1 つだけあり、歪度がない (対称) 分布です。すべてのデータ ポイントが 1 つのポイントの周りに対称的なベルのような曲線を形成している場合は、正規分布に従っている可能性があります。データが正規分布に従っているかどうかを確認するには、QQ プロットや ShapiroWilk 検定などのさまざまな統計検定を使用できます。

外れ値を特定する

外れ値は、データ セット内の通常の観測値から遠く離れた観測値です。これらの潜在的に影響力のある異常値を特定することが重要です。これらの異常値は、分析や実験の結果に非常に大きな影響を与えることがよくあります。

ヒストグラムを評価するときは、コーヒーの 2 つの異なる抽出方法を比較する場合など、分布と形状をそれに似た他のものと比較すると役立ちます。ヒストグラムを見るときは、ビニングされたデータのグループに異常値が存在するかどうかを観察する必要があります。データのビン分割では、大規模なデータセットを、ビンまたはバケットと呼ばれる管理しやすいセグメントに分類することで、それらを小さなグループに分割します。

他のビニングされたバケット (全体的な形状を形成する) と比較して、値が分布の外にあるように見えるかどうかを確認すると、不正確な回答またはサンプルの変動を示す可能性のある外れ値を特定するのに役立ちます。通常、外れ値は、グラフまたは表示内で通常のグループとは一線を画して目立ち、注目を集めます。たとえば、観察された 1 つのバケットに値がなく、他のすべてのバケットに異常値を示す可能性のあるグループ内の結果が示されている場合です。

当然のことながら、外れ値の特定はコンテキストによって異なります。ただし、信頼性と厳密性を確保するためには、データを分析する際に、傾向やパターンに関する推論を行う前に、収集したデータ セットに存在する異常値を特定することが常に必要です。

中央値と最頻値を計算する

データをヒストグラムにプロットしたら、ヒストグラムを使用してデータの中央値最頻値を計算できます。中央値は分布の中央値であり、それより下の項目の数にその上の項目の数の半分を加えたものに等しくなります。ヒストグラムから中央値を決定するには、最大数のポイントが表されている場所を見つけてから、50%に達するまで各バーの下にあるポイントの数を追跡しながら下方に移動します。その時点でのバーは、中央値に等しくなります。

モード、どのバーがその下にプロットされたほとんどのポイントを含むかをヒストグラムで表します。たとえば、それぞれ5、6、および 8 ポイントの3 つのバーがある場合、8 が最頻値を表します。これは、グラフ上の任意の 1 ポイントが最も多く発生するためです