Как да се изчисли коефициент на корелация в Excel (2 лесни начина)

Excel е мощен инструмент, който има някои невероятни функции и функционалности при работа със статистика.

Намирането на корелация между две серии данни е едно от най -често срещаните статистически изчисления при работа с големи масиви от данни,

Работих като финансов анализатор преди няколко години и въпреки че не бяхме силно ангажирани със статистическите данни, намирането на корелация беше нещо, което все още трябваше да правим доста често.

В този урок ще ви покажа два наистина лесни начина изчислете коефициента на корелация в Excel. Вече има вградена функция за това и можете също да използвате пакета с инструменти за анализ на данни.

Така че нека започнем!

Какъв е коефициентът на корелация?

Тъй като това не е статистически клас, нека накратко да обясня какъв е коефициентът на корелация и след това ще преминем към раздела, където изчисляваме коефициента на корелация в Excel.

Коефициентът на корелация е стойност, която ви казва колко тясно са свързани две серии данни.

Често използван пример е теглото и ръстът на 10 души в група. Ако изчислим коефициента на корелация за данните за ръста и теглото за тези хора, ще получим стойност между -1 и 1.

Стойност по -малка от нула показва отрицателна корелация, което означава, че ако височината се увеличава, теглото намалява, или ако теглото се увеличава, тогава височината намалява.

А стойност повече от нула показва положителна корелация, което означава, че ако височината се увеличава, теглото се увеличава, а ако височината намалява, теглото намалява.

Колкото по -близо е стойността до 1, толкова по -силна е положителната корелация. Така че стойност от .8 би показала, че данните за височината и теглото са силно свързани.

Забележка: Има различни видове коефициенти на корелация и статистика, но в този урок ще разгледаме най -често срещания, който е коефициентът на корелация на Пиърсън

Сега, нека да видим как да се изчисли този коефициент на корелация в Excel.

Изчисляване на коефициента на корелация в Excel

Както споменах, има няколко начина, по които можете да изчислите коефициента на корелация в Excel.

Използване на формулата CORREL

CORREL е статистическа функция, въведена в Excel 2007.

Да предположим, че имате набор от данни, както е показано по -долу, където искате да изчислите коефициента на корелация между височината и теглото на 10 души.

По -долу е формулата, която би направила това:

= CORREL (B2: B12, C2: C12)

Горната функция CORREL приема два аргумента - серията с точките за височината и серията с точките за данни за теглото.

И това е!

Веднага щом натиснете enter, Excel прави всички изчисления в задния край, той ви дава един единствен брой коефициент на корелация на Pearson.

В нашия пример тази стойност е малко над .5, което показва, че има доста силна положителна корелация.

Този метод се използва най -добре, ако имате две серии и всичко, което искате, е коефициентът на корелация.

Но ако имате няколко серии и искате да разберете коефициента на корелация на всички тези серии, тогава можете също да обмислите използването на пакета с инструменти за анализ на данни в Excel (обхваната по -долу)

Използване на пакета с инструменти за анализ на данни

Excel има пакет с инструменти за анализ на данни, който може да се използва за бързо изчисляване на различни статистически стойности (включително получаване на коефициента на корелация).

Но пакетът с инструменти за анализ на данни е деактивиран по подразбиране в Excel. Така че първата стъпка би била да активирате инструмента за анализ на данни и след това да го използвате за изчисляване на корелационния коефициент на Pearson в Excel.

Активиране на пакета с инструменти за анализ на данни

По -долу са описани стъпките за активиране на пакета с инструменти за анализ на данни в Excel:

  1. Щракнете върху раздела Файл
  2. Кликнете върху Опции
  3. В диалоговия прозорец с опции на Excel, който се отваря, щракнете върху опцията Добавки в панела на страничната лента
  4. В падащото меню Управление изберете добавки на Excel
  5. Щракнете върху Go. Това ще отвори диалоговия прозорец за добавки
  6. Проверете опцията Анализ на инструментариума
  7. Щракнете върху OK

Горните стъпки биха добавили нова група в раздела Данни в лентата на Excel, наречена Анализ. В рамките на тази група ще имате опцията Анализ на данни

Изчисляване на коефициента на корелация с помощта на Пакет от инструменти за анализ на данни

Сега, когато отново имате инструмента за анализ на лентата, нека да видим как да изчислим коефициента на корелация, като го използваме.

Да предположим, че имате набор от данни, както е показано по -долу и искате да разберете връзката между трите серии (височина и тегло, ръст и доход, и тегло и доход)

По -долу са описани стъпките за това:

  1. Щракнете върху раздела Данни
  2. В групата Анализ щракнете върху опцията Анализ на данни
  3. В диалоговия прозорец Анализ на данни, който се отваря, щракнете върху „Корелация“
  4. Щракнете върху OK. Това ще отвори диалоговия прозорец Корелация
  5. За обхват на въвеждане изберете трите серии - включително заглавките
  6. За „Групирано по“ се уверете, че е избрано „Колони“
  7. Изберете опцията - „Етикет в първия ред“. Това ще гарантира, че в получените данни ще има същите заглавки и ще бъде много по -лесно да се разберат резултатите
  8. В опциите за изход изберете къде искате да получите получената таблица. Ще отида с клетка G1 на същия работен лист. Можете също така да изберете да получите резултатите си в нов работен лист или нова работна книга
  9. Щракнете върху OK

Веднага щом направите това, Excel ще изчисли коефициента на корелация за всички серии и ще ви даде таблица, както е показано по -долу:

Имайте предвид, че получената таблица е статична и няма да се актуализира в случай, че някоя от точките данни в таблицата ви се промени. В случай на промяна, ще трябва да повторите горните стъпки отново, за да генерирате нова таблица с коефициенти на корелация.

Това са два бързи и лесни метода за изчисляване на коефициента на корелация в Excel.

Надявам се, че сте намерили този урок за полезен!

wave wave wave wave wave