Средната стойност е прост термин с няколко значения. Типът на средната стойност, която да използвате, зависи от това дали добавяте, умножавате, групирате или разделяте работа между елементите във вашия набор.

Бърз тест: Карахте до работа със скорост от 30 мили в час и се върнахте със скорост от 60 мили в час. Каква беше средната ви скорост?

Подсказка: Не е 45 mph и няма значение колко далеч е пътуването до вас. Прочетете, за да разберете многото приложения на този статистически инструмент.

анализираме

Но какво означава това?

Нека се върнем малко назад: какво представлява „средното“?

За повечето от нас това е „числото в средата“ или числото, което е „балансирано“. Привърженик съм на вземането на множество гледни точки, затова ето още една интерпретация на средната стойност:

Средната стойност е стойността, която може да замени всеки съществуващ елемент и да има същия резултат. Ако можех да изхвърля данните си и да ги заменя с една „средна“ стойност, каква би била тя?

Една от целите на средното е да разбере набор от данни, като вземе „представителна“ извадка. Но изчислението зависи от това как елементите в групата си взаимодействат. Нека да разгледаме.

Средната аритметична

Средната аритметична стойност е най-често срещаният тип средна стойност:

Да предположим, че тежите 150 lbs и сте в асансьор с дете от 100 lb и 350 lb морж. Какво е средното тегло?

Истинският въпрос е „Ако сте заменили тази весела група с 3 идентични души и искате еднакъв товар в асансьора, какво трябва да тежи всеки клонинг?“

В този случай бихме разменили трима души с тегло 200 фунта всеки [(150 + 100 + 350)/3] и никой не би бил по-мъдър.

  • Той работи добре за списъци, които просто се комбинират (добавят) заедно.
  • Лесно е да се изчисли: просто добавете и разделете.
  • Той е интуитивен - това е числото „в средата“, изведено от големи стойности и намалено от по-малки.

  • Средната стойност може да бъде изкривена от извънредни стойности - тя не се справя добре с диво различни проби. Средното за 100, 200 и -300 е 0, което е подвеждащо.

Средната аритметична стойност работи чудесно 80% от времето; много количества се събират. За съжаление, винаги има онези 20% от ситуациите, при които средната стойност не е съвсем подходяща.

Медиана

Медианата е „елементът в средата“. Но дали средната стойност (средната аритметична стойност) не означава същото? Какво дава?

Изчакайте ме за секунда: каква е „средата“ на тези числа?

Е, 3 е средата на списъка. И въпреки че средната стойност (22) е някъде по средата, 22 всъщност не представлява разпределението. По-вероятно е да получим число по-близо до 3, отколкото до 22. Средната стойност е увеличена със 100, което е по-голямо.

Медианата решава този проблем, като взема номер в средата на сортиран списък. Ако има две средни числа (четен брой елементи), просто вземете средната им стойност. Изпъкналите като 100 само придърпват медианата по един елемент в сортирания списък, вместо да правят драстична промяна: медианата на 1 2 3 4 е 2,5.

  • Справя се добре с отклоненията - често най-точното представяне на група
  • Разделя данните на две групи, всяка с еднакъв брой елементи

  • Може да бъде по-трудно да се изчисли: първо трябва да сортирате списъка
  • Не толкова добре познат; когато кажете „медиана“, хората могат да мислят, че имате предвид „средно“

Някои шеги вървят по линия на „Половината от всички шофьори са под средното ниво. Страшно, нали? ". Но наистина в главата си знаете, че трябва да казват „половината от всички шофьори са под средната стойност“.

Цифрите като цените на жилищата и доходите често се дават по медиана, тъй като искаме представа за средата на опаковката. Бил Гейтс, който печели няколко милиарда допълнително една година, може да увеличи средния доход, но не е от значение за това как се е променила заплатата на обикновения човек. Не се интересуваме от „добавяне“ на доходи или цени на жилища заедно - просто искаме да намерим средния.

Отново, типът на средната стойност, която да се използва, зависи от това как се използват данните.

Режимът звучи странно, но това просто означава гласувайте. И понякога гласуването, а не изчислението е най-добрият начин да се направи вземете представителна проба на това, което хората искат.

Да приемем, че организирате парти и трябва да изберете ден (1 е понеделник и 7 е неделя). „Най-добрият“ ден би бил вариантът, който задоволява повечето хора: средно ниво може да няма смисъл. („Боб харесва петък, а Алис харесва неделя? Събота е!“).

По същия начин цветовете, предпочитанията за филми и много други могат да се измерват с цифри. Но отново идеалният избор може да бъде режимът, а не средният: „средният“ цвят или „средният“ филм може да бъде ... незадоволителен (Рамбо среща гордостта и предразсъдъците).

  • Работи добре за изключителни ситуации на гласуване (този или онзи избор; без компромис)
  • Дава избор, който повечето хора са искали (докато средният може да даде избор, който никой не е искал).
  • Лесно за разбиране

  • Изисква повече усилия за изчисляване (трябва да се съберат гласовете)
  • „Победителят взема всички“ - няма среден път

Терминът „режим“ не е толкова често срещан, но сега знаете какъв бутон да търсите, когато играете с любимата си програма за статистика.

Средна геометрична

„Средният елемент“ зависи от това как използваме съществуващите ни елементи. През повечето време елементите се събират и аритметичната средна работи добре. Но понякога трябва да правим повече. Когато се занимаваме с инвестиции, площ и обем, ние не добавяме фактори, а ги умножаваме.

Нека опитаме с пример. Кое портфолио предпочитате, т.е. кое има по-добро типична година?

  • Портфолио А: + 10%, -10%, + 10%, -10%
  • Портфолио Б: + 30%, -30%, + 30%, -30%

Те изглеждат доста сходни. Ежедневната ни средна стойност (средна аритметична стойност) ни казва, че и двамата са влакчета, но трябва да бъдат средни до нула печалба или загуба. И може би В е по-добре, защото изглежда, че печели повече в добрите години. Нали?

Вронго! Говорете така, ще ви изгорят на фондовия пазар: възвръщаемостта на инвестициите се умножава, а не се добавя! Не можем да бъдем всички неволно и да използваме средно аритметично - трябва да намерим действителната норма на възвръщаемост:

  • Портфолио А:
    • Връщане: 1.1 * .9 * 1.1 * .9 = .98 (2% загуба)
    • Средна стойност за годината: (.98) ^ (1/4) = 0.5% загуба годишно (това е около 2%/4, тъй като броят е малък).
  • Портфолио Б:
    • 1,3 * .7 * 1,3 * .7 = .83 (17% загуба)
    • Средна стойност за годината: (.83) ^ (1/4) = 4.6% загуба годишно.

Загуба от 2% срещу 17%? Това е огромна разлика! Щях да се държа далеч от двата портфейла, но бих избрал А, ако бъде принуден. Не можем просто да добавяме и разделяме възвръщаемостта - не така работи експоненциалният растеж.

Още няколко примера:

  • Инфлация: Имате инфлация от 1%, 2% и 10%. Каква беше средната инфлация през това време? (1,01 * 1,02 * 1,10) ^ (1/3) = 4,3%
  • Купони: Имате купони с 50%, 25% и 35% отстъпка. Ако приемем, че можете да ги използвате всички, каква е средната отстъпка? (т.е. какъв талон може да се използва 3 пъти?). (.5 * .75 * .65) ^ (1/3) = 37.5%. Помислете за купоните като за „отрицателна“ възвръщаемост - така или иначе за магазина.
  • ■ площ: Имате парцел 40 × 60 ярда. Каква е „средната“ страна - т.е. колко голям би бил съответният квадрат? (40 * 60) ^ (0,5) = 49 ярда.
  • Сила на звука: Имате кутия за доставка 12 × 24 × 48 инча. Какъв е „средният“ размер, т.е. колко голям би бил съответният куб? (12 * 24 * 48) ^ (1/3) = 24 инча.

Сигурен съм, че можете да намерите още много примери: средното геометрично намира „типичния елемент“, когато елементите се умножават заедно. Вземете набор от числа, умножете ги и вземете N-тия корен (където N е броят на елементите, които обмисляте).

Дълго се бях чудил защо геометричната средна стойност е полезна - сега знаем.

Средно хармонично

Хармоничното средно е по-трудно да се визуализира, но все пак е полезно. (Между другото, „хармоници“ се отнасят до числа като 1/2, 1/3 - 1 над нещо, наистина.) Хармоничното средно ни помага да изчислим средни ставки когато няколко елемента работят заедно. Нека да разгледаме.

Ако имам скорост от 30 mph, това означава, че получавам някакъв резултат (преминавайки 30 мили) за всеки вход (шофиране 1 час). Когато осреднявате въздействието на множество скорости (X и Y), трябва да помислите за изхода и входа, а не за суровите числа.

средна норма = обща продукция/общ входящ ресурс

Ако поставим и X, и Y на даден проект, като всеки изпълнява еднакъв обем работа, какъв е средният процент? Да предположим, че X е 30 mph и Y е 60 mph. Ако ги накараме да изпълняват подобни задачи (карат миля), мотивите са:

  • X отнема 1/X време (1 миля = 1/30 час)
  • Y отнема 1/Y време (1 миля = 1/60 час)

Комбинирайки входове и изходи получаваме:

  • Обща мощност: 2 мили (X и Y допринасят „1 ″)
  • Общ вход: 1/X + 1/Y (всеки отнема различно време; представете си релейно състезание)

И средната скорост, продукция/вход, е:

Ако имахме 3 елемента в сместа (X, Y и Z), средният процент би бил:

Хубаво е да имате този пряк път, вместо да правите алгебрата всеки път - дори намирането на средната стойност от 5 процента не е толкова лошо. С нашия пример отидохме на работа с 30 мили в час и се върнахме с 60 мили в час. За да намерим средната скорост, просто използваме формулата.

Но не трябва ли да знаем колко далеч е работата? Не! Без значение колко дълъг е маршрутът, X и Y имат еднакъв изход; тоест вървим R мили със скорост X и още R мили със скорост Y. Средната скорост е същата като преминаването на 1 миля при скорост X и 1 миля при скорост Y:

Има смисъл средната стойност да бъде изкривена към по-ниската скорост (по-близо до 30 от 60). В края на краищата прекарваме два пъти повече време, преминавайки 30 мили в час от 60 мили в час: ако работата е на 60 мили, това е 2 часа там и 1 час назад.

Ключова идея: Хармоничното средно се използва, когато две скорости допринасят за еднакво натоварване. Всяка ставка е в a щафета и допринасяне на същата сума за продукцията. Например правим двупосочно пътуване до работа и обратно. Половината резултат (изминатото разстояние) е от първата скорост (30 мили в час), а другата половина е от втората скорост (60 мили в час).

Разбирането: Не забравяйте, че средната стойност е един елемент, който замества всеки елемент. В нашия пример ние караме 40 мили в час по пътя там (вместо 30) и шофираме 40 мили в час по обратния път (вместо 60). Важно е да запомните, че трябва да заменим всеки „етап“ със средния процент.

Предаване на данни: Изпращаме данни между клиент и сървър. Клиентът изпраща данни на 10 гигабайта/долар, а сървърът получава на 20 гигабайта/долар. Каква е средната цена? Е, ние сме средно 2/(1/10 + 1/20) = 13,3 гигабайта/долар за всяка част. Тоест, бихме могли да сменим клиента и сървъра за две машини, които струват 13,3 GB/долар. Тъй като данните се изпращат и получават (всяка част върши „половината от работата“), истинският ни курс е 13,3/2 = 6,65 gb/долар.

Производителност на машината: Имаме машина, която трябва да подготви и довърши части. Когато се подготвя, той работи с 25 джаджи на час. Когато завършва, той работи с 10 джаджи на час. Каква е общата ставка? Е, това е средно 2/(1/25 + 1/10) = 14,28 джаджи/час за всеки етап. Тоест, съществуващите времена могат да бъдат заменени с две фази, работещи при 14,28 джаджи/час за същия ефект. Тъй като част преминава през двете фази, машината изпълнява 14,28/2 = 7,14 джаджи/час.

Изкупуване на акции. Да предположим, че купувате акции на стойност $ 1000 всеки месец, независимо от цената (усредняване на разходите за долари). Плащате \ $ 25/акция през януари, \ $ 30/акция през февруари и \ $ 35/акция през март. Каква беше средната платена цена? Тя е 3/(1/25 + 1/30 + 1/35) = \ $ 29,43 (тъй като сте купили повече на по-ниска цена и по-малко на по-скъпа). И имате \ $ 3000/29,43 = 101,94 акции. „Натоварването“ е малко абстрактно - превръщането на долари в акции. Някои месеци използват повече долари за закупуване на акция, отколкото други, а в този случай високият процент е лош.

Отново хармоничното средно помага за измерване ставки, работещи заедно за един и същ резултат.

Да, това беше трудно

Хармоничната средна стойност е трудна: ако имате отделно машини, работещи с 10 части/час и 20 части/час, тогава средната стойност наистина е 15 части/час, тъй като всяка машина е независима и вие сте добавяне на възможности. В този случай средната аритметична стойност работи добре.

Понякога е добре да проверите отново, за да сте сигурни, че математиката работи. В машинния пример твърдим, че произвежда 7,14 джаджи на час. Добре, колко време би отнело създаването на 7.14 джаджи?

  • Подготовка: 7.14/25 = .29 часа
  • Край: 7.14/10 = .71 часа

И да, .29 + .71 = 1, така че числата се получават: отнема 1 час, за да се направят 7.14 джаджи. Когато се съмнявате, опитайте да пуснете няколко примера, за да се уверите, че средният процент наистина е това, което сте изчислили.

Заключение

Дори една проста идея като средната има много приложения - има повече приложения, които не сме обхванали (център на тежестта, среднопретеглени средни стойности, очаквана стойност). Ключовият момент е следният:

  • „Средният елемент“ може да се разглежда като елемент, който може да замести всички останали
  • Типът на средната стойност зависи от това как се използват съществуващите елементи (Добавено ли е? Умножено? Използвано като ставки? Използвано като изключителен избор?)

Изненада ме колко полезни и разнообразни са различните видове средни стойности за анализ на данните. Честита математика.

Присъединете се към над 450 000 читатели на месец

Харесва ли статията? Има още много неща, които да ви помогнат да изградите трайно, интуитивно разбиране на математиката. Присъединете се към бюлетина за бонусно съдържание и най-новите актуализации.