Вследствие на трагичната стрелба в началното училище на Sandy Hook се появи дискусия относно контрола на оръжията в емисиите ми в Twitter и Facebook. Една статистика от статия от април 2012 г. в Ню Йоркър привлече вниманието ми:

Съединените щати са страната с най-висок процент на гражданско притежание на оръжие в света. (Вторият по височина е Йемен, където въпреки това процентът е само половината от този в САЩ) Никое цивилно население не е по-силно въоръжено.

Публикувах този цитат във Facebook и бях попитан дали има връзка между нивата на притежание на оръжие и смъртните случаи, свързани с оръжието. След 20 минути, като взех някои данни за притежаването на оръжие в световен мащаб и смъртта на оръжия от Wikipedia и ги пуснах през R, направих следната графика.

deaths

Фигура 1: Смъртни случаи на оръжие на глава от населението спрямо притежание на оръжие на глава от населението в страните от ОИСР.

Пуснах тази графика в Twitter късно в неделя вечер и се събудих тази сутрин, за да разбера, че е ретуиран над 200 пъти. Освен това имаше голям брой въпроси и искания за различни графики.

От любопитство взех от Уикипедия данни за смъртта на пистолета и притежанието на оръжие за страните от ОИСР и ги прегледах през R: dl.dropbox.com/u/38668/deaths ...

За да могат другите да анализират данните, които използвах сам, мислех, че ще напиша как съм създал графиката.

Информацията

Първата стъпка беше намирането на данни за притежанието на оръжие и смъртните случаи, свързани с оръжието, и въвеждането им в R.

Бързо търсене разкри статии в Уикипедия за държави по смъртност, свързана с огнестрелно оръжие, и брой оръжия на глава от населението по държави. Изрязах и поставих таблиците в тези статии в текстов редактор и ги запазих като CSV файлове. Също така взех списък на страните от ОИСР от Уикипедия и го преобразувах. Можете да вземете получените файлове тук:

  • deaths.csv (към 17 декември 2012 г.)
  • guns.csv (към 17 декември 2012 г.)
  • oecd.csv (към 17 декември 2012 г.)

Кодът

R кодът, който използвах за създаване на сюжета, е даден по-долу. Той просто чете в данните от CSV файловете с оръжия и смъртни случаи, обединява ги, добавя колона, указваща дали дадена държава е в ОИСР, и след това начертава резултатите.

Можете да получите целия код, който използвах за генериране на цифрите в тази публикация тук:

Други графики

Бяха ми зададени редица добри въпроси относно графиката, която публикувах в Twitter. По-специално, няколко души бяха изненадани от броя на смъртните случаи, свързани с оръжие за Швейцария. Както показва следващата графика на убийствата срещу оръжие срещу В, повечето от тези смъртни случаи всъщност са самоубийства.

Фигура 2: Убийства с оръжие на глава от населението срещу притежание на оръжие на глава от населението в страните от ОИСР.

Фигура 3: Подробности за убийствата с оръжие на глава от населението спрямо притежание на оръжие на глава от населението в страните от ОИСР.

И накрая, тук има сюжет за убийствата срещу собствеността във всички страни - не само тези в ОИСР. Масата на страните в долния ляв ъгъл е нечетлива, но ясно можете да видите тези страни с висок процент на убийства или с висока владеене на оръжие.

Фигура 4: Убийства с оръжие на глава от населението срещу притежание на оръжие на глава от населението във всички страни.

За да бъде ясно, не предявявам претенции за ефекта от притежаването на оръжие върху стрелбата. Исках просто да покажа колко лесно е да се използват свободно достъпни данни, за да се отговори на разумни въпроси по нажежени политически проблеми като контрола на оръжията.

Ще ви оставя да си направите изводите сами.

Актуализация (19 декември 2012 г.)

Отговорът и вниманието към тези заговори - както положителни, така и отрицателни - в Twitter, в коментарите по-долу и по имейл, бяха малко поразителни. Толкова много, че сайтът ми падна вчера поради това, че ударих (обикновено достатъчно) ограничение на честотната лента, което моят хост осигурява.

Актуализации на данни

Няколко души отбелязаха, че данните, които съм начертал за Швейцария, са несъвместими с тези в Уикипедия. Ако погледнете историята на редактиране на свързаната с огнестрелно оръжие страница за смъртност в Уикипедия, ще видите, че някой е актуализирал данните за Швейцария късно на 16 декември. Като се има предвид, че Канбера, Австралия е GMT ​​+ 11, тази актуализация се случи, след като изстъргах страницата за данните, които използвах тук.

Преработих заговорите на ОИСР с данни, изтрити от същите страници към 15:30 на 19-ти. Можете да видите резултатите и да получите новите данни по-долу.

Фигура 1 (актуализирана): Смъртност, свързана с оръжие, срещу Собственост на оръжие за страните от ОИСР.

Фигура 2 (актуализирана): Убийства с оръжие срещу В Собственост на оръжие за страните от ОИСР.

Новите данни са тук:

Други анализи

Редица хора ме насочиха към анализи, които са направили на подобни данни, критики към тази публикация и алтернативни източници на данни. Ето резюме на някои от тези други приноси:

Диего Баш преработи някои от горните заговори с общи данни за убийства (не само убийства с пистолет).

aphyr преработи един от моите заговори в дневник и също така сравни убийството с оръжие с доходи и богатство.

Dominikus Baur създаде по-интерактивна версия на горните парцели, използвайки d3.

Райън Росарио ме насочи към поредния анализ на смъртните случаи срещу В собствеността.

finem respice има много подробен отговор на този пост (и други отчети), който обяснява защо данните, които използвах за Швейцария в първоначалните си графики, бяха неправилни.

Уолтър Хики от Business Insider обобщи моя пост. Там има енергична дискусия в коментарите там.

Опровержение

И накрая, в светлината на някои по-гласни критики, които получих, смятам, че трябва да повторя няколко точки:

В нито един момент не съм твърдял, че това е дори близо до строг анализ. В оригиналния си туит и тук ясно заявих, че съм използвал данни от Уикипедия. Тъй като мислех, че е общоизвестно, че Уикипедия никога не трябва да се използва като основен източник за каквото и да е истинско изследване, не очаквах хората да объркат този пост със сериозно проучване.

Не съм се опитвал да използвам тези заговори, за да направя какъвто и да е извод за връзката между притежанието на оръжие и смъртта на оръжия. Всъщност не мисля, че съществува просто обяснение. Всичко, което възнамерявах да направя, беше да се опитам да хвърля светлина върху въпрос, който ми беше зададен относно възможна корелация.

Няма да провеждам никакъв вид статистически тест на горните данни (напр. Коефициенти на корелация на ранга). За да има смисъл всяко такова количество, трябва да предположа, че събраните от мен данни са били много по-внимателно контролирани. Тъй като току-що го взех от Уикипедия, това очевидно не е валидно предположение.

Не възнамерявам да създавам повече графики, показващи други данни или друга статистика. Други хора (вижте връзките по-горе) вече са го направили за различни алтернативни данни. Освен това осъзнавам, че те са по-добри източници на данни от Wikipedia. Въпреки това, както вече казах, намерението ми не беше да направя окончателно проучване, а по-скоро да покажа как леснодостъпен източник (т.е. Уикипедия) може да се използва за бърз преглед на дадена тема.

Вероятно няма да съм последният човек, който използва Уикипедия за този вид любителски анализ. Следователно, ако смятате, че данните, които съм използвал, са неверни или остарели, предлагам ви да разрешите проблема в източника и да актуализирате (с препратки) съответните записи в Wikipedia.

Ако имате въпрос относно други възможни корелации или взаимоотношения, не се колебайте да приложите горния код към каквито и да било източници на данни, които смятате, че биха могли да ви помогнат да отговорите. Бих се радвал, ако се свържете с това, което намерите в коментарите по-долу.

Марк Рийд 17 декември 2012 г. Канбера, Австралия