Mity morderstwa i regresji wielokrotnej

This is the translation. The original web-page (oryginalna strona): http://crab.rutgers.edu/~goertzel/mythsofmurder.htm

Jeśli chcesz dłuższy, bardziej techniczną wersję tej pracy, w formacie Word, kliknij tutaj.

Czy wierzysz, że za każdym razem wykonywany jest więźniem w Stanach Zjednoczonych, osiem przyszłe mordy odstrasza? Czy wierzysz, że wzrost o 1% w liczbie obywateli licencję do prowadzenia ukrytej broni powoduje 3,3% spadek w państwie kursie morderstwa? Czy wierzysz, że 10 do 20% spadku przestępczości w 1990 została spowodowana przez wzrost aborcji w 1970 roku? Albo, że stopa morderstwo wzrosłyby o 250% od 1974 roku, gdy Stany Zjednoczone nie zbudował tak wiele nowych więzień?

Jeśli zostali wprowadzeni w błąd przez którąkolwiek z tych badań, można spadły o złośliwej postaci nauki śmieci: wykorzystanie modeli matematycznych bez wykazać zdolność predykcyjną do wyciągnięcia wniosków politycznych. Badania te są powierzchownie imponujące. Napisany przez renomowanych naukowców z prestiżowych instytucji społecznych, często pojawiają się w czasopismach naukowych zweryfikowane. Wypełnione złożonych obliczeń statystycznych, dają dokładnych liczbowych „fakty”, które mogą być wykorzystane jako punkty dyskutantów W argumentów politycznych. Ale te „fakty” są wola o kosmyki. . „Faktów”, zanim farba wyschnie na jednym badaniu, kolejny pojawia się z zupełnie różnych Pomimo naukowego wyglądu, modele te nie spełniają podstawowe kryterium użytecznego modelu matematycznego: zdolność do przewidywania, które są lepsze niż przypadek.

Chociaż ekonomiści są czołowi praktycy tej tajemnej sztuki, socjologowie, kryminolodzy i innych nauk społecznych mają wersje równie dobrze. Jest znany pod różnymi nazwami, w tym modelowania ekonometrycznego „modelowanie równań strukturalnych” i „analizy ścieżki.” Wszystko to są sposoby wykorzystania korelacje między zmiennymi do wnioskowania przyczynowego. Problem polega na tym, jak ktoś, kto miał kurs w statystykach wie, że korelacja nie ma związku przyczynowego. Korelacje pomiędzy dwiema zmiennymi są często „fałszywe”, ponieważ są one spowodowane przez jakąś trzecią zmienną. Ekonometryczne modelarzy starają się rozwiązać ten problem poprzez uwzględnienie wszystkich istotnych zmiennych w swoich analizach, stosując technikę statystyczną zwaną „regresji wielokrotnej.” Jeśli ktoś miał doskonałe środki wszystkich zmiennych przyczynowych, to będzie działać. Ale dane nie są wystarczająco dobre. Powtarzające się starań, aby wykorzystać wielokrotnej regresji w celu osiągnięcia ostatecznych odpowiedzi na pytania polityki publicznej nie udało.

Jednak wielu naukowców społecznych niechętnie przyznać porażkę. Mają oddanych lat do uczenia się i nauczania modelowanie regresji, a oni nadal korzystać regresji aby przyczynowych argumenty, które nie są uzasadnione ich danych. Wzywam tych argumentów mity regresji wielokrotnej, i chciałbym użyć czterech badania stóp morderstwo jako przykłady.

Mit pierwszy: Więcej Broń, Mniej Zbrodni.

John Lott, ekonomista z Uniwersytetu Yale, stosowany model ekonometryczny, aby twierdzić, że „umożliwienie obywatelom do prowadzenia ukrytej broni odstrasza brutalne zbrodnie, bez zwiększania przypadkowych zgonów.” Analiza Lott zakładała „wyda” przepisy, które wymagają władze lokalne do wydawania ukrytej broni pozwolić na jakiekolwiek praworządnego obywatela, który ubiega się o jeden. Lott Szacuje się, że każdy wzrost o jeden procent posiadania broni w populacji powoduje spadek 3,3% w cenach zabójstwo. Lott i jego współautor, David Mustard opublikował pierwszą wersję swojej pracy w Internecie w 1997 roku, a dziesiątki tysięcy ludzi pobrana. Było to przedmiotem forach politycznych, felietonach, i często dość skomplikowanych debat na World Wide Web. W książce z chwytliwy tytuł More Guns, Less Crime, Lott drażnił jego krytyków, praca Lott jest przykładem statystycznej jednej upiększanie. On ma więcej danych oraz bardziej złożonych analiz niż ktokolwiek inny studiując temat. Żąda, że każdy, kto chce zakwestionować jego argumenty stają się zanurzone w bardzo skomplikowanej debaty statystycznych, na podstawie obliczeń tak trudne, że nie mogą one być wykonane ze zwykłych komputerów stacjonarnych. Wyzywa każdego, kto nie zgadza się z nim, aby pobrać swój zestaw danych i przerobić swoje obliczenia, ale większość socjologowie nie sądzę, że warto ich natomiast do powtórzenia badania z zastosowaniem metod, które wielokrotnie nie powiodło się. Większość badaczy kontroli pistolet prostu otrzepał roszczeń Lott i musztarda i udał się z ich pracą. Dwa bardzo szanowani naukowcy karnych sprawiedliwości, Frank Zimring i Gordon Hawkins (1997) napisał artykuł wyjaśniający, że:

tak samo jak panowie. Lott i musztarda mogą z jednego modelu wyznaczników zabójstwa, wytwarzają pozostałości statystycznych sugerujące, że „wydaje” prawo zmniejszyć zabójstwa, oczekujemy, że zdecydowana ekonometryk może produkować traktowanie tych samych okresach historycznych z różnych modeli i przeciwstawne efekty. Modelowanie ekonometryczne jest obosieczny miecz w jego zdolności do ułatwienia ustalenia statystycznych do ogrzania serca prawdziwych wyznawców jakiejkolwiek paskiem.Zimring i Hawkins rację. W ciągu roku, dwóch zdecydowanych ekonometrycy, Dan Black and Daniel Nagin (1998) opublikował wyniki badań wskazujące, że jeśli oni zmienili model statystyczny trochę, lub zastosować je do różnych segmentów danych, Lott i ustalenia musztarda zniknęła. Czarno Nagin odkryli, że kiedy na Florydzie został usunięty z próbki „nie było wykrywalne wpływ prawo do przenoszenia przepisów dotyczących wielkości mordu i gwałtu.” Doszli do wniosku, że „wnioskowanie na podstawie modelu Lott i musztarda jest niewłaściwe, a ich wyniki nie mogą być używane w sposób odpowiedzialny formułowanie polityki publicznej.”

John Lott jednak zakwestionowane ich analizę i nadal promować własną rękę. Lott zebrał dane dla każdego z powiatów amerykańskich za każdy rok od 1977 do 1992. Problem polega na tym, że powiaty amerykańskie różnią się ogromnie w wielkości i cech społecznych. Kilka dużych te, zawierające główne miasta, stanowią bardzo duży odsetek morderstw w Stanach Zjednoczonych. Jak to się dzieje, żaden z tych bardzo dużych okręgach mają „wyda” prawa kontroli broni. Oznacza to, że ogromny zbiór danych Lott był po prostu nie nadają się do swojego zadania. Nie miał odmianę w jego kluczowej zmiennej przyczynowego – „wydaje” prawa – w miejscach, w których wystąpiły większość morderstw.

Nie wspominając to ograniczenie w książce lub artykułach. Kiedy odkryłem brak „wyda” praw w największych miastach w moim badaniu jego danych, poprosiłem go o to. Wzruszył ją, mówiąc, że był „kontrolowany” dla wielkości populacji w swojej analizie. Ale wprowadzenie kontroli statystycznej w analizie matematycznej nie nadrobić fakt, że on po prostu nie miał danych dla dużych miast, gdzie problem zabójstwo był najbardziej dotkliwy.

Zajęło mi trochę czasu, aby znaleźć ten problem w swoich danych, ponieważ nie był zaznajomiony z problematyką kontroli pistolet. Ale Zimring i Hawkins wyzerowany w nim natychmiast, ponieważ wiedzieli, że „wydaje” prawa zostały ustanowione w państwach, w których National Rifle Association był potężny, głównie na południu, na zachodzie i na obszarach wiejskich. Były to kraje, które już miały kilka ograniczeń dotyczących broni. Zauważyli oni, że ta historia legislacyjna frustruje „nasza zdolność do porównania trendów w «zastępuje temat» stanów z trendami w innych stanach. Ponieważ kraje, które zmieniły przepisy różnią się w miejscu i konstytucji z państw, które nie porównania w całej kategorii ustawodawczych zawsze ryzykować mylące wpływy demograficzne i regionalnych z behawioralnej wpływu różnych reżimów prawnych „Zimring a ponadto zauważył, że Hawkins.:

Lott i gorczycy są, oczywiście, świadomość tego problemu. Ich rozwiązanie, standardowe techniki ekonometryczne, jest zbudowanie modelu statystycznego, który będzie kontrolować wszystkich różnic pomiędzy Idaho i Nowym Jorku, które wpływają zabójstw i przestępczości ceny, inne niż „powinny emitować” prawa. Jeśli ktoś może „określić” główne wpływy na temat zabójstwa, gwałty, włamania i kradzieży samochodów w naszym modelu, to możemy wyeliminować wpływ tych czynników na różnych trendów. Lott i gorczycy budować modele oszacowania skutków danych demograficznych, danych ekonomicznych i kary kryminalnej na różne przestępstwa. Modele te są ostatecznym w domu statystycznych gotowania w które są one stworzone dla tych danych określonym przez tych autorów i tylko testowane na danych, które zostaną wykorzystane w ocenie prawa do przeprowadzenia uderzenia.Lott i gorczycy porównywali trendy w Idaho i Wirginii Zachodniej i Missisipi z trendami w Waszyngtonie i Nowym Jorku. Co się właściwie stało, że nie było wybuchu zabójstw związanych z notowań w największych miastach-Wschodniej w 1980 i na początku 1990 roku. Cała argumentacja Lott przyszedł aż do twierdzenia, że w dużej mierze wiejskich i western „wydaje” stany oszczędzono zabójstwa epidemii związanych pęknięć z powodu ich „powinien wydać” prawa. To nigdy nie były poważnie brane pod uwagę, jeżeli nie zostały zasłonięte przez labirynt równań.

Mit drugi: uwięzienie więcej ludzi Tnie Przestępczość

Sprawa Lott i musztarda był wyjątkowy jedynie w wysokości uwagi publicznej jego otrzymania. To jest dość powszechne, nawet typowy dla badania rywalizujące zostać opublikowane za pomocą metod ekonometrycznych dotrzeć do przeciwnych wniosków dotyczących tej samej kwestii. Często nie ma nic złego w sposób oczywisty zarówno z analiz. Oni po prostu użyć nieznacznie różnych zestawów danych lub różne techniki, aby osiągnąć różne wyniki. Wydaje się, że modelarzy regresji może osiągnąć żadnego rezultatu chcą bez naruszania zasad analizy regresji w jakikolwiek sposób. W jednym z wyjątkowo szczerego rachunku frustracji z tego stanu rzeczy, dwie bardzo szanowani kryminolodzy, Thomas Marvell i Carlisle Moody (1997: 221), poinformował o otrzymaniu studium zrobili efektu uwięzienia w sprawie stóp zabójstwo. Zgłosili, że:

szeroko rozpowszechnione [ich] wnioski, wraz z danymi używany, kolegów, którzy specjalizują się w analizie ilościowej. Najczęstszą odpowiedzią jest to, że oni nie chcą uwierzyć wyniki bez względu na to, jak dobry jest analiza statystyczna. Za tego twierdzenia jest pojęcie, często omawiane nieformalnie ale rzadko publikowane, że socjologowie mogą uzyskać dowolny pożądany rezultat manipulując stosowanych procedur. W rzeczywistości, różnorodność szacunków dotyczących wpływu populacji więźniów jest traktowana jako dowód dobrej plastyczności badań. Implikacja, nawet wśród wielu, którzy regularnie publikuje badania ilościowe, jest to, że bez względu na to jak dokładna analiza, wyniki nie są wiarygodne, chyba że są one zgodne z wcześniejszymi oczekiwaniami. Dyscyplina badawcza nie może odnieść sukces w takim kontekście.Ku ich wielkiej zasługi, Marvell i Moody szczerze przyznał, problemy z regresji wielokrotnej, i kilka sugestii dotyczących poprawy. Niestety, niektóre ekonometrycy stają się tak zanurzony w swoich modelach, że tracą poczucie jak arbitralne są. Pochodzą one wierzyć, że ich modele są bardziej realne, bardziej aktualne, niż brudny, opornych „niekontrolowanego” rzeczywistości Znaczenie wyjaśnić.

Mit trzeci: Wykonywanie Ludzie Tnie Przestępczość

W 1975 roku American Economic Review opublikował artykuł czołowego ekonomisty, Isaac Ehrlich z University of Michigan, który szacowany że każde wykonanie odstrasza osiem zabójstw. Przed Ehrlich, najlepiej znany specjalista od skuteczności kary śmierci był Thorsten Sellen, którzy używali znacznie prostszą metodę analizy. Sellen przygotowane wykresy porównujące trendy w różnych stanach. Znalazł niewielki lub nie ma różnicy między państwami z lub bez kary śmierci, więc doszedł do wniosku, że kara śmierci nie ma różnicy. Ehrlich, w akcie statystycznych jednej upmanship, twierdził, że jego analiza była bardziej ważna, ponieważ kontrolowana dla wszystkich czynników, które wpływają na ceny zabójstwo.

Jeszcze zanim została opublikowana praca Ehrlicha był cytowany przez prokuratora generalnego Stanów Zjednoczonych w skrócie amicus curiae wniósł do Sądu Najwyższego Stanów Zjednoczonych w obronie kary śmierci. Na szczęście, Sąd postanowił nie powoływać się na dowody Ehrlicha, ponieważ nie zostały potwierdzone przez innych badaczy. To był mądry, bo w ciągu roku lub dwóch innych naukowców opublikowanych równie wyrafinowany ekonometrycznej analizy pokazujące, że kara śmierci nie miała skutku odstraszającego.

Spór pracy Ehrlicha było tak ważne, że National Research Council zwołane niebieski panel wstążki ekspertów, aby go przejrzeć. Po bardzo dokładnym przeglądzie, panel uznał, że problem nie tylko z modelem Ehrlicha, ale z ideą przy użyciu metod ekonometrycznych rozwiązać kontrowersje karnych polityki sprawiedliwości. Oni (Manski, 1978: 422) stwierdził, że:

ponieważ dane mogą być dostępne dla takiej analizy mają ograniczenia i dlatego zachowanie przestępca może być tak skomplikowane, nie należy oczekiwać pojawienia się ostatecznemu badaniu zachowań leżącego na odpoczynek przez cały spór o behawioralnych skutków polityki odstraszania.Większość ekspertów uważa, że teraz Sellen rację, że kara śmierci nie ma wymierny wpływ na stopy morderstwa. Ehrlich, ale nie został przekonany. On jest teraz samotny prawdziwie wierzący w ważności swojego modelu. W niedawnym wywiadzie (Bonner i Fessendren, 2000) twierdził, „jeśli zmiany takie jak bezrobocie, nierówności dochodów, prawdopodobieństwo zatrzymania i chęci wykorzystywania kary śmierci są rozliczane, kara śmierci pokazuje znaczący wpływ powstrzymujące”.

Mit czwarty: Legalizacja aborcji spowodowała Crime kropla w 1990 roku.

W 1999 roku John Donohue i Steven Levitt opublikował studium z nową wyjaśnieniem gwałtownego spadku stóp morderstwo w 1990 roku. Argumentowali oni, że legalizacja aborcji przez Sąd Najwyższy Stanów Zjednoczonych w 1973 roku spowodował spadek narodzin niechcianych dzieci, nieproporcjonalna liczba kogo by wyrośli się przestępcy. Problem z tym argumentem jest to, że legalizacja aborcji było historyczne wydarzenie jednorazowe i jednorazowych wydarzeń nie dostarczają wystarczającej ilości danych dla ważnej analizy regresji. Prawdą jest, że aborcja została zalegalizowana w niektórych stanach wcześniej niż inni, a Donohue i Levitt skorzystać z tego faktu. Ale wszystkie te stany jechaliśmy przez te same procesy historyczne, i wiele innych rzeczy działy się w tym samym okresie historycznym, że dokonane ceny morderstwo. Poprawna analiza regresji musiałby uchwycić wszystkie te rzeczy i przetestować je w szerokim zakresie zmienności. Istniejące dane nie pozwalają na to, aby wyniki analizy regresji będą się różnić w zależności od których dane zostały wybrane do analizy.

W tym przypadku, Donohue i Levitt zdecydowała skupić się na zmiany na przestrzeni czasu dwanaście lat, ignorując wahania w ciągu tych lat. W ten sposób, jak James Fox (2000: 303) wskazał, „przegapili większość zmian w przestępczości w tym okresie – trend wzrostowy pod koniec 1980 roku zgryzienia erę i korektę spadkową w latach po zakończeniu notowań. To jest coś jak badanie wpływu fazami księżyca na przypływy i odpływy oceanu, ale tylko zapis danych dla okresów odpływu.”

Kiedy pisałem ten artykuł, ja zawierał zdanie stwierdzające „wkrótce inny analityk regresji prawdopodobnie naleŜy przeanalizować te same dane i dotrzeć do różnych wniosków.” Kilka dni później, moja żona podała mi historię gazety o takim właśnie badania. Autor był nikt inny jak John Lott Yale, wraz z Johnem Whitley z University of Adelaide. Oni nawał te same numery i stwierdziła, że „legalizacji aborcji wzrosły ceny morderstwa przez około 0,5 do 7 procent” (Lott i bielą, 2001).

Dlaczego takie znacząco różne wyniki? Każdy zestaw autorów po prostu wybiera inną drogę do modelowania niewystarczającą ciało danych. Ekonometria nie można dokonać ważnego prawa ogólnego z historycznego faktu, że aborcja została zalegalizowana w 1970 roku i zbrodnia poszedł w dół w 1990 roku. Musielibyśmy przynajmniej kilkadziesiąt takich historycznych doświadczeń dla ważnego testu statystycznego.

Wnioski.

Kwas test modelowania statystycznego jest przewidywanie. Przewidywania nie musi być doskonały. Jeżeli model jest w stanie przewidzieć znacznie lepiej niż losowego zgadywania, to jest przydatne. Na przykład, jeśli model mógł przewidzieć cen akcji nawet nieco lepiej niż losowego zgadywania, to by jej właściciele bardzo bogaty. Tak wiele wysiłku włożono w badania i oceny modeli cen akcji. Niestety, naukowcy, którzy używają technik ekonometrycznych ocenić polityka społeczna bardzo rzadko poddają swoje modele do testów prognostycznych. Ich wymówką jest to, że trwa zbyt długo na rezultaty mają być znane. Nie dostaniesz nowe dane na temat ubóstwa, aborcji czy zabójstwo co kilka minut, jak to zrobić z cenami akcji. Ale naukowcy mogą zrobić badania predykcyjną w inny sposób. Mogą opracowanie modelu przy użyciu danych z jednej jurysdykcji lub okresu, następnie użyć go do przewidzenia dane z innych czasów i miejsc. Jednak większość naukowców po prostu nie rób tego, czy robią modele zawieść, a wyniki nie są publikowane.

Czopy, które publikują badania ekonometryczne zagadnień polityki publicznej często nie wymagają predykcyjną badania, które pokazuje, że redaktorzy i recenzenci mają niskie oczekiwania swoich dziedzinach. Więc naukowcy podejmują danych przez określony czas i zachować dostrajania i dostosowywania ich modelu, dopóki mogą „tłumaczyć” trendy, które już się wydarzyły, Istnieje zawsze wiele sposobów, aby to zrobić, a także z nowoczesnych komputerów nie jest strasznie trudno próbować, aż znajdziesz coś, co pasuje. W tym momencie, badacz zatrzymuje, pisze się wnioski i wysyła papier off do publikacji. Później inny badacz może dopasować model, aby uzyskać inny wynik. To wypełnia stron czasopism naukowych, a każdy udaje, że nie zauważyć, że niewiele lub nie dokonuje się postęp. Ale nie jesteśmy bliżej do posiadania ważnego modelu ekonometrycznego stóp zabójstwo dzisiaj niż my kiedy Isaac Ehrlich opublikowany pierwszy model w 1975 roku.

Społeczność naukowa nie ma dobrych procedur udzielenia awarię powszechnie stosowanej metody badawczej. Metody, które są zakorzenione w programach podyplomowych w wiodących uniwersytetów i opublikowane w renomowanych czasopismach wydają się być utrwalona. Wielu świeckich założyć, że jeśli badanie zostało opublikowane w czasopiśmie rówieśniczej, jest on ważny. Przypadki zbadaliśmy pokazują, że nie zawsze tak jest. peer review zapewnia, że ustalone praktyki były przestrzegane, ale jest mało przydatna, gdy same te praktyki są wadliwe.

W 1991 roku David Freedman, wybitny socjolog z University of California w Berkeley, autor podręczników ilościowych metod badawczych, wstrząsnął podstawami modelowania regresji kiedy otwarcie stwierdził: „Nie sądzę, że regresja może nosić wiele obciążeń w Argument przyczynowy. Ani nie równania regresji, przez siebie, daje wiele pomóc w kontrolowaniu zmiennych zakłócających”(Freedman, 1991: 292). artykuł Freedman wywołała szereg silnych reakcji. Richard Berk (1991: 315) zaobserwowali, że argument Freedman za „będzie bardzo trudne dla większości socjologów ilościowe, aby zaakceptować. To idzie do serca ich empirycznej przedsiębiorstwa iw ten sposób stawia całą karierę zawodową w niebezpieczeństwie.”

W obliczu krytyki, którzy chcą jakiś dowód, że mogą przewidzieć trendy, modelarzy regresji często spadają z powrotem na statystycznego jednej upmanship. Robią argumenty tak skomplikowane, że tylko inne wysoko wykwalifikowanych analityków regresji może zrozumieć, nie mówiąc już obalić, im. Często ta technika działa. Potencjalni krytycy po prostu zrezygnować z frustracji. Filadelfia Inquirer za Dawid Boldt (1999), po zapoznaniu John Lott mówić o ukrytej broni i stóp zabójstw, a także sprawdzanie z innymi ekspertami, ubolewał, że „stara się uporządkować argumentów naukowych jest prawie posyłki głupiego. Można utopić w sporach t-statystyk, zmiennych binarnych i ‘Poissona Vs. metody analizy danych “najmniejszych kwadratów.”

Boldt słusznie podejrzewać, że został zwabiony misji głupców. Są to w rzeczywistości, nie ważne ustalenia w socjologii i kryminologii, które nie mogą być przekazywane do dziennikarzy i polityków, którzy nie posiadają stopnie naukowe w zakresie ekonometrii. Jest to czas, aby przyznać, że cesarz jest nagi. Po zaprezentowaniu modelu ekonometrycznego, konsumenci powinni domagać się dowodów, że może przewidzieć trendy w danych innych niż dane użytych do jej utworzenia. Modele, które nie przejdą ten test jest nauka śmieci, bez względu na to, jak skomplikowane analizy.