Brak miejsca do ukrycia – Odwróć identyfikację pacjentów z opublikowanych map

Mapowanie danych dotyczących zdrowia jest obecnie szeroko rozpowszechnione zarówno w badaniach akademickich, jak i publicznej służbie zdrowia1. Chociaż pojęcie, że lokalizacja wpływa na ryzyko choroby, pochodzi z mapowania żółtej febry i cholery w 1800 roku, badania integrujące mapy z ludzkim zdrowiem są wyłaniające się pole oparte na powszechnym dostępnym oprogramowaniu do informacji geograficznych (GIS). Takie systemy mają szerokie zastosowanie, a ich wykorzystanie jest napędzane przez zwiększoną moc obliczeniową, przyjazne dla użytkownika oprogramowanie i duże geograficzne bazy danych. Liczba publikacji wykorzystujących dane GIS do badań nad zdrowiem wzrosła o około 26% rocznie, co stanowi czterokrotny wzrost liczby artykułów dotyczących ogólnie ludzkiego zdrowia.2 Adresy pacjentów są mapowane w celu identyfikacji wzorców, korelacji i predyktory choroby. Mapy te są następnie publikowane elektronicznie i w postaci print.1
Korzystając z wyszukiwań słów kluczowych dla terminów geograficzne i mapa w legendzie figur artykułów w pięciu głównych czasopismach medycznych opublikowanych w latach 1994-2005, zidentyfikowaliśmy 19 artykułów (w tym 5 w Dzienniku), które zawierały mapy z adresami pacjentów wykreślonych jako pojedyncze kropki lub symbole. W tych artykułach ponad 19 000 takich adresów zostało wykreślonych na mapach.
Rysunek 1. Rysunek 1. Odwrotna identyfikacja pacjentów z symulowanej mapy danych zdrowotnych Bostonu. Panel A pokazuje fragment mapy z lokalizacjami adresowymi 550 pacjentów (kół) wybranych zgodnie z warstwowym projektem losowego próbkowania. Oryginalny obraz JPEG użyty w analizie miał rozdzielczość 266 punktów na cal (minimalna wymagana rozdzielczość w dzienniku), rozmiar pliku 712 kb i skalę 1: 100 000. Panel B pokazuje wyniki odwrotnej identyfikacji adresów pacjentów. Okręgi wskazują przewidywane lokalizacje domów pacjentów zgodnie z metodą odwrotnej identyfikacji, a niebieskie kształty przedstawiają rzeczywiste domy pacjentów (z fragmentem sąsiedztwa pokazanym szczegółowo we wkładce).
Biorąc pod uwagę potencjalne konsekwencje dla prywatności pacjentów, zbadaliśmy, czy moglibyśmy wykorzystać te opublikowane mapy do ponownego zidentyfikowania pacjentów. Stworzyliśmy symulowaną mapę 550 geograficznie zakodowanych adresów pacjentów w Bostonie, wykorzystując minimalną rozdzielczość liczbową wymaganą do publikacji w czasopiśmie (rysunek 1A). Następnie zastosowaliśmy standardowe techniki GIS, aby określić dokładność, z jaką można zidentyfikować takie adresy. Zaskakująco, metoda odwrotnej identyfikacji precyzyjnie zidentyfikowała 432 adresów (79%) i zidentyfikowała wszystkie 550 adresów w odległości 14 m od prawidłowego adresu (rysunek 1B).
Publikacja map choroby z dokładnymi lokalizacjami pacjentów zagraża prywatności pacjentów. Aby zagwarantować anonimowość pacjentów, potrzebne są wytyczne dotyczące wyświetlania lub publikowania danych zdrowotnych.4 Wspólnym podejściem było mapowanie według jednostki administracyjnej, a nie adresu domowego. Jednak agregacja danych w ten sposób nakłada ograniczenia na wizualizację wzorców chorobowych. Inną metodą jest przestrzenne skrzywienie lub losowe przemieszczenie adresów pacjentów w określonej odległości od ich rzeczywistej lokalizacji Pochylenie może pozwolić na wizualizację, która przekazuje niezbędne informacje przy jednoczesnym zachowaniu prywatności pacjentów. 5 Zarówno agregacja, jak i pochylenie są systematycznymi i niezawodnymi środkami do deidentyfikacji, które są o wiele bezpieczniejsze, jeśli chodzi o ochronę możliwych do zidentyfikowania informacji dotyczących zdrowia, niż po prostu zmniejszenie rozdzielczości mapa. Redaktorzy czasopism i podręczników powinni rozważyć wdrożenie takich zasad w celu bezpiecznego raportowania danych przestrzennych.
John S. Brownstein, Ph.D.
Szpital Dziecięcy w Bostonie, MA 02115
[email protected] edu
Christopher A. Cassa, M. Eng.
Harvard-MIT Wydział Nauk o Zdrowiu i Technologii, Boston, MA 02139
Kenneth D. Mandl, MD, MPH
Harvard Medical School, Boston, MA 02115
5 Referencje1. Croner CM, Sperling J, Broome FR. Systemy informacji geograficznej (GIS): nowe perspektywy w zakresie zrozumienia zdrowia ludzkiego i relacji środowiskowych. Stat Med 1996; 15: 1961-1977
Crossref Web of Science MedlineGoogle Scholar
2. Pickle LW, Waller LA, Lawson AB. Obecne praktyki w zakresie analizy danych przestrzennych raka: wezwanie do wskazówek. Int J Health Geogr 2005; 4: 3-3
Crossref MedlineGoogle Scholar
3. Brownstein JS, Cassa CA, Kohane IS, Mandl KD. Odwrotne geokodowanie: obawy o poufność pacjenta w wyświetlaniu danych dotyczących zdrowia w kontekście geoprzestrzennym. AMIA Annu Symp Proc 2005: 905.
Google Scholar
4. Rushton G, Armstrong MP, Gittler J, i in. Geokodowanie w badaniach nad rakiem: przegląd. Am J Prev Med 2006; 30: Suppl: S16-S24
Crossref Web of Science MedlineGoogle Scholar
5. Cassa CA, Grannis SJ, Overhage JM, Mandl KD. Kontekstowe podejście do anonimizacji danych nadzoru przestrzennego: wpływ na wykrywanie epidemii. J Am Med Inform Assoc 2006; 13: 160-165
Crossref Web of Science MedlineGoogle Scholar
(26)
[hasła pokrewne: olx bedzin, co to jest choroba genetyczna, ile kosztuje wizyta u lekarza medycyny pracy ]
[przypisy: nowa lista leków dla seniorów, olx bedzin, skierowanie na leczenie uzdrowiskowe ]