Великі дані показали, як змінюються родини протягом століть
21.07.2021
Аналітика великих даних з переписів населення США розповіла історію занепаду патріархату, підйому та падіння ранніх шлюбів та пандемічні наслідки; оцифрування даних може розкрити ще цікавіші історії.
Стівен Рагглз, історик-демограф з Університету Міннесоти (США) побудував свою кар’єру, розшифровуючи дані переписів населення, щоб простежити історію сім’ї в західному світі. Видобуваючи та аналізуючи загальнодоступні записи, Рагглз продемонстрував, як змінювались сімейні структури з часом: хто і коли одружується, коли у них з’являються діти, де і як люди живуть, як люди заробляють на життя.
Протягом останніх років, спрощений доступ до оцифрованих записів та посилені можливості аналітики великих даних значно прискорили його роботу. Будучи директором Інституту соціальних досліджень та інновацій даних у своєму університеті, Рагглз запустив найбільшу в світі базу даних, що пов’язує інформацію з перепису та інші історичні дані, в 1993 році. Відома як IPUMS, колекція відслідковує дані переписів населення США з 1790 року до сьогодні, а також дані понад 100 національних статистичних агентств у всьому світі та безлічі інших архівів.
IPUMS є однією з перших баз даних, що відстежують людей за часом і по різних локаціях – “золота жила” для демографів та багатьох інших типів науковців, переконаний Рагглз, який оцінив майбутнє історичної демографії в Annual Review of Sociology 2012 року. Лише у першій половині 2021 році вчені у всьому світі за допомогою IPUMS опублікували статті про здоров’я матері, контроль над палінням, доступність оренди та методологію демографії. Рагглз розповів Knowable, чому “копання” у великих даних так цікава і важлива для демографів.
Вчений пояснив, що його база збирає дані перепису населення на індивідуальному рівні, які на першому рівні включають відповіді, які кожна американська сім’я подає для опитування кожні 10 років. Індивідуальні дані з 1950-х років минулого століття зберігаються в Бюро перепису через правила конфіденційності, але попередні звіти є загальнодоступними. “Ми відновили та організували доступ до подібних записів і для багатьох інших країн – усього зі 109 національних статистичних агентств. Єдиними великими країнами, яких нам бракує, є Японія та Австралія, де ми все ще намагаємось переконати їх поділитися”, – каже Рагглз.
Одним із важливих результатів роботи з великими даними є аналіз історії сім’ї як інституту. “У європейській сімейній системі перед тим, як одружитися, ви повинні були мати трохи землі та кошти на утримання сім’ї, тож, як правило, шлюб брали досить пізно. Наприкінці XVII століття середній шлюбний вік в Англії становив 27 років для жінок та, можливо, 29 або 30 для чоловіків. Нині ж, за оцінками, серед білих жінок медіана зараз становить близько 29 років. Для чоловіків це на рік-два старше. Це пізніше, ніж будь-коли раніше, безумовно, в американській історії, і це, можливо, пізніше, ніж це було на північному заході Європи в 1600-х роках”, – каже він.
Він додає, що завдяки аналітиці великих даних можна спрогнозувати, яка частина людей ніколи не збирається одружуватися. “Вона може наблизитися до 40 відсотків до того моменту, коли сьогоднішні люди віком від 20 до 24 років досягнуть віку від 45 до 54 років”, – додає дослідник.
Ще один напрямок досліджень – вивчення наслідків пандемії іспанського грипу в 1918 році. “Більшість демографів, які вивчають грип 1918 року в своєму населеному пункті, розглядають його вплив на роботу, сім’ю та бідність. Вивчення записів, пов’язаних із людьми, які були дуже молодими в 1918 р., включаючи людей, що були ще в утробі, показує, що вони отримали “шрами” на все життя: погані наслідки для здоров’я, нижча освіта та менший економічний успіх”, – пояснює історик-демограф.
Рагглз певен, що великі дані переписів населення дозволять у майбутньому проаналізувати і вплив пандемії коронавірусної хвороби на людство в цілому.