Возможности и опасности использования цифровых данных для понимания человеческого поведения

Вычислительная социология - это мощный инструмент исследования. Но она нуждается в том, чтобы различные области науки нашли общий язык.Вычислительные социологи использовали данные с мобильных телефонов для изучения пандемии коронавируса. Каковы причины нерешительности в отношении вакцин? Как можно побудить людей больше заниматься спортом? Что могут сделать правительства для улучшения благосостояния граждан?

 

ОБЩЕСТВО
|

Исследуя эти вопросы, социологи наблюдают за поведением людей, записывают данные об этом поведении, а затем дополняют эти знания путем собеседования и/или опроса тех, кого они изучают. Проведение исследований таким образом - это трудоемкий и рутинный процесс. Кроме того, трудно получить большое количество данных одновременно.

Но теперь исследователи имеют доступ к беспрецедентному объему социальных данных, которые генерируются каждую секунду в результате непрерывного взаимодействия на цифровых устройствах или платформах. К ним относятся данные, отслеживающие передвижения людей, покупки и социальные взаимодействия в Интернете - все эти данные оказываются чрезвычайно полезными для исследований. В результате в последние годы наблюдается огромный рост работ, связанных с анализом больших данных и решением социальных вопросов, известных как вычислительная социология.

Только в ходе пандемии коронавируса исследователи смогли получить доступ к миллионам записей мобильных телефонов, чтобы изучить, как менялось передвижение людей во время пандемии и влияние этих изменений на распространение SARS-CoV-2. Они смогли получить доступ к анонимным историям покупок по кредитным картам, чтобы изучить, как люди тратят деньги во время пандемии - информация, которая затем используется для понимания того, как COVID-19 влияет на различные сектора экономики.

Использование компьютеров для анализа больших массивов данных относится к самым ранним компьютерам мейнфреймов и занимает важнейшее место в работе национальных статистических бюро, которые уже давно являются важными ресурсами для изучения общества и людей. Но богатство информации в режиме реального времени и на индивидуальном уровне сегодня не имеет себе равных в своей способности отслеживать тенденции, делать прогнозы и обосновывать решения. А доступность информации делает ее доступной практически для всех общественных наук: исследователи в областях от психологии до экономики и политологии теперь могут полагаться на данные для более глубокого изучения ключевых вопросов общества.

Власть и ответственность
В то же время исследователи должны помнить, что сбор и обмен такими персональными данными - практика, которая в настоящее время практически не регулируется, - создает множество проблем для общества. К ним относятся риски, связанные с усилением наблюдения, и опасность повторной идентификации людей по анонимным данным.

Существуют также опасения, что люди, чьи данные используются, не дали полного согласия на это, а также более широкие опасения по поводу экономической монополии технологических корпораций, которым принадлежит большая часть данных. Эти цифровые следы, как правило, оставляют непропорционально богатые люди в развитых странах, что искажает попытки сделать глобальные выводы. Признание этих проблем и работа с ними - ключ к этической вычислительной социальной науке, способствующей реальному общественному прогрессу.

Необходимость сочетать знания в области социальных наук с навыками, требуемыми для сбора, очистки и анализа больших массивов данных, означает, что для вычислительной социальной науки требуются команды исследователей, которые могут использовать необычайно разнообразные знания и навыки. Однако сотрудничество между различными научными областями сопряжено с другими проблемами.

Более прочные мосты
Для начала различным научным направлениям необходимо преодолеть языковой барьер, при котором одни и те же термины имеют разное значение. Например, во многих социальных науках (таких как психология и социология) " прогноз" часто означает корреляцию; в физических науках (таких как физика, информатика и инженерия) он обычно означает прогноз. Настоящие трансдисциплинарные исследования требуют, чтобы ученые сначала выучили языки друг друга, а затем выработали общее понимание терминов.

Но разрыв может быть глубже, чем язык, - в том, как собирать, анализировать и интерпретировать данные для объяснения того или иного явления. Джейк Хофман из Microsoft Research в Нью-Йорке и его коллеги утверждают, что вычислительная социальная наука может наиболее эффективно отвечать на вопросы исследования, комбинируя взаимодополняющие подходы. Например, исследователи, строящие численный прогноз, скажем, причин возникновения пробок, соберут данные о транспортных потоках, а также сведения от водителей о причинах, по которым они ездят по определенным маршрутам.

Результаты любого исследования определяются не только используемыми аналитическими стратегиями, но и качеством данных - и это становится особенно важным при работе с социальными данными. Огромные объемы доступных данных, которые делают возможной вычислительную социальную науку - например, твиты или данные о местоположении с телефонов - обычно собираются не для исследовательских целей, и поэтому легко могут быть неправильно истолкованы.

Именно поэтому, как пишет Дэвид Лейзер из Северо-Восточного университета в Бостоне, штат Массачусетс, и его коллеги, исследователи, работающие с большими массивами данных, не должны делать выводы только на основе тенденций или закономерностей, наблюдаемых в цифрах, но должны учитывать факторы, которые могут повлиять на результат. Чтобы извлечь реальный смысл из данных, исследователи должны тщательно определить объекты исследований в соответствии с теорией, проверить их и интерпретировать соответствующим образом.

Широко распространенное влияние алгоритмов является еще одним источником потенциальной ошибки, как объясняют Клаудия Вагнер из Института социальных наук имени Лейбница в Мангейме (Германия) и ее коллеги. Они отмечают, что алгоритмы, пронизывающие наше общество, оказывают влияние на индивидуальное и групповое поведение различными способами - это означает, что любые наблюдения описывают не только поведение людей, но и влияние алгоритмов на их поведение. Они утверждают, что теории, на которых базируется социальная наука, должны быть обновлены, чтобы признать эти влияния; без этих теорий и четкого понимания влияния алгоритмов на имеющиеся данные исследователи не смогут сделать значимые выводы.

Еще одним осложняющим фактором для вычислительной социальной науки является то, что большие массивы данных часто являются частной собственностью коммерческих предприятий. Академическим ученым приходится поддерживать связь с корпорациями, чтобы получить доступ, и это может внести еще большую предвзятость. Отчасти это объясняется тем, что для компаний данные представляют ценность, и поэтому обмен данными представляет собой риск для их прибыли. Это одна из причин, по которой компании стремятся ограничить доступ к данным, как подчеркивают Джейтан Садовски из Университета Монаша в Мельбурне (Австралия) и его коллеги. Но в свете того, что эти данные могут принести пользу обществу, компаниям - вместе с научными исследователями и государственными органами - необходимо коллективно решать эти вопросы и устанавливать стандарты качества, доступа и владения данными.

Пути продвижения вперед
Существуют способы получения данных, которые могут быть полезными и надежными, как описывает Мирта Галесич из Института Санта-Фе в Нью-Мексико и ее коллеги в статье о "социальном зондировании человека". Это изучение того, как люди собирают информацию о других людях в своих социальных сетях. Например, исследователи могут предсказать изменение политических взглядов, опросив людей и спросив их, о чем говорят их друзья. Сбор данных о людях от других людей может помочь избежать некоторых предубеждений, наблюдаемых в самоотчетных данных, и имеет дополнительное преимущество в получении анонимных данных: исследователям никогда не нужно знать никаких личных или конфиденциальных деталей о людях, о которых они получают информацию.

Еще одна область, требующая развития, находится на пересечении моделирования инфекционных заболеваний и поведенческих наук. Как утверждают Кэролайн Баки из Гарвардской школы общественного здравоохранения имени Т. Х. Чана в Бостоне и ее коллеги, точная модель заражения и инфекции требует от исследователей понимания культуры и поведения людей, которые были - или могут быть - инфицированы. Трудно предсказать путь развития болезни без учета этих и других социальных аспектов передачи. Структурированное и широкомасштабное сотрудничество между различными дисциплинами является ключом к достижению этой цели.

Пандемия показала, как можно спасти жизни людей, если использовать масштабные массивы данных в научных целях. Этот потенциал только начинает реализовываться по мере того, как исследователи с опытом работы в области информатики или прикладной математики объединяются с социологами. Эти отношения должны углубляться и охватывать исследователей из других областей - таких как этика, ответственные исследования и научно-технические исследования - для того, чтобы мы могли избежать известных подводных камней и использовать эти данные таким образом, чтобы максимизировать полученные знания и минимизировать потенциальный ущерб.

Совместное взаимодействие между представителями разных научных отраслей редко бывает легким, но оно необходимо для принятия более эффективных решений и достижения надежных результатов. Мы будем стремится содействовать этому общению, помогая ученым изучать языки друг друга, чтобы исследователи могли вместе добиться большего прогресса в решении некоторых из самых насущных проблем общества.


Комментарии

Пока нет комментриев, будьте первым кто выскажется

Добавление комментария

Ваше имя
Почта
Комментарий
В ситуациях с коронавирусом в России и в США много общего: сейчас открываются кафе и магазины, отменяют масочный режим. Но все ли так оптимистично,

Социальные сети уже давно интересуют исследователей самых разных отраслей научного знания. Социологи, культурологи, антропологи, философы собирают и

Cambridge Analytica — частная компания, образованная в 2013 году. Она занимается проблемами применения массивов данных в пиаре и политтехнологиях.

В последнее время, быть интровертом — значит ставить на себя несмываемое клеймо нелюдимого человека, который не способен работать в группе, а,

Прорыв в области телекоммуникационных технологий явился причиной значительных изменений в нашей повседневной жизни. Доступ к информации можно











РУбрики
все шаблоны для dle на сайте newtemplates.ru скачать