Экономисты показали, что прогноз рождаемости можно сделать заметно точнее, если учитывать не только статистику, но и поисковые запросы о беременности и родах.

Исследование провели сотрудники факультета экономических наук НИУ ВШЭ Лилия Родионова и Елена Копнова вместе с аспирантами Никитой Родионовым и Светланой Камелендиновой. Они сопоставили ежемесячные данные Росстата о числе родившихся в России с 2011 по 2024 год с динамикой запросов в Google Trends. 

сумка в роддом

Авторы собрали корпус из 56 слов и с помощью машинного обучения разделили их на четыре блока: планирование беременности, течение беременности, подготовка к родам и универсальные запросы. Затем эти данные добавили в модель SARIMA, которая учитывает динамику рождений вне зависимости от сезонности.

Обычная модель на горизонте один год дала среднюю ошибку прогноза 4,62%, или около 4,6 тысячи на 100 тысяч рождений. Когда в расчет включили поисковые данные, ошибка снизилась до 3,2%.

“Наиболее эффективным блоком запросов оказался “Подготовка к родам”. Можно предположить, что такие запросы, как “роддом”, “сумка в роддом”, чаще совершают женщины, которые уже знают о своей беременности и активно готовятся к предстоящим родам. Это делает их четким и надежным предиктором для краткосрочного прогноза”, – объяснили доцент Родионова.

Сильнее всего точность выросла после учета временного фактора. По расчетам авторов, запросы о планировании беременности отражаются в модели примерно через 7,4 месяца, а запросы о подготовке к родам – уже через шесть. Это логично: “сумку в роддом” или “дыхание при родах” обычно ищут незадолго до рождения ребенка.

На более длинном горизонте лучше всего сработала модель, которая учитывала все блоки запросов и временные интервалы. При прогнозе на два года ошибка снизилась до 2,7%, на три года – до 2,6%.

“Модель тестировалась на данных за период до декабря 2024 года, который включал в себя и пандемию COVID-19, и начало геополитической нестабильности. Высокая точность прогнозов на контрольном периоде, который включал кризисные годы, свидетельствует о высоком потенциале модели”, – отметила Родионова.

Демографические прогнозы важны и для Беларуси. Тема рождаемости также остается чувствительной: ранее Smartpress писал, что, по данным Белстата, в 2024 году в стране родилось 58 938 детей – заметно меньше, чем в 2019-м, когда такие данные публиковались в последний раз. От точности таких прогнозов зависят планы по детским садам, школам, медицине, рынку труда и социальным расходам.