Федеральное государственное бюджетное образовательное учреждение высшего образования «Московский государственный институт культуры» На правах рукописи ДЕЛИЦЫН Леонид Леонидович НАУЧНЫЕ ОСНОВЫ РАЗРАБОТКИ И ПРИМЕНЕНИЯ КОЛИЧЕСТВЕННЫХ МОДЕЛЕЙ РАСПРОСТРАНЕНИЯ НОВЫХ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ Специальность 05.25.05 – Информационные системы и процессы ДИССЕРТАЦИЯ на соискание ученой степени доктора технических наук Москва – 2015 2 Оглавление ВВЕДЕНИЕ ............................................................................................................................................. 4 ГЛАВА 1. КОЛИЧЕСТВЕННЫЕ МОДЕЛИ РАСПРОСТРАНЕНИЯ СЕТИ ИНТЕРНЕТ ......... 21 1.1 Моделирование и прогнозирование распространения сети Интернет с учетом воспроизводства населения ............................................................................................................. 23 1.1.1 Разработка количественной модели распространения нововведения: система уравнений, алгоритм численного решения и процедура идентификации параметров ......... 24 1.1.2 Прогнозирование распространения сети Интернет на основе разработанной количественной модели ............................................................................................................... 32 1.2 Некоторые аналитические модели распространения новых информационных технологий и их приложения .......................................................................................................... 44 1.2.1 Аналитическая модель распространения нововведения с учетом обучения ........... 45 1.2.2 Модель динамики цифрового разрыва ......................................................................... 51 1.3 Многостадийные модели распространения и интенсивности использования новых информационных технологий ......................................................................................................... 57 1.3.1 Совместное моделирование количества информированных, намеренных воспользоваться и пользователей новой технологии ............................................................... 58 1.3.2 Совместное моделирование количества пользователей и абонентов ....................... 75 1.3.3 Многостадийная модель охватов аудитории сети Интернет ..................................... 80 ГЛАВА 2. МОДЕЛИ ИНТЕНСИВНОСТИ ИСПОЛЬЗОВАНИЯ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ И РЕСУРСОВ ........................................................................................................... 85 2.1 Количественная модель интенсивности использования сети Интернет .......................... 87 2.1.1 Разработка модели интенсивности (частоты) использования сети Интернет ......... 90 2.1.2 Прогнозирование динамики охватов аудитории сети Интернет на основе разработанной количественной модели ................................................................................... 114 2.2 Моделирование онлайн-панели при помощи смеси бета-биномиальных распределений… ............................................................................................................................ 125 2.3 Модель охвата аудитории информационных ресурсов WWW ....................................... 136 2.3.1 Модель поведения пользователей информационного ресурса WWW ................... 139 2.3.2 Способ расчѐта охватов аудитории информационных ресурсов WWW по данным счетчиков..................................................................................................................................... 153 ГЛАВА 3. СОВМЕСТНОЕ МОДЕЛИРОВАНИЕ ПАРКА И РЫНКА ТЕХНИЧЕСКИХ СИСТЕМ ............................................................................................................................................. 160 3.1 Модели распространения мобильной связи среди индивидов и в домохозяйствах ..... 163 3.1.1 Модели с постоянным потенциалом распространения ........................................... 163 3.1.2 Модели с линейно растущим потенциалом распространения ................................ 193 3.2 Совместное моделирование компьютерного рынка и парка компьютеров ................... 205 3.2.1 Модель распределения срока службы компьютера .................................................. 206 3.2.2 Прогнозирование парка и рынка ПК, планшетных компьютеров и сотовых телефонов .................................................................................................................................... 217 3 ГЛАВА 4. МОДЕЛЬ ВЫБОРА НОВЫХ ИКТ ДЛЯ ИНВЕСТИРОВАНИЯ ВЕНЧУРНЫМ ФОНДОМ ............................................................................................................................................ 223 4.1 Модель принятия решения об инвестировании в информационные и телекоммуникационные технологии венчурным фондом ......................................................... 224 4.2 Проблемы венчурного инвестирования в новый способ предоставления программного обеспечения .................................................................................................................................... 251 ЗАКЛЮЧЕНИЕ .................................................................................................................................. 260 CПИСОК ЛИТЕРАТУРЫ................................................................................................................. 264 ПРИЛОЖЕНИЕ A. ............................................................................................................................. 294 ПРИЛОЖЕНИЕ Б. .............................................................................................................................. 295 4 ВВЕДЕНИЕ Актуальность темы исследования Информационный «взрыв» XXI века сопровождается ускоренной разработкой и быстрым распространением новых технологий, их эволюцией, конкуренцией и замещением. У каждого из таких устройств, как персональный компьютер, мобильный телефон, цифровая камера и пластиковая карточка, сегодня насчитывается более двух миллиардов пользователей. Не менее популярны новые услуги, среди которых – доступ к сети Интернет и информационным ресурсам WWW, электронная коммерция и реклама, видеоконференции, дистанционное обучение, программное обеспечение в виде услуги (SaaS). В то же время завершают жизненный цикл и выходят из употребления широко распространенные ранее технологии: телеграф, факс, компакт-диски, а в ряде стран – и проводная телефонная связь. Стремительное развитие и быстрая смена технологий1, изменяя поведение пользователей и потребителей, вынуждают руководителей и специалистов принимать решения в условиях высокой неопределѐнности, а значительный объѐм разнородных и противоречащих друг другу статистических показателей усложняет выбор альтернатив. В итоге проблемы оценки современного состояния и прогнозирования распространения новых информационных и коммуникационных технологий (ИКТ), ранее интересовавшие преимущественно производителей компьютерной техники, связистов, финансистов и маркетологов, попадают в поле внимания руководителей и специалистов издательской, библиотечной и образовательной отраслей [293-296, 212]. Основу моделирования и прогнозирования распространения новых информационных технологий по сей день образуют классические модели 1 М.Я.Дворкина оценивает протяженность периода, в течение которого инновация в современной библиотеке (например, предоставление услуг через сеть Интернет) сохраняет статус новшества, лишь в один-два года по окончании внедренческих работ [59]. 5 диффузии инноваций, созданные около полувека назад и обладающие весьма ограниченными объяснительными и прогностическими возможностями. Разработка и апробация более пригодных для решения практических задач моделей становится возможной благодаря, во-первых, доступности статистических и социологических данных об использовании новых технологий, и, во-вторых, − возросшей вычислительной мощности компьютерной техники и наличию необходимого программного обеспечения. Данная работа посвящена разработке и внедрению количественных моделей распространения ИКТ, которые позволяют решать задачи прогнозирования, анализа сценариев и оценки воздействия регулирования, что существенно расширяет инструментарий поддержки принятия решений руководителями учреждений, организаций и компаний перечисленных выше отраслей. Объект и предмет исследования Объектом исследования является процесс распространения новых информационных технологий, который рассматривается как коммуникационный процесс распространения информации о нововведении. Традиционно основными считались два канала распространения сведений – средства массовой информации и межличностное общение, в то время как обучение в образовательном учреждении и в семье ранее оставались за рамками рассмотрения. Предметом исследования являются количественные модели динамики (изменения во времени) статистических показателей распространения новых информационных технологий. В частности, в работе предложены модели динамики аудитории Интернета, охвата аудитории информационных ресурсов WWW, парка компьютеров, мобильной связи, предоставления программного обеспечения в качестве сервиса (SaaS), обосновано применение таких моделей в качестве инструмента поддержки принятия решений. 6 Цель и основные задачи исследования Целью исследования является разработка и апробация количественных моделей распространения новых информационных и телекоммуникационных технологий как инструмента поддержки принятия решений. В соответствии с поставленной целью в диссертации поставлены и решены следующие задачи: 1. Разработать обществе, количественную сегментированном модель по распространения полу и типу нововведения населенного в пункта, учитывающую процессы воспроизводства населения, а также изменение доступности использования нового продукта или услуги во времени. Применить разработанную модель для построения прогноза распространения сети Интернет в России и в различных типах населенных пунктов (города, села). Вывести и использовать аналитические решения уравнений распространения нововведения в частном случае стабильной популяции, для изучения влияния обучения использованию нововведения в семье и в школе на распространение информационных технологий. 2. Разработать и апробировать на данных массовых социологических опросов многостадийную модель роста интенсивности использования нововведения. Построить среднесрочные прогнозы суточного, недельного и месячного охватов аудитории российского Интернета. 3. Разработать и апробировать на данных социологических опросов модель кумулятивных кривых охвата аудитории Интернета, на данных онлайн-панелей и счетчиков – модель кумулятивных кривых охвата аудитории информационных ресурсов WWW. 4. Разработать и апробировать на данных социологических опросов об использовании мобильной связи индивидами и в домохозяйствах количественные модели распространения нововведений, в которых единицей, принимающей решения, является не индивид, а домохозяйство. 7 5. Разработать модель и прогноз распространения компьютерного парка и рынка России с привлечением социологических данных и онлайн-опросов. 6. Разработать метод выбора новых проектов в сфере ИКТ для венчурного инвестирования. Проанализировать новые направления в предоставлении ИТуслуг, такие как предоставление программного обеспечения в качестве услуги (SaaS) при помощи разработанного метода и выработать рекомендации для венчурных инвесторов и ИТ-предпринимателей. Научная новизна исследования состоит в обосновании и последующей разработке комплекса средств анализа сценариев и построения прогнозов распространения новых информационных технологий, в состав которого входят: количественная модель распространения новой информационной технологии, учитывающая процессы воспроизводства населения, изменение доступности нововведения с течением времени, а также обучение использованию новой технологии в учебных заведениях; аналитические решения уравнений указанной модели, позволившие описать историческую динамику и построить прогнозы распространения Интернета в ряде стран, где статистические данные противоречат предсказаниям классических моделей распространения нововведений; многостадийная модель интенсивности использования информационного ресурса, на основе которой построены прогнозы суточного, недельного и месячного охватов аудитории российского Интернета; модели интенсивности использования информационных ресурсов в форме вероятностных смесей, позволяющие полностью описать кумулятивные кривые охватов аудитории онлайн-ресурсов, построенные по данным онлайн-панелей и счетчиков; модель распространения нововведения, рассматривающая в качестве единицы, принимающей решения, домохозяйство, и при этом описывающая три вида данных: о личном владении сотовыми телефонами, 8 об использовании сотовой связи индивидом и о наличии сотового телефона в домохозяйстве; оценка размера использующая эксплуатационного функцию парка распределения технических времени отказа систем, устройства, полученную с привлечением данных ежегодных онлайн-опросов; инструментарий отбора проектов в сфере новых информационных технологий венчурным фондом на основе метода машинного обучения, включающий способ визуализации агрегированных экспертных оценок в виде двумерной карты. Личное участие автора в получении результатов, изложенных в диссертации: 1. Автор построил систему интегро-дифференциальных уравнений распространения новых информационных технологий с учетом процессов воспроизводства населения и динамики стоимости доступа, разработал программное обеспечение для еѐ численного решения, нашѐл аналитические решения этой системы при помощи некоторые элементарных и специальных функций. Автор рассчитал среднесрочные прогнозы полной (полугодовой) аудитории Интернета в России и ряде развитых и развивающихся стран, а также в российских городах и сѐлах. 2. Автором построены среднесрочные прогнозы суточного, недельного и месячного охватов аудитории российского Интернета. 3. Автор предложил модель поведения онлайн-панели в виде смеси бетабиномиальных распределений для описания наборов кумулятивных кривых охвата аудитории информационных ресурсов WWW. 4. Автором разработаны модели принятия решения об использовании новой информационной технологии домохозяйством, в которой первым владельцем нового продукта становится глава домохозяйства, а остальные получают продукт в личное владение с определенной задержкой. Автор провел расчеты 9 по этой модели, и построил прогнозы динамики количества пользователей мобильной связи в России. 5. С целью определить функцию распределения срока службы (т.н. функцию надежности) компьютера автор разработал и с 2004-го по 2008-й год проводил онлайн-опросы о сроке службы компьютера на Интернет-портале Rambler. 6. Автор разработал диаграмму ―неопределенность – привлекательность‖, моделирующую принятие венчурным фондом решений по предложенным инновационным проектам. На защиту выносятся следующие положения: Разработанная количественная модель распространения новой информационной технологии, учитывающая изменение еѐ доступности во времени и процессы воспроизводства населения, может быть применена для описания и прогнозирования динамики количества пользователей сети Интернет среди городского и сельского населения. Предлагаемая многостадийная модель интенсивности использования новой информационной технологии позволяет построить прогнозы охватов аудитории сети Интернет за сутки, неделю и месяц. Представленные в работе вероятностные модели интенсивности использования информационных ресурсов позволяют описать накопленные охваты аудитории WWW-сайтов (в частности, поисковых систем и порталов), измеренные как с применением онлайн-панелей, так и при помощи счѐтчиков. Моделирование динамики эксплуатационного парка технических систем, объединяющее данные онлайн-опросов о возрастном составе устройств со статистикой поставок, российского парка повышает обоснованность оценки величины устройств доступа к сети Интернет, в частности, персональных компьютеров и мобильных телефонов. 10 Инструментарий поддержки принятия решений на основе методов машинного обучения позволяет венчурному фонду повысить релевантность выбираемых аналитиками инвестиционных предложений и ускорить обработку заявок. Достоверность научных положений, рекомендаций и выводов подтверждается корректным применением методов системного анализа, моделирования, статистических репрезентативностью данных методов, массовых математического принятия социологических решений, опросов и объективностью их анализа. Методологическая база исследования Методологической основой моделирования и прогнозирования распространения новых информационных технологий в данной работе служит теория распространения нововведений. Следуя Э.Роджерсу [449], мы определяем нововведение (инновацию) как любую идею, объект, практику, которая воспринимается как новая индивидом или иной единицей (домохозяйством, организацией), принимающей решение об ее использовании, а распространение нововведений (―диффузию инноваций‖) как информационный процесс, в ходе которого инновация с течением времени распространяется по определенным каналам между членами социальной системы. Основными методами, которые применяются в данной работе, являются методы информационного моделирования, системного анализа, прикладной статистики, теории случайных процессов, численные методы решения дифференциальных и интегральных уравнений, методы решения обратных задач и идентификации систем. 11 Эмпирическая база исследования Исследование использует данные статистики Международного союза электросвязи (МСЭ), публикации Росстата, Министерства Информационных технологий и связи Российской Федерации, массовых репрезентативных опросов Фонда ―Общественное мнение‖, ВЦИОМ, Левада-центра, Ромир, GfK, КОМКОН, World Internet Institute, ARD/ZDF, данные маркетинговых исследований IDC, Gartner, IT-Research, а также данные онлайн-панели TNS и интернет-счѐтчика Rambler‘s Top 100 об аудитории российских Интернет-проектов. Кроме того, использованы данные разработанных и проведенных автором в 2004-2008 гг. на Интернет-портале Rambler онлайн-опросов, а также массив экспертных оценок показателей венчурных проектов в сфере ИКТ, выставленных аналитиками инвестиционного фонда ФИНАМ ИТ и студентами МГУКИ в 2005-2011 гг. Степень разработанности проблемы В качестве фундамента для построения количественных моделей распространения информационных технологий в нашей работе используется теория распространения нововведений (диффузии инноваций), в частности, работы Ц.Грилихеса С.К.Додда [370,371], [349], Э.Мэнсфилда [413], Дж.Коулмана, И.Катца и Г.Менцеля [337], Э.Роджерса [449], С.Ожги [438], Э.Пессемье [443], [315,316,317,318,315], Р.Фишера и П.Леквалла Р.Прая и [364], К.Валбина Ф.Басса [401], и соавторов Р.Диксона [348], В.Махайана и соавторов [406,407,408,410,411,409,412], Дж.Додсона и Э.Мюллера [350], К.Изингвуда и др. [354,356], Ш.Калиша [390], Д.Мидгли [428], В.Камакуры и Ш.Баласубраманьяна [392,392], К.Лоуренса и У.Лоутона [399], Р.Бьюли и Д.Фибига [324], У.Путсиса и С.Шринивасана [518], Дж.Робертса и Дж.Латтина [448], Б.Ратчфорда и др. [447], П.Стоунмана [463], А.Беммаора [322], П.Стеффенса и Д.Мурти [461], М.Хана и др.[512], Д.Джейна и Р.Рао [387], А.Жоланда [388], Х.Скиадаса [455,456], М.Н.Шарифа и соавторов [457,458,459], К.Ван ден Бульте и соавторов [470,471], П.Мейера [425], М.Коэна и др.[336], 12 Р.Перес и соавторов [442], Дж.Гольденберга и др. [368], С.Молдован и Дж. Гольденберга [430]. В нашей стране уже в 1959 году логистические модели роста были применены Г.Э.Влэдуцем, В.В.Налимовым и Н.И.Стяжкиным [41] при изучении развития науки; с этим их применением отечественный читатель знакомился и в учебниках информатики А.И.Михайлова, А.И.Черного и Р.С.Гиляревского [222] и К.В. Тараканова [269]. Отдельные модели распространения нововведений рассматривались в восьмидесятые годы XX века, а среди более новых публикаций следует отметить работы О.С.Багатуровой и А.Г.Мамиконова [17], К.А.Багриновского и др. [18], Р.Л.Болдырева и др. [26], В.Б.Булгака и др. [28], Л.Е.Варакина [31,32], Л.М.Гельмана и М.И.Левина [49], О.Г.Голиченко [51], В.М.Московкина [226], Р.М.Нижегородцева и соавторов [230,231,232], В.М.Полтеровича и Г.М.Хенкина [244], В.Д. Секерина и др. [259], И.Н.Щепиной [300], Ю.А.Кобленц-Мишке [186,187] и др. В работах А.А. Самарского и А.П.Михайлова [257], В.А.Шведовского [290], А.П.Михайлова и соавторов [176,223,224] а также ряде других публикаций рассмотрены модели распространения информации в обществе. Сущность информации и методы еѐ количественного изучения обсуждается в монографиях Ю.Н.Столярова [266], К.К.Колина [196], Р.С.Гиляревского А.И.Михайлова [50] и ряде и др. других. [222], К.В.Тараканова Исследования [269], распространения нововведениях в социальных сетях получили отражение в монографии Д.А.Губанова, Д.А.Новикова и А.Д.Чхартишвили [56]. Пионером в области применения статистики к изучению развития и распространения изобретений стал французский социолог Жан-Габриель Тард, книга которого ―Законы подражания‖ [271], впервые изданная в 1890 году, уже в 1892 была переведена на русский язык. Важный этап развития моделирования распространения инноваций пришѐлся на шестидесятые годы прошлого века. Вопервых, опыт изучения распространения инноваций был обобщѐн Э.Роджерсом в монографии «Диффузия инноваций» [449], которая по сей день является одной из 13 наиболее цитируемой книг в области изучения коммуникаций. Во-вторых, Ф.Басс модифицировал известное с XIX в. уравнение П.Ф.Ферхюльста [476,477], предложил интерпретацию параметров этого уравнения с позиций теории коммуникаций, и применил его на для прогнозирования новых товаров [315]. Успех прогнозов Ф.Басса и многочисленные публикации его учеников в течение четырех десятилетий привлекли к изучению распространения инноваций значительное число исследователей. Отметим классическую монографию В.Махайана и Р.Петерсона [408], посвященную количественным моделям распространения нововведений, и изданный в виде монографии детальный обзор достижений последних десятилетий Р.Перес, Э.Мюллера и В.Махайана [442], коллективные монографии под ред. В.Махайана, Э.Мюллера и Й.Уинда [412], и А.Вишваната и Дж.Барнетта [478]. Методам прогнозирования распространения нововведений посвящена серия обзоров Н.Мида и Т.Ислама [421,422], статья П.Паркера [440]. С позиций экономической теории распространение нововведений рассмотрено в монографиях К.Тиртла и В.Руттана [467], П.Стоунмана [463]. Сетевым моделям распространения нововведений посвящена монография Т.Валенте [469]. Монография Р.Бэнкса [314], посвященная явлениям роста и диффузии является, по-видимому, наиболее полной энциклопедией логистических моделей и примеров их применения. Ряд важных работ, посвященных распространению новых технологий, был опубликован исследователями Международного института прикладного системного анализа (IIASA) в Вене (Н.Накиченович [435,434,308], Ч.Марчетти [414,417,415,416], А. Грюблер [375,376,377], В.Петерка и Ф.Флек [444]). Лишь в последние десять лет появились количественные модели распространения нововведений, учитывающие воспроизводство населения. В частности, в статьях Ф.Центроне, А.Гойя и Е.Салинелли [329,328] найдены точные решения уравнений распространения нововведений для частного случая стабильной популяции. В работе Х.-К.Кортеса, И.Ломбаны и Р.Виллануэвы [338] 14 модель распространения электронной коммерции в Испании построена на основе подхода Г.Хезкота [381], при котором система интегро-дифференциальных уравнений в частных производных аппроксимируется системой обыкновенных дифференциальных уравнений. За исключением этих работ, в исследованиях распространения нововведений процессы воспроизводства населения игнорируются. Однако эти процессы детально рассмотрены в демографии, экологии и математической теории распространения эпидемий, которая традиционно служит основным источником заимствований коммуникативных моделей распространения нововведений (поскольку, на наш взгляд, является математической теорией межличностных коммуникаций). В этой связи остаются актуальными основополагающие труды А.Лотки [404], В.Вольтерра [42], Р.Пирла и Л.Рида [441], А.Мак Кендрика [477], В.Кермака и А.Мак Кендрика [393], а также работы Н.Бейли [313], Н.Кейфица и Х.Касвелла [394], Ф.Хоппенстедта [382], Р.Гуртина и Р.Мак-Кеми [378,379], Р.Элдеркина [361], О.Дикмана и Дж.Хестербика [346], М.Ианелли, М.Марчевой и Ф.Милнера [384], Ф.Брауэра и К.Кастилло-Чавеса [326], Х.Тиеме [466], Х. фон Фѐрстера [479,480], Г.Хезкота [381], Э.де Руса [343], А.Цулариса [468], О.В.Барояна, Л.А.Рвачева и Ю.Г.Иванникова [21], Г.И.Марчука [218], Н.В.Перцева [239,240]. Важными источниками моделей социальных процессов с учетом воспроизводства населения являются монографии Д.Бартоломью [22], В.Вайдлиха [30] и Д.Хелбинга [380]. Среди российских работ следует выделить учебник математической демографии О.В.Староверова [265], монографию Ю.И.Хмелевского [285], посвященную теории самовоспроизводящихся систем, монографии И.Д. Колесина [189,190], Ю.М.Плотинского [242], А.К. Гуц и соавторов [58]. В работах Ю.Н.Гаврильца и соавторов [см., например, 44] предложена модель динамики установки индивидов (предрасположенности используем Интернета. при к определѐнному исследовании виду изменения поведения), интенсивности которую мы использования 15 В 1995 г. Я.Нильсен [436] предложил применить модель Ф.Басса [315] и ее расширение, модель NSRL [355], для исследования распространения Интернета и WWW (Всемирной Паутины). Среди исследований, использующих модели диффузии инноваций для изучения распространения Интернета в европейских странах, можно отметить работу М.Форнерино [365], в которой проведено сравнение моделей Ф.Басса [315] и NUI [356], причем сделан выбор в пользу последней. Р.Роуз [450], изучая распространение Интернета в России, выделил важное подмножество индивидов, которые не пользуются Сетью, но знакомы с пользователями и подготовлены для восприятия этого нововведения. Глобальные прогнозы распространения Интернета были построены Т.Модисом [429] и С.Арбесманом [307]. Прогнозированию распространения Интернета, в первую очередь – широкополосного, посвящена коллективная монография под ред. Д.Лумиса и Л.Тэйлора [403], прогнозированию инфокоммуникационных технологий – брошюра Л.К. Уэнстона и Дж.Х.Уэнстона [472]. Отметим также работу С.Кииски и М.Похъйола [395], где была получена оценка эластичности потенциала распространения Интернета по отношению к стоимости доступа. Исследованию распространения Интернета в России посвящены монографии Ю.Ю. Перфильева [238], Г.Л. Смоляна, В.Н. Цыгичко и Д.Д. ХанМагомедова [262] (см. также монографию В.Н.Цыгичко [286]), исследование коллектива ВНИИПВТИ под руководством В.А. Конявского [199]. Наиболее полное описание источников российских социологических данных об использовании Интернета содержится в монографиях А.В. Чугунова [287,288]. К.К.Колин [196,195] выделил информационное неравенство в качестве важной проблемы XXI века; Е.Л.Вартанова и Я.Н.Засурский [34,33] указывают на сохранение информационного неравенства в течение многих лет даже между европейскими государствами. Преодолению ―цифрового разрыва‖ в обществе посвящена диссертация А.В.Короткова [202]. Ц.Хуанг и Х.Чен [383] предложили способ оценки динамики цифрового разрыва между странами при помощи модели 16 диффузии нововведений и исследовали различия в использовании Сети домохозяйствами в Великобритании и России. Распространение Интернета в России рассматривается как процесс диффузии инноваций в книге Ю.Ю.Перфильева [238], при этом автор указал на географическую высокую неоднородность доступность в распространения мегаполисах и Сети, дороговизну ее сравнительно и техническую недоступность в сельских регионах. Диффузионный подход был распространен Ю.В.Деарт на сети связи [60], этим автором и ее коллегами были построены логистические модели и прогнозы распространения сотовой связи и Интернета в России [62,61], важную роль в которых играют межстрановые сопоставления. Классические нововведений, трех- и помимо четырехпараметрические уже отмеченных моделирования и прогнозирования модели работ, распространения использовались для динамики Интернета, мобильной связи и других информационных и телекоммуникационных технологий в работах А.В.Абилова [1], K.E.Афанасьевой и В.И.Ширяева [12,11], В.Б.Булгака и др. [28], Л.Е.Варакина [32,31], Т.А.Кузовковой и Л.С.Тимошенко [206], С.Ю.Казанцева и И.Э.Фролова [178,178], М.И. Левина и др. [211] и других авторов. Актуальность для библиотечно-информационной отрасли прогнозов распространения таких нововведений, как смартфоны, планшетные компьютеры, читающие устройства, мобильные библиотеки, акцентируется в обобщающих ежегодных докладах Я.Л.Шрайберга [293,296,294,295]. При прогнозировании суточного, недельного и месячного охвата аудитории информационных ресурсов мы опирались на модели медиаметрии и поведения потребителей, рассмотреные в работах Р.Мезерингэма [424], Ж.- Л.Шандона [330], П.Данахера и соавторов [340, 341], Й.Парка и П.Фейдера [439], Дж.Ли и Л.Кербак [400], в монографиях Р.Руста [452], Дж.Росситера и П.Данахера [451], Э.Эренберга [360], П.Лифлэнга [514], Г.А.Шматова [291,292], а также в монографии под ред. Ю.Г.Рязанова и Г.А.Шматова [256]. 17 Модель Ф. Басса [315] была применена М.Райтом и др. [481] для описания динамики числа абонентов мобильной связи в Новой Зеландии. Х.Грубер и Ф.Вербовен [374, см. также 373] использовали логистическую модель для исследования распространения мобильной связи в странах Европейского союза. Согласно их выводам, наиболее сильно на процесс диффузии повлияли переход от аналоговых стандартов к цифровым и конкуренция операторов связи. Л.Франк [366] использовал логистическую функцию с переменным во времени параметром внутренних воздействий для моделирования распространения мобильной связи в Финляндии. А.Ботельо и Л.Пинто [325] применили логистическую модель для объяснения динамики распространения мобильной связи в Португалии, а Х.Михалакелис с соавторами [426] построили модели динамики сотовой телефонии в Греции при помощи большого количества Sобразных кривых. Ф.Центроне и др. [329] применили упоминавшуюся выше модель распространения нововведений с учетом демографических процессов для изучения распространения мобильной связи в ряде стран Европы. Изучая эффект ―наверстывания‖, Джиованис и Скиадас [367] предложили первую многостадийную модель распространения мобильной связи. Отметим, что в большинстве работ диффузионные модели применялись к данным операторов мобильной связи о количестве абонентов (SIM-карточек). Важный вопрос о связи числа пользователей и абонентов сотовой связи был поставлен лишь в статье И. С. Березина [24]. Распространению технических систем, и в частности – компьютеров, посвящен значительный объем литературы, в частности, работы С.Чоу [333], Ц.Грилихеса и соавторов [372,323], Дж.Ольсона и С.Чои [437], В.Камакуры и Ш.Баласубраманьяна [392], П.Стеффенса [462], П.И.Басс и др. [320,319,321], А.А.Ананьева и И.М. Ильенкова [6], В.В.Васильева и В.Б.Соколова [264], Т.Ю.Салютиной [36], Л.Е.Варшавского [35], Т.А.Кузовковой и Л.С.Тимошенко [206]. Наиболее общие модели обновления технического парка технических систем были разработаны Ю.Н.Григоровым, П.В.Даниловым и Ю.Н.Павловским 18 [54], см. также [53,236], ряд стохастических моделей технических и социальноэкономических систем рассмотрен в монографии К.В.Тараканова и др. [270]. При разработке моделей отбора инновационных информационных технологий мы основывались на проектов в сфере работах А.Бретта [27], Дж.Мартино [419], С.Я.Бабаскина [15,16], А.И.Каширина и А.С.Семенова [182], при этом полезными оказались сопоставления с моделями распространения новых информационных технологий в организациях, разработанными Ф.Дэвисом [342], Р.Багоцци и соавторами [311,312], В.Венкатешем и др. [475], Дж. Тенга и др. [465]. Теоретическая значимость работы заключается в 1. Разработке количественной модели распространения новых информационных технологий в неоднородном обществе с учетом демографических процессов и изменения доступности нововведения во времени. Объяснении на основании построенной модели динамики распространения Интернета в ряде случаев, которые не поддается описанию при помощи классических логистических моделей. 2. Создании единого подхода к моделированию охвата аудитории и интенсивности использования сети Интернет и информационных ресурсов WWW при помощи вероятностной смеси непрерывных распределений интенсивности простейших потоков событий. 3. Разработке многостадийной модели роста интенсивности использования информационных ресурсов, в которой на каждой стадии пользователя характеризует непрерывное распределение частоты использования. 4. Обосновании сложного и протяженного характера процесса принятия решений потенциальным потребителем нововведения в сфере ИКТ, в ходе которого первым пользователем нововведения становится домохозяйство (или его глава), а последующие члены семьи получают устройство (или услугу) с задержкой. 19 Практическая значимость работы Модели апробированы автором на данных социологических опросов, и были внедрены следующими организациями: 1. ЗАО Артикул Продакшн при разработке прогноза аудитории официального проекта Сочи-2014. 2. ЗАО ФИНАМ при разработке исследований компаний ИТ-сектора в 2006-2012 гг., а также при отборе инновационных проектов в сфере ИКТ в 2006-2012 гг. 3. ООО ЮДУ для прогнозирования количества запросов к сервису. Соответствующие акты о внедрении приведены в приложении Б к диссертации. Результаты исследования применяются в учебном процессе в Институте информационных коммуникаций и библиотек МГУКИ в читаемых автором курсах ―Поисковые системы Интернета‖, ―Количественные методы исследования социокультурной среды‖, ―Социология виртуального пространства‖, и факультете журналистики МГУ им. М.В.Ломоносова в курсах ―Организация, хранение и поиск данных в Интернете‖ и ―Методы компьютерного анализа данных в гуманитарных науках‖. Материалы диссертационного исследования, научные выводы и рекомендации могут быть полезны для дальнейших научных разработок и практической деятельности организаций, компаний, работающих в области в производства и внедрения новых информационных технологий. Апробация работы По теме диссертационного исследования автор сделал тридцать два доклада на международных и всероссийских конференциях, кроме того, сновные результаты исследования были представлены автором на одиннадцати семинарах в г. Москве. Общее число печатных публикаций автора по теме исследования составляет 121 работу. 20 Автором опубликованы 23 статьи в изданиях, включенных в перечень ВАК (шесть из них – в соавторстве), 11 работ в журналах, не включенных в перечень (четыре из них – в соавторстве), одна монография. Кроме того, 65 работ автора (26 статей и 39 тезисов докладов) опубликованы в сборниках трудов международных конференций, 11 работ (4 статьи и 7 тезисов докладов) – в сборниках трудов всероссийских конференций, 13 (8 статей и пять тезисов докладов) – в материалах региональных и институтских конференций и коллективных сборниках. Восемнадцать из этих работ опубликованы автором в соавторстве, остальные – самостоятельно. Структура и объем диссертации Диссертационная работа состоит из введения, четырѐх глав, заключения, списка литературы, включающего 482 отечественных и зарубежных источника, двух приложений. Объѐм текста работы составляет 299 страниц, включая 80 рисунков и 12 таблиц. 21 ГЛАВА 1. КОЛИЧЕСТВЕННЫЕ МОДЕЛИ РАСПРОСТРАНЕНИЯ СЕТИ ИНТЕРНЕТ Актуальность технологий в моделей неоднородной распространения новых социально-экономической информационных системе вызвана значительными отклонениями данных социологических опросов от предсказаний классических логистических моделей. Опубликованные ранее прогнозы распространения Интернета в России и других странах, построенные на основе классических трехпараметрических логистических моделей [48,147,211], оказались существенно занижены. Простая экстраполяция линейного тренда количества пользователей российского Интернета на период с 2005 по 2009 год [177,178] оказалась точнее логистических моделей. Однако данные о распространении Интернета в развитых странах и в российской столице (см. рис.1.1 и рис.1.4) свидетельствуют о том, что приток пользователей постепенно замедляется, и линейный тренд нельзя успешно эксплуатировать долго. Кроме того, предсказания логистических моделей противоречат данным социологических и статистических служб. В частности, данные опросов Фонда ―Общественное мнение‖ (ФОМ) об использовании россиянами Интернета с 2002 по 2007 год точнее всего описывает трехпараметрическая логистическая модель с весьма низким потенциалом распространения среди взрослых россиян — 34% [48]. Однако уже в 2006 году более половины россиян в возрасте от 18 до 24 лет пользовалась Интернетом. В таком случае, предсказанный моделью однородного общества потенциал распространения Интернета в 34% подразумевает, что значительная часть россиян, по мере взросления, откажется от использования Всемирной Сети. Такой вывод не подтверждается наблюдениями. Отметим, что хотя тренд показателей проникновения Интернета во многих странах является S-образным, он не обязательно является логистическим. В этом убеждает рис.1.1. Изображенные в нижней части этого рисунка цепные приросты показателей проникновения, рассчитанные с шагом один год, не образуют 22 симметричный ―колокол‖, характерный для логистической функции. Они асимметричны, с резким началом и сравнительно длинным и пологим ―хвостом‖ справа от максимального значения цепного прироста, которое в Швеции и в США было достигнуто в 1997 году. Если бы мы поставили задачу описания данных при помощи одной из S-образных кривых с малым числом параметров, то хорошее приближение на достаточно длительном промежутке времени можно было бы 37 42 47 54 57 62 66 67 70 70 70 3 5 6 8 10 15 12 7 5 7 5 5 4 3 3 3 2 2 1 2 2 5 5 5 3 1 3 3 4 0 0 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 0 10 9 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 1 1 2 9 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 1 2 3 3 5 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 11 Абсолютные цепные 7 приросты (% насел.) Использование Интернета в США (% населения) 25 71 74 76 12 17 Использование Интернета в Швеции (% населения) 28 37 44 53 56 61 65 68 получить при помощи модели Гомперца [348,408,472,473] или NUI [356,365,408]. Рис. 1.1. Использование Интернета в Швеции и в США К сожалению, показатели распространения Интернета в 2008-2013 гг. в Швеции и США модель Гомперца предсказывает столь же неверно, как и логистическая модель. Более того, описанные модели не помогут нам объяснить данные о распространении Интернета в разных возрастных группах или среди лиц с разным уровнем дохода. Существенно больший объем данных можно описать и объяснить при помощи разработанной нами общей модели распространения нововведений, учитывающей процессы воспроизводства населения и изменение доступности нововведения с течением времени [128,301]. 23 1.1 Моделирование и прогнозирование распространения сети Интернет с учетом воспроизводства населения Мы используем разработанную нами модель распространения Интернета в неоднородном обществе и идентифицируем ее параметры при помощи данных социологических опросов ФОМ [281,282] и ВЦИОМ об использовании Интернета в России в Москве. Разрешение на использование данных опросов ФОМ приведено в Приложении A к настоящей работе. Данные ВЦИОМ брались из пресс-выпусков организации. Одну из проблем, возникающих при практическом применении классических моделей распространения нововведений, легко проиллюстрировать на простом примере. По данным опросов ВЦИОМ, проведенных в сентябре и ноябре 2008 г., доля пользователей Интернета среди взрослых россиян (в возрасте 18 лет и старше) составила от 31% до 35%. По данным ФОМ, собранным осенью 2008 г., полная взрослая аудитория также достигла уровня 30% [234]. В то же время в возрастной группе от 18 до 24 лет проникновение Интернета по данным как ВЦИОМ, так и ФОМ, составило 63%. В сентябре 2009 г. ВЦИОМ сообщил о стабилизации проникновения Интернета среди взрослых россиян на уровне 32%, а ФОМ по итогам летних опросов получил близкую величину, 35%. Поскольку классические модели распространения нововведений игнорируют воспроизводство населения, полученная при их помощи оценка будущего уровня распространения Сети в России лишь немного превышает 35%. Здравый смысл, однако, подсказывает, что молодые поколения постепенно придут на смену взрослым и пожилым, а следовательно, итоговое проникновение Интернета (или каких-либо иных глобальных компьютерных сетей) окажется по крайней мере не меньше 63%. Важным фактором будущего роста распространения Интернета стало подключение в 2006-2008 гг. всех российских школ к Сети в рамках национального проекта «Образование». В случае продолжения действия этой программы, в ближайшие годы российские выпускники будут вступать во 24 взрослую жизнь, обладая навыками использования Интернета. В благоприятных экономических условиях от использования глобальных компьютерных сетех молодые россияне уже вряд ли откажутся. 1.1.1 Разработка количественной модели распространения нововведения: система уравнений, алгоритм численного решения и процедура идентификации параметров Система уравнения процесса распространения нововведений с учѐтом воспроизводства населения Уравнения процесса распространения нововведений с учетом взросления, рождаемости и смертности, которые можно рассматривать как частный случай общих уравнений социальной динамики, получены нами в совместной работе с Э.А.Юриной [301] и использованы нами в [75,79,68,78,69, 80,128]. Детальный вывод уравнений проведѐн в [301], здесь мы ограничимся обсуждением переменных и соотношений между ними. Рассмотрим так называемое атомизованное или атомарное общество, состоящее из индивидов, каждый из которых является лицом, принимающим решения (ЛПР), каждый индивид способен влиять на решение другого, и способность повлиять на чужое решение одинакова для всех. Такая модель является весьма упрощенной, ведь в реальном обществе индивид является членом таких ячеек как домохозяйство, коллектив сотрудников, учебная группа, совокупность жильцов микрорайона и т.п.. В модели атомизованного общества принадлежность к таким группам считается несущественной и не рассматривается. Модели, учитывающие принадлежность индивида к семье и к домохозяйству рассмотрены в четвертой главе данной работы. Будем предполагать, что общество сегментировано по типу населенного пункта и полу2, а в остальном – ―атомизовано‖, то есть состоит из индивидов, самостоятельно принимающих решения. Каждый индивид может находиться в 2 Гендерные аспекты информатизации [5] привлекают значительное внимание исследований, в связи с чем нами были построены прогнозы распространения Интернета отдельно среди мужчин и женщин [66]. 25 одном из трех состояний – невосприимчивости к нововведению, восприимчивости и, наконец, использования нововведения. ГОРОД СЕЛО Пользователи x1 x2 x3 x4 y1 y2 y3 y4 z1 z2 z3 z4 Потенциальные пользователи Невосприимчивые индивиды Рис. 1.2. Состояния индивидов и допустимые переходы между ними Смена состояний происходит однонаправленно (рис.1.2). Индивиды, находящиеся в первом состоянии (невосприимчивые), не имеют возможности использовать нововведение в силу технических, финансовых или иных причин. Индивиды во втором состоянии, которых принято называть потенциальными пользователями, могут использовать нововведение, однако не пользуются им, потому что ещѐ не слышали о нѐм, или не приняли положительного решения о его использовании. Переходы невосприимчивых использования нововведения, минуя непосредственно состояние в стадию восприимчивости, не допускаются. Пусть непрерывная переменная π соответствует моменту рождения индивида. В каждый момент времени t каждый i-й сегмент поколения π разбивается на три непересекающихся класса (подмножества), в зависимости от 26 состояния, в котором находится индивид. Плотности на единицу возраста количества индивидов, принадлежащих этим классам, удовлетворяют уравнению xi (t, ) yi (t, ) zi (t, ) ki (t, ) , где xi (t, ) , xi (t, ) , zi (t, ) , ki (t, ) – плотности на единицу возраста количества пользователей, потенциальных пользователей, представителей «невосприимчивого» класса и населения в целом. Определим повозрастные потенциалы распространения Интернета как суммы удельных численностей пользователей и потенциальных пользователей нововведения mi (t, ) xi (t, ) yi (t, ) . Для описания распространения нововведения с учетом взросления, рождаемости и смертности нами была предложена [75,69,128,301] следующая система интегро-дифференциальных уравнений xi hi (t, ) yi i (t, ) xi t yi hi (t, ) yi fi (t, , u(t )) i (t, ) yi t (1) zi fi (t, , u(t )) i (t, ) zi t с граничными условиями (в общем случае – нелокальными) J t yi (t , t ) сij B j (t , )k j (t , )d , j 1 zi (t, t ) 0 xi (t, t ) 0 , и ограничениями на параметры (2) J с i , j 1 ij 1, сij 0 , где B j (t , ) – возрастные коэффициенты рождаемости для поколения π сегмента j в момент времени t , hi (t , ) – функция риска ( hi (t, )t есть вероятность того, что потенциальный пользователь станет пользователем за время t , при условии, что еще не был им в момент t ), 27 i (t , ) – носит название силы смертности, f i (t , , u(t )) – число переходов из «невосприимчивого» класса в класс потенциальных пользователей в единицу времени, u (t ) – «траектория» управляющих параметров (например, цены нововведения) во времени, сij – определяют доли сегментов (в частности, мальчиков и девочек) среди новорожденных, J – количество выделенных сегментов (в данной работе J 4 ). Далее за начальный момент времени мы принимаем начало 2001-го года, этот момент не совпадает с началом распространения нововведения. Значения xi (t0 , ) , yi (t0 , ) , zi (t0 , ) , мы не считаем заранее известными. Мы предполагаем, что влияние коммуникантов на реципиентов при межличностном общении аддитивно, поэтому функция риска имеет вид hi (t , ) pi ( ) t 1 J qij ( , , t ) x j (t, )d , K (t ) j 1 (3) где K (t ) – полная численность населения, – момент рождения реципиента, – момент рождения коммуниканта, pi ( ) – коэффициенты внешних воздействий, qij ( , , t ) – коэффициенты внутренних воздействий. Такая форма функции риска распространяет известную модель Ф.Басса [315] на случай зависимости влияния пользователей на потенциальных пользователей от возрастов участников коммуникации. В этой работе мы полагаем равным нулю коэффициент внешних воздействий pi ( ) 0 . Мы предполагаем также, что коэффициент внутренних воздействий увеличивается с возрастом реципиента a t до достижения совершеннолетия для t 18( лет ) q q( , , t ) q(t ) для 7 t 18( лет ) 0 для t 7( лет ) (4) Более простая модель с параметром q , не зависящим от возрастов коммуниканта 28 и реципиента, не позволила нам удовлетворительно описать данные опросов, и была отвергнута. Алгоритм численного решения уравнений модели Используемые разностные уравнения для системы (1)-(2), имеют вид [301]: N (t ) x j (t t ) x j (t ) p j (t ) q j (t ) j y j (t )t 1 j (t )t K (t ) N (t ) y j (t t ) y j (t ) p j (t ) q j (t ) j y j (t )t f j (t )t 1 j (t )t K (t ) z j (t t ) z j (t ) f j (t )t1 j (t )t , где сила смертности j (t ) вводится отдельно для каждого поколения j (t ) 1 l j (t t ) 1 , t l j (t ) а l j (t ) – функция дожития (вероятность, что к моменту времени t индивид жив). Функция влияния пользователей на представителя j-го поколения линейна: N j (t ) ij xi (t ) . i Для учета рождаемости при переходе к каждому следующему моменту времени требуется добавлять когорту новорожденных y J (t ) (t t ) i max B (t )K (t ) , i i min i i где фертильности Bi (t ) учитывают рождаемость в различных поколениях. Последняя формула использует три упрощающих предположения. Вопервых, мы предполагаем, что дети любого из сегментов рождаются потенциальными пользователями и не попадают в недоступное подмножество. Разумеется, это верно не для любого общества, однако мы надеемся, что для российского общества такое предположение допустимо. Во-вторых, мы предполагаем, что рождаемость не зависит от того, к какому подмножеству – x, y или z – принадлежат родители. Наконец, и особенно важно – предполагается, что в атомизованном обществе, принятие решений об использований нововведений 29 детьми не зависит от того, являются ли пользователями их родители. В следующих разделах данной главы последнее предположение будет обсуждаться более детально. Общее число принимаемых во внимание когорт J(t) на каждом шаге вычислений следует увеличивать на единицу: J (t t ) J (t ) 1. Выделение большого числа сегментов пользователей приводит необходимости решать интегро-дифференциальные уравнения баланса к (1-4) относительно большого числа переменных. Для идентификации параметров системы (1) необходимо минимизировать функционал ошибки, что, зачастую требует решить саму систему несколько сотен или даже тысяч раз. Наконец, для оценки доверительных интервалов при помощи метода Монте-Карло [3,344] (такой способ был применѐн в нашей кандидатской диссертации [163]) или при помощи метода бутстреп (bootstrap) [358], требуется несколько тысяч раз повторить процедуру минимизации. При условии векторизации уравнений (2) возможно осуществить достаточно быстрое решение столь большой системы при помощи популярных программных пакетов. Для этого необходимо заменить обращение к отдельным элементам матриц операциями с матрицами в целом или, если это невозможно, с подматрицами. Известно, что иногда при этом достигается уменьшение времени счета задачи в сотни раз. Ниже приведен пример фрагмент кода на языке свободно распространяемого пакета SCILAB3, содержащий векторизованную разностную версию уравнений (1). При этом используется матричное умножение и поэлементное умножения ―.*‖ . В данной работе мы использовали простейшую разностную схему Эйлера; в дальнейшем мы предполагаем использовать метод Р.Е. Миккенса [516]. 3 См. http://www.scilab.org/ 30 for it = 1:nt // Расчет функции риска popfct = 1/sum(P) ; HMAT = QAge . * ( PMAT + popfct * CommX * X * QMAT ); // Блок диффузии нововведения DY = Y .* HMAT; DZ = Z .* LMAT ; Y = Y - DY + DZ; X = X + DY; Z = Z - DZ; // Учет интернетизации школ if it == ktschool then Y(ks1:ks2,:) = 0; Z(ks1:ks2,:) = 0; X(ks1:ks2,:) = P(ks1:ks2,:); elseif it > ktschool then Y(ks1,:) = 0; Z(ks1,:) = 0; X(ks1,:) = P(ks1,:); end; // Расчет рождаемости BVECT = OneV *( FERTILITY .* P ); BVECT = mbabies * [ BVECT(2:$), 0 ] + ( 1 - mbabies ) * BVECT; P(2:$,:) = P(1:$-1,:) .* R; P(1,:) = BVECT; // Учет рождаемости и смертности X = [ ZeroV; X(1:$-1,:) .* R ]; Y = [ BVECT; Y(1:$-1,:) .* R ]; Z = [ ZeroV; Z(1:$-1,:) .* R ]; // Сохранить суммы значений X(t) для вывода XsumVect( : , : , it + 1 ) = SMAT * X; end При расчетах мы использовали ПК с процессором Intel Core ™ 2 Duo и 3,25 ГБ ОЗУ под управлением Windows XP Professional версии 2002 SP 3. Время работы содержащей приведенный код программы при указанном выше числе переменных и 120 шагах времени составило в среднем 1,8 секунды [151]. Скромное время решения системы (2) позволяет в течение получаса подобрать неизвестные параметры модели при помощи процедур нелинейной оптимизации, 31 когда число вызовов минимизируемой функции составляет две-три тысячи. В дальнейшем при расчѐтах мы использовали не систему SCILAB в ОС Windows, а интерпретируемый язык Python с расширением NumPy [см., например, 29] и операционную систему Linux, что связано с большей распространѐнностью Python, что повышает шансы развивать наше программное обеспечение. Отметим, что в наших расчѐтах использовалась сегментация по полу и по типу населѐнного пункта (т.е. рассматривались мужчины и женщины, проживающие в городах и сѐлах). Идентификация параметров модели Три вида параметров нашей модели являются свободными: 1) начальные значения потенциалов mi (t0 , ) для рожденных до t0 ; 2) начальные показатели распространения нововведения xi (t0 , ) ; 3) неотрицательный параметр внутренних воздействий q . Мы предполагаем, что все россияне, рождѐнные после 2000 года, потенциально способны стать пользователями Интернета, поэтому постулируем mi ( , ) ki ( , ) для всех t0 . Зависимости mi ( , ) и xi (0, ) были аппроксимированы кусочно-линейными функциями с семью узлами. В итоге общее число неизвестных параметров модели m составило 15 для каждого сегмента (сочетания пола и региона), в то время как совокупное число измерений ФОМ составило 166 для каждого сегмента. Для сравнения с данными ФОМ, которые относятся к возрастным отрезкам от 18 до 24 лет, от 25 до 34 лет и т.д. (см.рис.1.3 и рис.1.4), расчетные значения xi (t, ) суммируются внутри соответствующих отрезков x (tl ; m) (n) i l 1 x(t , )d . l (5) l Определение неизвестных параметров проведено методом наименьших квадратов при помощи минимизации суммы квадратов данными наблюдений d in,l и расчетными значениями расхождений между 32 (m) wn ,l din,l xi( n ) (tl ; m) . 2 (6) n ,l После идентификации параметров модели появляется возможность построения прогнозов величин показателей xi( n ) (tl ; m) . В классических моделях диффузии нововведений часто предполагается, что нововведение доступно всем индивидам с самого начала, поэтому редко ставится вспомогательная задача прогнозирования динамики невосприимчивого класса zi (t, ) или, эквивалентно, динамики потенциалов mi (t, ) . Однако в случае распространения Интернета такое предположение является чрезмерно грубым. Среди определяющих динамику mi (t, ) факторов можно выделить доступность услуги доступа к Сети, еѐ стоимость и уровень доходов населения. 1.1.2 Прогнозирование распространения Интернета на основе разработанной количественной модели Учѐт подключения учебных заведений к Интернету Первый из опубликованных нами прогнозов (рис.1.3) учитывал интернетизацию школ, но предполагал консервацию текущей стоимости доступа к Интернету для частных лиц [301]. Для упрощения расчетов предполагалось, что с осени 2007 года все подростки в возрасте от 12 до 18 лет начали использовать Интернет и, более того, затягивать в Сеть взрослых. Это предположение оказалось слишком смелым. По данным опросов, проведенных ФОМ летом 2008 года, лишь 75,5% подростков в возрасте от 14 до 17 лет используют Интернет хотя бы раз в полгода, дома или в школе. Этот показатель возрастал в Москве до 97,4%, и убывал с размерами населенного пункта, снижаясь до 59,9% в селах. Около трети (32%) учащихся старше 12 лет заявили, что не имеют возможности пользоваться Интернетом в учебном заведении, и лишь 30% сообщили, что могут выйти в Интернет не только на специальных занятиях, но и по необходимости [234]. Тем не менее, проникновение Интернета среди подростков уже 33 существенно превосходило уровень проникновения среди взрослых (равный 3235%), и мы сочли возможность пренебречь описанными выше расхождениями. 80% 35 - 44 90% 25 - 34 18 - 24 100% 70% 60% 50% 18+ 45 - 54 40% 30% 55+ 20% 10% янв.23 янв.22 янв.21 янв.20 янв.19 янв.18 янв.17 янв.16 янв.15 янв.14 янв.13 янв.12 янв.11 янв.10 янв.09 янв.08 янв.07 янв.06 янв.05 янв.04 янв.03 янв.02 янв.01 янв.00 0% Рис.1.3. Результаты моделирования распространения Интернета в возрастных группах с учетом интернетизации школ На рис.1.3 кружками и треугольниками изображены данные ФОМ и ВЦИОМ о проникновении Интернета в отдельных возрастных группах. Закрашены только те кружки и треугольники, которые соответствуют агрегированным данным, относящимся к населению России в возрасте 18 лет и старше, а символы, соответствующие отдельным возрастным группам, не закрашены. Результаты численного моделирования изображены сплошными линиями. Возрастные группы, к которым относятся кривые, указаны при помощи меток. Так, метка ―18+‖ означает ―население России в возрасте 18 лет и старше‖. При условии полной интернетизации российских школ, уровень распространения Интернета в возрастной категории 18–24 года достигнет 100% уже в 2014 году4.Однако на средний уровень распространения Интернета среди 4 Интернетизация школ существенно увеличила некоторые технические показатели доступности Сети, в частности, по оценке С.В.Пехтерева в 2007 г. ―за один год количество VSAT (малогабаритных спутниковых терминалов), в первую очередь благодаря национальному проекту "Образование" (школьный Интернет) и госпрограмме по Универсальным услугам связи, практически утроилось‖ (См.: http://www.telemultimedia.ru/art.php?id=367 ) 34 взрослой части населения это почти не влияет. Таким образом, школьный Интернет – необходимое, но не достаточное условие движения страны к информационному обществу. 100% 25 - 34 90% 35 - 44 80% 45 - 54 18+ 70% 18 - 24 60% 55+ 50% 40% 30% 20% 10% янв.23 янв.22 янв.21 янв.20 янв.19 янв.18 янв.17 янв.16 янв.15 янв.14 янв.13 янв.12 янв.11 янв.10 янв.09 янв.08 янв.07 янв.06 янв.05 янв.04 янв.03 янв.02 янв.01 янв.00 0% Рис.1.4. Результаты моделирования распространения Интернета в Москве Прогнозирование распространения Интернета в г. Москве На рис.1.4 изображены данные ФОМ и ВЦИОМ о распространении Интернета среди взрослых москвичей, сплошными линиями показаны результаты моделирования [120]. В Москве, так же, как в Швеции и США (см. рис.1.1), период роста доли пользователей Интернета среди взрослого населения с 10-15% до 60% составил 8 лет. В соответствии с предсказанием модели, в последующие 7-8 лет в Москве этот показатель должен был вырасти до 70%. В США и Швеции аналогичный переход занял всего лишь три года, вследствие быстрого подключения к Сети старших возрастных групп (см.рис.1.13-1.15). Так, в Швеции в 2008 году Интернетом пользовались 73% жителей в возрасте от 55 до 64 лет и 38% – старше 65 лет [363]. Но как показывает наша модель, ―естественным путем‖, без проведения специальных мероприятий по обучению пожилых людей использованию Интернета, в Москве уровень проникновения Интернета в группе 35 лиц старше 55 лет достигнет 40% только к 2020 году. Внутренний ―цифровой разрыв‖ между поколениями сказывается даже в российской столице. Уточним, что при моделировании распространения Интернета среди взрослых москвичей мы не рассматривали отдельно распространение Сети среди школьников. Уровень проникновения Интернета в возрастной группе 18-24 года уже летом 2007 года составил 90%, таким образом, эффект перехода обученных использованию Сети школьников в эту возрастную группу не может быть велик. Прогнозирование распространения Интернета в Российской Федерации Сценарий быстрого роста Несомненно, рост благосостояния в последнее десятилетие сделал Интернет доступнее для россиян. При постоянном или снижающемся уровне благосостояния существенно повысить уровень проникновения Интернета в России могло бы относительное снижение цен на доступ в Интернет. Альтернативой снижению цен может быть существенный рост полезности Интернета для жителей российских регионов. Как показывает современная история распространения технологий, в некоторых случаях при снижении темпов прироста финансовых или натуральных показателей компании ищут пути удешевления товаров или услуг для конечных пользователей, с целью увеличить потенциал рынка. Так, в 1999 году, когда мобильной связью в России пользовались в основном обеспеченные слои населения, крупные операторы сотовой связи, ощутив замедление роста своих абонентских баз, приняли решение о выводе услуги мобильной связи на массовый рынок и радикально снизили стоимость минуты разговора. В результате, рост числа пользователей возобновился, их доля в 2000 году достигла 2%, а сейчас личными сотовыми телефонами владеют более 70% взрослых россиян. То же произошло с широкополосным доступом (ШПД) в Интернет в мегаполисах: волна снижения цен на ШПД прошла в Москве, а, начиная с 2007 года, целый ряд провайдеров выступал с такими же инициативами и в регионах. 36 80% 70% 18+ 35 - 44 90% 25 - 34 18 - 24 100% 60% 55+ 50% 45 - 54 40% 30% 20% 10% янв.23 янв.22 янв.21 янв.20 янв.19 янв.18 янв.17 янв.16 янв.15 янв.14 янв.13 янв.12 янв.11 янв.10 янв.09 янв.08 янв.07 янв.06 янв.05 янв.04 янв.03 янв.02 янв.01 янв.00 0% Рис.1.5. Результаты моделирования распространения Интернета в возрастных группах с учетом интернетизации школ и снижения стоимости доступа При снижении стоимости доступа в Интернет рост численности его пользователей мог бы заметно ускориться (рис.1.5). По нашим расчетам [85], если бы, начиная с весны 2008 года, доступ дешевел на 5% в квартал, то половина взрослых россиян начала бы пользоваться Интернетом уже к концу 2011 г. При этом требуется снижение стоимости доступа не только в городах-―миллионниках‖ (где проживает только 27 миллионов россиян), а повсеместно. Отметим, однако, что апробированных моделей ценовой эластичности потенциала рынка для интернет-индустрии нет, за исключением работы С.Киискии и М.Похьола [395], где эластичность была получена в ходе совместного моделирования падения цен и роста количества подключенных к Сети хост-компьютеров в странах ОЭСР, поэтому полученную оценку нельзя считать вполне надежной. Сценарий отложенного роста Как свидетельствовали опубликованные прессой заявления компаний, в 2009 году повсеместное снижение стоимости доступа к Интернету для частных лиц не планировалось [233]. Кроме того, ряд крупных российских провайдеров 37 уже тогда объявил о замораживании инвестиций в строительство широкополосного доступа в Интернет в регионах, в том числе и в крупнейших городах-миллионниках. Те компании, которые не объявили об этом прямо, сообщили о ―пересмотре временных рамок‖. В то время как московские провайдеры выражали осторожную надежду, что жители столицы не откажутся от Интернета, многие аналитики обосновывали сворачивание строительства ШПД в регионах неизбежным падением спроса. Тогда более вероятной представлялась 18 - 24 90% 80% $ 25 - 34 100% 35 - 44 динамика развития российского Интернета, изображенная на рис.1.6. 18+ 70% 60% 50% 45 - 54 55+ 40% 30% 20% 10% янв.23 янв.22 янв.21 янв.20 янв.19 янв.18 янв.17 янв.16 янв.15 янв.14 янв.13 янв.12 янв.11 янв.10 янв.09 янв.08 янв.07 янв.06 янв.05 янв.04 янв.03 янв.02 янв.01 янв.00 0% Рис.1.6. Результаты моделирования распространения Интернета в различных возрастных группах в условиях замораживания регионального развития Более того, в условиях рецессии растет вероятность стагнации российского Интернета [301], которая неизбежна без обучения использования Интернета школьников. Такой сценарий еще год назад казался невозможным, однако сейчас представляется вполне вероятным, поскольку региональные власти могут и не найти миллиард рублей для инвестиций в отдаленное будущее. 38 Сопоставление с опубликованными прогнозами других авторов На рис.1.7 сплошной линией показан опубликованный Л.С.Тимошенко прогноз Мининформсвязи распространения Интернета в Москве [272]. Этот прогноз носил нормативный характер, так что потенциал распространения Сети был установлен в качестве желаемой (но необязательно – достижимой) цели. Закрашенная область на рис.1.7 ограничена сверху оптимистическим прогнозом Минэкономразвития для России [246] снизу – консервативным. Дополнительно показаны два наших сценария – инерционный, помеченный цифрой 1, и сценарий быстрого роста, помеченный цифрой 2. 100% Прогнозы Минэкономразвития (для России) Прогноз Мининформсвязи (для Москвы) 80% 60% Москва Доля пользователей Интернета во взрослом населении 40% 2 1 Россия 20% 5 лет 01.2020 01.2015 01.2010 01.2005 01.2000 01.1995 01.1990 0% Рис.1.7. Сравнение прогнозов Мининформсвязи и Минэкономразвития с данными массовых опросов Мы видим, что прогноз использования Интернета москвичами, разработанный Мининформсвязи, заметно превышает данные опросов. Заметим, что Мининформсвязи прогнозирует аудиторию с учетом детей, в то время как ФОМ и ВЦИОМ опрашивают только взрослых, однако, как показали наши расчеты, если бы опрашивали и детей, то это сказалось бы только на абсолютных показателях, но не на относительных (доле пользователей среди населения). 39 Прогнозируемый Минэкоомразвития тренд распространения Интернета в России повторяет прогноз Мининформсвязи для Москвы, но отстает от него на пять лет. Наша траектория быстрого роста (кривая ‗2‘ на рис.1.7), отстает от прогноза Минэкономразвития еще на один год, была рассчитана в предположении ежегодного снижения стоимости доступа не менее, чем на 20%. Однако в прогнозах Минэкономразвития не содержится ни описания каких-либо мер, стимулирующих такое снижение, ни каких-либо иных мер, упрощающих россиянам использование Сети. Обсуждение результатов прогнозирования распространения Интернета в Российской Федерации и в г.Москве Рис.1.8. иллюстрирует результаты прогнозирования для России в целом, проведѐнного нами в 2009 году в соответствии с описанным выше сценарием быстрого роста (рис.1.5), при этом закрашенные треугольники и кружки соответствуют опубликованным на тот момент данным ФОМ и ВЦИОМ, сплошные линии – результатам расчѐтов, а незакрашенные кружки и треугольники – новым данным ФОМ за 2009-2013 гг. 100% 80% 60% 1 Возрастная группа: 1 - от 18 до 24 лет 2 - от 25 до 34 лет 3 - от 35 до 44 лет 4 - от 45 до 54 лет 5 - 55 лет и старше 2 40% 3 4 5 20% янв.23 янв.22 янв.21 янв.20 янв.19 янв.18 янв.17 янв.16 янв.15 янв.14 янв.13 янв.12 янв.11 янв.10 янв.09 янв.08 янв.07 янв.06 янв.05 янв.04 янв.03 янв.02 янв.01 янв.00 0% Рис.1.8. Результаты прогнозирования доли пользователей Интернета в России по возрастным группам 40 Для России в целом средняя квадратическая ошибка прогноза доли пользователей в возрасте 18 лет и старше за четыре года (с лета 2009 по весну 2013 гг.) составила 3 процентных пункта, максимальная ошибка – 6 п.п. Максимальная ошибка в отдельной возрастной группе составила 12 п.п. – для возрастной группы от 18 до 24 лет. 100% 1 80% 3 60% 4 2 40% Возрастная группа: 1- от 18 до 24 лет 2 - от 24 до 35 лет 3 - от 34 до 45 лет 4 -от 44 до 55 лет 5 - 55 лет и старше 20% 5 янв.22 янв.20 янв.18 янв.16 янв.14 янв.12 янв.10 янв.08 янв.06 янв.04 янв.02 янв.00 0% Рис.1.9. Результаты прогнозирования доли пользователей Интернета в Москве по возрастным группам В то время как в России прогнозные значения к концу пятилетнего периода оказались, как правило, ниже реально наблюдаемых, в случае Москвы наблюдается обратная картина: в столице свежие итоги опросов ФОМ превысили наши прогнозы во всех возрастных группах (рис.1.9). Можно указать две возможные причины такого характера отклонений. Во-первых, в то время как наш общероссийский прогноз предполагал рост потенциала проникновения Интернета за счѐт снижения стоимости доступа к Сети, прогноз для Москвы был сделан в предположении постоянства потенциала, поскольку мы полагали, что в столице услуга уже доступна каждому. Однако рост потенциала распространения Интернета мог иметь место и в Москве, поскольку благодаря распространению 41 мобильного Интернета возможность использовать Сеть получили лица среднего возраста, работающие не в офисе (охранники, продавцы, рабочие, водители). Второе возможное проигнорированного объяснение нами заключается коэффициента в возможном ―внешних усилении воздействий‖ pi ( ) , поскольку в этот период в Москве конкурирующие между собой провайдеры доступа (преимущественно – операторы мобильной связи) размещали значительное количество рекламы новых тарифов доступа к Сети. Мы заключаем, что успех прогнозирования показателей проникновения Интернета xi (t, ) существенно зависит от прогнозов значений потенциалов проникновения Сети mi (t, ) . Однако прогноз динамики потенциалов является не менее сложной задачей, чем прогнозирование показателей распространения Сети, поскольку требуется предвидеть решения провайдеров доступа. В свою очередь, при принятии решений провайдеры доступа и регулирующие органы привлекают прогнозы динамики количества пользователей, и эти прогнозы могут быть построены на основе иных теорий и методов (таких как теория критической массы [46,47,357,474], ―закон Джиппа‖ [32,206,64], логистическая экстраполяция [206,405], полиномиальная и эконометрические зависимости [167,203,10] и т.п.). С нашей точки зрения прогресс в этой области может быть достигнут путѐм детального изучения процесса управления информатизацией, включая описание кейсов, описывающих принятие решений в этой сфере [216,215]. Кроме того, необходима разработка методов измерения потенциалов mi (t, ) , то есть доли населения, которая имеет возможность использовать новые информационные технологии, хотя и не делает этого в настоящее время. Прогнозирование распространения Интернета в городских и сельских населѐнных пунктах Российской Федерации При прогнозировании распространения Интернета в российских городах и сѐлах [144] мы ограничились простейшими предположениями о поведении 42 потенциала рынка, и предлагаем два гипотетических итоговых сценария – оптимистический и консервативный. Мы полагаем f i (t, , u(t )) zi (t, ) (7) для поколений, рожденных до 2001 года, что позволяет прогнозировать соответствующие потенциалы проникновения. Как уже упоминалось, мы предполагаем, что в более молодых поколениях невосприимчивые индивиды отсутствуют. Коэффициент равен 0,12 / год для оптимистического сценария и нулю – для консервативного сценария. ГОРОДА 90% 80% 70% 25 - 34 Доля пользователей Интернета в возрастной группе 35 - 44 100% 18+ 60% 40% 30% 45 - 54 18 - 24 50% 55+ 20% 10% янв.20 янв.18 янв.16 янв.14 янв.12 янв.10 янв.08 янв.06 янв.04 янв.02 янв.00 0% Рис.1.10. Результаты моделирования распространения Интернета в российских городах в ряде возрастных групп (оптимистический сценарий). Кружки и треугольники – данные опросов ФОМ, сплошные линии – результаты расчетов. На рис.1.10 представлены результаты моделирования и прогнозирования распространения Интернета в российских городах в различных возрастных группах с учетом интернетизации школ и снижения стоимости доступа. Показан только оптимистический прогноз, предполагающий, что совокупная численность пользователей и восприимчивых индивидов, начиная с 2012 года, будет 43 возрастать на 12% ежегодно, благодаря технологическому прогрессу, снижению стоимости доступа к Сети и упрощению оконечных устройств доступа. По оптимистическому сценарию к концу 2018 года проникновение Сети в городах достигнет 86%, в том числе в старшей возрастной группе (55 лет и старше) составит 61%. Нами был рассмотрен также консервативный сценарий, при котором рост проникновения Сети продолжится только благодаря обучению использованию Интернета в школах и смене поколений. В этом случае через шесть лет пользователями станут 78% российских горожан, в том числе 40% пожилых людей. При моделировании структуры коммуникаций в городах предполагалось, что на решения горожан влияют только другие горожане (но не жители сѐл). Кроме того, мы учли, что сверстники влияют друг на друга сильнее, чем остальные индивиды, однако это не дало сколько-либо заметного эффекта по сравнению с простой моделью, представленной уравнением (4). 90% 80% 70% 25 - 34 Доля пользователей Интернета в возрастной группе 35 - 44 СЁЛА 100% 60% 50% 20% 10% 18+ 55+ 30% 45 - 54 18 - 24 40% янв.20 янв.18 янв.16 янв.14 янв.12 янв.10 янв.08 янв.06 янв.04 янв.02 янв.00 0% Рис.1.11. Результаты моделирования распространения Интернета в российских сѐлах в ряде возрастных групп. При моделировании распространения Интернета в сѐлах мы допустили возможность влияния горожан на принятие сельским жителем решения о 44 подключении к Сети. Как отмечают Перес и др. [442], помимо непосредственных контактов между индивидами, регионы могут воздействовать друг на друга и другими способами, в нашем случае речь может идти, например, об экспансии городских провайдеров доступа к Интернету в сельские населенные пункты. Результаты моделирования представлены на рис.1.11. В соответствии с оптимистическим сценарием (рис.1.11), к концу 2018 года 76% сельчан будут использовать Сеть. В старшей возрастной группе Интернетом воспользуются 33% граждан. Если же реализуется консервативный сценарий, то средний уровень проникновения в селах составит 55%, а в старшей возрастной группе – 17%. В этом случае и в более молодых возрастных группах проникновение Сети останется неполным. Расчитав взвешенное среднее из оптимистических прогнозов для городского и сельского населения, мы получили прогноз распространения Интернета в России в целом. Отличия от опубликованного нами ранее прогноза, в котором не учитывались различия между сельскими и городскими жителями [111], составили лишь полтора процентных пункта. Эти отличия оказались значительно меньше, чем мы ожидали, основываясь на анализе прогнозов глобального распространения Интернета [429,307], проведѐнном автором совместно с Н.С. Матвеевой [159]. Причиной столь малых различий, повидимому, является относительно небольшая доля населения, приходящаяся на ―запаздывающий‖ регион, которая в России составляет четверть населения, в то время как глобально – шесть седьмых. 1.2 Некоторые аналитические модели распространения новых информационных технологий и их приложения Классические модели распространения новвовведений, такие как логистическая модель и модель Басса [315] не учитывают воспроизводство населения, что ограничивает их применение инновациями со сравнительно короткими характерными временами. Разработанные нами в предыдущих разделах модели распространения нововведений в неоднородном обществе с 45 учетом демографических процессов решают указанную проблему, однако представляют собой систему интегро-дифференциальных уравнений в частных производных, которые требуют разработки специальных методов численного решения. Оценка точности численных решений представляет самостоятельную сложную проблему. Поэтому желательно провести качественный анализ решений уравнений распространений нововведений с учетом демографических процессов хотя бы в небольшом числе случаев, допускающих аналитическое решение. Благодаря недавним работам Ф.Центроне, А.Гойя и Е.Салинелли [329,328] обнаружилось, что такие случаи существуют, более того, возможны относительно простые аналитические модели некоторых сценариев, для которых полные системы уравнений баланса пока написать не удается. Соответствующие модели проанализированы в данном разделе, который основан на ряде результатов, полученные в 2011 г. совместно с Т.А.Подлесной [154] и С.А.Белоцерковским [152,155,156,157]. Для ряда практически важных частных случаев получены точные решения для уравнений распространения нововведений в стабильной (экспоненциально растущей или убывающей) популяции с возрастной структурой. Решения для модели Центроне, Гойя и Салинелли [329] с возрастной структурой получены для случая постоянной силы смертности. Для моделей с всеобщим и обязательным обучением детей использованию нововведения или с обучением только в семьях пользователей получены точные решения и для изменяющейся с возрастом силы смертности. Для общего случая граничных условий задача сведена к линейному интегро-дифференциальному уравнению, которое можно решить численно при помощи преобразования Лапласа. 1.2.1 Аналитическая модель распространения нововведения с учетом обучения Ф.Центроне, А.Гойя и Э.Салинелли [329,328] построили и проанализировали модель распространения нововведения с учетом рождаемости и смертности для случая, когда 1) смертность не зависит от возраста индивида (t, ) ; 46 2) коэффициенты рождаемости не зависят от возраста b(t, ) b ; 3) популяция стабильна (экспоненциально изменяется с сохранением возрастной структуры). 4) все новорожденные пополняют класс потенциальных пользователей; 5) нет таких индивидов, которым нововведение недоступно по финансовым или техническим причинам; 6) функция риска стать пользователем h(t, (t )) одинакова для любого индивида и не зависит от его возраста. Преимуществом этой модели, которая в [329] названа моделью CGS, по сравнению с классической логистической моделью, является возможность анализа влияния естественного роста населения на распространение инноваций, что актуально для многих регионов мира. Модель CGS можно описать при помощи системы обыкновенных дифференциальных уравнений dX X p q Y X , dt K Здесь X (t ) – dY X p q Y bK , dt K dK (b ) K . dt количество пользователей нововведения; Y (t ) – количество потенциальных пользователей, еще не использующих нововведение; K (t ) – численность населения. Используются также постоянные неотрицательные параметры: p – параметр внешнего воздействия, q – параметр внутреннего воздействия; b – коэффициент рождаемости; – коэффициент смертности. Для уравнений модели CGS еѐ авторами получено явное решение [329] K (t ) K (0)e (b )t , X (t ) K (t ) (t ) , Y (t ) K (t ) 1 (t ) , где используются вспомогательная (логистическая) функция (t ) 1 ~ p~0 exp ( ~ p q~)(t t0 ) ~ M 1 q~~0 exp ( ~ p q~)(t t0 ) и семь комбинаций параметров и начальных условий исходной задачи ~ M ~0 ~ ~ ~0 , pM q 0 0 ~ p , 2 X (t0 ) , K (t0 ) q~ , 2 2 4 pq , q p b. 2p q~ p ~ M ~. 2q q p 47 Модель CGS справедлива лишь для постоянной силы смертности (t, ) (где t – текущий момент времени, – момент рождения индивида), не характерной для человеческого общества. Обобщѐнная модель CGS В предлагаемом нами обобщении модели CGS сила смертности зависит от момента рождения индивида (или, эквивалентно, от его возраста), т.е. снимается ограничение (1). Ослабляя ограничение (4), допускаем немедленное зачисление в пользователи нововведения детей, рождѐнных в семьях пользователей (аналогично наследственным болезням)5. Пусть нововведение начинает распространяться в момент t0 0 . Мы предполагаем, что плотности (на единицу возраста) количества пользователей x(t, ) и потенциальных пользователей y(t, ) нововведения, рожденных в момент , при t удовлетворяют уравнениям баланса, рассмотренным в предыдущих разделах x h(t, (t )) y (t, ) (t, ) x(t, ) , t y h(t, (t )) y (t, ) (t, ) y (t, ) t (1) с нелокальными граничными условиями для поколений (при t 0 ) x(t, t ) bx X (t ) byY (t ) , где y(t, t ) (b bx ) X (t ) (b by )Y (t ) , (2) численности пользователей X (t ) и потенциальных пользователей Y (t ) вычисляются при помощи интегрирования по моменту рождения t X (t ) x(t, )d , а их доли в населении суть t Y (t ) y(t, )d , (t ) X ( t ) / K ( t ) , t K (t ) k (t, )d , (3) (t ) Y (t ) / K ( t ) . (4) От допущения (2) тоже можно отказаться, при этом удается получить систему, состоящую не из двух, а из трех интегральных уравнений. Предприняв попытку отказаться также и от допущения (6) и позволить функция риска зависеть от , мы не смогли получить каких-либо простых решений. 5 48 Здесь K (t ) – описывает полную численность населения, k (t, ) – плотность популяции на единицу возраста. Функции k (t, ) считаются известными и непрерывными при t bK ( )l (t , ) l (t , ) k (t , ) k (0, ) l (0, ) 0 при t 0 при t 0 . при t Заданы начальные условия x(t0 , ) k (t0 , ) ( ) . y(t0 , ) ( ) , (5) Условия (2) содержат два новых параметра по сравнению с CGS: bx – определяет количество детей, которые родились в семьях пользователей, и которые обучены (дома или в школе) использованию нововведения; b y – определяет количество детей, которые обучены в обязательном порядке (в школе), хотя их родители к моменту t и не являются пользователями. Определим функцию дожития t l (t , ) exp ( , )d для t и l (t, t ) 1 для t , (6) и плотность распределения популяции по моментам рождения (t, ) b l (t, ) K ( ) / K (t ) . (7) Как и в CGS, функция риска стать пользователем h(t, (t )) не зависит от . Определим также две вспомогательные функции t exp h( ; ( ))d для t 0 u (t ) 0 1 для t 0 и (t )u(t ) для t 0 v (t ) для t 0 (0) (8) Утверждение 1 (лемма эквивалентности). Решения интегральных уравнений u( ) y ( , )l (t , ) u(t ) l (t , ) 1 y (t , ) y (0, ) l (0, ) u(t ) 0 для t 0 для t 0 для t (9) 49 являются также решениями интегро-дифференциальных уравнений (1) с условиями (2) и (5), и наоборот, решения (1),(2),(5) удовлетворяют (9). Утверждение 2 (аналог уравнения восстановления) Функции v(t ) и u(t ) связаны уравнением t t v(t ) 0 (t ) x (t, )u( )d xy (t, )v( )d , 0 (10) 0 1 l (t , ) где 0 (t ) ( ) d – доля потенциальных пользователей, рожденных K ( t ) l (0, ) 0 не позже t0 0 и доживших до t . Функция 0 (t ) известна, поскольку вычисляется по известным функциям. Здесь введены обозначения: x b b b bx и xy x y . b b Доказательства обоих утверждений приведены в нашей статье [164] . В частности, формулу (10) можно получить при помощи интегрирования (9) по моментам рождения и последующего умножения обеих сторон уравнения на u(t ) . Утверждение 3 (следствие выбора формы функции риска). Примем предположение Ф.Басса [315] о том, что функция риска воспользоваться нововведением линейно зависит от (t ) , т.е. h(t,(t )) p q (t ) p q q(t ) . (11) Тогда функции u(t ) и v(t ) связаны вторым интегральным уравнением t u(t ) e( pq ) t q e( pq )( t ) v( )d . (12) 0 Действительно, из (8) следует du u h(t; ) ( p q)u qu ( p q)u qv . dt Решение этого уравнения относительно u(t ) имеет вид (12). Уравнения (10) и (12) образуют систему линейных интегральных уравнений Вольтерра. В векторных обозначениях t f (t ) g(t ) G(t , )f ( )d , 0 (13) 50 u ( t ) f (t ) , v (t ) где e ( p q ) t g (t ) 0 (t ) и 0 qe( pq )( t ) . G(t , ) ( t , ) ( t , ) x xy (14) Теорема (теорема 3.11 монографии П.Линца [402, стр.46]). Если g(t ) и G(t, ) непрерывны в треугольнике 0 t T (в смысле непрерывности всех их компонент), то система (13) имеет единственное непрерывное решение на отрезке 0 t T . Отсюда вытекает существование решения системы интегро- дифференциальных уравнений (1) для непрерывных функций l (t, ) . Утверждение 4 Обобщенную модель CGS описывает система интегральных уравнений t ˆ (t , )fˆ ( )d , fˆ (t ) gˆ (t ) G (15) 0 где u ( t ) e ( p q ) t f̂ (t ) , ( p q ) t v (t )e 1 gˆ (t ) ( p q ) t 0 (t )e и 0 q ˆ (t , ) G ˆ (t , ) ˆ (t , ) . xy x (16) Здесь введено обозначение ˆ (t, ) (t, )e( pq )( t ) и рассмотрены только t 0 . Следствие Пусть 1) функция дожития l (t, ) l (t ) зависит только от разности аргументов; 2) популяция стабильна при t 0 : K (t ) K (0)et ; 3) популяция и ранее была стабильной, т.е. начальные условия имеют вид k (0, ) K (0)eb . Параметр определяется из уравнения Лотки 1 b e a l (a )da . 0 Тогда (t, ) , ˆ (t, ) и G(t, ) зависят только от разности аргументов, и уравнения (15) становятся уравнениями свѐртки. Замечание Практическую проблему при применении дискретного преобразования Фурье для решения уравнений свѐртки (15) создаѐт разрывность в нуле функции дожития и разрыв в нуле производной u(t ) . Поэтому мы применяем 51 преобразования Фурье не для расчета u(t ) , а для расчета u~(t ) u(t ) uCGS (t ) , где uCGS (t ) подобрана так, чтобы u~(t ) была непрерывна в нуле вместе с первой производной. Поскольку вычисляется uCGS (t ) аналитически, находим аналитических решений u(t ) uCGS (t ) u~(t ) . Наши дальнейшие направления поиска обобщѐнной модели CGS [145] связаны с другими аппроксимациями функции l (a ) , которые используются в биологии продолжительности жизни [45]. 1.2.2 Модель динамики цифрового разрыва В данном разделе решена задача о распространении нововведения в обществе, где количество индивидов, не имеющих возможности воспользоваться нововведением в сфере ИКТ, убывает со временем. Мы разделяем общество на три поколения (см.рис.1.12): ―доцифровое‖ поколение, ―цифровые мигранты‖ (взрослые) и ―цифровые аборигены‖ в терминологии Дж. Пэлфри и У. Гассера [247]. Рассмотрим распространение новшества в стационарной популяции с функцией дожития в виде ступеньки длиной T лет. Такую функцию дожития называют функцией дожития II типа [7]. Пусть все индивиды, которым в момент t0 исполнилось более L лет (―доцифровое‖ поколение), отвергают нововведение. Остальные индивиды принимают решения принять или отвергнуть новинку, при этом информация к ним поступает как через СМИ, так и в ходе межличностного общения. Кроме того, дети (―цифровые аборигены‖) могут научиться использовать нововведение в семье или в школе. На отрезке t0 t t0 T L умирают только представители ―доцифрового‖ поколения, и модель можно описать дифференциальными уравнениями dX / dt h(t, X )Y ( x ) X y (Y Z ) , dY / dt h(t, X )Y ( x ) X ( y )Y Z , dZ / dt K , 52 с начальными условиями X (t0 ) 0 , Y (t0 ) K L / T , Z (t0 ) K 1 L / T . Здесь X (t ) и Y (t ) − количество соответственно пользователей и потенциальных пользователей нововведения; Z (t ) K 1 L / T (t t0 ) – количество индивидов старше L лет; K – численность популяции; h(t, X ) p qX (t ) / K – т.н. функция риска; p и q − коэффициенты внешнего и внутреннего воздействия; 0 − интенсивность прекращения использования; 1 / T − коэффициент рождаемости; неотрицательные параметры x и y характеризуют обучение детей нововведению в семье и школе. I1 I2 I3 T возраст L t0 t1 время t2 Рис.1.12. Три поколения, различно воспринимающие нововведение, на сетке Лексиса. Проведя подстановку h(t, X ) u(t ) / u(t ) и замену переменной q / 2 t , а также добавив условие u(0) 1 , получим задачу Коши для уравнения Эрмита d 2u du 2 2u 2 d d с параметрами ( x ) p y ( p q) q и p q x y qZ (t0 ) / K 2q . Решением этой задачи является линейная комбинация функций Эрмита первого и второго рода (при x y , 0 решение выражается через 53 интегральную функцию Доусона). Вычислив u(t ) , рассчитываем h(t, X ) u(t ) / u(t ) , и, наконец, X (t ) h(t, X ) p K / q . На последующих отрезках времени: t0 T L, t0 T , t0 T , t0 2T L и т.д. задача сводится к решению системы линейных дифференциальных уравнений. (a) (б) 100 С обучением в школах 80 60 60 40 20 (в) 12 Абсолютные цепные приросты (% населения) 6 4 2020 (г) 150% 10 8 0 2000 2020 2015 2010 2005 2000 1995 1990 0 2015 X(t)/K Без обучения в школах 2010 (X+Y)/K 20 2005 40 1995 80 Использование Интернета в Швеции (% населения) 1990 100 100% Цепные темпы прироста (%) 50% 2 2020 2015 2010 2005 2000 1995 2020 2015 2010 2005 2000 1995 1990 1990 0% 0 Рис. 1.13 Распространения Интернета в Швеции: данные World Internet Project (треугольники) и результаты расчетов при помощи модели (жирные линии), параметры которой получены методом наименьших квадратов. Используя полученные решения, мы предлагаем новую интерпретацию данных опросов World Internet Project о проникновении Интернета в ряде стран в 1990-2010 гг. На рис.1.13 показаны данные о распространении Интернета в Швеции, где с 1994 года началась программа всеобщего и обязательного обучения школьников использованию Интернета. Эффект этой программы проявляется на рис.1.13 (г) в резком подъеме цепных темпов прироста доли пользователей в населении (треугольники), который отчасти удалось отразить в нашей модели (сплошная линия). 54 Важный частный случай при x y сводится к рассмотренному в следующем разделе решению, выражающемуся через интеграл Доусона, и исследованному нами в работах [131,115,116,112,122]. Случай линейно растущего потенциала распространения нововведения Как отмечено выше, хотя тренд показателей проникновения Интернета во многих странах является S-образным, он не обязательно является логистическим. В этом убеждают, например, рис. 1.1 и 1.13. В случае, если распространение нововведения в отдельных возрастных группах нас не интересует, а требуются лишь агрегированные данные по населению в целом, можно использовать упрощенный подход, позволяющий избежать численного интегрирования дифференциальных уравнений. Такой подход менее трудоемок, и при его помощи были получены все модели и прогнозы распространения Интернета в зарубежных странах, которые использованы в наших работах [129,140, 345]. В этом случае модель имеет вид обыкновенного дифференциального уравнения [408] dX X p q M ( t ) X dt K (1) с начальным условием X (0) X 0 , где M (t ) − потенциал распространения нововведения, который может изменяться во времени. Известно решение уравнения (1) в квадратурах, удовлетворяющее заданному начальному условию [408]. Это решение имеет громоздкий вид и в общем случае требует использование численного интегрирования t q exp pt M ( )d K0 p X (t ) K t q 1 q q exp p M ( )d d p K0 X (0) K K 0 q Нами показано, что если (2) потенциал распространения нововведения линейно растет со временем, M (t ) a bt . (3) 55 то можно выразить решение (4) через т.н. ―интеграл Доусона‖специальную функцию, для вычисления которой предназначено большое количество алгоритмов и программ. При вычислениях оказывается практически целесообразным разделять случаи b 0 и b 0 . Решение для случая b 0 и постоянного M K хорошо известно [см., например, 408], мы перепишем его в модифицированном виде X (t ) 1 p exp p q t M , 1 q exp p q t (4) где M X (0) / pM qX (0) . (5) Для b 0 нам удалось выразить решение уравнения (1) с условием (2) для потенциала вида (2) при помощи специальной функции, которая носит название интеграла или интегральной функции Доусона [305]. Выражение имеет вид K 1 X (t ) p , 2 2 c e z ( 0) z (t ) daw z (t ) q (6) где daw ( x ) e x x 2 e u2 du – интегральная функция Доусона, 0 z (t ) c t − нормированное время, 1 daw z (0) , X (0) pq K pK qa , qb 2K – параметры, не зависящие от qb времени (постоянные величины). Область применения решения (6) ограничена областью 0 t K a / b (поскольку требуется M (t ) K ), а вне этой области следует использовать классическое решение (4). При использовании интеграла Доусона, который доступные библиотечные функции вычисляют с точностью 18-20 знаков после запятой, не требуется численно интегрировать дифференциальное уравнение распространения 56 инновации (1) или вычислять интеграл (2) с помощью численных методов, соответственно не нужно выбирать шаг интегрирования и оценивать сходимость алгоритма. В данной работе при расчетах мы использовали функцию DawsonIntegral() библиотеки ALGLIB, реализованную С.Бочкановым на основе библиотеки Cephes [432]. 2020 2020 2015 0 2010 0 2005 2 2015 6 2 2000 2020 8 4 1995 2015 10 4 1990 2010 12 2010 6 2005 8 2005 10 2000 2020 Абсолютные цепные приросты (% насел.) 2000 12 2015 0 2010 0 2005 25 2000 25 1995 50 1990 50 1995 75 Использование Интернета в США (% населения) 1995 100 83 1990 75 Использование Интернета в Швеции (% населения) 1990 100 Рис. 1.14. Использование Интернета в Швеции и в США При помощи модели (6) выполнены прогнозы распространения Интернета в США (рис.1.14), Швеции, Германии и Португалии на основе данных [363]. На рис.1.15 кружками и треугольниками показаны данные опросов ФОМ и ВЦИОМ о распространении Интернета среди москвичей в возрасте 18 лет и старше. Ромбы изображают аналогичные данные World Internet Institute об использовании Сети шведами. Квадратиками изображены данные ARD-ZDFOnline-Studies об использовании Интернета в Германии лицами старше 14 лет [43]. Пунктирными линиями показаны прогнозы, построенные нами при помощи модели распространения нововведения с растущим потенциалом [128]. Рис.1.15 демонстрирует, что тренды распространения Интернета в различных регионах 57 могут быть очень похожи, в первом приближении отличаясь лишь временным сдвигом. Так, тренд доли пользователей Интернета в Москве приблизительно повторяет тренды двух других стран, отставая на пять лет от Швеции и на два года от Германии. Москва ―ближе‖ к Швеции и Германии по уровню доходов, чем Россия в целом, поэтому различия в распространении Интернета в общих чертах сводятся к простому отставанию во времени. 100% Доля пользователей Интернета во взрослом населении 80% Швеция Германия 60% Москва 40% 20% 01.2020 01.2015 01.2010 01.2005 01.2000 01.1995 01.1990 0% Рис.1.15. Распространение Интернета в Швеции, Германии и в Москве. В наших работах [129,140, 345] приведена результаты аналогичных расчетов для Португалии. 1.3 Многостадийные модели распространения и интенсивности использования новых информационных технологий В этом разделе рассмотрены многостадийные, то есть включающие не менее трѐх стадий, модели распространения новых информационных и телекоммуникационных технологий (ИКТ), способные включить информацию о знаниях и намерениях лиц или групп, принимающих решения. Простая многостадийная модель, которая учитывает стадии осведомленности и 58 использования нововведения, применена к данным массовых репрезентативных опросов о распространении Интернета в России и в Москве. Полученная в итоге чрезвычайно высокая величина задержки между осведомленностью и формированием желания воспользоваться Сетью, составляющая 15 лет, может означать, что процесс распространения Интернета в России определяется не столько распространением информации в обществе, сколько технической и финансовой доступности услуги. Основные результаты этого раздела опубликованы в работах автора [94,100,107,93,104,92,105,108,110,111]. Классические одностадийные модели диффузии инноваций [315,408], как правило, успешно аппроксимируют исторические данные о динамике процесса распространения нововведения, однако обладают рядом важных недостатков как с точки зрения задачи объяснения всех доступных данных измерений, так и в задачах прогнозирования. Простые модели с тремя или четырьмя параметрами не позволяют задействовать доступную информацию о намерениях потенциальных пользователей, которая способна помочь определить потенциал распространения нового товара или услуги [308]. Зачастую классические модели оказываются непригодными для прогнозирования статистических показателей распространения ИКТ более, чем на два или три года вперед, что побуждает искать способы привлечения дополнительной информации, помогающие заглянуть в более отдаленное будущее. 1.3.1 Совместное моделирование количества информированных, намеренных воспользоваться и пользователей новой технологии В этом разделе мы рассматриваем некоторые многостадийные модели распространения нововведений, способные включить информацию о знаниях и намерениях лиц или групп, принимающих решения. Первая многостадийная модель принятия решения потребителем (модель AID), была предложена Э. Льюисом еще в 1898 году для применения страховыми агентами. В настоящее время при выделении стадий в распространении нововведений наиболее часто используется модель, разработанная Э. Роджерсом 59 и включающая пять стадий [449]. Дж. Додсон и Э. Мюллер [350], опираясь на модель воздействия рекламного сообщения, предложенную в 1961 г. Р.Лавиджем и Г.Стейнером, построили количественную многостадийную модель распространения нововведений, содержащую стадии неведения, осведомленности и использования, образующие иерархию. В современных моделях, помимо стадий, учитываются также неоднородность общества, например, по уровню доходов или по типу населенного пункта, однако в большинстве известных нам моделей в обществе не выделены ячейки, такие, как сообщество, домохозяйство или семья. Далее мы рассматриваем примеры применения многостадийных моделей распространения инноваций для изучения распространения информационных и телекоммуникационных технологий в России и российской столице. Предлагаемые нами модели развивают подход Додсона и Мюллера [350] и применены к комплексным статистическим данным о распространении Интернета в России, собранным различными организациями при помощи различающихся способов, а также в Москве и ряде стран мира. В нашей работе [100] две альтернативные многостадийные модели применены к комплексу данных о распространении Интернета в Швеции, при этом обнаружилось, что данные могут быть с равной точностью описаны существенно различающимися моделями. Разработка многостадийной модели Главная особенность рассматриваемой в этом разделе модели, развивающей подход Дж. Додсона и Э. Мюллера [350], состоит в учете доступности нововведения: отдельно рассмотрены те индивиды, которым нововведение доступно, и те, которым оно недоступно по техническим, финансовым или иным причинам. Поскольку мы используем данные опросов россиян об индивидуальном использовании Интернета, то единицей, принимающей решение, в нашей модели является индивид. Разделим общество, в котором распространяется нововведение, на две части по полу (женщины и мужчины), а каждую часть – по географии проживания и 60 иным признакам на однородные непересекающиеся сегменты, пусть i обозначает номер сегмента. Специфика многостадийных моделей распространения нововведений, выделяющая их среди общих моделей социальной динамики, проявляется в том, что в каждый момент времени t каждый i -й сегмент каждого поколения разбивается на несколько непересекающихся подмножеств, соответствующих стадиям использования нововведения. Дополнительно мы классифицируем индивидов на тех, кому нововведение доступно или не доступно (по техническим или финансовым причинам). Мы исключаем из рассмотрения состояние, в котором индивид использует недоступное ему нововведение, предполагая такое явление редким. X(t,a) Пользуются Желают Y(t,a) Z(t,a) A(t,a) Осведомлены W(t,a) Не V(t,a) осведомлены Нет возможности U(t,a) Есть возможность Рис. 1.16. Четыре нововведения стадии распространения Данные опросов о распространении Интернета в России [209,235] (см. также раздел ―СМИ и Интернет‖ WWW-сайта www.fom.ru), позволяют выделить семь состояний и, соответственно, семь подмножеств индивидов, численности которых (точнее, плотности на единицу возраста) для каждого поколения в каждый момент t удовлетворяют уравнению баланса: 61 K i (t , ) X i (t , ) Yi (t , ) Z i (t , ) Ai (t , ) Wi (t , ) U i (t , ) Vi (t , ) , где (1) X i (t , ) — количество6 пользователей нововведения, Yi (t , ) — количество желающих приобрести нововведение и имеющих такую возможность (техническую и финансовую), Z i (t , ) — число желающих приобрести нововведение, но не имеющих возможности это сделать (в частности, осенью 2008 года ФОМ установил, что среди желающих пользоваться Интернетом, составляющих 20% городского населения России, 40% не могут пользоваться Сетью по финансовым причинам и 12% — по техническим), Ai (t , ) — число информированных (осведомлѐнных) о нововведении и имеющих возможность, но не имеющих желания его приобрести, Wi (t , ) — число информированных (осведомлѐнных) о нововведении, не имеющих ни желания, ни возможности его приобрести, U i (t , ) — число не осведомлѐнных о нововведении, потенциально имеющих возможность его приобрести, Vi (t , ) — число не осведомлѐнных о нововведении, не имеющих возможности его приобрести. На рис.1.16 эти семь подмножеств изображены в виде кружков, образующих иерархию стадий. Улыбающиеся лица соответствуют наличию возможности приобрести нововведение. Вертикальные стрелки соответствуют переходам индивидов из предыдущей возникновению технической стадии и в последующую, финансовой горизонтальные возможности - использовать нововведение. В иерархической модели, изображѐнной на рис.1.16, индивид не способен ―перескочить‖ через стадию. Отметим, что на рис.1.16 не отражены процессы рождаемости и смертности, которые учтены в предлагаемой ниже формуле (2) и которые затрагивают каждое из состояний. 6 Здесь и далее следовало бы использовать выражение ―плотность на единицу возраста‖ или ―концентрация‖, но мы для краткости называем этот показатель просто ―количеством‖ или ―числом‖. 62 Если всем стрелкам на рис.1.16 отвечают ненулевые интенсивности переходов (потоков событий), то лишь одно состояние – использование нововведения – является поглощающим [37]. Это означает, что в перспективе все рассматриваемые нами индивиды будут использовать нововведение (кроме умерших). На основе сделанных предположений мы предложили представить модель системой уравнений: X i 0 hi Y 0 h i i Z i 0 0 Ai 0 0 t Wi 0 0 U i 0 0 Vi 0 0 0 fi ZY fi ZY 0 0 0 ai 0 0 0 wi 0 0 0 ai 0 0 0 0 gi 0 0 0 0 f fi WA i WA wi gi 0 Xi Xi Y 0 Y i i 0 Zi Zi 0 Ai i Ai . Wi Wi gi f iVU U i U i VU Vi f i g i Vi 0 (2) Граничные условия, как и в предыдущих разделах, имеют вид7 J t j 1 U i (t , t ) сij B j (t , ) K j (t , )d , При этом мы требуем J с i 1 где B j (t , ) ij 1, (3) сij 0 , (4) - рождаемость в поколении сегмента j в момент времени t , i (t , ) – интенсивность смертности. Для простоты подразумевается, что у всех новорожденных есть потенциальная возможность приобрести нововведение. Остановимся на содержании уравнения (4). Подразумевается, что при рождении индивид попадает в подмножество U i (t , ) — он или она, безусловно, еще не знают о нововведении, но потенциально имеют возможность его использовать, поскольку государство уже обеспечивает всеобщее и обязательное обучение детей в школах использованию компьютеров, программного обеспечения и Интернета. В случае более дорогостоящих нововведений (например, 7 космического туризма) некоторым сегодняшним младенцам К сожалению, в наших публикациях [2.3,2.4,2.5,2.6,2.7,2.8,2.9,2.10,2.11] в уравнении (3) были неверно указаны пределы интегрирования и аргументы U . 63 инновация и через двадцать лет может не стать доступнее по причине дороговизны, в таком случае рационально перераспределить новорожденных между сегментами U i (t , ) и Vi (t , ) . Количество младенцев в формуле (4) получается путем суммирования рожденных в момент t от матерей всех поколений детородного возраста, эта величина вычисляется при помощи произведения B j (t , ) K j (t , ) и интегрируется от до t . Поскольку в момент t возникает поколение, которые мы характеризуем также датой t , в левой части (3) имеет вид U i (t , t ) . Функции hi (t , ) , ai (t , ) , wi (t, ) , g i (t , ) описывают условные вероятности перехода пользователя из предыдущей стадии в последующую (например, g i (t , ) − от неосведомленности к осведомленности), а функции f i (t , , u(t )) - переходы из «недоступных» подмножеств (численностью V ,W , Z ) в подмножества потенциальных пользователей (численностью соответственно U , A, Y ), u (t ) – «траектория» управляющих параметров (в частности, цен) во времени. Модель без изменения доступности Интернета Первая многостадийная модель распространения Интернета в России и в Москве была построена нами в 2009 году [100,107,93,104,92,105,108,110,111] и не учитывала изменения доступности Сети. Мы запретили все горизонтальные переходы на рис.1.16, положив все fi (t, , u(t )) 0 , благодаря чему состояния образовали два изолированных подмножества – имеющих и не имеющих доступ к Сети. Кроме того, положив Zi (t, ) 0 и wi 0 , мы исключили состояние, в котором осведомлѐнный индивид хотел бы использовать Интернет, несмотря на отсутствие в данный момент доступа, несмотря на цитированные выше свидетельства ФОМ о наличии таких индивидов8. 8 В работе [442] рассмотрено формирование интереса к предстоящим кинопремьерам, при этом, благодаря рекламе в СМИ желание посмотреть фильм формируется, несмотря на отсутствие возможности. Признавая возможное наличие такого состояния, мы не учитываем его в моделях по причине отсутствия у нас данных, которые могли бы подтвердить или опровергнуть результаты моделирования. 64 Рассмотрим однородное общество, состоящее лишь из одного сегмента индивидов. Для простоты, следуя подходу [350], положим все g i (t , ) одинаковыми и равными gi (t , ) g (t ) p q X (t ) Y (t ) A(t ) W (t ) , K (5) где X (t ) – полное количество пользователей нововведения. Разрабатывая эту модель, мы предполагали, что и в ближайшее десятилетие не все россияне будут осведомлены количества о существовании потенциально неизвестной, величине Интернета, осведомлѐнных поэтому равной положили некоторой, величину изначально K , которая не должна превосходить численность взрослого населения региона. Все функции риска hi (t , ) и ai (t , ) , как и в работе [350], были положены постоянными ( hi (t, ) h и ai (t, ) a ), что эквивалентно экспоненциально распределенным задержкам между состояниями осведомленности, желания и использования. Выбор таких функций риска игнорирует межличностные коммуникации на всех стадиях, кроме перехода от неосведомлѐнности к осведомлѐнности. Пренебрегая процессами воспроизводства населения, получаем систему обыкновенных дифференциальных уравнений X 0 h Y 0 h Z 0 0 d A 0 0 dt W 0 0 U 0 0 V 0 0 0 0 0 0 0 0 a 0 0 0 0 0 0 a 0 g 0 0 0 0 0 0 0 g 0 0 0 0 0 X 0 Y 0 Z 0 A g W 0 U g V (6) Здесь X (t ) и другие зависимые переменные обозначают уже не плотности, а просто численности описанных выше множеств индивидов. При расчѐтах мы добавили ещѐ одну промежуточную стадию ―знания‖, чтобы отразить различия между поверхностной осведомлѐнностью и уверенным знанием. Ввести эту стадию нас вынудили не только теоретические 65 представления [449], но и социологические данные, поскольку в 2000-м году около 80% российских респондентов ―что-то слышали‖ об Интернете, но лишь 40% твѐрдо знали, о чѐм идѐт речь (см. рис.1.18). Модифицированная система уравнений модели имеет вид X 0 h Y 0 h Z 0 0 A 0 0 d W 0 0 dt U 2 0 0 V2 0 0 U 1 0 0 V 0 0 1 0 0 0 0 0 0 0 a 0 0 0 0 0 0 0 0 0 0 0 a 0 0 0 0 b 0 0 b 0 0 0 0 0 b 0 g 0 0 0 0 b 0 0 0 0 0 0 0 0 0 0 0 g 0 0 X 0 Y 0 Z 0 A 0 W 0 U 2 g V2 0 U 1 g V1 (7) Для процесса передачи информации используем функцию риска9 gi (t , ) g (t ) p q Все начальные неосведомлѐнных условия X (t ) Y (t ) A(t ) U 2 (t ) W (t ) V2 (t ) . K были нулевыми, U1 (0) U 0 , V1 (0) K U 0 . кроме Величину U0 (8) исходного количества мы включили в состав неизвестных параметров модели. Другими неизвестными параметрами модели были h , a , b , q и K . Предполагалось, что на стадии распространения информации (осведомлѐнности) межличностные коммуникации доминируют, т.е. Расчѐты величин, входящих в уравнения (6) были проведены способом p 0. конечных разностей. Значения неизвестных параметров были определены путѐм минимизации функционала невязки между расчѐтными и фактическими количествами пользователей X (t ) , пользующихся или желающих пользоваться M (t ) X (t ) Y (t ) , знающих I (t ) X (t ) Y (t ) A(t ) W (t ) и осведомлѐнных N (t ) I (t ) U2 (t ) V2 (t ) . Для Москвы значения параметров оказались равны h 6,94 , a 1,75 , b 4,76 , q 8,83 (размерностью всех параметров является доля индивидов в процентах в В наших предыдущих работах было опубликовано неверное выражение для gi (t , ) , но расчѐты проводились по формуле (7), поэтому результаты расчѐтов, отображѐнные на рис.1.21 и 1.22 остаются в силе. 9 66 месяц), K 0,94 , Иными U 0 0,85 (размерность обеих величин – доля населения столицы). словами, 94% москвичей способны существовании Сети, при этом 80% воспринять информацию о москвичей составляют потенциальную аудиторию Интернета. Коэффициент внутренних воздействий q и интенсивность перехода в состояние использования h оказались сравнительно высоки, а интенсивность перехода из состояния знания в состояние наличия желания a – относительно низкой. Соответствующая средняя задержка между этими двумя состояниями 1/ a осведомлѐнностью составляет 4,75 москвича о года, а среднюю существовании задержку Интернета и между началом использования Сети при помощи рис.1.17 мы оценивали в 7 лет [100,107]. Распространение Интернета в Москве 100% Доля взрослых москвичей 90% 80% Осведомлены 70% Знают 60% Желают 50% 40% Пользуются 30% 20% 10% янв.15 янв.14 янв.13 янв.12 янв.11 янв.10 янв.09 янв.08 янв.07 янв.06 янв.05 янв.04 янв.03 янв.02 янв.01 янв.00 янв.99 янв.98 янв.97 янв.96 янв.95 янв.94 0% Рис. 1.17. Динамика распространения Интернета в Москве по данным ФОМ, Левада-центра и ВЦИОМ. Результаты моделирования, опубликованные нами на их основе прогнозы на 2009-2014 гг. [100,107], а также данные массовых социологических опросов изображены на рис.1.17. При построении рис.1.17 и 1.18 использованы следующие обозначения: серые прямоугольники − данные Левада-центра о доле осведомлѐнных; 67 серые ромбы – аналогичные данные ФОМ; чѐрные прямоугольники – данные ФОМ о знании пользователями Интернета ( I (t ) / K ); белые кружки – данные ФОМ о желании использовать Интернет ( M (t ) / K ); чѐрные треугольники и кружки – данные ФОМ об использовании Интернета, опубликованные до 2009 года ( X (t ) / K ); серые треугольники – данные ВЦИОМ об использовании Интернета; белые треугольники – данные ФОМ об использовании Интернета, опубликованные после публикации нашего прогноза. Максимальное превышение фактическими данными о количестве пользователей X (t ) нашего прогноза составило 5,5% взрослого населения Москвы, а максимальное относительное отклонение фактических данных от прогнозных показателей за шесть лет составило 8%. К сожалению, несмотря на то, что ФОМ опрашивал россиян о намерении (желании) использовать Интернет по крайней мере до 2010 года, открытая публикация данных была прекращена, поэтому сравнить фактические и прогнозные значения количества желающих использовать Сеть мы не можем. Как показывает рис.1.17, многостадийная модель ―справляется‖ с задачей описания S-образного не логистического роста. Таким образом, отклонения от логистического роста могут быть объяснены не только при помощи процессов воспроизводства населения и неоднородности общества, обсуждавшихся в предыдущих разделах. Оказывается, что даже столь упрощенная многостадийная модель удовлетворительно описывает четыре набора данных, полученные тремя различными социологическими организациями (ФОМ, Левада-центром и ВЦИОМ) на протяжении 15 лет между 1999 и 2014 гг. Мы, однако, предполагаем, что учѐт воспроизводства населения необходим и в многостадийных моделях, и без этого усложнения данные о распространении Интернета в Москве в следующие пять лет весьма значительно отклонятся от нашего рис.1.17. 68 В целом по России величина задержки между осведомлѐнностью и решением воспользоваться Интернетом − существенно выше, чем в Москве (что очевидно из сравнения рис.1.17 и рис.1.18). В наших работах [100,107,92,108,111] эта задержка была оценена нами в 15 лет. Мы предположили, что столь высокая величина задержки между осведомленностью и желанием воспользоваться может означать, что, несмотря на формальное соответствие данных за 1999-2008 годы нашей модели (в целом лишь незначительно модифицирующей модель Додсона и Мюллера [350]), процесс распространения Интернета в России определяется не распространением информации о Сети в российском обществе, а, во-первых, взаимным влиянием и убеждением (или ―подражанием‖ в духе Г. Тарда [464,271]), и, во-вторых, доступностью услуги. недоступность В течение многих лет Всемирной Сети для россиян (в первую очередь по причине дороговизны), не позволяет сформировать желание стать ее пользователем. Распространение Интернета в России 100% 80% Доля взрослых россиян Осведомлены 60% 2 Желают Знают 1 40% 20% Пользуются янв.22 янв.20 янв.18 янв.16 янв.14 янв.12 янв.10 янв.08 янв.06 янв.04 янв.02 янв.00 янв.98 янв.96 янв.94 0% Рис. 1.18. Динамика распространения Интернета в России по данным ФОМ, Левада-центра и ВЦИОМ. Цифрами отмечены наши прогнозы, построенные: (1) – в 2009 и (2) – в 2014 гг. 69 Как свидетельствует рис.1.18, опубликованный нами прогноз (помеченный на рисунке символом ―1‖) оказался существенно занижен. Рис.1.18 показывает, что отклонения данных от нашего прогноза составили 12-20 процентов населения России. Эти расхождения вынуждают нас модифицировать изложенную выше модель, включив в неѐ изменение доступности Интернета. Наиболее важной причиной расхождений мы считаем изменение доступности Интернета, поэтому ниже представлен способ учѐта этого фактора. Модель, учитывающая рост доступности Интернета Сравнивая распространения рис.1.17 и рис.1.15, мы Интернета X (t ) в Москве заключаем, что показатель лишь незначительно отстаѐт от аналогов в развитых странах [129,140]. Тренд доли пользователей Интернета в Москве приблизительно повторяет тренды двух других стран, отставая на пять лет от Швеции и на два года от Германии. Можно предположить, что параметры модели, отвечающие за межличностные коммуникации и принятие решений ( h , a , b , q ) должны быть приблизительно одинаковы в Москве, в России, и в других странах, а основной причиной отличия показателей являются различия в доступности нововведения. В новой модели мы распространяем приведѐнное выше ―московское‖ значение параметра h 6,94 на всю Россию и фиксируем его. Основываясь на результатах предыдущих разделов, мы выделяем три сегмента индивидов: ―доцифровой‖ сегмент, ―цифровых мигрантов‖ и ―цифровых аборигенов‖ (см. рис.1.14). Представители ―доцифрового‖ сегмента в нашей модели не только отказываются от использования Интернета, но и отвечают, что ничего о нѐм не слышали. Для этих поколений мы полагаем a 0 и h 0 , а также X (t ) 0 , Y (t ) 0 . Численность доцифровых поколений в нашей модели составляет 23% взрослого населения России в 1994 году, после чего убывает до нуля со скоростью 1,5 процента взрослого населения в год. Два других поколения восприимчивы к нововведению, но поначалу оно не всем доступно. 70 Разрешив ―горизонтальные‖ переходы между состояниями на рис.1.16, т.е. отменив условие fi 0 , получаем систему уравнений модели, учитывающих динамику доступности Интернета: X 0 h Y 0 h Z 0 0 A 0 0 d W 0 0 dt U 2 0 0 V2 0 0 U1 0 0 V 0 0 1 0 0 0 0 0 0 0 0 a 0 0 0 0 0 0 0 0 0 0 0 0 f f b 0 0 b 0 0 0 0 0 a 0 0 0 0 0 b f g 0 0 0 0 0 b f 0 g 0 0 0 0 0 0 0 0 0 0 g 0 f g X Y Z A W U 2 V2 U1 f V1 (9) По-прежнему, все начальные условия положим нулевыми, кроме исходного количества неосведомлѐнных U1 (0) U0 , V1 (0) K U0 10. Функция f (t ) , отвечающая за изменение доступности Интернета, заранее неизвестна, требуется построить еѐ модель и прогноз. Мы задаѐм f (t ) в виде интенсивности переходов (в демографических терминах − ―силы смертности‖), соответствующей функции дожития c~ ~ ~ a b t ~ (t ) 1 exp d (t ) (t * ) 1 при t t * при t t . (10a) * Таким образом f (t ) 1 d . dt (10b) Параметры a, b, c, d включаются в число неизвестных параметров модели и будут определены методом наименьших квадратов. Ниже будет показано, что непосредственно f (t ) нам не потребуется, поскольку достаточно знать (t ) . 10 Мы обосновываем нулевые начальные условия как содержательными аргументами (малым количеством пользователей и желающихся пользоваться Интернетом в начале 90-х гг. XX ), так и небольшим количеством доступных нам данных, которое не позволяет нам определить значения слишком большого количества неизвестных. Таким путѐм мы избегаем проблему моделирования переменных (характеристик процесса), не являющихся наблюдаемыми [236]. 71 Определим также функцию (t ) , описывающую вероятность, что индивид остался неосведомлѐнным к моменту t (такую же, как использованная в предыдущих разделах) t (t ) 0 exp g ( )d , 0 тогда g (t ) 1 d . dt Предположим, что 8-10% неосведомлѐнных о существовании Интернета, которых выясили опросы Левада-центра и ФОМ – это представители самых старших (―доцифровых‖) поколений. Используя результаты разделов 1.1.2.1 и 1.1.2.2. положим 1 1 1 p 2 2 (t ) q c e z ( 0 ) z ( t ) daw z (t ) q 0 при t0 t T при . (11) t T Мы полагаем T 20 , а в качестве начала отсчѐта выбрали 1.01.1994 года. После того, как (t ) и (t ) определены, для расчѐта X (t ) вместо системы (10) достаточно решить три линейных обыкновенных дифференциальных уравнения (основные расчѐтные уравнения) dX h (M X ) dt где M (t ) X (t ) Y (t ) dM dI a I (t )1 (t ) M b K 1 (t ) I (t ) dt dt − сумма количества пользователей и (12) желающих воспользоваться; I (t ) X (t ) Y (t ) A(t ) W (t ) − общее число знающих о нововведении. Доказательство. Рассмотрим сперва часть системы (9), отвечающую за осведомлѐнность. Введѐм две вспомогательные переменные: R(t ) U2 (t ) А(t ) Y (t ) X (t ) − количество осведомлѐнных, имеющих доступ; E (t ) V2 (t ) W (t ) − количество осведомлѐнных без доступа. Запишем уравнения для количества осведомлѐнных и неосведомлѐнных dE g (t )V1 f (t ) E dt dV1 g (t ) f (t ) V1 dt dR g (t )U1 f (t ) E (t ) dt . dU1 g (t )U1 f (t )V1 dt (13) 72 Этим уравнениям удовлетворяют функции (проверяется дифференцированием) E (t ) K (t )1 (t ) R(t ) K 1 (t ) 1 (t ) . V1 (t ) K (t )(t ) U1 (t ) K 1 (t ) (t ) (14) Определим теперь N (t ) E(t ) R(t ) − общее число осведомлѐнных; F (t ) U1 (t ) R(t ) − общее число имеющих доступ. Подставляя в эти определения решения (14), получаем N (t ) E (t ) R(t ) K 1 (t ) (15) F (t ) U1 (t ) R(t ) K 1 (t ) . (16) Способ расчѐта N (t ) при помощи интеграла Доусона дан в предыдущих разделах. Тогда мы можем выразить решения в интуитивно понятном виде E (t ) K F (t ) N (t ) / K R(t ) F (t )N (t ) / K . V1 (t ) K F (t ) K N (t ) / K U1 (t ) F (t )K N (t ) / K (17) Приступим теперь к задаче вычисления количества знающих. Определим S (t ) I (t ) W (t ) как общее число знающих, имеющих доступ. Для S (t ) и I (t ) из системы (9) следуют уравнения dI b ( N (t ) I (t )) dt (18) dS b U 2 f (t )W dt (19) Первое уравнение является линейным и решается в квадратурах, поскольку N (t ) нам известна (формула 15). Покажем, что выражение S (t ) F (t ) I (t ) . K (20) является решением уравнения (19). Дифференцируя (20), и учитывая dF d K f (t )( K F ) (см. 16 и 10b), получаем dt dt dS F dI I dF Fb N I If (t )K F FN b S f (t )I S b( R S ) f (t )( I S ) . dt K dt K dt K K K Здесь мы воспользовались полученной выше формулой (17): R(t ) F (t ) N (t ) / K . 73 Но R S U2 , а I S W . Таким образом, доказано, что выражение (20) является решением уравнения (19). С учѐтом введѐнных определений из (9) получим систему уравнений: dX dM dI h (M X ) a (S M ) b (N I ) . dt dt dt (21) Чтобы превратить систему (21) в (12), достаточно в (21) вместо S (t ) подставить выражение (20), а вместо N (t ) − выражение (15). Утверждение доказано. Последнее упрощение, которое мы здесь предпринимаем, состоит в том, что мы распространяем систему (12) на произвольный момент времени, хотя, как отмечено в предыдущих разделах, она остаѐтся в силе лишь в течение T лет, пока живы представители ―доцифрового‖ поколения. Это допущение упрощает вычисления, но является одним из наиболее уязвимых мест данной модели. Построенный прогноз получен при помощи расчѐта по формулам (10)-(12), и незначительно отличается от полученных ранее в разделе 1.1.2. Отличие моделей состоит в том, что в модели раздела 1.1.2 доминирующую роль играли межличностные коммуникации, в то время как в построенной здесь модели – внешние воздействия и переходы между стадиями. Тот факт, что обе модели породили приблизительно одинаковые прогнозы, означает, что мы не можем с уверенностью утверждать, что определяющую роль при распространении Интернета играют именно межличностные, а не массовые коммуникации. Что касается прогнозирования, то, как и в разделе 1.1.2, мы предполагаем, что наибольшее важным для построения точного прогноза является определение потенциала распространения нововведения (в данном разделе роль потенциала распространения выполняет S (t ) в уравнениях (21)). Относительное влияние каналов коммуникаций (межличностные коммуникации или воздействие СМИ) при этом трудно определить, используя одни лишь данные массовых социологических опросов. Вообще говоря, возможность аппроксимации одних и тех же статистических показателей при помощи существенно различных моделей – это 74 общее свойство социально-экономических систем, и процесс диффузии нововведений не составляет исключения. Более того, различные управленческие задачи могут требовать построения различных моделей одних и тех же явлений [25]. В силу сказанного мы рекомендуем российским социологическим организациям включить в регулярные опросы россиян об использовании Интернета вопросы о том, имеет ли кто-либо из членов семьи респондента доступ к сети Интернет, и о том, намерены ли респонденты сами начать пользоваться Сетью. Наобходимо отметить, что Р. Роуз [450], изучая распространение Интернета в России, выделил дополнительно подмножество индивидов, которые не пользуются Сетью, но знакомы с пользователями и, следовательно, лучше подготовлены для восприятия этого нововведения. Такое подмножество отсутствует в нашей модели, поскольку оно отчасти нарушает иерархию стадий, и поскольку Р.Роуз опубликовал данные только одного опроса. Следует также отметить ограниченность нашей попытки представить многостадийную модель как марковский процесс с дискретными стадиями и непрерывным временем. В наших моделях пользователь переходит в следующую стадию независимо или под действием контакта с каким-либо индивидом, находящимся на более высокой стадии овладения нововведением. При этом, однако, игнорируется длительность нахождения индивида на той или иной стадии. В случае, когда переход на новую стадию неправомерно описывать процессами без последействия, на наш взгляд, интересные возможности предоставляют модели, разработанные О.В.Барояном и Л.А.Рвачевым [21] и их коллегами для моделирований эпидемий гриппа, где вводится дополнительная переменная, описывающая время нахождения индивида на определенной стадии. Однако, внедрение такое модели требует более объемных вычислений, чем модели, рассматриваемые в нашей работе. По итогам применения описанных здесь многостадийных моделей, мы приходим к двум выводам. Во-первых, как показывают рис.1.17 и рис.1.18, 75 различия между состояниями осведомлѐнности и желания использовать Сеть, не сводятся к простой задержке во времени. Во-вторых, для моделирования перехода от состояния желания использовать Сеть к фактическому использованию, достаточно простого временного сдвига11. В то время как область применения количественных многостадийных моделей распространения инноваций в качестве инструмента анализа систем весьма широка, успешное применение этого инструмента при моделировании каждой новой предметной области потребует специфических вспомогательных задач, постановки и решения подобных задачам компенсации искажающего влияния прибора. Необходимость решения таких задач вызвана спецификой вида доступных исследователю данных о распространении нововведений, который в каждом случае имеют свои особенности. Следующие разделы данной главы, а также вторая глава диссертационной работы посвящены решению подобных вспомогательных задач. 1.3.2 Совместное моделирование количества пользователей и абонентов В настоящее время оценки количества пользователей передаются российским Министерством связи и массовых коммуникаций в Международный союз электросвязи (МСЭ), после чего публикуются совместно с соответствующими показателями других стран. Кроме того, МСЭ публикует данные о количестве абонентов доступа к Интернету, предоставляемые государствами-членами этой организации. Такие данные представляются нам ценными, поскольку данные о пользователях, в силу различия методик измерения, часто оказываются несопоставимы, и автору часто приходилось слышать предположение, что статистика количества абонентов должна дать более устойчивую картину распространения Интернета в развивающихся странах. Действительно, интуитивно такой показатель кажется проще и понятнее и не требует изучения 11 К аналогичному выводу можно прийти, изучая данные опросов Левада-центра о распространении банковских карточек. 76 выборочного метода и особенностей его реализации. Как показывает изучение данных МСЭ, в западноевропейских странах количество Интернет является более стабильным показателем, абонентов сети чем количество пользователей. Однако это оказывается не всегда так в развивающихся странах, где статистические органы иногда существенно изменяют, а то и вообще прекращают публикацию количества абонентов. Поскольку домохозяйства на два порядка многочисленнее предприятий, можно предположить, что количество абонентов характеризует в первую очередь домашнее использование Интернета, В таком случае количество абонентов отражает более интенсивное использование Интернета индивидами, чем то, которое изучалось в первом разделе этой главы. На рис. 1.19 изображены результаты моделирования данных о численности пользователей и абонентов сети Интернет в Швеции, опубликованных Международным союзом электросвязи (МСЭ) на веб-сайте (icteye.ict.int), а также веб-сайтом ―Показатели достижения целей развития, сформулированных в Декларации Тысячелетия‖ ООН (mdgs.un.org). Модель A Модель B На 100 чел. 60 50 50 40 40 30 Абоненты Год 1992 2016 2013 2010 2007 2004 0 2001 0 1998 10 1995 10 1992 Абоненты 20 2001 20 2016 60 2013 70 2010 70 2007 80 2004 80 30 Пользователи 90 1998 90 100 Пользователи 1995 100 Год Рис. 1.19. Сравнение двух моделей численности пользователей и количества абонентов сети Интернет в Швеции 77 Для применения многостадийной модели к данным о пользователях и абонентах выбрана Швеция, а не Российская Федерация, по следующим причинам. Во-первых, распространение Интернета в Швеции, в основном, завершилось (см. рис. 1.1,1.19), что позволяет изучать процесс диффузии этой услуги на протяжении значительной части ее жизненного цикла. Во-вторых, данные МСЭ о России, на наш взгляд, чрезвычайно неточны. МСЭ сообщает о 1,3 миллионах абонентов сети Интернет в России в 2006 году и 21,5 миллионах абонентов − в 2007 году. При этом, количество пользователей (не абонентов!) в 2007 году было оценено в 21,14 миллиона человек. По-видимому, российское телекоммуникационное ведомство до 2007 года не сообщало в МСЭ актуальный показатель количества абонентов, а позже сочло целесообразным считать его эквивалентным количеству пользователей12. Мы полагаем, что российская методика подсчета количества пользователей и абонентов постепенно будет согласована с европейской, но сейчас нам приходится ограничиться европейскими данными. На рис. 1.19 стрелками показано направление перехода индивидов от стадии ―использования‖ к стадии подписки на услугу. На стадии использования индивид может и не быть абонентом Интернета, а использовать Сеть в офисе, в учебном заведении, в интернет-кафе или у друзей. Черными кружками на рис. 1.19 изображена т.н. полная аудитория, т.е. доля лиц в возрасте от 16 до 74 лет, использующих Интернет хотя бы раз в течение 12 месяцев, а серыми кружками – ―активные‖ пользователи, использовавшие Интернет в течение последнего квартала. Черные треугольники показывают количество абонентов. Сплошными линиями изображены результаты моделирования (синтетические данные). В левой части рис. 1.19 представлены результаты, полученные при помощи модели A, представляющей собой описанную в разделе 1.3.1 модификацию модели Додсона и Мюллера [350]. Здесь предполагается, что: 12 О.Н.Вершинская и О.А.Алексеева [38], анализируя причины снижения позиции России в рассчитанном ООН и МСЭ Индексе готовности стран к электронному правительству, отмечают, что позиция России по подындексу развития телекоммуникаций определена по статистическим данным за 2005 год, т.е. с трѐхлетним запаздыванием. 78 а) некоторая часть полной аудитории постепенно начинает использовать Интернет активно (хотя бы раз в квартал); б) некоторая часть активной аудитории постепенно подписывается на услугу доступа к Интернету, увеличивая количество абонентов. В обоих случаях под ―постепенностью‖ подразумевается экспоненциально распределенная во времени задержка. Не все пользователи становятся абонентами, поскольку для использования Интернета достаточно одного подписчика услуг на домохозяйство. В модели A общество образует т.н. клику, в которой каждый индивид оказывает влияние на каждого. Общество ―атомизовано‖ в том смысле, что на процесс не влияет наличие каких-либо ячеек общества, например, семей или домохозяйств. В правой части рис. 1.19 представлены результаты вычислений при помощи модели B, которая аналогична модели B, подробно описанной далее в третье главе настоящей работы и в нашей работе [100] и использует следующие допущения: 1. Условный ―глава семейства‖ первоначально обучается использованию Интернета на работе, в учебном заведении, в интернет-кафе или у друзей, так он становится пользователем. 2. Домохозяйство, глава которого научился использовать Интернет, спустя некоторое время приобретает доступ к Интернету, задержка распределена экспоненциально (в общем случае, некоторые главы семейств могут и не подключить свои квартиры, но в случае Швеции отвечающий за такую задержку дополнительный параметр модели оказался нулевым). 3. Период времени между приобретением домохозяйством доступа к Интернету и началом его использования несколькими взрослыми членами (период обучения) в этой работе мы считаем пренебрежимо малым (иными словами, одновременно с абонентом появляется и некоторое количество новых пользователей – для Швеции мы получили величину 0,97). 79 4. ―Главы семейств‖ становятся пользователями как под действием внешних факторов (СМИ, рекламы, наличия Интернета в офисе), так и под действием других пользователей (вне зависимости от того, являются ли они абонентами). Таким образом, модель B можно представить системой уравнений du1 u p q K 1 u1 dt K ds a 1 u1 s dt u2 b s (22) u u1 u 2 K K1 K 2 с нулевыми начальными условиями и ограничением K 100% . Параметры p, q K , K1 , a, b, могут быть найдены путем подгонки синтетических и наблюденных данных о количестве пользователей u (t ) и абонентов s(t ) методом наименьших квадратов. Для расчета активной аудитории используется отдельная простейшая модель с экспоненциальной задержкой, аналогичная модели A. Как демонстрирует рис. 1.19, обе модели (A и B) с приблизительно одинаковой погрешностью описывают все три вида доступных данных – о количестве пользователей, активных пользователей и абонентов. Подобные результаты получены нами для ряда других стран Северной и Западной Европы. На рис. 1.19 прогнозные значения на 2010-2016 гг. практически совпадают благодаря тому, что процесс распространения Интернета в Швеции практически закончен. Однако в случае стран, где этот процесс находится на более ранней стадии, не следует надеяться, что различные модели приведут к одинаковым прогнозам. Для обоснованного выбора модели (A или B) данных, публикуемых в настоящее время МСЭ и ООН, недостаточно, что приводит нас к необходимости использовать дополнительные данные опросов о распространении Интернета в домохозяйствах. Такие данные собраны в странах Евросоюза и систематически публикуются проектом Eurostat. За пределами Евросоюза необходимые данные, как и данные о количестве абонентов Сети Интернет, как правило, разрозненны, но иногда могут быть найдены на сайтах национальных статистических служб. 80 1.3.3 Многостадийная модель охватов аудитории сети Интернет В монографии В.Н.Цыгичко [286] рассмотрены три постановки задачи прогнозирования социально-экономического процесса, самой трудной из которых является третья, когда не задан оператор прогнозирования, т.е. отсутствует математическая (а иногда и вербальная) модель процесса. Известно много моделей, описывающих динамику количества пользователей нововведения (модель Басса, пороговые модели, модели байесовского обучения и т.п.), однако модели изменения интенсивности использования нововведения практически отсутствуют. Хотя Э.Роджерс [449] включил в свою модель принятия решения об использовании нововведения стадии применения (implementation) и подтверждения (confirmation), в фокусе его внимания была модификация нововведения самими пользователями (а не производителем) на этих стадиях. Нас же больше интересует вопрос о том, как определить, сколько индивидов будут пользоваться сетью Интернет и/или отдельными крупными информационными ресурсами [8] ежедневно, сколько – несколько раз в неделю, и сколько – лишь несколько раз в месяц, и т.д. Безусловно, можно попытаться поставить интенсивность использования Сети в зависимость от стоимости доступа к ней и благосостояния индивида и построить соответствующую микроэкономическую модель. Однако в настоящее время систематические данные о стоимости доступа, которые были бы собраны одним и тем же способом на протяжении нескольких лет, отсутствуют. Кроме того, даже члены одного и того же домохозяйства, которые платят за доступ к Интернету сообща, могут использовать Сеть с различной интенсивностью, таким образом, потребуется выделить несколько сегментов пользователей и исследовать поведение каждого. Альтернативой может служить эмпирический подход, при котором для каждого вида данных (т.е. для ―суточной‖, ―недельной‖ и др. аудиторий) независимо строится модель, например, логистическая. Подобный подход использовался М.И.Левиным и соавторами в работе [211], где впервые были построены модели интенсивности использования Интернета в России. К 81 сожалению, при обосновании такого способа приходится сделать предположения, которые не выглядят обоснованными. Например, в подобных моделях негласно предполагается, что на индивидов, которые будут использовать сеть ежедневно, могли повлиять только такие же активные пользователи, но не те, кто пользуется реже. Кроме того, сложно обеспечить взаимную согласованность таких моделей. Ниже описана разработанная автором модель интенсивности (частоты) использования новых информационных технологий, которая преодолевает этот недостаток эмпирического подхода. Эта модель была применена в 2011 году автором и специалиастами Фонда ―Общественное мнение‖ для решения задачи прогнозирования интенсивности (частоты) использования Интернета. x11 x12 x13 x14 x23 x24 g1 x22 g2 x 33 x 34 g3 x44 Рис.1.20. Смена Интернета. В предлагаемой нами модели состояний предполагается, что пользователей для описания интенсивности использования Сети достаточно выделить небольшое число уровней использования и соответствующих этим уровням классов пользователей. Пусть, например, первому уровню соответствует использование Интернета в среднем один раз в сутки, второму − использование Интернета в среднем один раз в неделю; третьему − один раз в месяц; четвѐртому − один раз в полгода. Всѐ 82 множество индивидов в каждый момент времени разбивается на сегменты по окончательной интенсивности использования Интернета. Представители первого сегмента всегда будут пользоваться Сетью редко (в среднем, не чаще, чем раз в полгода), представители второго – в перспективе могут перейти во второй класс по интенсивности, третьего – в третий и т.д. Описанные сегменты изображены на рис.1.20 вертикальными последовательностями прямоугольников. Далее представители выделенных сегментов делятся по текущей интенсивности использования на несколько подможеств. Между состояниями возможны переходы, например, x13 x 23 x 33 . Строки прямоугольников на рис.1.20 объединяют индивидов, использующих в данный (а не конечный) момент новую технологию с заданном уровнем интенсивности. Первый верхний индекс обозначает текущий уровень использования, а второй – окончательный уровень. Систему уравнений баланса (уравнение 1 раздела 1.1) дополним уравнениями для нескольких возможных состояний пользователя (опуская нижние индексы, отвечающие за пол и географию индивида): x1,1 (t , ) x1, j f 1, j (t, ) t x1, j g 1 (t , ) x1, j (t , ) x1, j f 1, j (t, ) t для j 1 x i , j g i 1 (t , ) x i 1, j g i (t, ) x i , j (t , ) x i , j f i , j (t, ) t (23) x n , j g i 1 (t, ) x n 1, j (t, ) x n , j f n , j (t, ) . t Здесь x i , j (t, ) – это доля тех, кто использует Интернет с интенсивностью уровня i и повысит еѐ до j , g i (t, ) – функции риска смены уровня интенсивности с i 1 го на i -й, f i , j (t , ) – источник новых пользователей, который начинают использовать Сеть с интенсивностью уровня i и в перспективе доберутся до j . 83 Требуется также сформулировать гипотезы относительно вида f i , j (t, ) . Разумно было бы предположить, что f i , j i , j (t , )h( t , ) y ( t , ) , где i , j (t , ) (24) x i , j (t , ) , x i , j (t , ) (25) i, j т.е. что распределение по интенсивности новых пользователей пропорционально текущему распределению. В окончательных расчѐтах использовалась более простая 1,n (t, ) 1 , модель: i , j (t , ) 0 . остальные Иными словами, предполагалось, что все новые пользователи начинают с минимальной интенсивности использования Сети, а заканчивают – максимальной. Таким образом, оказалось, что достаточно лишь одного сегмента – четвѐртого. 100 % Доля взрослых россиян, пользовавшихся Интернет хотя бы раз за последние 80 Полгода 60 Месяц Неделю 40 Сутки 20 2021 2020 2019 2018 2017 2016 2015 2014 2013 2012 2011 2010 2009 2008 2007 2006 2005 2004 2003 2002 0 Рис.1.21. Прогноз охватов аудитории российского Интернета за сутки, неделю, месяц и полгода Несмотря на очевидную грубость такого предположения, рис.1.21 иллюстрирует удовлетворительные прогнозы суточной и недельной аудиторий российского Интернета, сделанные на его основе. Здесь закрашенными значками изображены охваты аудиторий, измеренные ФОМ по зиму 2011 года включительно. Незакрашенные значки изображают данные, полученные после построения прогноза. Как показывает рис.1.21, за два с половиной года (с весны 84 2011 по лето 2012 года) максимальные ошибки суточного и недельного охватов аудитории составили 3 п.п., месячного охвата – 5 п.п.. Основной недостаток представленных здесь расчѐтов заключается в том, что модель применялась непосредственно к данным опросов Фонда ―Общественное мнение‖, которые, строго говоря, содержали не информацию о частоте использования Интернета, а информацию о моменте последнего использования Сети. Таким образом, мы применяли для описания и прогнозирования данных ФОМ модель, требующую других данных. Такой шаг был вынужденным, поскольку вспомогательная модель, предоставляющая ―интерфейс‖ к данным ФОМ ещѐ не была разработана, а прогноз уже был востребован. Во второй главе данной работы представлены ―интерфейсные‖ модели интенсивности использования Интернета в целом и отдельных информационных ресурсов, а также прогнозы, построенные на их основе. Выводы 1. Разработана количественная модель распространения нововведения с учетом изменения его доступности и процессов воспроизводства населения, которая объясняют историческую динамику количества пользователей сети Интернет. На основе этой модели с использованием данных массовых опросов построены прогнозы доли пользователей Интернета в России, а также – отдельно в российских городах и сѐлах. Для России в целом средняя квадратическая ошибка прогноза доли пользователей в возрасте 18 лет и старше за четыре года (с лета 2009 по весну 2013 гг.) составила 3 процентных пункта, максимальная ошибка – 6 п.п. Максимальная ошибка в отдельной возрастной группе составила 12 п.п. – для возрастной группы от 18 до 24 лет. 2. Разработана многостадийная модель роста интенсивности использования нововведения, с помощью которой построены прогнозы суточного, недельного и месячного охватов аудитории российского Интернета. За два с половиной года (с весны 2011 по лето 2012 года) максимальные ошибки суточного и недельного охватов аудитории составили 3 п.п., месячного охвата – 5 п.п. 85 2 ГЛАВА 2. МОДЕЛИ ИНТЕНСИВНОСТИ ИСПОЛЬЗОВАНИЯ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ И РЕСУРСОВ Рассмотренные в первой главе данной работы модели распространения новых информационных технологий позволяют описать только динамику полного охвата аудитории, но не интенсивность использования Интернета различными группами пользователей, что существенно ограничивает их применение. В настоящее время организации, работающие в Интернет-индустрии, практически перестали использовать в своей операционной деятельности показатель полной аудитории Интернета. Сегодня индустрией востребованы оценки и прогнозы охватов аудитории Интернета и отдельных информационных ресурсов за месяц, неделю и сутки13. Поэтому при внедрении разработанных моделей в практику нам потребовалось разработать специальную модель для описания интенсивности использования Интернета и информационных ресурсов, которая позволила бы прогнозировать охваты за сутки, неделю и месяц. Теоретические основы информационных ресурсов, методы их описания и классификации, организации и мониторинга рассмотрены в монографии А.Б.Антопольского и О.В.Шлыковой [8]. В разделе 1.3.3 мы описали разработанную нами многостадийную модель распространения интенсивности использования Интернета, в которой полугодовая аудитория выступала потенциалом для месячной, месячная − потенциалом для недельной и т.п. Такой подход, однако, не удовлетворяет критерию теоретической обоснованности. Во-первых, основанием классификации аудиторию на ―месячную‖, ―недельную‖ и ―суточную‖ является сложившаяся практика социологических организаций и индустрии, однако, не исключено, что пропущены какие-нибудь важные сегменты аудитории, например, индивиды, использующие Сеть приблизительно один раз в две недели. Во-вторых, в наших расчѐтах использовались данные измерений ФОМ, которые, по традиции 13 В итоге фонд ―Общественное мнение‖ (ФОМ) перестал публиковать оценки полной аудитории, хотя и продолжает проводить еѐ измерения и предоставляет необходимые данные автору данной работы. ВЦИОМ и Левада-центр продолжают публиковать оценку полной аудитории Интернета. 86 медиаизмерений имеют форму т.н. кумулятивных кривых охватов аудитории. Именно прогнозы этих кумулятивных кривых востребованы индустрией. Однако модели распространения нововведений описывают поведение индивидов, а не охваты аудитории. Поэтому необходима дополнительная модель, обеспечивающая ―интерфейс‖ между теорией распространения нововведений и теорией случайных процессов, объясняющей формирование кумулятивных кривых охвата аудитории. Такая модель разработана в первом разделе данной главы. Здесь рассмотрены различия в способах аппроксимации измерения распределения аудитории Интернета интенсивности и два использования способа Интернета. Методологической основой раздела служит теория случайных процессов, в частности – теория потоков событий. В первом случае плотности распределения интенсивности использования дискретны и отличаются лишь количеством ―пиков‖ или ―точечных масс‖. Во втором случае распределения интенсивности аппроксимируются смесью гамма-распределений. Оба подхода позволяют аппроксимировать данные измерений ФОМ, РОМИР и ВЦИОМ. Выбор в пользу непрерывной плотности распределения обосновывается при помощи данных онлайн-панели, работа которой описана в разделе 2.2. В разделе 2.2 предлагается модель распределения интенсивности использования информационных ресурсов Интернета в виде смеси бетараспределений. Эта модель позволяет аппроксимировать данные измерений онлайн-панели и отчасти обосновывает выбор непрерывного распределения и в разделе 2.1. В разделе 2.3 представлена модель использования информационного ресурса WWW с учѐтом смены пользователями файлов cookies, позволяющая интерпретировать измерения Интернет-счѐтчиков, каких как LiveInternet, Rambler‘s Top 100, Top.Mail.Ru и другие. Проведѐнная работа была инициирована критикой данных социологических опросов со стороны аналитиков Интернетиндустрии в 2007-2008 гг. 87 2.1 Количественная модель интенсивности использования сети Интернет В 2002-2008 г. ежеквартально открыто публиковались результаты репрезентативных массовых опросов фонда ―Общественное мнение‖ (ФОМ), которые сообщали, каков суточный, недельный, месячный, квартальный и полугодовой охват аудитории российского Интернета. Поставим вопрос, какую информацию об использовании Интернета гражданами содержат данные об охватах? Можно ли с их помощью узнать, какое количество россиян использует Интернет каждый день? Или, например, несколько раз раз в неделю? Сколько людей использует Интернет реже, чем один раз в неделю? Именно в такой форме рекомендуют опрашивать респондентов инструкции поддерживаемых ООН проектов международных сопоставлений использования Интернета в различных странах. Очевидно, что прямого ответа на такие вопросы охваты не дают. Прямой ответ можно было найти в публикациях компании РОМИР за 2003-2007 гг., но в 2007 году публикация таких данных прекратилась. В настоящее время вопросы в похожей форме задают ВЦИОМ и Левада-центр, данные которых, к сожалению, публикуются не чаще двух раз в год. Возникает вопрос, нельзя ли получить показатели использования расчетным путем, используя данные об охватах аудитории? В качестве методологической базы исследования в этой главе используется теории случайных процессов. Случайным процессом значение которого при любом фиксированном величиной N (t0 ) N (t ) называется процесс, t t0 является случайной [37]. Потоком событий называется последовательность однородных событий, появляющихся одно за другим в случайные моменты времени [37]. В этой главе использования информационных технологий и ресурсов индивидом моделируется при помощи потока событий. Количество событий N (t, ) , появившихся за промежуток времени длиной , есть случайный процесс (процесс накопления событий). Обозначим интенсивность потока [37] 88 событий буквой λ, это непрерывная неотрицательная величина. В общем случае интенсивность потока событий определяется как математическое ожидание числа событий в единицу времени (t ) lim 0 (t , ) . Здесь угловые скобки означают математическое ожидание случайной величины. Для стационарного потока событий λ постоянна во времени. Для стационарного потока определим также вероятность того, что на промежутке (t0 , t0 t ) произошло хотя бы одно событие w(t ) vˆk (t ) 1 vˆ0 (t ) . k 1 Параметр потока событий определяется как предел lim t 0 w(t ) . t Известно, что для любого стационарного потока событий , а для стационарных ординарных потоков, в частности, для простейшего потока событий, . Далее мы используем понятия интенсивности и параметра потока только для простейших потоков событий, поэтому в пределах этой главы обе величины всегда будут совпадать. В первой главе данной работы основной интерес представляла величина xi , j (t, ) – плотность количества пользователей, которые сейчас используют Интернет с интенсивностью класса i , но со временем увеличат еѐ и перейдут в класс j . Мы предполагаем, что значения интенсивности могут отличаться для различных пользователей. Определим в момент времени t плотность количества пользователей на единицу возраста, использующих Интернет с интенсивностью, меньшей ~ X i , j (t , , ) . ~ Тогда 0 X i , j (t, , ) xi , j (t, ) , причѐм ~ xi , j (t, ) lim X i , j (t, , ) . 89 ~ Из определения X i , j (t, , ) следует, что эта величина – не убывает по , и еѐ производная по неотрицательна ~ X i , j i, j ~ x (t , , ) 0. Введѐнная здесь величина ~x i , j (t, , ) имеет смысл плотности количества индивидов на единицу возраста и на единицу интенсивности. Очевидно, ~ i, j i, j ~x (t, , )d X (t, , ) и 0 ~x i, j (t , , )d x i , j (t , ) . 0 Мы предлагаем модель величины ~x i , j (t, , ) в виде ~ x i , j (t, , ) pi (; t, ) xi , j (t, ) , где pi (; t, ) − некоторая (заранее неизвестная) плотность вероятности случайной величины , определѐнной на [0, ) . Мы налагаем на pi (; t, ) требование конечности математического ожидания величины pi ( ; t , )d , 0 которое обеспечивает конечность параметра (и интенсивности) итогового потока событий. Кроме того, мы предполагаем, что 1. для интересующего нас периода измерения охватов T длиной полгода величину λ можно считать постоянной для каждого индивида; 2. для представителей i -го класса в момент времени t показатель λ есть случайная величина, распределѐнная по некоторому закону распределения; 3. закон распределения для каждого i -го класса не изменяется во времени; 4. законы распределения для всех классов принадлежат к одному семейству, хотя могут отличаться параметрами. Такая модель не противоречит сформулированным выше определениям и свойствам ~x i , j (t, , ) . Отметим, что pi ( ; t, ) зависит лишь от текущего класса интенсивности i , но не от индекса окончательного класса j . 90 В разделе 2.1.1. для краткости вместо pi (; t, ) используется обозначение p( ) . Таким образом, p ( ) есть вероятность использования Интернета с интенсивностью («частотой») λ раз в сутки ( 0 ). Величину p( ) можно интерпретировать и как долю аудитории, которая посещает Интернет с интенсивностью λ. 2.1.1 Разработка модели интенсивности (частоты) использования сети Интернет Пусть аудитория Интернета (или некоторая еѐ целевая часть) неоднородна и содержит как очень активных, так и менее активных пользователей. Объѐм выделенного сегмента аудитории будем предполагаеть постоянным на рассматриваемом интервале измерения длительности охватов и обозначим R0 xi , j (t, ) . В работах [291,292] для относительных величин, аналогичных по смыслу x i , j (t, ) / k i , j (t, ) используется термин "предельный охват‖. Уточним, что подразумевается под использованием информационного ресурса с частотой ―λ раз в сутки‖. Рассмотрим пользователей, для которых посещение информационного ресурса описывается событий с интенсивностью . Простейшим простейшим потоком называется ординарный стационарный поток случайных событий без последействия или, иными словами, стационарный пуассоновский поток. Для такого потока событий [37]: 1. пользователи появляются в Интернете поодиночке, а не группами (ординарность); 2. интенсивность использования Интернета не меняется со временем (стационарность); 3. вероятность выхода пользователя в Интернет не зависит от предшествующей истории его поведения (отсутствие последействия). Состояния пользователя и переходы между ними для простейшего перехода событий изображены на рис.2.1 (A). Такую модель поведения индивидов в 1959 91 году Э.Эренберг предложил для описания статистики трансакций баз данных о поведении покупателей [359], этот подход и используется в моделях поведения потребителя. В литературе известен подход с использованием модели поведения пользователя и в виде потока Эрланга 2-го порядка [331], однако, как будет показано ниже, для описания и прогнозирования охватов аудитории Интернета, модель простейшего потока событий является достаточной. Правомерность предположения о стационарности потока обсуждается в конце раздела 2.1. S0 S1 … S2 Sk … (A) простейший поток событий S0 c0 S1 c1 Sk c3 … c2k c2 c2k+1 … (B) поток Эрланга 2-го порядка Рис.2.1. Состояния пользователя и переходы между ними: (A) − в простейшем потоке событий; (B) − в потоке Эрланга 2-го порядка. Функция распределения (ф.р.) интенсивности использования информационного ресурса вычисляется при помощи интегрирования P( ) p( )d (1) 0 и представляет собой вероятность того, что представитель такой аудитории использует Интернет реже, чем раз в сутки. Очевидно, что P( ) 1 . 92 В этой главе нам потребуется распределение Эрланга непрерывной переменной 0 , (имеющей смысл длительности промежутка времени, в течение которого измеряются охваты), зависящее от параметра , а именно k 1 — плотность распределения Эрланга k -го порядка; f k ( ; ) e k 1! Fk ( ; ) 1 e m — функция распределения Эрланга k -го порядка. (2) k 1 m 0 m! (3) По определению функции распределения (ф.р.) и плотности распределения (п.р.) dFk ( ; ) f k ( ; ) . d (4) Далее мы будем использовать следующее из (2) и (3) рекуррентное соотношение f k ; Fk 1 ; Fk ; . (5) Вероятность того, что индивид, характеризуемый параметром потока , за промежуток времени длиной обращался к ресурсу ровно k раз, описывает распределение Пуассона (распределение дискретной величины k ) uˆk ; e t Математическое ожидание k k! 1 f k 1 ( ; ) . количества индивидов, (6) характеризуемых параметром , которые обращались к ресурсу ровно k раз за промежуток времени длиной , есть R0 p( )uˆk ; . Определим абсолютный кумулятивный охват порядка k аудитории как математическое ожидание количества представителей этой аудитории, которые использовали информационный ресурс не менее k раз за время . Тогда абсолютный кумулятивный охват или просто охват порядка k за время аудитории, использующей выбранный информационный ресурс с частотой , описывается формулой [452]: Rk ; R0 Fk ( ; ) p( ) (7) для k 1,2,... и т.д. Действительно, количество тех, кто использовал ресурс не менее k раз, складывается из тех, кто делал это ровно k раз, k 1 раз и т.п. Rk ; R0 p( )uˆk ( ; ) uˆk 1 ( ; ) ... R0 p( ) Fk ( ; ) . (8) 93 Если же величина R0 обозначает не общее число пользователей Интернета, а долю таковых в населении страны (или в иной целевой аудитории), то величину Rk ; будем называть относительным охватом аудитории. В работах [291,292, 256] именно такая величина называется охватом аудитории. Вероятность того, что произвольно выбранный индивид за время обращался к ресурсу ровно k раз, в данной модели составляет uk ( ) uˆk ; p( )d 0 k e k! k p( )d . (9) 0 В частности вероятность, что пользователь не использовал ресурс, можно рассчитать при помощи преобразования Лапласа плотности p( ) u0 ( ) p( )e d . (10) 0 Выражением (9) дается вероятностная смесь распределений Пуассона с параметром . Дифференцируя k раз обе части (10) и сравнивая с (9), получаем формулу k k d uk ( ) u0 ( ) , k! d (11) позволяющую найти любую uk ( ) , если удалось найти выражение для u0 ( ) . Подчеркнѐм, что столь простая формула верна только в том случае, когда поведение индивида можно описать простейшим потоком событий. Кумулятивный охват порядка k всей аудитории информационного ресурса может быть найден путем интегрирования всех охватов Rk ( ; ) по λ 0 0 Rk ( ) Rk ; p( )d R0 Fk ( ; ) p( )d . (12) Из (5), (10) и (12) вытекает рекуррентное соотношение Rk ( ) Rk 1 ( ) R0uk 1 ( ) , (13) означающее, что разность k -го и k 1 -го охватов есть величина той части аудитории, которая использовала ресурс ровно k раз. 94 Разностное уравнение (13) следует дополнить граничным условием R0 ( ) R0 . (14) Формулы (10), (11) и (13) позволяют рекуррентно рассчитать кумулятивные охваты аудитории ресурсов в следующих, важных для практики, случаях. Пример 1. Отрицательное биномиальное распределение. Зададим плотность распределения виде плотности гамма-распределения [37]: 1 b p( ; b, ) b e b , (15) где использована гамма-функция Эйлера ( ) 1e d ( 0 ). (16) 0 Соответствующая функция распределения вероятностей имеет вид b P( ; b, ) 1e b d . 0 (17) Заменим в (17) y b , тогда b y P( ; b, ) 0 b 1 e y 1 1 dy b ( ) b y 1 y e dy . (18) 0 В выражении справа стоит т.н. «регуляризованная» неполная гамма-функция. Подпрограммы для ее вычисления есть в стандартных статистических пакетах, в том числе и в прикладном пакете MS Excel (с помощью которого получен, в частности, рис.2.14). Подставляя (17) в (10), получаем u0 ( ) p( )e 0 b d . b (19) Подставляя затем (19) в (11) находим вероятность того, что индивид за время обращался к ресурсу k раз uk ( ) где использован символ Похгаммера ( ) k k b , k! (b ) k (20) 95 ( )k k ( k ) ( i 1) , ( ) i 1 (21) таким образом, ( )0 1 , ( )1 ,..., ( )k ( 1) ... ( k 1) . Распределение вероятностей целой величины k с параметрами 0 p 1 и 0 PrK k ( k ) k p 1 p , ( )k! k 0,1,2,... (22) носит название отрицательного биномиального распределения (NBD). Очевидно, формула (20) превращается в (22), если положить p b . b Отрицательное биномиальное распределение использовалось в прикладных задачах уже в работах Дж.У.Юла в 1910 году [482] и М.Гринвуда и Дж.У.Юла в 1920 году [369]. В 1959 г. Эндрью Эренберг описал при помощи NBD статистику трансакций баз данных продуктовых сетей [359,332], позже применил модель NBD для описания охвата аудитории телеканалов. В работе Парка и Фейдера [439] отрицательное биномиальное распределение используется для моделирования аудитории WWW-сайтов. В наших работах [72,135] NBD применяется для моделирования аудитории российского Интернета в целом. При помощи (13) находим все охваты аудитории информационного ресурса Rk ( ) Rk 1 ( ) R0 ( )k 1 b (k 1)! b b k 1 . (23) В частности, при k 1 получаем значения охвата b R1 ( ) R0 R0 . b (24) Формула (24) используется нами ниже при разработке модели D использования информационного ресурса пользователем. При этом охваты Rk ( ) мы вычисляем по формулам (13) и (14), а для вычисления uk ( ) используем вытекающую из (20) рекуррентную формулу uk ( ) k 1 k b uk 1 ( ) . (25) 96 Пример 2. В следующем разделе этой главы используется бета-распределение вероятности использовать информационный ресурс в течение промежутка времени t , в качестве которого обычно используются одни сутки. Это соответствует плотности распределения интенсивности использования ресурса p( ) 1 t 1 e t e t . ( , ) Заменив переменную e t , получим d u0 ( ) 1 t e dz и найдѐм аналог (20) t 1 1 1 / t 1d ( , / t ) . ( , ) 0 ( , ) 1 Полученная формула позволяет рассчитать теоретические охваты ( , / t ) R1 ( ) R0 1 , ( , ) т.е. все синтетические данные, которые мы можем сравнить с эмпирическими данными опросов Фонда ―Общественное мнение‖. Ценность полученного результата состоит в том, что он позволяет на основе одной и той же модели сопоставить данные массовых опросов и описанных в следующем разделе панельных исследований (например, опросов ФОМ и ВЦИОМ и панели TNS). Для вычисления uk ( ) получаем рекуррентную формулу uk ( ) где ( m ) ( z ) 1 1 k 1 ( 1)m 1 m 1 ( m ) ( / t ) ( m ) ( / t ) uk 1 m ( ) , k 1 ( t ) k m 0 m! d m ( 0) ( z ) d m1 m1 ln ( z ) – полигамма-функция, для вычисления которой dt m dt во многих математических пакетах есть подпрограммы, и которую несложно вычислить рекуррентно при целых значениях . После этого охваты Rk (t ) можно рассчитать рекуррентно по формуле (13). Смесь полученных распределений может стать важной альтернативой используемой далее смеси NBD, благодаря связи с обобщѐнными полиномами Бернштейна, при помощи которых, как показали Хиршман и Уиддер [284], можно аппроксимировать распределения p( ) . широкий класс заданных на полупрямой плотностей 97 Пример 3. Дискретные распределения Рассмотрим дискретное распределение частоты 14. В этом случае функция распределения P( ) является разрывной кусочно-постоянной (ступенчатой) M P( ) pi i , (26) i 1 где ( ) sign( ) 1 / 2 − ступенчатая функция Хевисайда. Плотность такого распределения состоит из M дельта-функций Дирака: M p( ) pi i . (27) i 1 Подставив выражение для p( ) в (12), получим формулы охватов аудитории: M Rk ( ) R0 pi Fk ( ; i ) . (28) i 1 Обозначим ri R0 pi . Тогда формула охвата первого порядка за период для дискретных распределений приобретает вид M R1 ( ) ri 1 exp( i ) . (29) i 1 Эта формула используется в следующем разделе для расчѐта охватов R1 ( ) в описанных ниже моделях A1-A4. Далее для моделирования упоминавшихся выше данных РОМИР и ВЦИОМ об интенсивности использования Интернета мы используем величину Q( ) R0 1 P(1 / ) , (30) представляющую размер аудитории, которая в среднем использует Интернет не реже, чем один раз за дней. Сказанное не следует трактовать как утверждение, что ни один пользователь никогда не пропустит дней – иногда он выходит в Интернет реже, а иногда чаще, но в среднем за достаточно большой промежуток 14 Соответствующее этой модели распределение времени между двумя обращениями произвольно выбранного индивида к информационному ресурсу носит название гиперэкспоненциального; плотность этого распределения имеет вид M (T ) pi i e T . i i 1 98 времени T оказывается, что пользователь обращался к Интернету или информационному ресурсу не менее, чем T / раз. Исследования РОМИР определяли недельную аудиторию следующим образом: ―пользующиеся Интернетом не реже одного раза в неделю, но не ежедневно‖. Сложив количество таких пользователей с количеством тех, кто пользуется Интернетом ежедневно, мы получаем Q( ) для интервала времени длиной в одну неделю. Таким образом, РОМИР публиковала15 величину Q( ) при нескольких значениях , равных суткам, неделе и месяцу. В частности, в четвѐртом квартале 2005 г., который был выбран нами в [72] для исследования накопленной аудитории, Q(30) 0,17 . К сожалению, РОМИР не сообщал, какова ―полная‖ аудитория Интернета, то есть полное число использующих Сеть с ненулевой интенсивностью , поэтому для оценки этой полной аудитории мы использовали данные ФОМ. Согласно данным ФОМ, в 2008 году для взрослого населения России можно было считать, что 70% взрослого российского населения не использовали Интернет. Соответственно, для этого периода можно положить Q() 0,3 , а в четвѐртом квартале 2005 г. в соответствии с данными ФОМ следовало положить Q() 0,2 . Отметим, что остаѐтся не до конца исследованным вопрос о влиянии нестационарности, то есть о том, как влияет на итоги опросов респондент, который обычно пользуется Интернетом каждый день, но на последней неделе один день провел в командировке, и не проверил почту. Такие пользователи могут увеличить недельную аудиторию в ущерб ежедневной. Безусловно, среди пользователей найдутся и такие, которые пользуется Интернетом раз в неделю, но последнюю неделю провели на в туристическом походе или на курорте. Их ответы уменьшат недельную аудиторию. К сожалению, одни лишь данные массовых социологических опросов не позволяют оценить влияние нестационарности. Однако в следующем разделе мы приводим данные и 15 См., например, http://romir.ru/news/res_results/333.html 99 результаты моделирования аудитории онлайн-панелей, которые свидетельствуют, что влияние нестационарности на кумулятивные охваты аудитории невелико. Основное предположение этого раздела состоит в том, что можно найти функции распределения P( ) , способные удовлетворительно описать как данные ФОМ об охватах аудитории R1 ( ) , так и данные РОМИР о Q( ) . В таком случае, несмотря на небольшой объѐм данных, предоставляемый каждой из организаций, мы можем получить аппроксимацию P( ) , достаточно точную для целей прогнозирования. Первоначально мы ожидали, что совместное использование различных данных массовых опросов позволяет найти весьма узкие границы для P( ) и рассчитывали найти одно простое распределение с малым числом параметров, пригодное для описание любых данных такого рода. Однако оказалось, что можно найти различные аппроксимации распределения P( ) , которые существенно различаются по свойствам, но при этом с одинаковой точностью описывают все доступные нам данные массовых опросов. Сказанное проиллюстрировано ниже на примере ступенчатого распределения (модель A и B) и смеси гамма-распределений (модель D). Разрешающая способность данных о R1 ( ) и Q( ) при данном уровне погрешности измерений оказывается недостаточно высока, чтобы ограничить P( ) . Мы пришли к выводу, для целей прогнозирования можно использовать различные аппроксимации P ( ) , в частности – в виде смеси гамма-распределений или в виде ступенчатых функций. Отметим, что задача аппроксимации P( ) при наличии конечного объѐма данных оказывается непосредственно связанной с классической проблемой моментов [13,14] и, таким образом, всегда допускает бесконечное множество решений. Для рассматриваемых далее моделей A1-A4, использующих дискретные распределения , теоретические охваты описывает формула (28), свободные параметры есть m r1, 1,..., rM , M , а их общее количество составляет 2M . Далее вместо R1 ( ) будем использовать обозначение R1 ( ; m) , чтобы подчеркнуть зависимость значений теоретических охватов от свободных параметров модели. 100 В случае моделей A1 и A2 мы ищем такие параметры модели ri , i , чтобы расчетная кривая R1 ( ; m) проходила как можно ближе к данным опросов d k , полученным ФОМ. На параметры налагаются вытекающие из смысла задачи требования ri 0, i 0 . оптимальными m, Мы говорим, что параметры модели m* являются подразумевая, что они минимизируют функционал ошибок (m* ) min (m) (31) m где (m) d k R1 ( k ; m) , Kd 2 (32) k 1 – сумма квадратов отклонений расчетных (―синтетических‖) данных R1 ( k ; m) от наблюдений ФОМ d k , K d − количество точек данных, в случае моделей A1 и A2 использовались только данных ФОМ, поэтому – Kd 5 (сутки, неделя, месяц, квартал и полгода). Поскольку точность измерений ФОМ во всех пяти точках близка, мы не взвешиваем ошибки при помощи каких-либо весов. Для других моделей функционал ошибок имеет более сложный вид и будет описан в каждом случае отдельно. Синтетические (расчѐтные) данные РОМИР, которые используются для оценки результата в моделях A1 и A2 и непосредственно для поиска оптимальных параметров моделях A3 и A4, можно получить по формуле M Q( ) ri ( 1 / i ) , (33) i 1 которую несложно вывести из (30) и (26). Эта формула верна только для дискретных распределений величины . Модель A1. Однородная аудитория. Рассмотрим сперва однородную модель, в которой все пользователи одинаковы и используют Интернет приблизительно с равной интенсивностью 1 (или выходят в Интернет в среднем каждые 1 1 суток). Такая модель (модель простейшего потока событий) чрезвычайно широко используются в технике, в 101 моделях массового обслуживания, в частности − при моделировании телетрафика и компьютерных сетей [171,40,201]. Эта модель оказалась чрезмерно упрощѐнной, даже для описания только лишь охватов R1 ( ) . В случае модели A1 есть только один сегмент пользователей M 1 , и, соответственно два свободных параметра. Оптимальные значения параметров модели A1, минимизирующие функцию ошибки (32), оказались равны 1* 0,19 суток 1 , r1* 18% . Иными словами, согласно модели A1, осенью 2005 г. общая аудитория Рунета составляла 18% взрослых россиян, каждый из которых выходил в Интернет приблизительно один раз в пять дней. При этом поведение каждого пользователя описывает простейший поток событий. Даже при ―оптимальных‖ значениях параметров модель однородной аудитории A1 значительно (на несколько процентов населения России) отклоняется как от данных ФОМ, так и от данных РОМИР. Относительная ошибка превышает 10% для данных ФОМ и 30% для данных РОМИР. Такие расхождения многократно превышают нашу оценку [163] погрешности измерений ФОМ и РОМИР в этот период. По нашей оценке [163] в рассматриваемый период относительная ошибка выборки ФОМ использовавшей 18 тысяч респондентов, составляла 1,7%. Выборка РОМИР-Мониторинг включала 1,6 тысяч респондентов, и относительная ошибка этой выборки осенью 2005 г. составляла 5-6%. Таким образом, отклонения предсказаний модели от данных пятикратно превосходят ошибки выборочных исследований, поэтому такая модель не подходит для аппроксимации данных социологических опросов об использовании Интернета Модель A2. Два сегмента пользователей. Удовлетворительного описания данных ФОМ об охватах R1 ( ) можно описать при помощи моделей с двумя и большим числом сегментов пользователей. Самой простой из них является модель A2, в которой выделяется лишь два сегмента пользователей. Здесь будет показано, что модель A2 способна 102 удовлетворительно аппроксимировать данные ФОМ об охватах R1 ( ) , хотя всѐ ещѐ не позволяет одновременно аппроксимировать и данные РОМИР о Q( ) . Пусть представители первого сегмента используют Интернет в среднем 1 раз в сутки, а второй − 2 раз в сутки, а плотность распределения частоты использования Интернета имеет вид (27) с M 2 . Тогда на вопросы интервьюеров РОМИР представители первого сегмента будут отвечать, что используют Интернет несколько раз за t1 1 дней, а второго 1 – несколько раз за t 2 1 дней. 2 Данные ФОМ описывает формула (28) при M 2 с неизвестными нам пока параметрами r1, r2 , 1, 2 . Мы находим оптимальные параметры путем минимизации функционала ошибки (30); эти параметры оказываются равны: 1 1 1 0,754 суток , r1 10,9% , 2 0,024 суток , r2 8,8% . Оба сегмента оптимальной модели оказались приблизительно равны по количеству пользователей. Первый сегмент представляет активных пользователей, которые выходят в Интернет почти каждый день (один раз в 1,32 дня). Второй сегмент состоит из значительно менее активных пользователей, которые выходят в Интернет реже, чем раз в месяц (один раз в 40,1 дня). Модель A2 с двумя сегментами пользователей значительно лучше описывает данные ФОМ об охватах R1 ( ) (см. левую часть рис.2.2), чем модель A1. Ошибка аппроксимации R1 ( ) теперь составляет менее одного процента населения РФ (и укладывается в пределы ―трех сигм‖). Если бы у нас не было данных РОМИР (см. правую часть рис.2.2), то мы не смогли бы отклонить гипотезу, что аудитория российского Интернета состоит всего лишь из двух однородных сегментов16. Отсюда следует вывод о том, что с помощью одних только данных ФОМ об R1 ( ) мы вообще не можем доказать наличие аудитории, которая посещает Интернет 16 Далее будет показано, что двух сегментов аудитории достаточно для описания данных опросов, если каждый сегмент описать не вырожденным распределением , а гаммараспределением. Затем аналогичный результат будет получен для онлайн-панели, в этом случае также используются не вырожденные, а бета-распределения. 103 несколько раз в неделю, но не каждый день (―недельной‖ аудитории по терминологии РОМИР). Данные ФОМ об охвате аудитории можно было бы объяснить сочетанием активной (ежедневной) и малоактивной аудиторий, причем погрешность аппроксимации не превышала бы ошибку выборочных измерений. 25% 25% R1(τ) Q(τ) 20% 20% 20% 18% 16% 15% 15% Данные ФОМ (осень 2005 г.) 12% 17% 10% 14% 10% 6% 5% 5% τ 0% 0 Данные РОМИР (IV квартал 2005 г.) 30 60 90 τ 0% 120 150 180 210 Период измерений (дни) 5% 0 7 14 21 28 35 42 Период измерений (дни) Рис.2.2. Результаты расчетов R1 ( ) и Q( ) при помощи модели аудитории A2, состоящей из двух сегментов. Однако благодаря данным РОМИР о Q( ) , мы знаем, что действительная форма распределения P( ) сложнее, чем сумма двух ступенчатых функций Хевисайда. Правая часть рис.2.2 показывает, что величины Q( ) , предсказанные моделью A2, и реальные данные РОМИР расходятся весьма заметно: относительное отклонение составляет 50%. Данные РОМИР свидетельствуют, что некоторая часть аудитории пользуется Сетью несколько раз в неделю, но не каждый день. 104 Первый вывод из анализа модели A2 состоит в том, что для эвристического описания данных ФОМ об охватах R1 ( ) достаточно двух однородных сегментов пользователей: очень активного, и малоактивного. Модель A2 можно было бы попытаться использовать для целей прогнозирования охватов аудитории по данным ФОМ, невзирая на то, что она противоречит данным РОМИР о Q( ) . Второй вывод из нашего анализа состоит в том, что при наличии измерительной погрешности данные ФОМ о кумулятивном охвате аудитории R1 ( ) , по-видимому, можно с равной точностью описать с помощью очень широкого набора моделей, не все их которых способны одновременно описать данные других измерений интенсивности использования (например, измерений РОМИР). Третий вывод состоит в том, что данные других измерений, в частности – данные РОМИР о Q( ) позволяют отклонить часть моделей из упомянутого широкого набора, что и служит обоснованием поставленной нами задачи найти модель, описывающую совместно оба вида данных. Модель A3. Три сегмента пользователей. Чтобы включить в расчеты третий сегмент пользователей, достаточно добавить третий ―спектральный пик‖ плотности распределения, и использовать формулу (27) с M 3 . Однако при этом число неизвестных параметров 2M 6 превышает объѐм данных ФОМ об охватах R1 ( ) , поэтому мы расширяем множество данных, включая в него и данные РОМИР о Q( ) . Функционал ошибки необходимо модифицировать, чтобы включить оба вида данных Kd Ld 2 ~ 2 (m) d k R1[m]( k ) (1 ) d l Q[m]( l ) . k 1 (34) l 1 Здесь постоянный коэффициент является весом данных об охватах R1 ( ) , а 1 является весом данных о Q( ) . Мы положили Kd /( Kd Ld ) 5 / 8 . Постоянная Ld 3 обозначает количество точек данных о Q( ) для текущего момента времени. 105 25% 25% R1(τ) Q(τ) 20% 20% 20% 18% 16% 15% 15% Данные ФОМ (осень 2005 г.) 12% 17% 10% 14% 10% Данные РОМИР (IV квартал 2005 г.) 6% 5% 5% τ 0% 0 30 60 90 5% τ 0% 120 150 180 210 0 7 14 21 28 35 42 Период измерений (дни) Период измерений (дни) Рис.2.3. Результаты расчетов при помощи модели аудитории A3, состоящей из трех сегментов Оптимальные параметры, минимизирующие функцию (34), оказались равны 1 1 1,293 суток , r1 6,1% , 1 2 0,129 суток , r2 8,9% , 3 0,04 суток 1 , r3 8,9% . Число свободных параметров (шесть) приблизилось к объему данных, которыми мы располагаем: пятью измерениями ФОМ и тремя измерениями РОМИР. Если данные РОМИР (или аналогичные данные ВЦИОМ или Левада центра о Q( ) ) для интересующего нас момента времени окажутся недоступны, то число неизвестных параметров модели превысит число точек данных. Таким образом, недостатком модели A3 является то, что она не в любой момент времени может быть обеспечена данными массовых опросов. Поэтому в случае применения A3 с целью прогнозирования охватов R1 ( ) некоторые параметры придѐтся зафиксировать, например, можно зафиксировать 1 1,293 и 3 0,04 . 106 Расчеты показали, что при помощи модели A3 данные ФОМ за осень 2005 г. удается аппроксимировать с формально нулевой погрешностью (см. рис.2.3). Максимальное отклонение от данных РОМИР при этом составит всего лишь 2% населения России. Модель A4. В нашей работе [72] была исследована также модель A4, содержашая четыре сегмента пользователей. Было показано, что если добавить четвѐртый спектральный пик (с 1 / 30 ), то можно найти такую его амплитуду, при которой отклонения от данных РОМИР равны нулю, а отклонения от данных ФОМ не превышают ошибки округления (рис.2.4). Критическим недостатком модели A4, однако, является тот факт, что число свободных параметров в ней (восемь параметров) сравнялось с числом точек данных массовых опросов, полученных в отдельный момент времени. При этом мы не имеем возможности снизить ошибку измерений за счѐт осреднения, например, данных мониторинга за последовательные кварталы, поскольку нашей конечной целью является прогнозирование изменения аудитории во времени, и мы можем жертвовать разрешающей способностью. Нет практического смысла и в увеличении числа точек данных за счѐт увеличения градаций , например, в вопросах респондентам, пользовались ли они Интернетом в последние две недели, три недели, два месяца и т.п., поскольку, на наш взгляд, респонденты не смогут дать точные ответы на такие вопросы. В [72] мы обратили внимание на сходство задачи определения параметров моделей A1-A4 и задачи высокоразрешающего спектрального анализа, то есть определения амплитуд и фаз двух-трех синусоид по короткому отрезку данных при наличии шума. Такая чрезвычайно сильной наблюдений могут неустойчивостью. порождать очень задача известна Малые погрешности в сильно различающиеся данных модели. Нелинейность по параметрам i , значения которых заранее неизвестны и подбираются путѐм минимизации функционала ошибки (30), может приводить к значительной неустойчивости этих параметров, и эти параметры будут сильно 107 различаться в близкие моменты времени. Интерпретация моделей с резко изменяющимися во времени параметрами сегментов пользователей, на наш взгляд, настолько сложна, что полезность этих моделей снижается по сравнению с более простой A3. Таким образом, увеличение числа параметров моделей с дискретными плотностями p( ) свыше шести мы считаем нецелесообразным. 25% 25% R1(τ) Q(τ) 20% 20% 20% 18% 16% 15% 14% 15% Данные ФОМ (осень 2005 г.) 12% 17% 10% 10% 6% 5% 5% τ 0% 0 30 Данные РОМИР (IV квартал 2005 г.) 5% 60 90 τ 0% 120 150 180 210 0 7 14 21 28 35 42 Период измерений (дни) Период измерений (дни) Рис.2.4. Результаты расчетов при помощи модели аудитории A4, состоящей из четырех сегментов Еще более тесная связь существует между задачей аппроксимации R1 ( ) и классической проблемой моментов [13,14] с ограничениями на функцию распределения в виде равенств в нескольких точках. Модель C. В работе [72] мы использовали также кусочно-постоянную модель плотности p( ) с разрывами в заранее фиксированных точках i , при i 1,..., M . Достоинством модели C является непрерывность полученной (кусочно-линейной) аппроксимации функции распределения P( ) . При этом мы не претендовали на определение ―оптимальных‖ частот i , рассматривая модель лишь как способ 108 аппроксимации неизвестной нам P( ) . Свободными параметрами m модели C являются только амплитуды ri R0 pi , но не частоты i . Для охвата аудитории использовалась формула, выведенная в [72]: M exp( i ) exp( i 1 ) R1 ( ; m) i i 1 ri . i 1 (35) Недостаток подхода заключается в том, что для достижения приемлемой точности аппроксимации требуется весьма значительное число M свободных параметров, которое при неудачном выборе i может превышать число точек данных. С целью ―сглаживания‖ ri в работе [72] мы добавили к функции ошибки (31) сумму квадратов первых разностей ri : Kd Ld (m) d k R1 ( k ; m) (1 ) d l Q( l ; m) 2 k 1 2 l 1 M 1 r i 1 i i 1 2 ri , (36) где i − неотрицательные сглаживающие множители. Поскольку функция R1 ( ; m) линейна по неизвестным параметрам ri (см.формулу 35), но на ri наложены ограничения ri 0 , минимизация функции (36) не сводится к решению системы линейных уравнений, а является примером задачи квадратичного программирования. Модель C аппроксимирует данные приблизительно с той же точностью, что и модели A3 и A4 (см. приведѐнную ниже таблицу 2.1). В работе [72] нами показано, что полученные аппроксимации неизвестной функции распределения P( ) оказались ―похожи‖ на аппроксимации при помощи моделей A3 и A4. К сожалению, выбор сглаживающих множителей i существенно зависит от представлений исследователя о том, какого уровня колебания следует подавить в итоговой оценке p( ) . Различные исследователи могут выбрать различные i и, следовательно, получить различные ―оптимальные‖ параметры модели. Так в процесс моделирования вносится субъективизм, который сегодня подвергается критике в литературе, посвящѐнных выбору наилучших моделей. По этой 109 причине мы далее отказываемся от использования модели C в пользу другого непрерывного распределения P( ) , описанного в следующем разделе. Модель D. Смесь отрицательных биномиальных распределений Плотность распределения частоты использования ресурса в модели D описывается смесью двух гамма-распределений, соответствующих сегментам активных и малоактивных пользователей p( ; b1 , 1 , b2 , 2 , w) wb1 Величина r( ) R0 p( ) b1 1 e b (1 w)b b2 1 e b . 2 1 2 1 2 1 (37) 2 изображена в левой половине рис.2.5. Соответствующая функция распределения имеет вид взвешенной суммы регуляризованных неполных гамма-функций (см. формулу (18) 1 P( ; b1 ,1 , b1 ,1 , w) w1 (1 ) b1 1 1 y 0 y 1 e dy (1 w1 ) (2 ) b2 y 2 1 y e dy . (38) 0 Из (24) выводим выражение для первого кумулятивного охвата аудитории 1 2 b b R1 ( ) R0 R0 w 1 R0 (1 w) 2 . b1 b2 (39) Обозначив r1 wR0 , r2 (1 w) R0 , получаем формулу для расчетов охвата 1 2 b b R1 ( ; m) r1 r1 1 r2 r2 2 , b1 b2 (40) где m (b1,1, r1, b2 ,2 , r2 ) − совокупность свободных параметров модели. Таблица 2.1. Сравнение ошибок моделей Модель Количество свободных параметров Количество точек данных Максимальное отклонение от данных ФОМ * Максимальное отклонение от данных РОМИР* A1 2 5 -2,9% 5,0% A2 4 5 -0,7% 6,1% A3 6 8 0,0% 2,0% A4 4 8 0,6% 0,0% C 20 8 1,2% 1,2% 110 D * 6 8 0,5% 0,2% в процентах взрослого населения РФ Минимизируя функцию ошибки вида (34) по m , мы получили параметры модели D, описывающие данные опросов ФОМ и РОМИР за осень 2005 года. Оптимальные параметры модели ―активного‖ сегмента: r1 =14,4% взрослого населения РФ, b1 =1,8 суток, 1 =1,00. Оптимальные параметры модели ―малоактивного‖ сегмента: r2 =7,8% взрослого населения РФ, b2 =75 суток, 2 =1,00. Таким образом, в модели D активный сегмент составляет около двух третей всей аудитории и состоит из лиц, посещающих Интернет в среднем раз в 1,8 суток. Однако параметр не совпадает у всех представителей этого сегмента, как в моделях A1-A4, а распределѐн в широком диапазоне . Объѐм малоактивного сегмента немного превышает треть аудитории. На рис.2.5 результаты расчетов по модели D сравниваются с данными ФОМ и РОМИР. В обоих случаях ошибка составляет менее процента населения РФ. Таким образом, модель D не уступает модели A3 по аппроксимации эмпирических данных о R1 ( ) и Q( ) . пользу модели D является тот факт, что функция r( ) R0 p( ) точности Вторым аргументом в на рис.2.5 внешне оказалась похожа на приведѐнные в следующих разделах эмпирические данные об аудитории WWW-сайтов, которые получены при помощи онлайн-панелей логфайлов серверной аппроксимации статистики. распределения Как показывает частоты − табл. при 2.1, два помощи способа дискретного распределения (модель А3) и при помощи непрерывного распределения (модель D), каждый из которых требует шесть свободных параметров, с равной точностью описывают данные опросов ФОМ и РОМИР. Решить вопрос о том, какой способ аппроксимации удачнее, т.е. позволяет приблизить истинное распределение частоты , используя меньшее число свободных параметров, можно было бы, если бы можно было измерить не только первую кумулятивную 111 кривую охвата аудитории Интернета R1 ( ) , но и несколько последующих – R2 ( ) , R3 ( ) и т.п., которые изображены на рис.2.6. 3,0 r(λ) 20% 17% 2,5 Q(τ) 14% 15% 16% 2,0 R1(τ) 12% 1,5 10% 1,0 6% 5% 0,5 5% 0,00 0,25 0,50 0,75 1,00 1,25 1,50 1,75 2,00 2,25 0,0 0% 0 7 14 21 28 35 Период измерений (дни) Интенсивность использования (раз в сутки) Рис.2.5. Результаты расчетов при помощи модели аудитории D, состоящей из двух сегментов с непрерывными распределениями P ( ) . Использованы данные РОМИР и ФОМ за осень 2005 г. Рис. 2.6 иллюстрируют весьма заметные различия между кривыми охвата аудитории высших порядков. В кривых охвата для модели A3, использующей ―дискретное‖ распределение частоты (левая половина рис.2.6), наблюдаются отчетливые ―ступеньки‖ или ―полочки‖, происхождение которых детально обсуждается в нашей статье [72]. В кривых охвата для модели D (правая половина рис.2.6) ступеньки отсутствуют. Если бы были доступны данные измерений Rk ( ) для больших значений k , то для того, чтобы выяснить, какая модель, A3 или D, лучше аппроксимирует неизвестное нам P( ) , достаточно было бы измерить Rk ( 1 ) лишь при одном, достаточно большом, значении времени 1 . Подобные данные предоставляют так 112 называемые ―онлайн-панели‖, рассмотренные в следующем разделе. Однако наше изучение данных онлайн-панелей показало, что такие панели репрезентируют не всех пользователей Интернета, а лишь наиболее активную их часть. A Rk(t) 20% 20% R1 B Rk(t) 20% 20% R2 16% R5 15% R20 R7 R10 10% R2 R3 R5 R7 R10 R20 16% R3 15% 12% R25 R15 12% R30 10% R30 Модель A3 (три дискретных пика) 5% R1 18% 18% Модель D (непрерывное распределение) 5% t (дни) t (дни) 0% 0% 0 30 60 90 120 150 180 0 30 60 90 120 150 180 Рис.2.6. Кумулятивные кривые охвата аудитории Rk ( ) для моделей с дискретным (A) и непрерывным (B) распределением . К сожалению, при помощи массовых опросов измерить охваты аудитории Интернета высших порядков память респондентов не Rk ( ) хранит не представляется возможным, поскольку необходимых данных. Действительно, респондентам сложно вспомнить, за какой период они выходили в Интернет два раза, три раза и так далее. Чтобы измерить Rk ( ) , можно было бы использовать дневниковые записи специально подготовленных членов панели, однако, такой сповоб измерений, вероятно был бы слишком дорог. Альтернативой являются данные онлайн-панелей, которые позволяют инструментально измерить аналоги кумулятивных кривых высших порядков. Действующие в России панели TNS, Gemius, КОМКОН-SpyLOG, LiveInternet и др. позволяют получить такие данные. 113 В следующем разделе будет продемонстрирован непараметрический способ оценки распределений интенсивности использования информационных ресурсов на основе данных онлайн-панелей. Строго говоря, мы не можем отвергнуть предположение, что распределение частоты использования Интернета является дискретным. Однако, мы предполагаем, что люди ведут себя сходным образом при использовании Интернета и отдельных информационных ресурсов, поэтому будем аппроксимировать p( ) в обоих случаях смесями непрерывных распределений. 3,0 r(λ) 46% 50% 2,5 2,0 40% 1,5 30% 1,0 20% 0,5 10% 0,0 0% 48% R1(τ) 52% 44% 38% 0,00 0,25 0,50 0,75 1,00 1,25 1,50 1,75 2,00 2,25 Q(τ) Интенсивность использования (раз в сутки) 32% 0 7 14 21 28 35 Период измерений (дни) Рис.2.7. Слева – плотность p( ) в модели D. Справа − результаты расчетов при помощи модели D. Использованы данные ФОМ (кружки) и ВЦИОМ (треугольники) за осень 2010 г. Тестирование модели D на данных за 2008 и 2010 гг. Как отмечалось выше с лета 2007 года публикация данных РОМИР о Q( ) прекратилась. На секции IV социологического конгресса в 2012 году президент холдинга РОМИР, А.В.Милѐхин, сообщил автору данной работы, что в связи с отсутствием коммерческого спроса прекращѐн и сбор данных об интенсивности 114 использования Интернета. Тем не менее в той же форме, что и РОМИР (или в весьма близкой форме), вопросы респондентам продолжают задавать две другие организации – ВЦИОМ и Левада-центр. Мы повторили расчѐты по модели D для данных за осень 2008 г. и осень 2010 г., используя совместно данные ВЦИОМ о Q( ) и ФОМ об охватах R1 ( ) . Эти тесты показали удовлетворительное согласование расчѐтных и эмпирических данных. Рис.2.7 позволяет удостовериться в удовлетворительном совпадении данных опросов за осень 2010 г. с результатами расчѐтов по модели D. Таким образом, по итогам тестирования за разные моменты времени, отстоящие друг от друга на пять лет, что сравнимо с интересующим нас горизонтом прогнозирования, мы заключаем, что модель D способна одновременно описать как данные об охватах R1 ( ) , так и данные о Q( ) . Таким образом, для прогнозирования данных массовых опросов об охватах R1 ( ) мы выбираем модель D, а не A3, исходя из принципа совместимости: 1) модели с непрерывными удовлетворяют данным распределениями панельных p ( ) лучше исследований крупных простейшего потока, информационных ресурсов; 2) Гамма-распределение параметра характеризующего индивидов, широко используется в моделях поведения потребителя и в медиаметрии уже более пятидесяти лет, начиная с пионерской работы Э.Эренберга [359,332]. 2.1.2 Прогнозирование динамики охватов аудитории сети Интернет на основе разработанной количественной модели Квазистационарная модель динамики R1 ( ; m(t )) Предыдущая часть этой главы была посвящена построению модели охвата аудитории R1 ( ) в некоторый отдельно взятый момент времени t . В этом разделе мы построим модель охватов аудитории для последовательности моментов времени. Мы используем данные опросов ФОМ в Москве за каждый квартал с 115 2002 по 2010 г. Здесь разумно использовать для охватов обозначение R1 ( ; m(t )) , где обозначает интервал времени (сутки, неделю, месяц, квартал и полгода), а t – момент проведения опроса. Аппроксимация исторических данных Поскольку в описанной выше модели D, которую мы хотели бы использовать, шесть свободных параметров (см. формулу 40), а опросы ФОМ предоставляют лишь пять точек, мы зафиксировали значения трѐх параметров: b1 =0,08 суток (12 раз в сутки), 1 =1,00, 2 =1,00. Таким образом, мы используем редуцированную версию модели D, которую будем обозначать E. Cвободными в модели E остаются лишь параметры: r1 (t ) , r2 (t ) и b2 . Первоначально мы позволяли параметру b2 изменяться во времени используя упрощѐнную версию модели динамики установки индивида (предрасположенности к определѐнному виду поведения), развиваемую школой Ю.А.Гаврильца [44]. Однако итоговый прогноз, построенный на основе такого подхода, оказался менее точным (на трѐхлетнем горизонте), чем прогноз, построенный в первой главе данной работы на основании эвристической многостадийной модели (см. рис.1.25). Мы предположили, что причина ухудшения точности прогноза состоит в чрезмерном количестве неизвестных величин, требующих прогнозирования. Поэтому в модели E параметр b2 хотя и является заранее неизвестным, но должен быть один и тот же для всех моментов времени. Плотность распределения в модели E является смесью двух экспонент p(; b1 , b2 , w) w(t )b1e b1 (1 w(t ))b2 e b2 . (46) Обозначив r1 (t ) w(t ) R0 (t ) , r2 (t ) (1 w(t )) R0 (t ) , для каждого момента измерений t перепишем формулу (40) для расчета охвата аудитории в виде R1 ( ; m(t )) b1 r1 (t ) b2 r2 (t ) , (47) где m(t ) (b2 , r1 (t ), r2 (t )) − совокупность свободных параметров модели, которые различаются для различных моментов времени t . 116 Положив, как указано выше, b1 =0,08 суток, мы фактически постулируем, что активная аудитория использует Сеть так часто, что еѐ кривая кумулятивного охвата вырождается в ступень амплитудой r1 (t ) , и формулу охвата можно приближѐнно записать в виде b R1 ( ; m(t )) r1 (t ) r2 (t )1 2 b2 . (48) Этот приѐм сближает нашу модель с моделью Ж.-П.Шандона, описанной в следующем разделе данной главы, и имеет ту же цель: повысить устойчивость оценки параметров модели при малом объѐме данных. 75% Доля россиян Вся аудитория 50% Активная аудитория 25% Малоактивная аудитория окт-2014 окт-2013 окт-2012 окт-2011 окт-2010 окт-2009 окт-2008 окт-2007 окт-2006 окт-2005 окт-2004 окт-2003 окт-2002 окт-2001 0% Рис.2.8. Динамика активной и малоактивной аудитории в России в 2001-2010 гг. и прогноз на основе модели E Подход, который мы при этом используем, можно назвать квазистационарным, поскольку при выводе формул для охватов предполагалось, что параметры r1 и r2 не зависят от времени, а при моделировании данных мы позволяем этим параметрам принимать различные значения в различные моменты времени t . Нестационарные модели в медиаметрии чрезвычайно редки, отметим 117 здесь работу [453]. Мы считаем описанный подход допустимым, если общий объѐм аудитории изменяется лишь на несколько процентов на протяжении полугода, т.е. периода измерений кумулятивной кривой. Кроме того, мы форсируем ―плавность‖ колебаний параметров модели EV во времени, добавив к функционалу ошибки слагаемое, зависящее от амплитуды различий в параметрах, подобно тому, как это было сделано в модели C I 1 I 1 i 1 i 1 2 ~) (m d k ,i R1 ( k ; m(ti )) i 2 r1 (ti 1 ) r1 (ti )2 i 3 r2 (ti 1 ) r2 (ti )2 , I Kd i 1 k 1 (49) где вектор всех переменных параметров (включающих все моменты времени) ~ (m(t ), m(t ),..., m(t )) . обозначен m 1 2 I На рис.2.8 оценки объѐма активной части аудитории r1 (t ) российского Интернета в 2002-2010 гг. показаны сплошными кружками, а малоактивной r2 (t ) – открытыми треугольниками. Сплошными линиями на рис.2.8 показаны результаты прогнозирования r1 (t ) и r2 (t ) , и полной аудитории x(t ) r1 (t ) r2 (t ) ; методика соответствующей процедуры прогнозирования описана ниже. Моделирование данных опросов ФОМ в России за 2002-2010 гг. при помощи модели E показывает (рис.2.8), что в 2002 г. малоактивная аудитория существенно превосходила активную, однако к середине 2009 года оба сегмента сравнялись по величине, после чего активная аудитория росла, а малоактивная – убывала. Таким образом, существует переток аудитории из малоактивного сегмента в активный. На рис.2.8 объѐм активной аудитории следует за объѐмом полной аудитории, подобно тому, как на рис.2.3 количество абонентов Интернета следовало за количеством пользователей. Сделанное наблюдение позволяет предположить, что для моделирования динамики активной аудитории достаточно весьма простой многостадийной модели, которая может содержать существенно меньше параметров, чем модель, использованная в последнем разделе первой главы. Прогнозирование охватов аудитории 118 Модель E позволяет оценить объѐмы активной и малоактивной аудитории в прошлом, но не содержит средств прогнозирования ни этих величин, ни охватов R1 . Для решения задачи прогнозирования охватов аудитории, построим модель F, которая включает в себя модель E и многостадийную моделью использования Интернета, рассмотренную в последнем разделе первой главы. В этой многостадийной модели оставим лишь два класса (две крайние слева вертикальные последовательности на рис.1.24), соответствующие малоактивным и активным пользователям. Система уравнений баланса из первого раздела данной главы данной работы в данном случае будет содержать лишь три уравнения: x1,1 g1 (t, ) x1,1 (t , ) x1,1 f 1,1 (t, ) t x1,2 g1 (t, ) x1,2 (t, ) x1,2 f 1,2 (t , ) t (50) x 2,2 g1 (t, ) x1,2 (t , ) x 2, 2 f 2,2 (t, ) . t Добавим несколько упрощающих предположений. Во-первых, в формуле для интенсивностей переходов f i , j i , j (t , )h( t , ) y ( t , ) , положим все i , j (t , ) постоянными величиными, тогда f i , j i , j h(t , ) y (t , ) . (51) Пренебрегая воспроизводством населения, обозначим x(t ) − долю пользователей в населении рассматриваемого региона, а (t ) dx / dt − скорость притока новых пользователей. Затем, используя функции риска в форме g (t, ) ~p q~x 2,2 (t ) , запишем уравнения для сегментов в виде x1,1 1,1 (t ) t x1,2 ( ~ p q~x 2,2 (t )) x1,2 1,2 (t ) t x 2,2 (~ p q~x 2,2 (t )) x1,2 2,2 (t ) . t (52) 119 Поскольку новая аудитория должна целиком распределяться по сегментам, неотрицательные величины i, j связаны уравнением 1,1 1,2 2,2 1 . (53) Чтобы это условие выполнялось автоматически, введѐм вспомогательные параметры и , так чтобы выполнялись равенства 1,1 sin 2 , 1,2 cos 2 sin 2 , 2,2 cos 2 cos 2 . (54) Таким образом, в модели F лишь восемь свободных параметров: ~ , b , x1,1 (0) , x1,2 (0) , x 2,2 (0) ). m ( , , ~p , q 2 (55) Легко видеть, что малоактивную аудиторию составляют два подмножества состояний, возможных в многостадийной модели ( x1,2 (t ) и x1,1 (t ) ), а активную – только один ( x 2,2 (t ) ) r1 (t ) x1,1 (t ) x1, 2 (t ) (56) r2 (t ) x 2, 2 (t ) . Совокупность свободных параметров (55), скорость притока новых пользователей (t ) (как внешняя переменная) и уравнения (47), (52), (54), (56) составляют математическое описание модели F. Несложно вывести уравнения непосредственно для объѐмов активного и малоактивного сегмента. Достаточно заметить, что из первого уравнения системы (52) немедленно вытекает x1,1 (t ) x1,1 (0) 1,1 x(0) 1,1 x(t ) . (57) Обозначив с x1,1 (0) 1,1 x(0) , из (52) и (56) получаем два уравнения dr2 (~ p q~r2 )(1 1,1 ) x(t ) c r2 2,2 (t ) , dt dr1 ( ~ p q~r2 )(1 1,1 ) x(t ) c r2 ( 1,1 1,2 ) (t ) . dt (58) (59) Поскольку r2 (t ) x(t ) r1 (t ) , и x(t ) − известна, достаточно решить уравнение (58). Оно отличается от привычных уравнений многостадийных моделей, рассмотренных в первой главе, только наличием слагаемого 2,2 (t ) . Это слагаемое появляется, поскольку в модели F допускаются не только переходы 120 между соседними состояниями, но и ―перескок‖ нового пользователя через ―малоактивное‖ состояние напрямую в ―активный‖ сегмент. Оптимальные значения параметров модели были найдены при помощи минимизации функции ошибки вида 2 ~) (m d k ,i R1 ( k ; m(ti )) . Kd I (60) i 1 k 1 Оптимальные значения параметров модели F оказались равны: ~ 4,8( г од1 ) , b 5,7(дней ) , m* ( 0,38 , 1,26 , ~p 0,0 , q 2 x1,1 (0) 6,9% , x1,2 (0) 0,0% , x 2,2 (0) 1,6% ). Рассмотрение значений параметров 1,2 0,78 , 1,1 0,14 , 2,2 0,08 , подсказывает, что новые пользователи первоначально пополняют, в основном, малоактивный сегмент ( 1,2 0,78 ), однако, благодаря значительному влиянию активных пользователей ( q~ 4,8( г од1 ) ), быстро переходят в активный сегмент. Таким образом, сделанное в первой главе предположение, что все новые пользователи поступают в малоактивный сегмент, не является грубо ошибочным. 100% Доля взрослых россиян, пользовавшихся Интернетом хотя бы раз за последние 80% сутки 60% неделю месяц 40% полгода 20% янв-2015 янв-2014 янв-2013 янв-2012 янв-2011 янв-2010 янв-2009 янв-2008 янв-2007 янв-2006 янв-2005 янв-2004 янв-2003 янв-2002 0% 121 Рис.2.9. Прогноз полугодового, месячного, недельного и суточного охватов аудитории Интернета в России при помощи модели F. Прогнозируемые значения r1 (t ) показаны тонкой линией на рис.2.8, r2 (t ) − жирной пунктирной линией. Найденные ранее r1 (ti ) и r2 (ti ) изображены открытыми треугольниками и закрашенными кружками соответственно. Итогом применения модели F является прогноз охватов R1 суточной, недельной, месячной и полугодовой аудитории Интернета в России, представленный на рис.2.9. Сплошными символами представлены данные опросов ФОМ, которые были доступны автору на момент построения прогноза, а открытыми символами – новые данные. Разработанная здесь модель F обладает двумя важными преимуществами по сравнению с моделью, описанной в последнем разделе первой главы. Во-первых, эта модель теоретически обоснована, поскольку описывает поведение пользователя при помощи потока событий, в то время как старая модель фактически подавала охваты аудитории на вход ―чѐрного ящика‖. Во-вторых, в модели F пользователей достаточно разделить лишь на два сегмента, в то время как в прежней модели их было четыре. Соответственно, в модели F оказыватся на один свободный параметр меньше, что делает еѐ потенциально устойчивее. При этом, как показывает сравнение рис.1.25 и рис.2.9, прогнозы, построенные при помощи двух моделей, оказались чрезвычайно близки. Недостатоком модели F (как и всех моделей данной главы) с точки зрения скорости еѐ разработки и практического применения в условиях дефицита времени можно счесть необходимость привлечения теории потоков событий, т.е. своего рода теоретический ―барьер‖, который необходимо преодолеть исследователю. Пользователю модели, желающему избежать знакомства с теорией потоков событий, можно предложить следующий подход к прогнозированию охватов аудитории. Предполагается, что аудитория состоит из двух сегментов. Охваты аудитории этих сегментов пропорциональны неубывающим функциям Rˆ1,1 ( ) и 122 17 Rˆ1, 2 ( ) . Объѐмы сегментов, r1 (t ) и r2 (t ) меняются во времени и могут быть описаны при помощи описанной нами многостадийной модели. Такой подход может оказаться работоспособен и в том случае, когда поведение пользователя описывает не простейший поток, а поток с последействием, например, поток Эрланга второго порядка. 5,0 R0p(λ) 50% 2010 год 4,0 R1(t) 40% 3,0 30% 2,0 20% 1,0 2002 год 10% 0% 2,5 2,0 1,5 1,0 0,5 0,0 0,0 0 7 14 21 28 35 42 49 56 63 70 Период измерений (дни) Интенсивность использования (раз в сутки) Рис.2.10. Слева – плотность p( ) в модели H. Справа − результаты расчетов охватов аудитории при помощи модели аудитории H. Использованы данные ФОМ (кружки) за осень 2002 г. и осень 2010 г. С нашей точки зрения, в условиях, когда наилучший способ аппроксимации p ( ) неизвестен, для повышения надѐжности прогнозирования можно использовать несколько аппроксимаций p( ) , а затем осреднить полученные с их помощью прогнозы. 17 В частности, можно выбрать Rˆ1,i 1 exp( i ) , и, таким образом, взять за базовую модель поведения пользователя модель A2. Как было показано выше, эта модель удовлетворительно описывает данные опросов ФОМ. 123 В качестве примера испытаем аппроксимацию p( ) при помощи той же смеси гамма-распределений (37), но зафиксируем и оставим свободными иные параметры, что в модели F. Положим в (40) b1 b2 b 8,5(дней ) и оставим свободными параметры 1 и 2 . Формула для расчѐта охватов приобретѐт вид 1 2 b b R1 ( ; m) r1 r1 r2 r2 . b b 75% (61) Доля россиян Вся аудитория 50% Активная аудитория 25% Малоактивная аудитория окт-2014 окт-2013 окт-2012 окт-2011 окт-2010 окт-2009 окт-2008 окт-2007 окт-2006 окт-2005 окт-2004 окт-2003 окт-2002 окт-2001 0% Рис.2.11. Динамика активной и малоактивной аудитории в России в 2001-2010 гг. и прогноз на основе модели H В полученной модели H девять свободных параметров, т.е. на один больше, чем в модели F. Оптимальные значения параметров модели H оказались равны ~ 3,4( г од1 ) , 1,0 , 15,2 , m* ( 0,0 , 1,16 , ~p 0,0 , q 1 1 x1,1 (0) 4,7% , x1,2 (0) 2,6% , x 2,2 (0) 1,4% ). Аппроксимация плотности p( ) показана на рис.2.10, здесь активный и малоактивный сегменты, в отличие от модели F почти не перекрываются (в сравнении со значительным их перекрытием на рис.2.5 и 2.7). 124 Новая аудитория распределяется в соответствии со значениями коэффициентов 1,2 0,84 , 1,1 0,0 , 2,2 0,16 . Таким образом, в модели H величина x1,1 (t ) не меняется во времени, составляя 4,7% . Объѐм малоактивного сегмента может составлять существенную величину, поскольку параметр влияния активных пользователей q~ − ниже, чем в модели H, однако весьма быстро снижается до 4,7% населения уже к 2015 году (рис.2.11). Сравнение рис.2.11 с рис.2.8 показывает, что динамика объѐма малоактивного сегмента r1 (t ) убывает значительно быстрее, чем в модели F. Несмотря на различия в оценках r1 (t ) и r2 (t ) , результаты прогнозирования охватов R1 при помощи модели H, представленные на рис.2.12, практически совпадают с полученными при помощи модели F. 100% Доля взрослых россиян, пользовавшихся Интернетом хотя бы раз за последние 80% сутки 60% неделю месяц 40% полгода 20% янв-2015 янв-2014 янв-2013 янв-2012 янв-2011 янв-2010 янв-2009 янв-2008 янв-2007 янв-2006 янв-2005 янв-2004 янв-2003 янв-2002 0% Рис.2.12. Прогноз полугодового, месячного, недельного и суточного охватов аудитории Интернета в России при помощи модели H. Мы заключаем, что вне зависимости от конкретной аппроксимации p( ) при использовании простой многостадийной модели динамики активного и 125 малоактивного сегмента пользователей, а также при небольшом (8-9) совокупном числе свободных параметров, разработанные в этом разделе модели пригодны для прогнозирования охватов аудитории Интернета с горизонтом пять лет. 2.2 Моделирование онлайн-панели при помощи смеси бетабиномиальных распределений Бета-биномиальная модель широко используется в медиапланировании, в частности, для аппроксимации кумулятивного охвата аудитории газет и других медиа. Мы предприняли попытку применить эту модель к данным панельного исследования аудитории крупных Интернет-ресурсов [86,137,142]. К сожалению, классическая бета-биномиальная модель неудовлетворительно описывает данные онлайн-панели. Основных причин – две: различие в поведении ―офисной‖ и ―домашней‖ аудитории, и значительная доля малоактивных пользователей у большинства Интернет-ресурсов. Период наблюдений Количество дней, в течение которых пользователь использовал ресурс 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 1 5327 3991 3794 3464 3124 2496 2427 2314 2277 2137 2148 2022 1933 1863 1856 1859 1784 1724 1683 1635 1618 1606 1595 1606 1577 1557 1571 1579 1552 1571 2 3 4 2772 1924 1886 2446 2303 1697 1704 1597 1445 1439 1408 1434 1450 1414 1320 1309 1311 1333 1343 1299 1276 1264 1234 1239 1250 1225 1204 1213 1177 2125 1437 1374 1812 1808 1627 1582 1302 1196 1190 1150 1070 1014 1078 1036 985 975 937 912 929 881 858 833 790 796 819 826 838 1783 1257 1156 1469 1476 1339 1327 1051 995 914 960 961 879 863 884 887 906 874 866 863 874 862 818 800 762 728 661 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 1579 1088 1438 1041 982 1286 955 936 836 1149 996 876 763 786 1026 1204 954 743 733 725 956 1150 1113 848 714 672 672 873 864 1121 970 793 665 657 593 811 802 866 992 928 712 632 580 572 767 698 777 787 919 841 723 569 564 497 721 754 705 756 855 875 569 620 569 479 467 663 752 737 733 838 826 602 500 593 485 457 427 621 682 723 691 783 717 790 548 498 493 478 426 397 606 719 681 577 756 622 765 660 532 430 478 476 401 386 575 669 676 603 575 678 651 643 627 508 394 459 455 383 375 542 634 693 598 509 581 680 515 614 623 490 368 461 358 392 380 506 667 656 633 483 522 569 624 466 590 596 475 339 403 386 370 372 462 653 643 646 481 487 546 583 553 531 576 437 362 342 416 338 360 358 419 653 649 630 499 465 525 586 537 552 543 416 340 366 346 399 298 364 327 391 632 650 595 515 436 480 550 498 515 583 503 389 296 368 334 387 295 341 309 368 604 615 639 503 436 426 541 441 517 517 527 450 374 306 350 311 386 275 322 303 355 672 581 587 575 402 432 450 450 457 503 477 460 475 341 320 323 351 318 272 315 285 345 670 579 557 566 468 357 449 375 500 392 507 417 471 465 323 298 342 317 300 244 314 265 343 670 541 592 516 443 426 429 336 446 403 478 400 446 427 469 272 332 296 323 274 257 278 267 321 701 548 550 517 460 422 405 351 422 410 434 400 485 411 400 387 250 278 302 310 265 220 289 235 309 724 571 526 517 476 433 389 324 398 443 359 453 462 444 352 345 342 219 268 313 298 235 215 293 216 290 Рис.2.13. Данные онлайн-панели использовании почтового сервиса об 126 Мы внесли два усовершенствования в бета-биномиальную модель. Первое является очевидным – мы вводим два сегмента пользователей, представители первого пользуется ресурсом относительно часто, а второго – редко. Второе усовершенствование заключается в отдельном моделировании поведения офисной и домашней аудитории. Использование информационных ресурсов домашней аудиторией, по-прежнему, описывает бета-биномиальная модель, но для описания поведения офисной аудитории мы исключаем выходные дни, т.е. используем суперпозицию нестационарных потоков. Период наблюдений Количество дней, в течение которых пользователь использовал ресурс 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 1 291 386 450 557 705 861 963 1039 1103 1191 1334 1457 1644 1746 1802 1840 1895 1986 1995 2033 2120 2178 2174 2224 2312 2356 2371 2405 2419 2481 2 0 26 34 43 93 75 118 135 146 184 241 267 282 322 362 391 434 437 479 491 501 525 570 609 648 661 678 687 701 717 3 0 0 9 18 23 62 32 24 39 37 52 73 75 79 81 91 100 110 124 138 150 157 167 174 173 187 190 229 256 268 4 0 0 0 4 11 9 52 55 57 44 22 17 34 32 33 41 45 50 53 46 45 37 46 52 60 58 61 61 64 70 5 0 0 0 0 4 11 6 13 7 21 27 8 3 16 18 15 15 22 15 33 28 38 33 28 29 36 45 50 51 42 6 0 0 0 0 0 4 11 6 11 11 28 33 27 12 4 7 14 15 19 14 22 12 13 15 15 22 26 26 29 36 7 0 0 0 0 0 0 4 11 12 12 8 21 15 19 15 13 14 5 13 16 10 20 22 14 10 8 8 8 8 10 8 0 0 0 0 0 0 0 4 3 8 8 8 24 12 24 18 0 12 11 7 12 10 10 21 23 10 7 6 6 6 9 0 0 0 0 0 0 0 0 4 3 8 8 8 24 19 27 21 6 7 13 14 9 11 0 2 17 14 14 13 6 10 0 0 0 0 0 0 0 0 0 4 3 8 4 10 8 4 28 16 0 1 3 10 10 14 6 3 6 4 6 10 11 0 0 0 0 0 0 0 0 0 0 4 3 8 2 8 8 0 28 27 0 1 1 1 7 15 13 12 12 2 6 12 0 0 0 0 0 0 0 0 0 0 0 4 3 8 2 6 8 0 17 29 0 0 0 1 0 5 3 6 16 13 13 0 0 0 0 0 0 0 0 0 0 0 0 4 3 8 0 6 8 0 14 29 21 21 0 1 0 5 4 4 6 14 0 0 0 0 0 0 0 0 0 0 0 0 0 4 3 8 0 6 11 0 14 22 17 29 3 4 3 5 3 3 15 0 0 0 0 0 0 0 0 0 0 0 0 0 0 4 3 8 0 2 11 8 4 9 10 25 0 1 0 2 0 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3 4 0 0 0 0 0 0 0 0 0 0 0 0 0 8 3 4 0 0 0 0 0 0 0 0 0 0 0 0 0 8 3 4 0 0 0 0 0 0 0 0 0 0 0 2 0 8 3 4 0 0 0 0 0 0 0 0 0 0 3 2 0 8 3 4 0 0 0 0 0 0 0 0 0 6 2 2 0 8 3 4 0 0 0 0 0 0 0 0 4 2 3 0 0 8 3 4 0 0 0 0 0 0 0 13 0 4 2 0 0 8 3 4 0 0 0 0 0 0 15 8 0 4 2 0 0 8 3 4 0 0 0 0 0 33 7 8 2 4 0 0 0 8 3 4 0 0 0 0 3 31 7 8 4 2 0 0 0 8 3 4 0 0 0 1 8 28 8 4 4 2 0 0 0 8 3 4 0 0 1 8 21 11 4 8 0 2 0 0 3 5 3 4 0 3 3 26 11 0 10 2 2 0 0 0 3 5 3 4 Рис.2.14. Данные онлайн-панели использовании онлайн-СМИ об Начиная с 2006 года, несколько исследовательских компаний, в первую очередь – TNS Россия и Gemius, внедряют онлайн-панели в качестве инструмента исследования поведения аудитории крупных проектов российского Интернета. 127 Вне зависимости от того, какой способ используется – ―user-centric‖ или ―sitecentric‖, панель позволяет понять, как люди используют онлайн-ресурс. Панельные измерения сообщают, сколько людей, такого-то возраста и пола, пользовались сайтом за выбранный промежуток времени. При этом в практике медиаизмерений сложился способ, позволяющий избежать уточнения понятия ―использования‖ и связанных с этим вопросов о моментах начала и окончания сессии, в течение которой пользователь использует ресурс. Когда определить такие моменты сложно, вместо этого фиксируют факт наличия или отсутствия использования ресурса в определѐнный день (или иной промежуток времени), подобно отметке в журнале учѐта посещаемости занятий слушателями учебного заведения. Данные панельных измерений, использованные в этой главе, приведены на рис.2.13 для популярного почтового сервиса и на рис.14 для крупного онлайн- Тысячи панелистов СМИ. Почтовый сервис 16 R1 14 4 Онлайн-СМИ R1 R2 R3 12 3 10 8 2 R2 6 4 1 R3 2 0 0 5 10 15 20 25 30 Период наблюдений (число суток) (a) 0 0 5 10 15 20 25 30 Период наблюдений (число суток) (б) Рис.2.15. Кумулятивные охваты аудитории двух ресурсов по данным онлайн-панели: а) портал ―большой тройки‖, б) сайт ежедневной газеты. 128 На рис.2.15 приведены кумулятивные кривые охвата за период от 1 до 30 дней для двух крупных ресурсов Рунета – почтового сервиса и СМИ. По вертикали показано число членов панели, которые использовали ресурс за заданный период времени. Подписаны три первые кумулятивные кривые. В медиапланировании кумулятивные кривые используются с 50-х гг. XX века – в первую очередь для расчета охвата и частоты использования ресурсов при медиапланировании [424,160]. поведении аудитории Рис.2.15 демонстрирует важные различия в почтового портала и крупного онлайн-СМИ. Действительно, хотя аудитория СМИ за месяц составляет 26% аудитории почтового сервиса, по количеству тех, кто побывал на ресурсе два дня за месяц СМИ уступает уже в десять раз. По количеству побывавших три раза – в двадцать. В наших работах [67,103] описана модель поведения пользователя, с учетом смены cookies. Она подробно описана в следующем разделе данной главы. Эта модель предназначена для интерпретации данных онлайн-счетчиков и довольно сложна. Но при использовании онлайн-панели эффект обновления cookies отсутствует, что значительно упрощает модель. В марковской модели с дискретными состояниями и непрерывным временем процесс использования онлайн-ресурса пользователем представляет собой так называемый простейший поток событий. Иными словами: 1. Все сутки являются рабочими днями, а выходные и праздники отсутствуют. 2. Не возникает новых пользователей, а существующие пользователи никогда не отказываются от использования ресурса. 3. Процесс ординарен и не обладает ―последействием‖. В предлагаемой модели поведения аудитории каждый пользователь характеризуется одним параметром – интенсивностью использования ресурса . Если измерения проводятся в дискретные моменты времени, например, один раз в сутки, то простейшей моделью поведения пользователя является 129 последовательность испытаний (схема Бернулли), в которой вероятность обращения к ресурсу в течение суток есть 1 exp( t ) , (1) где t - одни сутки. Известно [424], что вероятность того, что член панели, характеризуемый параметром , будет зарегистрирован счетчиком на изучаемом ресурсе ровно k дней из n , описывается биномиальным распределением n v(k ; n, ) k (1 ) nk . k Здесь 0 , k и n -целые числа, 0 k n , n (2) n! а – биномиальные k k!(n k )! коэффициенты. Предположим, что пользователи могут отличаться своими параметрами : одни используют информационный ресурс – чаще, другие – реже. Предположим, что членов панели так много ( R ), что параметр можно считать непрерывно распределѐнным на отрезке 0 1, и опишем плотность его распределения функцией ( ) . Тогда математическое ожидание доли членов панели, которые зарегистрированы счетчиком на изучаемом ресурсе в точности k дней из n , составит n uˆk (n ) k (1 )n k ( )d . k 0 1 (3) Современные онлайн-панели предоставляют наборы uˆk (n) для весьма широкого диапазона значений n . В частности, мы располагаем данными для n 1,2,...,120 . Непараметрический подход к оценке распределения частоты использования информационного ресурса ~ На рис.2.16 слева изображены охваты аудитории почтового сервиса Rk (n) . При помощи рамки выделены кумулятивные охваты за максимальный период – 30 дней. Стрелки, которые исходят из рамки, показывают, где эти охваты 130 изображены на дополнительную графике к справа. эмпирической График справа функции изображает распределения функцию, параметра . Интерпретировать график следует так: каждая точка изображает число членов панели y , которые использовали ресурс не менее x дней из 30. Теоретически один этот график справа полностью эквивалентен полному набору 30 кривых слева, но только в том случае, если верна гипотеза о том, что поведение каждого Тысячи панелистов пользователя описывает простейший поток событий. Кумулятивные охваты 16 16 14 14 12 12 10 10 8 8 6 6 4 4 2 2 0 0 0 5 10 15 20 25 Период наблюдений (число суток) 30 R1 R2 Эмпирическая функция распределения R4 5101 человек использовал сайт не менее 15 дней из 30 R8 R15 0 5 10 15 20 25 Период наблюдений (число суток) 30 Рис.2.16. Кумулятивным охватам аудитории соответствует функция, дополнительная к эмпирической функции распределения интенсивности использования ресурса. Рис.2.17 иллюстрирует результаты измерений за три периода – 5 суток, 15 суток и 30 суток. При этом масштаб горизонтальной оси приведен к единице. По вертикальной оси отложено количество членов панели (правильнее было бы отложить долю членов панели). Чем больше период наблюдений, тем слабее выражена разница между кривыми, что означает сходимость оценок. 131 Несмотря на простоту и наглядность непараметрического подхода, три его недостатка вынуждают использовать Rk (n) при всех доступных k и n и прибегать к помощи параметрических моделей: 1) Эмпирические распределения не могут учесть эффект выходных дней. 2) Использование информационного ресурса пользователем может и не представлять собой простейшей поток. Если использование информационного ресурса пользователем не является простейшим потоком событий, а является, например, потоком Эрланга некоторого порядка, то график справа, разумеется, тоже будет связан со средними показателями процесса. Однако в этом случае эмпирические кривые Rk (n) могут грубо расходиться с рассчитанными на основе формулы (3). 3) Аудитория информационного ресурса не постоянна во времени. Как в случае еѐ возрастания, так и в случае оттока пользователей, по мере роста n 16 Почтовый сервис 14 12 10 8 Тысячи панелистов Тысячи панелистов эмпирические оценки функций распределения не будут сходиться. 4 Онлайн-СМИ 3 2 30 суток 15 суток 5 суток 6 1 4 2 0 0 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 Вероятность посещения (за сутки) Вероятность посещения (за сутки) Рис.2.17. Эмпирические функции, дополнительные к функции распределения для почтового сервиса и онлайн-СМИ. Квадратики – охваты за 30 суток, треугольники – за 15, кружки – за 5 суток. 132 В силу указанных причин, так же как и в предыдущем разделе данной главы, мы используем параметрическую модель частоты использования информационного ресурса. Параметрический подход к оценке распределения частоты использования информационного ресурса Классическая бета-биномиальная модель была предложена для описания медиаметрических данных Дж.П.Хайетом в 50-е гг. XX века и стала широко известной благодаря статье Р.Мезерингэма [424]. Дж.П.Хайет предложил использовать в качестве смешивающей функции ( ) бета-распределение ( ) 1 (1 ) 1 , ( , ) (4) где и – параметры бета-распределения, B( , ) ─ бета-функция Эйлера. Выражение для uˆk (n) было получено Дж.Скелламом [460] в 1948 году n (k , n k ) uˆk (n ) . ( , ) k (5) Это выражение носит название бета-биномиального распределения. Таким образом, для расчета теоретических кумулятивных кривых достаточно просуммировать величины, рассчитанные по формуле (5): ~ Rk (n) R uˆk (n) uˆk 1 (n) ... uˆn (n) (6) ~ где Rk (n) – k -й кумулятивный (накопленный) охват аудитории за n дней, то есть число членов панели, которые были зарегистрированы на изучаемом ресурсе не менее k дней из n , R – общий объѐм панели. Ж.-Л.Шандон предложил [330] модификацию бета-биномиальной модели, названную им ―двухсегментной бета-биномиальной моделью‖, состоящую из двух сегментов: лояльной (―definite‖) и случайной (―probable‖) аудитории. Для лояльной аудитории 1 , таким образом . Вместо формулы (4) в модели Шандона следует использовать выражение 1 (1 ) 1 , ( ) ( 1) (1 ) ( , ) где – доля лояльной аудитории, а вместо формулы (5) – выражение 133 n (k , n k ) uˆk (n) kn (1 ) , ( , ) k 1 при k n . 0 при k n где использован символ Кронекера kn Модель Шандона содержит лишь три параметра, однако учитывает важную особенность реальной аудитории: наличие лояльных пользователей. П.Данахер разработал алгоритм оценки параметров модели Шандона методом максимального правдоподобия и показал, что отсутствие члена, учитывающего лояльную аудиторию искажает оценки параметров модели [340]. Приведѐнная П.Данахером иллюстрация, однако, содержит заметный скачок амплитудой при p 1 . Фактически Ж.-Л. Шандон и П.Данахер обосновывают актуальность модели Шандона значительной величиной . Если бы была велика, то на рис.2.17 кривые спускались бы не к горизонтальной оси каждого из рисунков, а оставались несколько выше. В свою очередь на рис.2.15 и 2.16 в первый день амплитуда первой кумулятивной кривой должна была бы быть заметно выше, а все uˆn (n) , включая воспользовавшихся ресурсом 30 дней из 30, были бы велики. Мы заключаем, что данные онлайн-панелей не демонстрируют обособленный лояльный сегмент, как требует модель Ж.-Л.Шандона. Поэтому оба сегмента мы моделируем бета-распределениями, но с разными i и i . Для построения удовлетворительной модели в нашей работе, написанной совместно с Т.А.Подлесной [160], и в работе [142] сделаны следующие предположения: (1) Аудитория каждого ресурса состоит из четырѐх сегментов, которые мы условно назовѐм: 1) домашний активный; 2) домашний малоактивный; 3) офисный активный; 4) офисный малоактивный. Доли этих сегментов в общей аудитории ресурса обозначим соответственно w1 , w2 , w3 и w4 . (2) Каждый i -й сегмент характеризуется своими параметрами i и i ( i 1..4 ). (3) Домашняя аудитория состоит из пользователей, которые заходят на сайт со своего домашнего компьютера в любой день недели, в том числе – в выходные и 134 праздники. Офисная же аудитория по выходным и в праздники ресурсом не пользуется. Для офисного активного и офисного малоактивного сегментов в выражении для uˆk (n) следует заменить полное число суток (включающее выходные) n на m(n) , то есть на число рабочих дней, пришедшееся на изучаемый период времени ( n суток). Таким образом мы сталкиваемся с необходимостью использовать дополнительную ось времени, подобно тому, как при изучении эволюции возрастной структуры технологических систем приходится использовать ―эксплуатационный возраст‖ системы, наряду с обычным понятием возраста [236]. Тогда вместо (3) получим n1 k n k (1 ) i ( )d k uˆki ( n ) 01 m( n ) k (1 ) m ( n ) k ( )d i 0 k для i 1,2 , для i 3,4 где i ( ) wi 1 i 1 (1 ) i 1 . (i , i ) Итоговые формулы для частных охватов каждого сегмента uˆk(i ) (n) ( i 1..4 ) даны в таблице 2.2. Таблица 2.2. Формулы частных охватов uˆk (n) Активный Домашний Офисный Малоактивный n (k 1 , n k 1 ) uˆk(1) (1 , 1 ) k n (k 2 , n k 2 ) uˆk( 2 ) ( 2 , 2 ) k m(n) (k 3 , m(n) k 3 ) uˆk( 3) (3 , 3 ) k m(n) (k 4 , m(n ) k 4 ) uˆk( 4 ) ( 4 , 4 ) k Для доли членов панели, которые зарегистрированы счетчиком на изучаемом ресурсе в точности k дней из n , мы предлагаем формулу uˆk (n) w1uˆk(1) (n) w2uˆk( 2) (n) w3uˆk( 3) (n) w4uˆk( 4) (n) . Кумулятивные кривые охвата аудитории рассчитываются по формуле (6). (7) 135 Доля активной аудитории почтового сервиса (рис.2.18) чрезвычайно велика. Значительную часть отклонений наблюдаемых данных от синтетических можно объяснить, если разделить аудиторию на две части, одна из которых (меньшая) не использует ресурс в выходные дни. Можно назвать ее ―офисной‖ аудиторией. Таким образом, предположение о стационарности потока событий, не выполняется, поэтому ни классическая бета-биномиальная модель, ни смесь двух (или большего числа) бета-биномиальных распределений не описывают данные. Требуется построить отдельную модель для ―обычной‖ аудитории, а другую – для ―офисной‖. Как показывает рис.2.18, для описания данных этого уже вполне достаточно. В отличие от рис.2.15, сплошные линии на рис.2.18 – не просто соединительные линии, а теоретические кумулятивные кривые, рассчитанные при помощи моделей, приведенной на рис.2.17. Доля ―офисной‖ аудитории для изученных нами ресурсов оказалась невелика (не более 20% от Почтовый сервис 4 ов лист пане 16 14 12 Онлайн-СМИ ячи Тыс Тысячи панелистов общей). 3 10 8 2 6 4 1 2 0 0 0 5 10 15 20 25 30 0 5 10 15 20 25 30 Рис.2.18 Кумулятивные охваты аудитории двух ресурсов: а) портал ―большой тройки‖, б) сайт популярной газеты. Рис.2.19 позволяет сравнить ―истинные‖ распределения параметра для аудитории почтового сервиса и онлайн-СМИ. Здесь сплошными линиями показаны результаты моделирования при помощи двух бета-распределений. 136 Тонкими линиями с точками – эмпирические функции распределения (те же, что и на рис.2.17). Количество панелистов (тыс.) Почтовый сервис Онлайн-СМИ 20 20 18 18 16 16 14 14 12 12 10 10 8 8 6 6 4 4 2 2 0 0 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Вероятность использования ресурса (за сутки) Вероятность использования ресурса (за сутки) Рис.2.19. Теоретические (жирные линии) и эмпирические распределения (тонкие линии с кружками) интенсивности использования ресурса для почтового сервиса и онлайн-СМИ. Поскольку эмпирические распределения практически совпадают с теоретическими, многие важные для управления аудиторией выводы можно сделать без распределения математического не могут учесть моделирования. эффект Однако выходных дней. эмпирические Кроме того, математические модели нужны для медиапланирования и для обоснованного принятия решений о развитии аудитории сайта. Мы ожидаем, что моделирование кумулятивных кривых охвата аудитории Интернет-ресурсов при помощи смеси бета-биномиальных распределений войдет в состав программного обеспечения для медиапланирования, поэтому проведенные в нашей работе сравнения станут стандартной практикой. 2.3 Модель охвата аудитории информационных ресурсов WWW В 2002–2006 гг. абсолютные величины охвата аудитории Интернета, полученные путем моделирования социологических опросов, широко использовались для и прогнозирования развития российского сегмента Сети 137 [63,48,148,197]. В то же время краткосрочную динамику аудитории Интернета в целом и отдельных ресурсов (т.н. ―сайтов‖) удобнее было изучать при помощи интернет-счетчиков или программ статистической обработки серверных логфайлов [162,147]. В 2007-2008 г. социологический и инструментальный способы измерений охвата аудитории начали резко противоречить друг другу. Счетчики и внутренние статистические системы демонстрировали темпы прироста аудитории — от 40% до 70%, а результаты опросов Фонда «Общественное мнение» (ФОМ), ВЦИОМ, Левада-центра, TNS, не подтверждали такие темпы [48]. В работе [67] нами было проведено сравнение темпов прироста охвата аудитории одного из крупнейших российских Интернет-проектов, вычисленных по данным его собственной статистической системы и с помощью онлайн-панели TNS за 2007-2008 гг. Различия в поведении темпов прироста оказались чрезвычайно велики: по данным панельных исследований они быстро падали, а по данным внутренней статистической системы оставались постоянными и чрезвычайно высокими — около 70% в год. Такие расхождения представляли серьезные затруднения для руководства Интернет-компаний. Непосредственное сопоставление результатов опросов и измерений счетчиков затруднено, в частности, тем, что пользователи время от времени меняют компьютеры, операционные системы, стирают файлы cookies, записанные на их жесткие диски счетчиками [389]. Файлы cookies и есть главный источник сведений об аудитории сайтов. Если период измерений достаточно длинный, например, месяц, то один и тот же пользователь, обновив cookie, может быть учтен счетчиком несколько раз. Ситуация еще более осложняется использованием нескольких браузеров, различных способов выхода в Интернет, а также тем, что на одном компьютере работают разные люди и т.д. Некоторые пользователи отключают cookies, и счетчики пытаются учесть их при помощи IP-адресов и браузеров. Несмотря на то, что пользователей немного, счетчики могут учитывать их заново каждый день, и такой «вклад» в увеличение месячной аудитории окажется заметным. 138 Попытку согласовать разнородные данные предпринял исследовательский комитет ассоциации «Интернет и бизнес» [183,197]. По оценке комитета, по сравнению с концом 2006 г. количество российских пользователей Интернета, посещающих сайты Рунета хотя бы раз в месяц, выросло на 29%. При оценке роста аудитории Интернета в России исследовательский комитет учел значительное число факторов («многобраузерность», большое число мест доступа и прочее) и ввел ряд поправок. В частности, поскольку порталы не публиковали динамику российской аудитории, комитет оценил темпы ее прироста при помощи онлайн-опросов. Проделанная комитетом работа, с нашей точки зрения, важна в первую очередь как иллюстрация реального процесса информационного обеспечения принятия решений, – лица, принимающие решения ожидают от аналитиков разработку таких показателей, которые наиболее выгодным образом описывают деятельность предприятий. Как показано в нашей работе [67], кумулятивные кривые охвата аудитории, построенные по данным социологических опросов и интернет-счетчика, значительно различаются. Кумулятивная кривая, соответствующая результатам опросов, быстро выходит на асимптоту (см. рис. 2.10). Для данных за осень 2005 г. месячная аудитория составляет более 80% полной аудитории Рунета. Отметим, что в более новых данных, собранных весной 2008 г., доля месячной аудитории превысила 90%. Иными словами, в аудитории, измеренной путем опросов, очень мало «редких» пользователей. Напротив, кумулятивная кривая, построенная на основе данных статистики крупного портала, явно далека от выхода на уровень насыщения. Такая кривая продолжает расти с постоянной скоростью. Отметим, что данные популярного счетчика LiveInternet (www.liveinternet.ru) о частоте посещения крупных Интернет-ресурсов, свидетельствуют, что три четверти представителей аудитории портала проводят на страницах даже самых крупных проектов не больше одного дня в месяц. 139 2.3.1 Модель поведения пользователей информационного ресурса WWW В этом разделе мы ограничимся исследованием только одной проблемы из числа перечисленных ранее: эффекта удаления файлов cookies. В связи с этим мы построили построить простейшую модель кумулятивного охвата аудитории, которая учитывала бы эффект смены cookies и удовлетворяла данным наблюдений [83,109], т.е. теоретические кумулятивные кривые для счетчиков. Рассмотрим пользователей, для которых (рис. 2.20) ▪ посещение информационного ресурса описывается простейшим (стационарным пуассоновским) потоком событий с интенсивностью ; ▪ уничтожение файлов cookies описывается также простейшим потоком с интенсивностью . 10 9 8 7 6 5 4 3 2 1 0 k - количество посещений ресурса одним пользователем с момента последней смены cookie 0 10 s0 20 s1 30 40 s2 … 50 sk Время 60 … Рис.2.20. Вверху − количество посещений ресурса одним пользователем с момента последней смены cookie. Внизу − граф состояний актуальных уникальных пользователей. 140 Для простейшего потока событий вероятность наступления нового события не зависит от предшествующей истории, интенсивность потока не меняется со временем, а события происходят поодиночке, а не «пачками» [37]. Мы используем такую модель поведения пользователей по причине ее простоты и возможности легко получить явные выражения для абсолютного охвата аудитории Rk (t; , ) . Отметим, что рассматриваемый случайный процесс не образует потока однородных событий, поскольку использование ресурса и смена cookies являются разнородными событиями. Дискретная случайная величина k , равная количеству посещений информационного ресурса пользователем после последней смены cookie, может не только возрастать, но и падать скачком до нуля, а потом возрастать снова (см. верхнуюю часть рис.2.20). Таким образом теория входящих потоков однородных событий, которая использовалась в предыдущих разделах нашей работы, не применима к данной задаче. Обозначим p( , ) плотность распределения (п.р.) числа пользователей, посещающих ресурс с интенсивностью и стирающих cookie с интенсивностью . Сначала мы должны найти кумулятивные кривые Rk (t; , ) для заданных значений , периода измерений t и числа визитов k. Эти кумулятивные кривые описывают численность уникальных пользователей (далее — у.п.), т.е. cookies, пользовательских профилей и иным способом определенных пользователей (например, при помощи IP-адреса и браузера), которые в течение времени t были зарегистрированы статистической системой не менее, чем k раз. Общие кумулятивные кривые являются линейной суперпозицией таких решений: Rk (t ) p , Rk (t; , )dd . (1) 0 0 Пусть общая аудитория российского Интернета составляет R пользователей и постоянна во времени (решение для монотонно неубывающей аудитории может быть получено при помощи свертки во временной области). 141 Чтобы рассчитать абсолютные охваты аудитории Rk (t; , ) , требуются вспомогательные u k (t; , ) величины — численность актуальных у.п. (уникальных пользователей, cookies, пользовательских профилей), которые: ▪ в течение времени t были зарегистрированы счетчиком ровно k раз; ▪ «живы» в момент t . В частности, u0 (t; , ) — это численность актуальных у.п., которые за время t еще не были зарегистрированы счетчиком; u1 (t; , ) — численность актуальных у.п., которые за время t были зарегистрированы счетчиком ровно один раз, и т.д. Все эти профили актуальны («живы») в момент t . В отличие от u k (t; , ) , охваты Rk (t; , ) включают и те cookies, которые после регистрации были уничтожены и больше уже не появятся. Множества сгруппированных таким образом актуальных у.п. не пересекаются. В любой момент времени верны уравнения баланса u (t; , ) R . k 0 k (2) В начальный момент времени: u0 (0; , ) R u1 (0; , ) u2 (0; , ) ... uk (0; , ) ... 0 (3) Численности актуальных у.п. связаны посредством уравнений (с точностью до амплитуды совпадающих с уравнениями Колмогорова [37] для вероятностей): du0 R u0 dt duk uk 1 uk dt ... Отметим, что величины uˆk (t; , ) (4) 1 uk (t; , ) есть вероятности регистрации R пользователя (из данной группы, характеризуемой параметрами и ) счетчиком ровно k раз за время t . 142 Для начала проинтерпретируем второе уравнение. Число актуальных у.п., зарегистрированных ровно один раз, прирастает за счет регистрации «новых», ранее не регистрировавшихся актуальных у.п. и убывает как за счет повторной регистрации части этих «уникальных пользователей» (с интенсивностью ), так и за счет уничтожения другой их части (с интенсивностью ). Аналогично интерпретируются третье и все последующие уравнения. Первое уравнение интерпретируется несколько иначе. Прирост «свежих», не зарегистрированных актуальных у.п. обеспечивается «смертностью» всех групп актуальных у.п. (т.е. уничтожением cookies). Некоторая часть «новорожденных» актуальных у.п. уничтожается еще до регистрации. В частности, пользователь может установить новую операционную систему, а затем обнаружить сбой в работе программного обеспечения и переустановить систему снова, не будучи зарегистрированным счетчиком. Связи между состояниями а.у.п. иллюстрирует нижняя половина рис.2.20. Вывод решений для а.у.п. при помощи преобразований Лапласа дан в нашей работе [72]. Решения можно выразить в следующем компактном виде k f (t; ) Fk 1 (t; ) , uk (t; , ) R k 1 k 1 где f k (t; ) ( ) ( )t k 1 e t k 1! (5) (6) — плотность распределения (п.р.) Эрланга k-го порядка; k 1 ( )t m m 0 m! Fk (t; ) 1 e t (7) — функция распределения (ф.р.) Эрланга k-го порядка. Выражение (5) легко вывести при помощи вероятностного подхода. Вероятность того, что а.у.п. не сменит cookie за время t составляет e t . Вероятность того, что а.у.п. за время t зарегистрирован счѐтчиком k раз, при условии, что эта а.у.п. не сменил cookie, составляет ( t ) k t e . k! 143 Соответственно, вероятность того, что а.у.п. за время t зарегистрирован счѐтчиком k раз и не сменил cookie, вычисляется как произведение ( t ) k t k t e e f k 1 (t; ) . k! ( ) k 1 Умножив на R , получаем первое слагаемое в правой части формулы (5). Однако а.у.п. может и сменить cookie после обращения к ресурсу. На малом отрезке времени [t , t ] один а.у.п. успеет сменить cookie раз. Вероятность того, что а.у.п. сменил cookie на отрезке [t , t ] , а затем в период [t , t ] был зарегистрирован счѐтчиком k раз, уже не меняя cookie, есть k f k 1 ( ; ) . ( ) k 1 Проинтегрируем это выражение по и умножим полученную сумму на R . Результатом является второе слагаемое в правой части формулы (5). Перейдем к расчету охватов Rk (t; , ) . Численность у.п., зарегистрированных не менее k раз, пополняется только за счет актуальных у.п., зарегистрированных не менее k 1 раз: dRk uk 1 (t; , ) dt (11) Для вычисления Rk , перепишем выражение для ф.р. Эрланга k-го порядка Fk (t; ) 1 1 k f m (t; ) m1 (12) Число «живых» cookies, зарегистрированных ровно k раз за время t, приобретает вид u k (t; , ) R k k f m (t; ) f k 1 (t; ) k 1 m1 (13) Используя связь между п.р. и ф.р., искомые охваты запишем в виде Rk (t; , ) R k ( ) k k 1 Fm (t; ) Fk (t; ) t m1 (14) Эта формула использовалась нами в работах [67,83,103,109], позже мы нашли гораздо более простое выражение, которое приводим здесь без доказательства 144 k Rk (t; , ) R k Fk 1 (t; ) . (1 t ) Fk (t; ) k Покажем, что знать одну лишь кумулятивную кривую охвата R1 (t ) недостаточно, ибо одну и ту же кривую R1 (t ) можно описать разными моделями. Охват аудитории (млн. пользователей) 10 R1 8 6 R2 4 R3 2 R4 R5 0 0 7 14 21 28 35 Период измерений (количество суток) Рис.2.21. Накопленные охваты зарегистрированных не менее k раз за период t «уникальных пользователей» Rk (t ) . Сплошная линия – результаты расчетов, треугольники реальные данные за 2005 г. Однородная модель Кумулятивный охват аудитории, соответствующий модели, состоящей из одного сегмента пользователей, имеет вид R1(1) (t; , ) R 2 1 exp t . tR 2 (15) Рис. 2.21. иллюстрирует накопленные охваты аудитории Rk (t ) , рассчитанные для значений параметров 1 / 7 суток 1 , 1/16 суток 1 , R 5,0 млн. человек. 145 Однако полученные значения параметров представляются неправдоподобными. Особенно неправдоподобно частой выглядит смена cookies, производимая каждые две недели, что противоречит опубликованным данным [183,389]. Модель с двумя сегментами пользователей без смены cookies Кумулятивный охват аудитории, состоящей из двух сегментов: ―активного‖ сегмента и сегмента ―бесконечно редких‖ пользователей, которые используют ресурс бесконечно редко, может быть представлен в виде: l2 lm 1 exp l mt R1( 2 ) (t; l , m) A B t A l m2 lm (16) где A, l , m - параметры активного сегмента, B - численность сегмента ―редких‖ пользователей. Найдем параметры такой модели из двух сегментов, чтобы выполнялось тождество R1(1) (t; , ) R1( 2) t; l , m . Очевидно, такие параметры должны удовлетворять трем условиям A lm BR , lm lm, и A l2 l m2 R 2 . 2 (17) Если в качестве свободного параметра выбрать параметр m , то тождество R1(1) (t; , ) R1( 2) t; l , m окажется истинным для любых значения времени при выполнении равенств: l m A 2 l 2 B R R Alm . (18) Из первого и третьего равенств и очевидного требования B 0 следует дополнительное ограничение m . Таким однородной образом, модели для , , R произвольных можно найти неотрицательных бесконечно параметров много таких неотрицательных параметров l , m, A, B модели из двух сегментов, что кривые R1 (t ) для двух моделей совпадут. В силу аддитивности R1 (t ) решение задачи идентификации параметров модели (численности R и распределения p( , ) ) по кумулятивному охвату R1 (t ) 146 не единственно: существует совпадающими R1 (t ) [98]. бесконечное Рис.2.22 число различных иллюстрирует моделей накопленные с охваты аудитории Rk (t ) , рассчитанные для модели, включающей: 1) ―активную‖ аудиторию с интенсивностью использования l 0,20 суток 1 численностью A 2,4 млн. человек, которые вообще не меняют cookie ( m 0 суток 1 ), и 2) ―бесконечно редкую‖ аудиторию с суточным охватом в B 187,6 тыс. уникальных пользователей в сутки, бесконечно малой интенсивностью использования ресурса и произвольной частотой смены cookies. Охват аудитории (млн. пользователей) 10 R1 8 6 4 R2 2 R3 R4 0 0 7 14 21 28 35 Период измерений (количество суток) Рис.2.22. Накопленная аудитория зарегистрированных не менее k раз «уникальных пользователей». Для расчетов использована модель с двумя сегментами пользователей, не меняющих cookies. Модель с двумя сегментами пользователей и сменой cookies Результаты исследований поведения пользователей, проведенные компаниями Jupiter Research [389], Nielsen//NetRatings, Atlas Solutions и Gemius 147 [183] свидетельствуют, что от 39 до 43% пользователей WWW меняет cookies в течение одного месяца. В России по словам Марины Соловьевой, руководителя российского отделения Gemius: ―мы фиксируем ежемесячный процент обновления на уровне 41%‖ [183]. Если уничтожение cookies описывается простейшим потоком, то его интенсивность должна составлять m 1/57 суток 1 (пользователь меняет cookie в среднем один раз в 57 суток). Результаты расчетов по такой, наиболее реалистичной из рассмотренных, модели показаны на рис.2.23. m 0,018 суток 1 ), предполагаем, что B 169,5 в Здесь l 0,19 суток 1 , A 2,9 млн. человек, тыс. уникальных пользователей в сутки. Мы реальности охваты высших порядков Rk (t ) для рассматриваемого ресурса должны были бы выглядеть так, как показано на рис. 2.23. На рис.2.23 можно видеть, что кривые охвата Rk (t ) высших порядков ( k 2 ) существенно различаются. Таким образом, остается возможность однозначно определить R и p , по нескольким кривым Rk (t ) . К сожалению, в отличие от классического случае чтения газет, в случае аудитории WWW охваты Rk (t ) высших порядков не могут быть надежно измерены, поскольку трудно определить, когда закончилось первое событие, состоящее в использовании ресурса, и началось следующее. Отметим, что аналогичные решения можно было бы найти для любых 0 m 1 / 16 . Более того, взвешенные средние трех рассмотренных моделей породят ту же самую R1 (t ) . На рис.2.21-2.23 можно видеть, что теоретические кривые охвата Rk (t ) высших порядков ( k 2 ) существенно различаются. Требуется выяснить, можно ли восстановить распределение интенсивности по нескольким кривым Rk (t ) (предполагая, что часть необходимой информации, например, зависимость p от , известна). 148 К сожалению, в отличие от классического случае чтения газет, в случае аудитории WWW охваты Rk (t ) высших порядков не могут быть надежно измерены, поскольку трудно определить, когда закончилось первое событие, состоящее в использовании ресурса, и началось следующее. 10 Охват аудитории (млн. пользователей) 8 R1 6 R2 4 R3 R4 2 0 0 7 14 21 28 35 Период измерений (количество суток) Рис.2.23. Накопленная аудитория зарегистрированных не менее k раз «уникальных пользователей». Для расчетов используется модель с двумя сегментами пользователей и сменой cookies. Практическое решение проблемы расчета кумулятивных охватов высших порядков известно: счетчики измеряют и публикуют информацию о количестве пользователей, которые были отмечены на сайте только в один день месяца, только в два дня месяца и т.д.. Такие измерения разные системы способны выполнять единообразно. Поэтому мы предлагаем исследовать возможность ~ ограничить допустимые решения при помощи других кривых – Rk (n) , которые описывают количество уникальных пользователей, посещавших ресурс в течение k дней из n, и которые рассмотрены в последнем разделе данной главы. 149 Дополнительная сложность состоит в том, что в реально наблюдаемых данных ярко выражен эффект выходных дней, когда часть аудитории не пользуется Интернетом. В этой работе мы наметим путь учета этого эффекта для кривых Rk (t ) . Для нестационарной задачи специального вида: (t ) s(t ) (t ) s(t ) (19) с помощью подстановки dS s(t )dt можно получить решения достаточно простого вида: u k (t; , ) R Rk (t; , ) R k f (S (t ); ) Fk 1 (S (t ); ) k 1 k 1 k (20) k 1 S (t ) Fm ( S (t ); ) Fk ( S (t ); ) m1 (21) Это позволяет разделить аудиторию на два сегмента: ―рабочий‖ и ―домашний‖, соответствующих использованию рабочего и домашнего компьютеров. При этом можно предположить, что в выходные дни почти все ―рабочие‖ компьютеры выключены. Такая, более сложная, модель позволяет точнее описать данные. Возвращаясь к исходной проблеме оценки динамики роста российского Интернета, отметим, что «редкие» пользователи вкупе с эффектом уничтожения cookies чрезвычайно сильно влияют на кумулятивный месячный охват аудитории и маскируют его реальный рост. В настоящее время онлайн-статистика показывает нам не реальную динамику месячного охвата аудитории, а совокупность большого числа эффектов, которые нельзя учесть, не зная их механизма; ряд таких эффектов упомянут в статье[197]. Аудитория многих крупных российских информационных WWW-ресурсов растет уже более десяти лет, и это делает актуальной задачу учета ее роста, поставленную нами в [90,99]. В этих работах нами были получены теоретические кумулятивные кривые охвата аудитории WWW-ресурса с учетом уничтожения записей cookies для случая неубывающего во времени полного количества пользователей. Для некоторых видов зависимости полного объѐма аудитории от 150 времени, в частности для квазимногочленов, точные величины охватов можно получить с помощью известных алгоритмов. Такой способ расчета теоретических кривых Rk (t ) может быть использован в качестве подпрограммы решения прямой задачи при численном решении обратной задачи восстановления динамики полной аудитории x(t; , ) по наблюдаемым кривым охвата Rk (t ) . Кроме того, в работах [102,96] нами была предложена модель для расчета теоретических кумулятивных кривых охвата аудитории WWW-ресурса с учетом уничтожения записей cookies при наличии не только притока новых, так и оттока существующих пользователей. В случае аудитории WWW-ресурсов в настоящее время существуют способы измерения только кривой первого порядка R1 (t ) , причѐм лишь в некоторые моменты времени, а для кривых высшего порядка доступны лишь аналоги, моделирование которых требует другого теоретического аппарата и рассмотрено в следующем разделе этой главы. Однако упомянутые здесь теоретические результаты могут найти применение при анализе баз данных электронной коммерции, если под Rk ( ) подразумевать не кумулятивные охвата аудитории, а количество потребителей услуг, совершивших не менее k трансакций за период времени . В приложении Б к диссертации приведен акт от 03.03.2014 г. о внедрении в ООО ―Юду‖ разработанных нами моделей. Модель потока заявок Интернет-портала услуг В отличие от Интернет-счѐтчиков, статистические системы учѐта электронных порталов услуг (так же как и аналогичные системы электронных магазинов) регистрируют своих пользователей, которые используют имя аккаунта (login) и пароль (password) для аутентификации. Для упрощения работы пользователя и такие системы используют механизм ―cookies‖, однако, если пользователь стѐр cookie, то система спросит у него пароль, определит, что он уже зарегистрирован и не станет учитывать его многократно. 151 Как показывает практический опыт таких систем, отток пользователей, разочаровавшихся в товарах или услугах, оказывается столь существенен, что им нельзя пренебречь. Будем считать, что отток пользователей можно описать простейшим потоком событий с параметром , таким образом он аналогичен смене cookies. Переходы между состояниями пользователей такого портала можно изобразить при помощи диаграммы 2.24. Отличие этой диаграммы от нижней части рис. 2.20 состоит в том, что пользователи не возвращаются в состояние S 0 , а переходят в терминальное состояние S * . S0 S1 … S2 Sk … S* Рис.2.24. Граф состояний пользователя системы заявок Система уравнений такой модели оказывается однородной и еѐ решения имеют более простой вид, чем полученные в предыдущем разделе uˆ k ( ; , ) k f ( ; ) k 1 k 1 и Rk ( ; , ) R k F ( ; ) . k k Здесь uˆk ( ; , ) есть вероятность того, что пользователь отправил ровно k заявок за время , Rk ( ; , ) − кумулятивные охваты пользователей (количество 152 пользователей, отправивших не менее k заявок за время ). Поскольку неизвестно, остаются ли индивиды, сделавшие заказ, пользователями, или они уже отказались от дальнейшего использования системы, величину uˆk ( ; , ) непосредственно измерить нельзя. Однако, в отличие от случая счѐтчика, измерению поддаются все охваты Rk ( ) , рассчитываемые по формуле (1). В частности, в работе Д.Шмитляйна, Д.Морисона и Р.Коломбо [454] в качестве смешивающего распределения выбрано двумерное гамма-распределение с плотностью p( , ; b, , с, ) bс b 1 с 1 e b с , что позволяет получить распределение дискретной переменной k (т.е. количества заявок за время ) uk ( ) (k ) b k c , k! ( ) (b ) k (c ) зависящее от четырѐх параметров b, , с, , которое Д.Шмитляйн и соавторы назвали Парето-NBD распределением. Хотя кумулятивные охваты Rk ( ) и не выражаются через элементарные функции, для производных охватов по времени, интегрируя формулу (11), можно получить нужное выражение dRk k R0 uk ( ) . d Тогда Rk ( ) можно рассчитать при помощи численного интегрирования. Среднее число заявок в единицу времени выражается формулой k ( ) R0 c . b (c ) При практическом моделировании статистики заявок онлайн-ресурса мы использовали смесь двух Парето-NBD распределений. Первое распределение описывало пользователей, которые быстро разочаровывались в ресурсе, а второе – долговременных пользователей. В качестве данных ООО «ЮДу» предоставило нам ряд измерений кумулятивных охватов Rk ( i ) и соответствующих k ( i ) . Разработанная нами модель была использована в деятельности ООО «ЮДу», что 153 подтверждается актом о внедрении, приведѐнном в приложении Б к данной работе. Мы рекомендуем операторам Интернет-счѐтчиков классифицировать а.у.п., использующих информационные ресурсы Интернета в течение месяца на два класса: 1) а.у.п., уже зарегистрированные счѐтчиком ранее, 2) а.у.п., которым cookie была впервые выдана в этом месяце. Статистические данные для первой группы пользователей можно было бы описать при помощи как моделей, рассмотренных в данном разделе, так и активно развивающихся альтернатив [362]. Таким образом, при помощи весьма недорогой модификации способа сбора данных, можно было бы значительно упростить процесс моделирования. 2.3.2 Способ расчѐта охватов аудитории информационных ресурсов WWW по данным счетчиков Как отмечено выше, при помощи счѐтчика удаѐтся измерить лишь охват первого порядка R1 (t ) в дискретные моменты времени t0 , t1 ,..., tn . Так же как и в случае онлайн-панелей, вместо охватов высшего порядка Rk (t ) на практике ~ приходится использовать их дискретные аналоги Rk (n) . Для их описания используется марковский случайный процесс с дискретными состояниями и дискретным временем (цепь Маркова). Возможные состояния пользователей и переходы между ними изображены при помощи орграфа в верхней части рис.2.25. В описанной далее модели процесс посещения информационного ресурса каждым из пользователей описывается простейшим потоком событий с параметром , а процесс уничтожения cookie – простейшим потоком событий с параметром [67] . Пусть R0 – полное число пользователей, а vk (t, , ) – это количество актуальных уникальных пользователей (а.у.п.), обладатели которых, которые обращались к информационному ресурсу k дней из t . Пусть измерения охватов аудитории проведены в моменты tk kT , k 0,1,..., n 1 , тогда будем использовать краткую запись vk (n) в качестве синонима vk (n; , ) . 154 d d b b b S2 S0 S1 b S b k … c c c 1 c d 0 k+1 b k 2 … 0 Рис.2.25. Вверху: граф состояний актуальных уникальных пользователей (а.у.п.). Внизу: схема ―случайных блужданий‖ а.у.п. Нами сформулировано и доказано следующее Утверждение 1. Величины vˆk (n) удовлетворяют линейным разностным уравнениям vˆ0 (n 1) avˆ0 (n) c , (22) vˆ1 (n 1) bvˆ0 (n) avˆ1 (n) d , vˆk (n 1) bvˆk 1 (n) avˆk (n) для 2 k n, vˆn1 (n 1) bvˆn (n) , с начальными условиями vˆ0 (0) 1 и vˆk (0) 0 для 1 k n, (23) где использованы константы a e ( )T , b 1 eT e T , с 1 e ( ) T , d 1 a b с . (24) Действительно, полную группу событий, которые могут произойти с индивидом за время T , образуют следующие четыре несовместных события: 155 1) Индивид может не менять cookie и не использовать информационный ресурс. В итоге он останется в прежнем состоянии sk . Вероятность этого события есть a e ( )T , поскольку смена cookie и использование ресурса независимы. 2) Индивид может не менять cookie, но использовать ресурс. Вероятность такого события, то есть условная вероятность перехода из состояния sk в состояние sk 1 есть b 1 eT e T . 3) Индивид может стереть cookie в промежутке между между и , образно говоря, ―родиться заново‖ и с тех пор ни разу не использовать ресурс. Тогда он совершит переход из состояния sk в состояние s0 . Рассчитаем вероятность такого перехода. В каждый момент времени вероятность смены cookie индивидом за малый промежуток составляет . Вероятность того, что произвольный индивид, сменив cookie в промежутке между и t , больше еѐ не менял и не T использовал ресурс, есть с e ( ) d 0 1 e ( ) T . 4) Индивид, стерев cookie (в последний раз) в промежутке между между и , может с тех пор воспользоваться информационным ресурсом (один раз или более). В данном случае это означает переход в состояние s1 . Вероятность перехода из sk в s1 получим d 1 e e d 1 с . T 0 Система (50) даѐт компактное описание матрицы переходов марковской цепи, описывающей состояния индивида. В нижней части рис.2.25 переходы индивида изображены в виде ―случайных блужданий‖ между состояниями. Решения уравнений (22) получены нами при помощи метода производящих функций и выражаются через распределение Паскаля. На практике, однако, вычисления гораздо проще осуществляются непосредственно по формулам (22). ~ Найдѐм способ расчѐта охватов Rk (n) аудитории. Как и в случае онлайнпанелей (см. раздел 2.2) под охватом k -го порядка подразумевается количество пользователей, зарегистрированных на ресурсе не менее k дней из n . ~ Для расчѐта охватов R1 (n) можно использовать формулу (15) для t nT 156 2 ~ 1 exp nT , R1 (n; , ) R1 (n; , ) R0 nT R0 2 ибо обе величины измеряют количество уникальных пользователей, которые не менее одного раза использовали информационный ресурс за время t . ~ Охваты Rk (n) при k 2 можно рассчитать по рекуррентной формуле ~ ~ ~ Rk (n 1; , ) Rk (n; , ) R0 T vˆk 1 (n; , ) , (25) где vˆk 1 (n; , ) рассчитываются при помощи системы (22) и введена константа ~ 1 e ( )T . ( )T (26) Доказательство. Пусть к началу отрезка времени было vk1 (n; , ) а.у.п., k 1 раз. Найдѐм, сколько индивидов воспользуются ~ ресурсом (и увеличат Rk ) до истечения отрезка времени T . Для этого нужно, зарегистрированных чтобы индивид не сменил cookie и не обратился к ресурсу до некоторого момента 0 t T t , а затем обратился к ресурсу в интервале от t до t t . Вероятность обращения к ресурсу на этом интервале есть t , откуда находим 1 e ( )T ~ ~ Rk (n 1; , ) Rk (n; , ) R0 exp d vˆk 1 (n; , ) R0 vˆk 1 (n; , ) . 0 T Справедливость формулы (25) доказана. Нам не удалось получить явные выражения для кумулятивных охватов аудитории при использовании непрерывных распределений и 18. Поэтому мы возвращаемся к дискретным распределениям , использованным в разделе 2.1.1, и лишь одним 1 . Мы аппроксимируем плотность распределения суммой M p( , ) pi i ( 1 ) . (27) i 1 Тогда расчѐтные охваты аудитории имеют вид сумм J ~ ~ Rk (n ) rj Rk (n; j , 1 ) , (28) j 1 18 Мы не исключаем, что явные выражения охватов можно получить, используя не распределения распределения и / , следуя подходу, использованному в работе [362]. и , а 157 где, как и прежде, используется обозначение ri R0 pi 0 . Частоты j растут в геометрической прогрессии j 0 s j . Свободными параметрами модели являлись m (r1 , r2 ,..., rJ ) . Как и в модели C (раздел 2.1), число свободных параметров велико ( J 15 ) и в функцию ошибки добавлено слагаемое, сглаживающее колебания ri N n J 1 2 ~ 2 (m) wki d kn Rk (n; m) j rj 1 rj . n 1 k 1 (29) j 1 Здесь j − неотрицательные сглаживающие множители; n − количество суток; d kn − данные счѐтчика о k -м охвате за n суток (нам удалось собрать 211 точек) ; wik − веса (которые полагались равны единице или нулю в зависимости от наличия или отсутствия данных счѐтчика); N − максимальное значение n (в Миллионы пользователей нашей работе − от 28 до 31 суток, в зависимости от месяца). 16 Охваты аудитории портала (млн. чел.) R0*p(λ) 40 R1 12 30 8 20 R2 R3 4 10 R4 R10 0 0 0 1 2 3 4 5 -1 Частота использования (сутки ) 0 5 10 15 20 25 30 Период измерений (кол-во суток) Рис.2.26. Слева – R p( , ) . Справа – расчѐтные ~ охваты Rk (n ) (линии) и данные статистической системы Rambler (кружки) об аудитории крупного Интернет-портала. 158 На рис.2.26 слева представлена полученная аппроксимация величины для ri R0 pi крупного Интернет-портала, пропорциональная плотности распределения pi частоты использования этого информационного ресурса. Здесь и на последующих рисунках точки ( i , ri ) соединены отрезками прямых линий, чтобы график имеет форму т.н. полигона, хотя распределение является дискретным, и, более корретным (но и менее удобным для восприятия) было бы представление в виде столбиковой диаграммы. Справа на рисунке показаны Миллионы данные d kn об охватах, которые были измерены в ноябре 2008 года. 5 16 R0*p(λ) Охваты аудитории поисковой системы (млн. человек) 14 4 R1 12 10 3 8 R2 2 6 R3 4 1 R4 2 R10 0 0 0 1 2 3 4 5 -1 Частота использования (сутки ) 0 5 10 15 20 25 30 Период измерений (кол-во суток) Рис.2.27. Слева – плотность p( , ) . Справа – ~ расчѐтные охваты Rk (n ) (линии) и данные статистической системы Rambler (кружки) об аудитории популярной поисковой машины. Здесь, в отличие от случая онлайн-панелей (раздел 2.2), аудитория не сегментировалась на ―рабочую‖ и ―домашнюю‖, поскольку нас интересовало 159 моделирование кумулятивных охватов R~k (n) в условиях смены cookies, а эффект выходных дней, как показали результаты раздела 2.2, не является значительным. На рис.2.27 в аналогичном формате представлены результаты моделирования и исходные данные для популярной поисковой системы, также относящиеся к ноябрю 2008 года. Из сравнения рис.2.26 и рис.2.27 можно заключить, что использование поисковой системы является более однородным. В случае портала можно наблюдать с одной стороны − значительный пик малоактивной аудитории, а с другой − существенную долю пользователей, посещающих ресурс чаще одного раза в сутки. Выводы 1. Разработана модель поведения онлайн-панели в виде смеси бета-биномиальных распределений, которая описывает все кумулятивные кривые охвата аудитории информационного ресурса. Модель применена для аппроксимации кумулятивных кривых крупного портала и популярного онлайн-СМИ. 2. При помощи моделирования данных онлайн-панели обосновано использование вероятностной смеси непрерывных, а не дискретных распределений частоты использования Интернета для прогнозирования суточного, недельного и месячного охватов аудитории. 3. Разработанная в разделе 2.3 модель может быть применена для восстановления p( , ) небольших информационных ресурсов, аудиторию которых не удаѐтся измерить при помощи панельных исследований, а также для восстановления p( , ) некоммерческих ресурсов, для которых панельные исследования слишком дороги. Следует сделать практическое замечание о том, что для того, чтобы получить оценки плотности распределения частоты использования менее популярных ресурсов, чем исследованные здесь, осреднение данных за несколько месяцев. может потребоваться 160 3 ГЛАВА 3. СОВМЕСТНОЕ МОДЕЛИРОВАНИЕ ПАРКА И РЫНКА ТЕХНИЧЕСКИХ СИСТЕМ Традиционно количество персональных компьютеров (ПК), которые до недавнего времени служили основным устройством доступа к Интернету, рассматривалось, как одно из основных ограничений, препятствующих распространению Интернета19 [199,262]. Статистические данные, собранные в развитых странах, подтверждали эту точку зрения – парк ПК в этих странах служил (и по сей день является) верхним ограничителем для числа пользователей Интернета. В России, так же как и во многих развивающихся странах, эта эмпирическая закономерность не выполнялась, поскольку ПК, будучи относительно дорогими устройствами, совместно использовались несколькими индивидами; но зачастую применялась при построении прогнозов распространения Интернета. Критикуя указанную практику, автор настоящего исследования ставил задачу построения модели российского парка ПК, которая согласовывалась бы со всеми доступными данными о распространении компьютеров, включая их продажи, наличие в домохозяйствах и в индивидуальном пользовании. Данные о количестве или доле пользователей нововведения, несмотря на их высокую полезность для моделирования, в настоящее время не являются наиболее распространенным и легко доступным видом статистических данных. Причина состоит в сложности проведения репрезентативных социологических опросов, к тому же, на ранних этапах распространения нововведений в новых отраслях экономики доля пользователей в населении столь незначительна, что не может быть измерена путем массовых опросов. В этот период в новых индустриях складывается традиция измерения рынка при помощи таких показателей, которые В данном 06.04.2009 г. интервью закрытому сегодня изданию ―Газета‖ генеральный директор крупнейшего российского онлайн-ресурса Mail.Ru, Дмитрий Гришин, называет доступность персональных компьютеров одним из двух главных факторов роста российской Сети: ―Главный фактор – это покупательная способность населения приобретать компьютеры и то, как крупные компании и государство будут развивать доступ к интернету в регионах.покупательную способность населения приобретать компьютеры‖ (см. http://corp.mail.ru/press/pubs/724 ). 19 161 могут быть получены оперативно, что позволяет использовать их для текущих задач управления предприятием, а также для оценки стоимости бизнеса. В случае рынка мобильной связи в качестве таких показателей укоренились суммарное количество абонентов (SIM-карточек) и поквартальные продажи телефонных трубок, в случае мобильных приложений – число ―скачиваний‖, в случае Интернета − количество IP-адресов и файлов ―cookies‖, в случае широкополосного Интернета – число подключенных квартир, в компьютерной индустрии – объѐм продаж или поставок компьютеров. Такие данные отнюдь не бесполезны при изучении распространении нововведений, более того, первые количественные модели диффузии инноваций, такие как модель Ф.Басса, были разработаны именно для объема продаж товаров длительного пользования (в натуральном выражении), а не для количества потребителей таких товаров. При этом в ранних исследованиях предполагалось, что повторные продажи устройств ―на замену‖ вышедшим из строя или морально устаревшим товарам длительного пользования несущественно искажают общую картину. Проблема учета продаж ―на замену‖ была в целом решена в работах Дж.Ольсона и С.Чои [437] и В.Камакуры и Ш.Баласубраманьяна [392], однако примеры применения моделей продаж ―на замену‖ остаются немногочисленными [36,186,187]. Отметим теоретический вклад отечественных исследователей, которым удалось формализовать задачи с переменной во времени функцией дожития технического устройства [53,54,236,264]. В то время как уровень информатизации российских домохозяйств регулярно анализируется в российской научной литературе [19,215], включая и сопоставления с индивидуальным использованием ИКТ [190,189], математическое моделирование с целью прогноза при таких сопоставлениях ранее не привлекалось. Результаты, обсуждаемые в этой главе, опубликованы в наших работах, посвящѐнных моделированию распространению мобильной связи ([65,82,71,74,70,84,87,95,111,116,138,112,122,118]) ([134,113,125,136,133,143,179]). Нами и разработана парка компьютеров модель роста парка 162 технических систем с учетом данных исследований о размере рынка и онлайнопросов о сроке службы устройства, которая применена для оценке размера и прогнозирования российского парка персональных компьютеров. Наиболее важным нам представляется тот факт, что два вида показателей – о продажах и о парке эксплуатируемых устройств, каждый из которых может содержать случайные и систематические ошибки, могут использоваться совместно для построения более надежных моделей и прогнозов процессов распространения нововведений, чем позволяет каждый из показателей по отдельности. В данной главе попытка такого совместного использования проведена при помощи данных о продажах и парке персональных компьютеров и мобильных телефонов. Разработку моделей осложняют два факта: - несколько индивидов, составляющих домохозяйство, могут приобретать и использовать устройство совместно; - один индивид может использовать несколько устройств (тем более несколько устройств может использовать домохозяйство). Таким образом, прежде, чем приступать к моделированию парка и рынка технических систем, необходимо иметь в арсенале, во-первых, модели распространения нововведений в домохозяйстве и, во-вторых, модели приобретения дополнительных устройств. Впервые модель, в которой явно учитывались различия в способах распространения информации внутри и вне домохозяйства, построил В.А.Шведовский в 1981 году [290] . В обзоре Б.Ратчфорда и др. [447] рассмотрены способы решения второй задачи на основе классической диффузионной модели, в которой владельцы дополнительных устройств влияют друг на друга. С нашей точки зрения обе задачи можно решать в рамках единого подхода, который изложен в двух последующих разделах на примере распространения мобильных телефонов. Покупка дополнительного устройства при этом рассматривается как покупка устройства для ―виртуального‖ члена домохозяйства. 163 3.1 Модели распространения мобильной связи среди индивидов и в домохозяйствах Мобильная телефонная связь, которая лишь в 1981 году начала распространение на массовом рынке, к 2009 году охватила 4,6 миллиарда абонентов. Как отмечают Р.Перес, Э.Мюллер и В.Махайан [442], мобильные телефоны не только чрезвычайно широко распространены, но и наиболее выпукло иллюстрируют многие сложные проблемы моделирования распространения инноваций. В частности, в мобильной телефонии услуга связи объединена с продуктом, который включает как устройство, так и программное обеспечение. Структура рынка подвижной электросвязи сложна, число игроков рынка регулируется государством, так что в одних регионах рынок является конкурентным, а в других может быть монополизирован. Конкуренция сопровождается ценовыми войнами и интенсивными рекламными кампаниями в традиционных и новых СМИ. Постоянным источником беспокойства компаний является отток мобильной пользователей к конкурентам. В течение жизненного цикла связи завоевывали возникли новые несколько стандарты поколений передачи технологий, данных. а рынок Эволюционировали и управляющие маркетинговые переменные – стоимость минуты разговора, цена телефона, способы и места оплаты трафика, преобладающие каналы распространения, дизайн и функции телефона, аксессуары [442]. 3.1.1 Модели с постоянным потенциалом распространения В этом разделе на основе данных массовых опросов о распространении мобильной связи в России проведено сравнение классической модели распространения нововведения в атомизованном обществе и новой модели, в которой решающей единицей является не индивид, а домашнее хозяйство20. В Под домашним хозяйством понимается совокупность лиц, проживающих в одном жилом помещении или его части, как связанных, так и не связанных отношениями родства, совместно 20 164 отличие от классической, новая модель успешно объясняет три вида данных социологических опросов: о личном владении сотовыми телефонами, об использовании сотовой связи, о наличии сотового телефона в домохозяйстве. Важно отметить, что область применения нашей модели не ограничивается мобильной связью. При помощи этой модели можно изучать распространение персональных компьютеров, планшетов, цифровых фотоаппаратов, навигаторов, устройств для чтения электронных книг и любых иных нововведений, которые первоначально весьма дороги и сложны и приобретаются для домохозяйства в единственном экземпляре, после чего по мере снижения цен и упрощения приобретаются дополнительные экземпляры для каждого члена домохозяйства или для некоторых его членов. Основные результаты этого раздела опубликованы в наших работах ([65,82,71,74,70,84,87,95,111,116,138,112,122,118]). Данный раздел ставит и решает следующие задачи 1) поставить вопрос о способности модели атомизованного общества (т.е. классической модели распространения нововведений) объяснить результаты комплексных социологических опросов о распространении новых информационных и телекоммуникационных технологий; 2) построить модель распространения нововведения в домохозяйствах, формализующую вербальную модель Э.Роджерса распространения мобильной связи [449] 3) построить модель идентифицировать еѐ распространения параметры, нововведения позволяющие в домохозяйствах, удовлетворить данным комплексных опросов 4) найти целовую эластичность, которая позволит моделировать динамику потенциала российского рынка мобильной связи; 5) предложить социологический эксперимент, обработать его данные и проверить предсказания разработанной нами модели. обеспечивающих себя пищей и всем необходимым для жизни, т.е. полностью или частично объединяющих и расходующих свои средства. Домашнее хозяйство может состоять из одного человека, живущего самостоятельно [52]. 165 Обнаружив отток абонентов в 1999 году, крупные российские операторы сотовой связи приняли решение о выводе услуги мобильной связи на массовый рынок и радикально снизили стоимость минуты разговора. В результате, рост числа абонентов возобновился, а доля владельцев сотовых телефонов среди россиян в 2000 году достигла 2%, что позволило начать изучение динамики распространения мобильной связи путем социологических опросов. Начиная с этого времени, публикуются уникальные в плане разнообразия и полноты данные: о личном владении мобильным телефоном (―Левада-Центр‖, ФОМ, ВЦИОМ, РОМИР); о наличии мобильных телефонов и их числе в домохозяйствах (―ЛевадаЦентр‖, ФОМ, ВЦИОМ, компания ―Гфк Русь‖); об использовании мобильной связи взрослыми россиянами (РОМИР, ФОМ, компания ―Башкирова и партнеры‖). Таким разнообразием данных мы обязаны отчасти конкуренции исследовательских агентств, которые избегают непосредственных сравнений заказчиками своих услуг и поэтому формулируют вопросы разными способами, а отчасти – отсутствию единого подхода к изучению распространения нововведений при помощи массовых опросов. Помимо неудобства, вызванного невозможностью непосредственно сравнивать данные различных источников, обнаружился важнейший плюс отмеченного разнообразия – данные описывают различные стороны процесса и позволяют построить модели распространения нововведения не только в атомизованном обществе (которое само по себе является чрезмерным упрощением), но в обществе, состоящем из домохозяйств. Высокая скорость и, соответственно, сравнительно короткое характерное время процесса распространения мобильной связи позволяют использовать для моделирования диффузии этого нововведения сравнительно простые модели, не требующие учета процессов воспроизводства населения, что, как показано в первых двух главах данной работы, оказывается необходимым при исследовании более медленных процессов, таких, как процесс распространения Интернета [301]. 166 Воспользовавшись этим преимуществом, мы построили количественную модель распространения сотовой связи в российском обществе, которая объясняет все три описанных выше вида данных социологических опросов. Отметим, что собранные аналитическими агентствами данные о динамике стоимости минуты разговора, позволяют также учесть влияние стоимости использования нововведения (которая складывается из тарифов и стоимости сотовых телефонов) на скорость диффузии. Детальное изучение этого вопроса проведено в следующем разделе. Модель AC: Атомизованное общество с постоянным потенциалом рынка На основе данных опросов ―Левада-Центра‖ и Фонда ―Общественное мнение‖ (ФОМ) за 2000-2006 годы нами были построены и опубликованы модель и прогноз распространения мобильной связи в России [301]. В этой работе мы ставили целью проиллюстрировать наличие российских данных, которые можно было бы описать нововведений при Ф.Басса, помощи а классической также модели распространения продемонстрировать возможность прогнозирования таких данных на основе классической теории. В качестве показателя уровня распространения мобильной связи была выбрана доля взрослых (старше 16 лет) россиян, владеющих личным мобильным телефоном. Источником данных послужили массовые опросы Левада-центра и ФОМ, которые измеряли долю владельцев сотовых телефонов методом в течение нескольких лет, не изменяя методики измерений. В то же время изменения в способе подсчета абонентов (активных SIM-карт) операторами мобильной связи бывали весьма значительными. В частности, в январе 2008 года в результате изменения способа учета абонентов крупным оператором число абонентов мобильной связи в России уменьшилось сразу на восемь миллионов [254]. Поскольку предсказать учетную политику операторов мы не в состоянии, мы отказались от попыток построить модели количества абонентов, хотя именно этот показатель наиболее широко использовался как в научной, так и в производственной литературе. Мы 167 ограничились моделированием доли пользователей и владельцев мобильных телефонов в населении. Данные социологических опросов, а также данные Росстата о численности абонентов в 1992-2000 годах [253,252] позволили нам провести сравнение двух наиболее популярных моделей распространения нововведений – Ф. Басса и Б. Гомперца [315,408]. Рис.3.1. Граф влияния владельцев сотовых телефонов на остальных индивидов в модели атомизованной клики. В модели Ф. Басса общество однородно и представляет собой так называемую атомизованную клику (см. рис.3.1), в которой все единицы, принимающие решение (индивиды, домохозяйства, организации), одинаковы, независимы (―атомарны‖), и каждый с равной вероятностью воздействует на каждого. На решение субъекта о начале использования нововведения оказывают влияние существующие пользователи и средства массовой информации, причем воздействия складываются. Иными словами, в этой модели два коммуникационных канала, через которые субъект получает информацию, влияющую на его решение; первым является межличностное общение, а вторым – масс-медиа (телевидение, газеты, книги и т.п.). Cогласно современным 168 представлениям первый коммуникационный канал включает не только межличностное общение, но также рыночные сигналы и экстерналии [442]. Модель Ф.Басса может быть описана нелинейным обыкновенным дифференциальным уравнением первого порядка dX X p q M X dt M (1) c начальным условием X (0) N 0 0 . Здесь X (t ) – количество пользователей нововведения, M – потенциал распространения нововведения, q – параметр ―внутреннего‖ воздействия или ―имитации‖, p – параметр ―внешнего‖ воздействия (СМИ и рекламы). В.Махайан и Р.Петерсон с целью подчеркнуть наличие двух каналов влияния предложили называть модель, описываемую уравнением (1), моделью смешанных (комбинированных) воздействий (―mixed influence‖) [408]. Модель Ф. Басса [315] является частным случаем модели смешанных воздействий, в ней начальное условие нулевое, то есть X (0) 0 , а момент начала распространения нововведения предполагается известным. Отметим, что потенциал распространения нововведения M , то есть полное число людей, способных воспользоваться инновацией, включающее всех текущих и будущих ее пользователей, заранее нам не известен. Потенциал M в общем случае не совпадает со взрослым населением России K , которое, по данным Росстата, составляет 110 933 868 человек. Отметим также, что в описываемой в этом разделе модели AС (а также рассмотренной далее AV) величина X (t ) – это количество владельцев сотовых телефонов. В моделях AC и AV оно предполагается тождественным количеству пользователей мобильной связи. Различия между этими величинами будут рассмотрены при обсуждении модели BC. Уравнение (1) имеет явное решение в виде логистической кривой X (t ) 1 p exp ( p q)t M, 1 q exp ( p q)t (2) 169 где M N0 – постоянная, имеющая размерность времени. pM qN 0 Для описания и прогнозирования динамики количества абонентов и пользователей мобильной связи наиболее часто использовались два частных случая. В первом случае, полагая N 0 0 , получаем модель Ф. Басса: X (t ) Во втором случае, 1 exp ( p q)t M. q 1 exp ( p q)t p предполагая (3) доминирование межличностных коммуникаций, полагаем интенсивность внешних воздействий p 0 и получаем логистическую модель (модель ―внутренних воздействий‖ [408]) X (t ) M . M 1 1 exp qt N0 (4) Модель Ф. Басса была применена Райтом и др. [481] для описания динамики числа абонентов мобильной связи в Новой Зеландии. Грубер и Вербовен [374] использовали логистическую модель для исследования распространения мобильной связи в странах Европейского союза. Согласно их выводам, наиболее сильно на процесс диффузии повлияли переход от аналоговых стандартов к цифровым и конкуренция операторов связи. Оба выделенных фактора способствовали снижению цен на услуги мобильной связи и, соответственно, их большей доступности. Кроме того, авторы попытались подтвердить эффект ―наверстывания‖, т.е. более высокой скорости распространения мобильной связи в тех странах, где процесс начался позже. Франк [366] использовал логистическую функцию (4) с переменным во времени параметром q(t ) для моделирования распространения мобильной связи в Финляндии. Хотя такой подход не является корректным, поскольку указанная функция не удовлетворяет исходному уравнению (1), заслуживает внимания найденная этим автором корреляция между приростом числа абонентов и вариациями темпов прироста среднедушевого ВВП Финляндии. 170 Вызывают интерес работы, посвященные распространению мобильной связи в странах Южной Европы, где этот процесс не столь сильно опережал российский. В частности, А.Ботельо и Л.Пинто применили логистическую модель для объяснения динамики распространения мобильной связи в Португалии [325], а Х.Михалакелис и др. [426] построили модели динамики сотовой телефонии в Греции при помощи большого количества S-образных кривых. Изучению распространения мобильной связи в различных странах мира посвящены коллективная монография факультета журналистики МГУ им. М.В.Ломоносова [172] и монография М.Кастельса и его соавторов [327]. Изучая эффект ―наверстывания‖, Джиованис и Скиадас [367] предложили первую многостадийную модель распространения мобильной связи dX X (t T ) pq M X (t ) , dt M (5) в которой между началом использования нововведения и началом влияния на других пользователей существует временной лаг T , аналогичный известному в эпидемиологии ―латентному‖ периоду, когда больной еще не заразен, то есть не способен инфицировать окружающих. В перечисленных работах использовалась статистика количества абонентов, предоставляемая операторами мобильной связи, Организацией экономического сотрудничества и развития (OECD), Международным телекоммуникационным союзом (ITU), а также публикации государственных статистических служб. Эвристическое применение моделей распространения нововведений в обществе, состоящем из людей, к прогнозированию статистики абонентов не дало положительных результатов, поскольку один индивид часто обладает несколькими мобильными телефонными номерами, и, наоборот, в развивающихся и бедных странах один сотовый телефон может использовать большое домохозяйство и даже целый поселок. В частности, Грубер и Вербовен [374] определили потенциал проникновения мобильной связи в Европе в 62% численности населения, а прогноз Л. Франка для Финляндии составил 92% [366]. Однако в последующие годы количество абонентов мобильной связи в 171 исследуемых этими авторами странах превысило численность населения. Сегодня статистические службы европейских стран вместо статистики операторов используют данные панельных исследований и опросов об использовании мобильной связи населением. Классические трех- и четырехпараметрические модели распространения нововведений, и их расширения, использовались для моделирования и прогнозирования мобильной связи в России и других странах в работах Л. Е. Варакина [31,32], Ю. В. Деарт и соавторов [61,60], Л. С. Тимошенко [272], Т. А. Кузовковой и Л. С. Тимошенко [206], С. Ю. Казанцева и И. Э. Фролова [177,178], А. В. Абилова [1], K. E. Афанасьевой и В. И. Ширяева [12,11]. В этих работах диффузионные модели применялись к данным операторов мобильной связи о количестве абонентов (активных SIM-карт) и базирующимся на них статистическим данным Росстата. Проблема различия между количеством пользователей и числом абонентов сотовой связи обсуждалась в статье И. С. Березина [24] (см. также статьи С.Казанцева и И.Э.Фролова [177,178]). И.С.Березин отметил, что количество активных SIM-карт не является корректным способом операционализации понятия проникновения мобильной связи, и предложил в качестве альтернативы данные опросов РОМИР о доле населения, использующей мобильную связь. В этой главе мы не ставим задачу моделирования численности абонентов (активных SIM-карт), но применяем теорию диффузии нововведений для моделирования динамики количества пользователей и владельцев мобильных телефонов в России. Подчеркнем, что в модели AC (и ее расширении на случай переменного потенциала рынка – модели AV) указанные две величины совпадают, однако в моделях BC и BV они различаются. Поскольку при моделировании данных опросов исходными данными является доля владельцев мобильных телефонов во взрослом населении страны, проведем в уравнении (3) замену x(t ) X (t ) K и M K 172 и получим x(t ) 1 exp ( p q)t . q 1 exp ( p q)t p (6) Задача идентификации модели была поставлена нами следующим образом: найти такие параметры m̂ модели, при которых достигает глобального минимума функционал ошибки (отклонения реальных данных d k от синтетических x(t k ) ) ˆ ) min (m) , (m m при условии, что на параметры модели m , p, q наложены ограничения: 0 1 , p 0 , q 0 . В качестве синтетических данных использована расчетная доля владельцев телефонов в населении страны. Мы выбрали функционал ошибки, который соответствует мультипликативной модели c логнормальным распределением ошибок 2 d (m) wi ln ~ i , i d i (m) i 0 K где ~ d i (m) x(ti ) 1 – синтетические (расчетные) данные; социологических опросов; i – di стандартные ошибки; wi – данные – весовые коэффициенты (мы использовали веса, убывающие в геометрической прогрессии в направлении убывания оси времени). В качестве начального момента распространения мобильной связи в России мы выбрали сентябрь 1991 года. Известно, что первый пользовательский мобильный звонок в России совершил 9 сентября 1991 г. мэр Санкт-Петербурга А. А. Собчак, который позвонил в США. Поскольку в процессе распространения мобильной связи в России можно выделить две фазы – до и после 1998 года, – правомерно было бы построить две модели, отдельно для каждой фазы. Вторым аргументом в пользу построения двух моделей является характер данных: период до 1998 года покрывают только данные Росстата о количестве абонентов, и лишь с 2000 года появились данные социологических опросов. Однако та модель, которую мы построили по данным 173 опросов, удовлетворительно аппроксимирует и исторические данные за 1992-1999 годы, поэтому мы ограничимся одной моделью. Владение сотовым телефоном 100% Доля взрослого населения России и Москвы 80% Москва 60% Россия 40% 20% Данные Левада-центра: Россия Модель: Россия Новые данные Левада-центра: Москва Данные ФОМ: Россия Модель: Москва сен.13 мар.13 сен.12 мар.12 сен.11 мар.11 сен.10 мар.10 сен.09 мар.09 сен.08 мар.08 сен.07 мар.07 сен.06 мар.06 сен.05 мар.05 сен.04 мар.04 сен.03 мар.03 сен.02 мар.02 сен.01 сен.00 мар.01 0% Данные Левада-центра: Москва Новые данные Левада-центра: Россия Рис.3.2. Динамика наличия личных сотовых телефонов в Москве и в России. Открытыми символами показаны данные опросов, проведенных после построения прогноза. В работе [301] Э.А.Юриной и автором этой работы получены следующие параметры модели, минимизирующие функционал ошибки: 0,91 , p 1,9 105 лет-1 , q 0,71 лет1. Как показывает рис.3.2, модель Басса удовлетворительно описывает исторические данные об использовании мобильной связи в России и в Москве в 2000-2006 годах21. На рис.3.2 представлены также новые данные за 2007-2012 годы, опубликованные ―Левада-Центром‖ и позволяющие визуально оценить точность прогноза. Однако такая модель объясняет не все данные массовых опросов. В частности, обнаруживаются систематические различия между долей пользователей и владельцев сотовых телефонов в населении. Результаты расчетов 21 Прогноз использовал данные за 2000-2006 г. и был опубликован в 2008 году. Результаты впервые были доложены автором на конференции ―Социология инноватики‖ в декабре 2007 года, см. [75]. В этой работе параметры модели немного отличались (например, 0,89 ), поскольку в качестве момента начала распространения нововведения был выбран 1997 год. 174 доли владельцев телефонов среди взрослых россиян x(t ) на рис.3.3 показаны совместно с данными опросов ―Левада-Центра‖, ФОМ, ВЦИОМ, компаний ГФК, РОМИР, ―Башкирова и партнеры‖. Доля взрослых россиян, лично владеющих сотовыми телефонами, изображена сплошными кружками. Треугольниками показана доля взрослых россиян, у которых мобильный телефон есть в домохозяйстве, а крестиками − доля заявивших, что пользуются сотовой связью (респондентов не спрашивали, личный или чужой телефон они используют). Рис.3.3 показывает, что доля россиян, у которых мобильный телефон есть в домохозяйстве, выше, чем доля имеющих мобильный телефон в личном пользовании [301]. Это наблюдение представляется тривиальным, однако не учитывается в модели атомизованного общества. Ни модель Ф. Басса, ни общая модель смешанного воздействия [408], ни модель Гомперца, к описанию которой мы переходим, не предоставляют инструментария для совместного моделирования количества пользователей и владельцев нововведения. 100% Доля взрослого населения России 80% Есть в домохозяйстве 60% 40% Владеют лично 20% Владельцы Есть в д/х мар.12 сен.11 мар.11 сен.10 мар.10 сен.09 мар.09 сен.08 мар.08 сен.07 мар.07 сен.06 мар.06 сен.05 мар.05 сен.04 мар.04 сен.03 мар.03 сен.02 мар.02 сен.01 мар.01 сен.00 0% Модель A: владельцы Рис.3.3. Динамика наличия сотового телефона в домохозяйстве и в личном пользовании [301] 175 Модель Гомперца Популярной моделью распространения нововведений является модель Гомперца [348,408,421,426,472,473], которую можно описать следующим дифференциальным уравнением dX M bX ln , dt X (7) решение которого имеет вид X (t ) M exp exp b(t ) . (8) В модели Гомперца три параметра, так же, как и в модели Басса. Параметр M описывает потенциал распространения нововведения, b характеризует скорость роста, а является координатой точки перегиба ( X (t ) 0 ). Для распространения сотовой связи в России получены следующие параметры модели Гомперца, минимизирующие функционал ошибки: 1,0 , b 0,384 , (8 / 03 / 2005) . Модель Гомперца является эвристической, и попытки ее применения к процессам в неоднородном обществе автору неизвестны. В то же время, модель Гомперца весьма точно описывает данные Международного союза электросвязи (ITU) о числе абонентов мобильной связи в США на протяжении 20 лет [473]. Кроме того, как отмечено в ряде работ [421,472,473], на практике прогнозы, полученные при помощи модели Гомперца, зачастую оказываются точнее. В дальнейших расчетах мы используем модель Ф. Басса, однако практически те же результаты для периода 2000-2008 гг. могли бы получить и для модели Гомперца. Выводы, полученные в следующем разделе, справедливы для обеих моделей. Модель распространения нововведения в домохозяйствах Мы намерены показать, что модель атомизованного общества не способна одновременно объяснить динамику двух видов статистических показателей: доли россиян, владеющих мобильными телефонами, и доли домохозяйств, в которых есть такие устройства. 176 Мы предлагаем альтернативную модель B, которая объясняет оба вида показателей. Модель B формализует наблюдение Э.Роджерса [449], который отметил, что первоначально сотовый телефон приобретался домохозяйством для совместного использования несколькими членами, и только потом наступила эпоха личных, индивидуальных сотовых телефонов. Для построения нужной нам количественной модели требуются данные о распределении домохозяйств по размеру. Возьмем домохозяйство, в котором живет j взрослых людей. Упорядочим этих людей по времени приобретения личного сотового телефона. Полные численности взрослых граждан, проживающих в домохозяйствах из j взрослых, которые стоят i -ми в гипотетической семейной очереди на личный сотовый телефон, обозначим K ij . Поскольку Росстат публикует данные о домохозяйствах, численность взрослых в которых не превышает шести, условимся считать, что в домохозяйствах не бывает более шести взрослых. Таким образом, верхнюю границу индекса j обозначим J и положим равной 6. Таблица 3.1 Доли взрослых членов домохозяйств kij (%) Порядковый номер члена домохозяйства Число членов домохозяйства 1 2 3 4 5 1 13,0 2 21,4 21,4 3 9,0 9,0 9,0 4 3,2 3,2 3,2 3,2 5 0,6 0,6 0,6 0,6 0,6 6 0,2 0,2 0,2 0,2 0,2 Разделив K ij на K, получим долю k ij K ij K 6 0,2 жильцов с номером i , проживающих в домохозяйствах размера j. Эти величины опубликованы 177 Росстатом и показаны нами в таблице 3.1. Сумма всех элементов табл. 3.1 равна единице (значения элементов даны в процентах). Для построения количественной модели B, объясняющей все описанные ранее данные социологических опросов, используем четыре допущения: 1. Условный ―глава домохозяйства‖ первоначально приобретает новинку для себя, становится ее официальным владельцем. 2. Период времени между приобретением домохозяйством мобильного терминала и началом использования этого устройства всеми взрослыми членами домохозяйства пренебрежимо мал. Это предположение позволяет считать эквивалентными данные об использовании новинки и о наличии новинки в домохозяйстве. 3. На решение взрослого россиянина о покупке нововведения влияет доля других пользователей среди взрослого населения, которую он оценивает в процессе общения (рис.3.4). 4. Пользователи-дети не влияют на решения взрослых об использовании нововведения. Рис.3.4. Влияние пользователей сотовых телефонов на глав домохозяйств в модели B. Глав домохозяйств можно распознать по ―шляпкам‖. 178 Необходимость в последнем допущении вызвана неполнотой опубликованных данных опросов, которые изначально не были предназначены для обеспечения моделирования распространения инноваций. Как показывают некоторые исследования, наличие ребенка в семье часто стимулировало покупку сотового телефона. Однако у нас нет достаточных данных об использовании сотовых телефонов российскими детьми. Предполагается, что позже, по мере накопления средств, домохозяйство приобретает мобильные устройства и для других жильцов. Возникает вопрос, не является ли более правдоподобным сценарий, когда глава домохозяйства по мере появления денег приобретает новые устройства для себя, а подержанную трубку дарит другому члену семьи. Такое поведение чрезвычайно распространено и подтверждается онлайн-опросами. Однако математические модели обоих сценариев совпадают. При использовании тех показателей, которые нам сегодня доступны, эти два сценария неразличимы. Подробнее этот вопрос обсуждается в конце этого раздела, там же приведены и данные онлайн-опросов. Рис.3.4 иллюстрирует структуру межличностных коммуникаций в модели B. Отметим, что в нашей работе [138] было проведено моделирование возможных способов влияния домохозяйств друг на друга, позволяющее учесть более высокую информированность крупных домохозяйств, однако для апробации этих моделей у нас недостаточно данных. Рассмотрим домохозяйство, включающее трех взрослых (и произвольное число несовершеннолетних). Примером домохозяйства из трех взрослых (старше 18 лет) людей могут служить совместно проживающие жена, муж и совершеннолетняя дочь. Добавив свекровь, получим домохозяйство из четырех взрослых, добавив совершеннолетнего сына – из пяти. Упорядочим всех членов домохозяйств, включающих трех взрослых людей, по времени приобретения ими (или для них) личного мобильного телефона. Обозначим численность обладающих личными мобильными телефонами глав домохозяйств из трех взрослых – X31, вторых взрослых членов домохозяйств 179 из трех взрослых – X32; и, соответственно, третьих взрослых членов таких домохозяйств – X33. Таким образом, первый индекс обозначает количество взрослых в домохозяйстве, а второй – очередность приобретения взрослым человеком личного мобильного телефона по сравнению с другими взрослыми членами домохозяйства Аналогично поступим с домохозяйствами других размеров. В общем случае численность владеющих личными сотовыми телефонами j-х членов домохозяйств, включающих i взрослых, обозначим Xij. Не все взрослые члены домохозяйств владеют сотовыми телефонами, их численность в каждом сегменте удовлетворяет ограничению X ij (t ) K ij . Уточним разницу между K ij и X ij . Величина X ij включает только тех взрослых, у которых телефон уже есть, а K ij – и тех, у которых телефон однажды будет, и даже тех, у кого телефона нет и не будет, но кто стоит в воображаемой семейной очереди i -м. Опишем домохозяйством процесс (или приобретения его ―главным‖ первого мобильного представителем) общей телефона моделью распространения нововведений [408] dX i1 h(t ,U ) M i1 X i1 (t ) . dt (9) Здесь U (t ) – полное количество взрослых пользователей сотовых телефонов, M i1 – потенциал распространения нововведения в домохозяйствах численностью i (количество домохозяйств, которые рано или поздно начнут использовать сотовый телефон, и которые состоят из из i членов). Функция h(t , U ) носит название ―функция риска‖ и характеризует вероятность приобретения нововведения тем, у кого его еще нет. В зависимости от выбора функции риска, уравнение (9) превращается в уравнение модели смешанных воздействий (1), Гомперца (7) и т.п. Мы постулируем, что функция риска h(t,U ) 180 1. Не зависит от размера домохозяйства, т.е. не выделяем отдельных hi (t ,U ) , но используем единую h(t,U ) ; 2. функционально зависит от текущего количества пользователей сотовой связи U (t ) (а не, например, числа владельцев телефонов, как в модели A, не числа самих трубок, и не числа домохозяйств, в которых есть телефоны, и т.д.). Если дополнительно предположить, что все взрослые члены домохозяйства начинают использовать мобильную связь одновременно с покупкой первого (общего) сотового телефона, то, как показано в последнем разделе этой главы, для численности пользователей сотовой связи справедливо уравнение dU h(t ,U )M U , dt (10) а численности обладающих сотовыми телефонами глав домохозяйств размером i , есть линейные функции от числа пользователей X i1 (t ) ai biU (t ) , (11) где ai X i1 (0) M U (0) M i1 , M U (0) bi M i1 X i1 (0) . M U (0) (12) Вывод уравнений (10)-(12) дан в нашей монографии [111] и не приводится здесь из-за значительного объѐма. Если в качестве функции риска выбрать линейную функцию от U (t ) , то, как показывает уравнение (10), в отличие от модели A, в модели B смещенная логистическая кривая описывает не численность владельцев телефона, а численность пользователей мобильной связи. Предположим, что домохозяйства приобретают личные сотовые телефоны для второго, третьего и прочих взрослых не сразу, а с некоторой, распределенной во времени, задержкой gij (t ) . Мы предполагаем, что форма распределения задержки остаѐтся неизменной на протяжении всего исследуемого периода времени. Тогда численность обладающих личными мобильными телефонами j -х 181 взрослых членов домохозяйств, где проживает i взрослых, можно описать сверткой во временной области: X ij (t ) g ij (t ) X i1(t ) . (13) В частности, если плотности распределения задержки выбраны в виде δимпульсов Дирака g ij (t ) ij (t ij ) (14) (это самый простой для вычислений способ), то покупка сотового телефона для jго члена домохозяйства отстает по времени от покупки телефона для главы домохозяйства на время задержки ij ( ij 0 ): X ij (t ) ij X i1(t ij ) , (15) где 0 ij 1 . Будем использовать ij и ij следующего вида: 1. Для j 2 задержка пропорциональна порядковому номеру взрослого члена домохозяйства ij ( j 1) . (16) 2. Для j i 2 множитель для j -х членов домохозяйства составляет ij j 2 (17) с ограничениями: 0 1, 0 1. Такая модель охватывает и случаи, когда телефоны приобретаются не для всех взрослых. В частности, при 0 личными телефонами обзаведутся только главы домохозяйств, а при 0 – только первый (глава) и второй члены домохозяйства. Выражение для численности владельцев аппаратов приобретает вид X ij (t ) j 2 X i1 t ( j 1) (18) Полное число владельцев сотовых телефонов в момент времени t: J i X (t ) X ij (t ) . i 1 j 1 (19) 182 Полученные формулы достаточны для расчета теоретических значений всех величин, которые собраны в ходе опросов, но содержат довольно много неизвестных параметров. С целью сократить количество неизвестных параметров, введем несколько дополнительных предположений. Во-первых, сократим количество неизвестных потенциалов. Предположим, что потенциалы распространения мобильных телефонов среди глав домохозяйств пропорциональны численности таких домохозяйств: M i1 c K i1 . (20) Иными словами, мы выдвигаем предположение, что доля домохозяйств, в которых уже есть или однажды появится сотовый телефон, не зависит от численности домохозяйств. Вообще говоря, считается, что в крупных домохозяйствах (за исключением очень бедных семей) обычно больше новинок, а сильнее всех в среднем отстают в освоении нововведений одинокие люди. Однако, во-первых, это означает скорее различие в параметрах скорости распространения q , чем в потенциалах, а во-вторых, в нашем распоряжении нет необходимых для моделирования таких различий российских данных. По этой причине мы и сокращаем число параметров. Умножая обе части последнего равенства на i и суммируя, убеждаемся, что J J i 1 i 1 M iM i1 c iK i1 cK , откуда c M и, наконец, K M i1 K i1 M ki1M . K (21) Величины ki1 возьмем из таблицы 3.1, таким образом, вместо шести неизвестных M i1 остался один неизвестный параметр M . Во-вторых, сократим аналогичным способом количество независимых начальных условий. Потребуем, чтобы для всех i X i1 (0) M i1 U (0) , M (22) иными словами, чтобы и в начальный момент времени наличие телефонов у глав домохозяйств не зависело от размера домохозяйств. 183 С учетом предыдущего предположения (20), получаем X i1 (0) ki1U (0) . (23) Теперь вместо шести X i1 (0) неизвестным остался только U (0) . Тогда bi ai 0 , M i1 ki1U (0) M U (0) и X i1 (t ) biU (t ) . Настало время выбрать конкретный (24) вид S-образной кривой для моделирования U (t ) . Выберем линейную модель функции риска (модель Ф.Басса): h(t ,U ) p q U , M (25) и, кроме того, учитывая, что до сентября 1991 года сотовой связи в России не было, используем нулевое начальное условие U (0) 0 . Тогда уравнение (10) превращается в уравнение (1) , а U (t ) выражается при помощи логистической функции (являющейся решением уравнения (4)) U (t ) 1 exp p q t M q 1 exp p q t p (26) Вследствие такого выбора функции риска и начальных условий получаем bi ki1 , X i1 (t ) ki1U (t ) и окончательную формулу для количества владельцев сотовых телефонов J X (t ) 1U (t ) j 2 jU t ( j 1) . (27) j 2 J где j ki1 . (28) i j Такое число взрослых людей на вопрос “Есть ли у вас лично мобильный сотовый телефон?” может искренне дать утвердительный ответ. 184 Таблица 3.2 Оптимальные параметры моделей Модель (%) q(лет-1) p (лет-1) (лет) B 85,8 0,80 1,8·10-5 1,09 1,0 1,0 A 91,3 0,71 2,9∙10-5 - - - Наилучшим образом (в предположении логнормального распределения ошибок) данным опросов удовлетворяют параметры модели B, указанные в таблице 3.2. В этой же таблице для сравнения приведены оптимальные параметры модели А. 100% Доля взрослого населения России 80% xА uB uA 60% Владельцы Есть в д/х Пользователи Модель A: есть в д/х Модель B: есть в д/х Модель A: владельцы Модель B: владельцы 40% xB 20% май.10 ноя.09 май.09 ноя.08 май.08 ноя.07 май.07 ноя.06 май.06 ноя.05 май.05 ноя.04 май.04 ноя.03 май.03 ноя.02 май.02 ноя.01 май.01 ноя.00 май.00 0% Рис.3.5. Сравнение моделей A и B На рис.3.5 вместе с данными социологических опросов представлены результаты расчетов по модели B: доли взрослых владельцев сотовых телефонов xB (t ) X (t ) / K (сплошная тонкая линия); доли взрослых пользователей мобильной связи u B (t ) U (t ) / K (сплошная жирная линия); 185 доли респондентов, отвечающих, что в домохозяйстве есть хотя бы один сотовый телефон, которая также равна u B (t ) . Здесь использованы данные ФОМ, ВЦИОМ, ―Левада-Центра‖, ―Ромир‖, компаний ―ГФК Русь‖ и ―Башкирова и партнеры‖. Синтетическая кривая u A (t ) , рассчитанная по модели A при помощи формул комбинаторики (см. таблицу 3.3), показана на рис.3.5 пунктирной линией. При расчете u A (t ) тоже предполагалось, что как только какой-нибудь член домохозяйства приобретает сотовый телефон, пользоваться им начинает все домохозяйство. Подчеркнѐм, что в моделях A и B величины u(t ) и w(t ) (доля респондентов, подтверждающих, что в домохозяйстве есть сотовый телефон) предполагаются тождественными. Однако в модели A все члены домохозяйства принимают решение о приобретении телефона независимо, другие члены домохозяйства влияют на это решение не больше, чем произвольный посторонний. На рис.3.5 эта независимость проявляется в значительном превышении u A (t ) над x A (t ) . В атомизованном обществе многие респонденты отвечали бы, что в домохозяйстве у них имеется сотовый телефон, но лично у респондента мобильника нет, ибо наличие телефона в домохозяйстве не влияет на собственное решение респондента (точнее влияет не более, чем наличие телефона у случайного встречного – а с членами своего домохозяйства в атомизованном обществе видятся не чаще, чем со случайными встречными). Этот эффект напрямую проявляется в значительном превышении пунктирной кривой над сплошной на рис.3.5 (см. аналогичный эффект на рис.3.6(б) и рис.3.7). Он, однако, вызван спецификой мобильного телефона, который, как отметил Э.Роджерс [449], проникает в домохозяйство как общий для всех инструмент, но позже становится личным. Другие устройства (например, ADSL-модем, Wi-Fi роутер, принтер, сканер, копировальная машина, холодильник, стиральная машина, швейная машинка) могут не приобретаться в личное пользование, в таком случае взаимное расположение пунктирной и сплошной кривой на рисунках будет иным. При этом 186 взаимное положение u A (t ) и x A (t ) всегда будет одинаковым, а взаимное положение uB (t ) и xB (t ) может отличаться. Рис.3.5 демонстрирует, что в то время как x A (t ) и xB (t ) почти совпадают, кривые u A (t ) и u B (t ) отличаются весьма заметно. Модель A предсказывает гораздо более высокий уровень проникновения сотовой связи в домохозяйствах, чем имеющий место в реальности. По-видимому, общество не является атомизованным, и наличие в домохозяйстве хотя бы одного сотового телефона существенно влияет на решение о покупке личных аппаратов для остальных членов домохозяйств. Как иллюстрирует рис.3.5, модель B удовлетворительно объясняет все три вида данных: о личном владении сотовым телефоном, о наличии его в домохозяйстве и об использовании мобильной связи. Таблица 3.3 Формулы расчета вероятностей различных сценариев в моделях A и B Событие 1. 2. Символ Модель A Модель B x(t ) x A (t ) X A (t ) / K x B (t ) X B (t ) / K J J ik ik i1 x iA xall (t ) i 1 i 1 3. 4. xsome (t ) ik 1 x 1 uB u A 1 xnone, A uB i 1 5. u B xall,B u A xall, A J xnone(t ) x (t ) x i1 ii , B i i1 A Дополнительные вопросы респондентам В феврале 2007 г. специалисты Фонда ―Общественное мнение‖ задали респондентам и более сложные вопросы, охватывающие пять событий: 1. Респондент владеет личным мобильным телефоном. 2. Все члены домохозяйства владеют личным мобильным телефоном. 3. Некоторые, но не все члены д/х-ва владеют личным мобильным телефоном. 187 4. Ни один член домохозяйства не владеет личным мобильным телефоном. 5. В домохозяйстве есть хотя бы один мобильный телефон. В таблице 3.3. приведены формулы расчета вероятностей этих ответов для модели A и модели B. Статистику ответов на первый и пятый вопрос мы подробно исследовали выше. Ответы на вопросы 2, 3, 4 были собраны Фондом ―Общественное мнение‖ в ходе опроса 15 февраля 2007 г. Эти данные вместе с соответствующими теоретическими величинами, указанными в таблице 3.3, представлены на рис.3.6. В этой таблице используются обозначения xij , A (t ) X ij ,B (t ) / K , и u A (t ) U A (t ) / K синтетические кривые xnone(t ) , т.п. x A (t ) X A (t ) / K , Пунктирными xall (t ) , xsome (t ) , x B (t ) X B (t ) / K , линиями показаны соответствующие модели A, сплошными линиями – аналогичные кривые, соответствующие модели B. При расчете параметров моделей данные этого опроса учтены не были, поэтому их можно считать контрольными. Рис.3.6 также свидетельствует в пользу модели B. У некоторых Ни у кого У всех 80% 60% 44% 40% 26% 20% 20% а) б) 2012 2010 2008 2006 2004 2002 2000 2012 2010 2008 2006 2004 2002 2000 2012 2010 2008 2006 2004 2002 2000 0% в) Рис.3.6. Наличие мобильных телефонов у членов домохозяйства: а – ни у кого; б – у некоторых; в – у всех 188 Мы заключаем, что модель B, в которой решающей единицей является домохозяйство, более полно описывает процесс распространения мобильной связи среди россиян, чем классическая модель A. Модель B способна одновременно объяснить несколько видов данных, в то время как модель A – только один. Анализ данных опросов ФОМ 2002, 2006 и 2011 гг. Данные другого опроса ФОМ, который проводился в 2002 и 2006 гг. (рис.3.7, закрашенные кружки), тоже лучше согласуются с моделью B. Сравнение сплошных и пунктирных кривых на рис.3.6 и рис.3.7 позволяет предположить, что дополнительный опрос, проведенный в 2010-2012 годах, смог бы предоставить чрезвычайно важные данные для обоснования выбора наиболее адекватной модели. 30% Только у других членов семьи Только у меня 25% 20% 15% 15% 14% 10% 5% 5% 7% 5% 4% 2012 2010 2008 2006 2004 2002 2000 2012 2010 2008 2006 2004 2002 2000 0% Рис.3.7. Наличие мобильных телефонов у респондента и у членов его семьи: а – только у респондента; б – только у других членов семьи. Сплошная линия – предсказания модели B, пунктирная – модели A. По просьбе автора данной работы Фонд ―Общественное мнение‖ включил вопросы, соответствующие рис.3.7, в опрос населения об использовании 189 мобильной связи и мобильного Интернета, который был проведѐн в конце мая – начале июня 2011 года. Результаты изображены на рис.3.7. незакрашенными кружками и располагаются заметно ближе к предсказаниям модели B. Замечание 1. Отметим, что в наших работах [95,111] рис.3.7(б) содержал ошибку: пунктирная кривая, соответствующая xother (t ) была рассчитана с использованием x B (t ) вместо x A (t ) . Расхождение между ошибочной и истинной кривыми незначительно, поскольку xB (t ) и x A (t ) очень близки. Замечание 2. Важно отметить, что в случае модели A выражения для всех изучаемых величин ( xall (t ) , xsome (t ) и т.п.) являются функциями x A (t ) и не включают какихлибо параметров диффузионной модели ( p , q и т.п.), хотя включают параметры структуры домохозяйств ki1 . Это означает, что, если предполагается, что общество атомизовано, то эти величины на практике определяются наблюдаемыми значениями d i , и не зависят от того, какая именно модель распространения нововведений в атомизованом обществе нами выбрана. Приведѐм два примера. Пример 1. Вместо модели риска Ф.Басса мы можем использовать модель Б.Гомперца, чтобы аппроксимировать те же данные d i . Если полученные прогнозные значения модели Гомперца x A,Gompertz(t ) окажутся близки к значениям, которые предсказывает модель Басса x A,Bass (t ) , то близки будут и прогнозируемые xall (t ) , xsome (t ) и т.п. Пример 2. Если мы усложним модель A, рассмотрев атомизованное, но неоднородное общество, например, используя расширяющийся со временем потенциал распространения нововведения (см. модель AС, описанную ниже), и применим усложненную модель к тем же самым данным наблюдений, то прогнозируемые xall (t ) , xsome (t ) тоже почти не изменятся. 190 Заметим, что при моделировании U (t ) мы не учитывали резкое снижение стоимости минуты разговора (MoU) и стоимости мобильного терминала, которые имели место в 1999-2003 годах, и, безусловно, оказывали влияние на решения индивидов и домохозяйств о начале использования мобильной связи. Однако мы предполагаем, что изменение цен во времени не нарушит связь между теоретическими кривыми x(t ) и u (t ) и не отменяет выводов относительно необходимости использования домохозяйств в качестве решающей единицы. Возможно, линейную зависимость (16) потребуется заменить более сложной, в которой задержки между последовательными покупками телефонов будут сокращаться. Модели, учитывающие снижение MoU обсуждаются в следующем разделе. Отметим, что подобно многим процессам в социально-экономических системах, процесс распространения нововведений, по-видимому, может быть описан с удовлетворительной точностью и при помощи других моделей. В частности, в нашей модели не учтены различия в использовании мобильной связи различными возрастными группами. ―Глава домохозяйства‖, который формально используется в нашей модели B, возможно, соответствует представителю возрастной группы 18-25 лет, которая осваивала мобильную связь наиболее активно. При этом различия между использованием мобильной связи в домохозяйствах различного размера, возможно, удастся полностью объяснить наличием или отсутствием в домохозяйстве молодых людей, а не самими размерами домохозяйств. Однако модели, учитывающие возраст членов домохозяйств, требуют для идентификации гораздо более детальные данные, чем те, которыми мы располагаем. Замечание о механизме приобретения и передачи устройств В рассмотренной модели B предполагается, что первоначально глава домохозяйства приобретает сотовый телефон для себя, а позже, по мере накопления средств, домохозяйство приобретает мобильные устройства и для других жильцов. 191 Как отмечалось выше, возникает вопрос, не является ли более правдоподобным сценарий, когда глава домохозяйства по мере появления денег приобретает новые устройства для себя, а подержанную трубку дарит другому члену семьи. С целью выяснить, насколько распространения практика дарения сотовых телефонов, автор настоящей работы в 2007 году провел опрос на Интернетпортале Рамблер. Результаты представлены на рис.3.8. Дарили (отдавали) ли вы мобильный телефон? Да, родителям 22.7 % Нет 18.5 % Да, родственникам 16.8 % Да, любимому человеку 14 % Да, ребѐнку 12.3 % Да, друзьям 8.9 % Да, коллеге на работе 2.1 % Выдавал подчинѐнному 2% Да, другое (нет в приведѐнном списке) 1.9 % Не могу вспомнить 0.8 % Рис.3.8. Итоги онлайн-опроса о дарении или передаче мобильных телефонов Оказалось, что практика дарения сотовых телефонов весьма распространена, по крайней мере среди пользователей Интернета. Итоги проведенного нами онлайн опроса подтверждают, что общество (или та его часть, которая использует Интернет и активно участвует в онлайн-опросах), в отношении приобретения сотовых телефонов не является атомизованным. Более правомерно назвать его 192 обществом с префигуративным типом культуры [221,141]. Более 80% участников опроса в прошлом дарили или отдавали свои сотовые телефоны. При этом мы снова наблюдаем возрастную неоднородность того же характера, что изучаемая в первой главе настоящей работы – чаще всего респонденты дарили мобильный телефон родителям. Отметим, что родители могут вести домохозяйство отдельно от детей, таким образом дарение устройств может пересекать границы домохозяйств. Дополнительный вопрос телефона. (рис.3.9) уточнял механизм передачи сотового Как показали результаты онлайн-опроса, среди тех респондентов, которые дарили телефоны, приблизительно половина приобретали их специально, а другая половина дарила собственный. Таким образом, в реальности имеют место оба упомянутых механизма. Вы отдали/подарили этому человеку собственный мобильный телефон или специально приобрели новый мобильный телефон в подарок? Это был мой телефон, я пользовался (пользовалась) им прежде 37.5 % Специально приобрел(а) новый мобильный телефон в подарок 36.6 % Никому не дарил(а) мобильных телефонов 24 % Не могу вспомнить 1.9 % Рис.3.9. Итоги онлайн-опроса о дарении или передаче мобильных телефонов Безусловным недостатком проведенного нами опроса является его нерепрезентативность. Не исключено, что индивиды, не склонные делать подарки, попросту не примут участие в таком опросе. Поэтому представленные данные приведены в качестве иллюстрации, а не доказательства. К сожалению, в 2007 году, когда был проведен опрос, математическая модель распространения нововведения еще не была построена, поэтому опрос не 193 служил инструментом ее верификации. К тому моменту, когда автор построил модель процесса, он уже потерял возможность проводить онлайн-опросы. Таким образом, оба рассмотренных способа поведения главы домохозяйства распространены и подтверждается онлайн-опросами. Как уже отмечалось, математические модели для выбранных нами показателей совпадают для обоих случаев. 3.1.2 Модели с линейно растущим потенциалом распространения В этом разделе распространения мы сотовой сосредоточимся связи. Мы на двух аспектах продемонстрируем процесса необходимость выделения по меньшей мере двух этапов распространения сотовой связи в России и построим количественную динамическую модель диффузии для второго этапа, которая учитывает информацию о снижении стоимости минуты разговора. Наш подход отличается от предыдущих исследований распространения мобильной связи в России, в которых либо использовались регрессионные модели, не включающие время в качестве переменной [203], либо динамические модели не логистического семейства [249], либо одна диффузионная модель для всего периода роста числа абонентов [61,60,95,111,177,178,206,301]. Динамика проникновения сотовой связи в России Известно, что первый пользовательский мобильный звонок в России совершил 9 сентября 1991 г. мэр Санкт-Петербурга А. А. Собчак, который позвонил в США. Вплоть до 1998 года пользователями мобильной связи являлись преимущественно организации и состоятельные индивиды [248,268]. Второй этап распространения этого нововведения в России начинается в 1999 году, когда, обнаружив отток абонентов, крупные операторы приняли решение о выводе услуги мобильной связи на массовый рынок и начали снижать стоимость минуты разговора. В итоге рост числа абонентов возобновился, а доля владельцев сотовых телефонов среди россиян в 2000 году достигла 2%. Ю.А.Бакман и В.С.Панфилов полагают, что началом этапа бурного роста систем сотовой связи в России можно считать 1999 г., когда количество 194 пользователей превысило первый миллион человек [20]. О.Панкратова отмечает более высокую скорость роста распространения мобильной связи в России по сравнению с европейскими странами, так что расширение абонентской базы с 40% до 100% произошло в России за 2 года [237]. (а) 200% Проникновение мобильной связи (доля абонентов в населении РФ) 150% (в) 600 164% 500 133% 115% 106% 84% 100% Млрд. руб. Доходы подвижной электросвязи РФ 400 Услуги населению 300 Услуги организациям 200 51% (б) 250% 150% 2009 2008 2007 2006 2005 2004 2003 2002 2001 2000 1999 1200 1000 800 ARPU 938 950 600 440 2009 2003 2002 2001 2000 1999 1998 1997 2009 2008 2007 2006 2005 2004 2003 2002 2001 2000 1999 1998 1997 1996 1995 1994 259 191 210 224 247 222 2008 325 0 0% 2007 200 2006 Этап 2 2005 Этап 1 611 400 2004 100% 50% (г) Руб./мес. 1200 Цепные темпы прироста 200% 1998 2009 2008 2007 2006 0 2005 2004 2003 2002 2001 2000 1999 1998 1997 1996 1995 0% 1994 100 25% 12% 1% 2% 5% 1997 50% Рис.3.10. Показатели распространения мобильной связи в РФ: а) относительное число абонентов, б) цепные темпы прироста числа абонентов за год, в) доходы подвижной электросвязи за год, г) среднемесячная выручка с абонента (ARPU). Использованы данные Росстата. В 2010 г. Международный Союз Электросвязи (МСЭ) отметил, что подобный ―рывок‖ был характерен и для стран СНГ в целом. Мы полагаем, что причиной столь высокой скорости диффузии стал быстрый рост потенциала рынка, вызванный снижением средней стоимости минуты разговора (т.н. appm), к которому привела интенсивная конкуренция операторов сотовой связи. Как показывает рис.3.10(б), высокие цепные темпы прироста количества абонентов R(t ) X (t t ) X (t ) / X (t ) наблюдались и в 1991-1998 г., однако к 1999 г. потенциал первого этапа распространения мобильной связи в РФ был исчерпан. 195 Объем услуг связи населению в денежном выражении в этот период не превышал половины объема услуг организациям. Однако он быстро рос, и в 2009 году семикратно превысил объем услуг организациям (см. рис.3.10.(в)). Поэтому в период после 1999 года мы ограничиваемся моделированием распространения мобильной связи среди населения. Начиная с 2000 года, публикуются уникальные в плане разнообразия и полноты данные массовых опросов о личном владении мобильным телефоном (―Левада-Центр‖, ФОМ, ВЦИОМ, РОМИР). Мы присоединяемся к мнению И.С.Березина [24] о том, что количество активных абонентов (SIM-карточек), которое во многих исследованиях используется в качестве данных, не является надежным статистическим показателем, поскольку операторы связи не раскрывают методику вычисления активной абонентской базы, так что известен случай, когда крупный российский оператор ―списал‖ сразу восемь миллионов абонентов. Поэтому в качестве данных для количественного моделирования мы выбираем данные массовых социологических опросов, хотя для иллюстрации этапов распространения сотовой связи привлекаем данные Росстата о количестве абонентов. При помощи рис.3.11 можно сравнить показатели распространения мобильной связи в России и Тайване. Тайвань является первым крупным регионом, где количество абонентов превзошло численность населения [335]. Это произошло в 2002 году. Рис.3.11(а) и (в) демонстрируют сходство динамики относительного числа абонентов (количество активных абонентов, отнесенного к численности населения). Здесь треугольниками изображены данные Росстата и МСЭ, а квадратами – данные о стоимости минуты разговора [237,278,335]. На рис.3.11(б) и (г) показаны результаты расчета цепных темпов прироста количества абонентов с шагом t , равным одному году. Как в Тайване, так и в России на графике темпов прироста отчетливо выделяются две фазы убывания темпов, обозначенные цифрами ―1‖ и ―2‖, обведенными в кружок. Сравнение поведения темпов прироста R(t ) с динамикой стоимости минуты разговора appm 196 позволяют предположить, что кратковременный быстрый рост R(t ) является результатом быстрого снижения appm. Действительно, в случае Тайваня в 1997 году на рынок в дополнение к монополисту фиксированной связи было допущено пять новых компаний, что повлекло 22-кратное снижение appm в течение двух лет и 32-кратное за весь период. 10 150% Тайвань 8 125% 100% 6 75% 0,4 50% 0% (в) 250% 200% 0,2 0,0 2007 0 2004 25% 2001 2 Appm ( $/мин ) 1998 2007 2004 2001 1998 1995 1992 1989 Цепные темпы прироста Цепные темпы прироста 150% 2004 (г) 1995 2007 2004 2001 1998 0% 1995 0% 1992 50% 1989 50% 2 1 2007 100% 2001 2 1 1992 100% 1998 150% (б) 0,6 1995 Appm ( $/мин ) 0% 200% 0,8 100% 1992 4 25% 250% 1,0 75% 50% (a) Россия Доля абонентов 1989 125% Доля абонентов 1989 150% Рис.3.11. Динамика показателей распространения мобильной связи в Тайване: а) –относительное число абонентов, б) – цепные темпы прироста числа абонентов за год; аналогичные показатели в России:, в) – относительного числа абонентов, г) – цепные темпы прироста. Пунктирными линиями показана стоимость минуты разговора (appm), которой соответствуют правые оси (а) и (в). Цифры 1 и 2 в кружках обозначают две фазы распространения мобильной связи. Использованы данные [237,278,335] и МСЭ (ww.itu.int/ITUD/ICTEYE/). В 1999 году снижение цен начинается и в России, но не столь стремительное, хотя в итоге стоимость минуты разговора падает почти в 20 раз (см.табл.3.5). Темпы прироста абонентской базы здесь были не столь высоки, так что кривая 197 относительной доли абонентов на рис.3.11(в) отстает от кривой на рис.3.11(а) приблизительно на пять лет. С целью объяснения поведение цепных темпов прироста, сплошными линиями на рис.3.11 показаны результаты наших расчетов [123] по двухсегментной модели распространения нововведений П.Стеффенса и Д.Мурти [461]. Поскольку снижение цен в Тайване произошло практически ―мгновенно‖, мы полагаем, что двухсегментная модель удовлетворительно описывает динамику показателей мобильной связи в Тайване. Однако в России процесс снижения цен занял несколько лет, в течение которых показатель appm монотонно падал, поэтому для второго этапа распространения мобильной связи в нашей стране мы считаем более подходящей модель с линейным, а не скачкообразным ростом потенциала рынка. Уравнение используемой в наших работах модели комбинированных воздействий с линейно растущим потенциалом рынка имеет вид [116,112,122] dX X (t ) pq M (t ) X (t ) . dt K (1) с начальным условием X (0) N0 . Здесь используются следующие обозначения: X (t ) – текущая численность пользователей, т.е. тех, кто уже использует нововведение в момент времени t ; M (t ) – потенциал распространения инновации, т.е. полная численность потенциальных пользователей, включающая как тех, кто уже пользуется, так и тех, кто способен когда-либо воспользоваться нововведением, p – параметр внешних воздействий (параметр инновации), воздействий (параметр имитации), K q – параметр внутренних – полное число коммуницирующих индивидов (например, численность популяции). При этом потенциал M (t ) может быть функцией дохода индивидов, appm и других переменных. Предполагается, что X (t ) M (t ) и dM / dt 0 . Решение уравнения (1) для случаев, когда потенциал M (t ) линейно растет со временем M (t ) t , или постоянен, получено нами в работах 198 [131,116,112,122] при помощи т.н. интеграла Доусона – специальной функции, для вычисления которой с высокой точностью существует большое количество алгоритмов и программ. В настоящей работе моделирование распространения мобильной связи в условиях линейно растущего потенциала рынка M (t ) проведено при помощи методов, описанных в [122]. Таблица 3.4. Типы моделей распространения нововведения Потенциал M (t ) Единица, принимающая решение Постоянный Растущий Индивид AC AV Домохозяйство BC BV Четыре модели диффузии нововведений, результаты применения которых ко второму этапу распространения мобильной связи в России обсуждаются ниже, перечислены в табл.3.4. Модель AC с постоянным потенциалом рынка и индивидом в качестве единицы, принимающей решение, является наиболее распространенной [61,60,111,177,178,301], однако, на наш взгляд, недопустимо упрощает действительность. Модель AV c переменным потенциалом рынка рассмотрена в наших работах [112,122]. Модель BC, в которой решения принимают домохозяйства, изучена в наших работах [70,84,87,95,111], и, наконец, BV, в которой решения принимают домохозяйства и потенциал рынка растет со временем, предложена в работах [116,112,118]. Модель AV Новизна предлагаемой в настоящей статье модели AV состоит в том, что в ней учтен рост потенциала M (t ) , который в классической модели AC считался постоянным. В реальности доступность мобильной связи, которую отражает M (t ) , росла во времени. Сперва M (t ) был мал по сравнению с численностью населения страны. Так, Ю.Федорова отмечает, что ―всего 10 с небольшим лет назад сотовый телефон считался предметом роскоши и далеко не каждый мог себе позволить 199 оплачивать счета, составлявшие в среднем 2-3 сотни долларов в месяц‖ [278]. Сходное мнение высказывает В.В.Радаев: ―Мобильные телефоны относились к разряду экзотики еще в середине 1990-х годов (всего лишь 5-8 лет назад), служили знаком статусного превосходства, элементом престижного потребления ‖ [248]. Однако уже в августе 2006 г. большинство респондентов ФОМ полагало, что мобильный телефон может иметь каждый, кто захочет (57%). Еще 17% респондентов связали наличие сотового телефона с уровнем дохода или наличием доступа. Несмотря на указанную возможность, в этот период только 54% взрослых россиян владели личным сотовым телефоном. Следовательно, потенциал M (t ) уже в 2006 г., по-видимому, составлял не менее 83% взрослого населения, и был заметно выше, чем текущий уровень проникновения X (t ) . В июне 2004 г. было опубликовано мнение представителя оператора, согласно которому в Перми в результате ―ценовых войн‖ операторов мобильная связь стала доступна даже малообеспеченным слоям населения, в том числе тем, кто был готов тратить на нее лишь 1-2 доллара в месяц [268]. При этом проникновение сотовой связи в Перми составляло 50%, а в Пермской области – 25-30% (этот уровень совпадал со среднероссийским). Эти данные подтверждают предположение о том, что в 2004 году, потенциал рынка достиг максимальной величины ( M (t ) M max ), и заметно превысил проникновение X (t ) . Таблица 3.5. Динамика APPM в России в 2000-2009 гг., долл. США по данным [237,278] Год APPM Год ($/min) APPM Год ($/min) APPM ($/min) 1998 0,77 2002 0,18 2006 0,06 1999 0,64 2003 0,13 2007 0,06 2000 0,40 2004 0,09 2008 0,05 2001 0,24 2005 0,07 2009 0,04 200 Как показывают данные табл.3.5 (см. также рис.3.12), данные о стоимости минуты разговора (appm) в период между 1999 и 2009 гг. можно удовлетворительно описать при помощи гиперболического тренда P(t ) P0 t T (2) параметры которого, определенные методом наименьших квадратов, оказались равны: P0 223,7 (долл.*сут.-1), T 04 / 10 / 1998 . (В качестве единицы времени приняты сутки). Данные об appm взяты из работ [237,278] и изображены серыми треугольниками на рис.3.12, а результаты расчетов по формуле (2) показаны сплошной серой линией. Доля пользователей среди взрослых россиян (%) APPM ($/min) 100 1,00 M(t) 80 0,80 X(t) P(t) 60 0,60 янв.13 янв.12 янв.11 янв.10 янв.09 янв.08 янв.07 янв.06 янв.05 янв.04 0,00 янв.03 0 янв.02 0,20 янв.01 20 янв.00 0,40 янв.99 40 Рис.3.12. Динамика наличия сотового телефона в личном пользовании по данным Левада-Центра – кружки, динамика appm по данным [237,278] – треугольники. Чтобы упростить задачу мы игнорируем рост доходов россиян и снижение стоимости сотового телефона в рассматриваемый период, полагая, что снижение appm было ключевым фактором. Примем во внимание лишь снижение средней стоимости минуты разговора (appm) и рассмотрим модель, в которой только appm 201 определяет потенциал M (t ) . Используем для указанного периода обратную зависимости потенциала распространения новой услуги от ее стоимости: M (t ) A пока M (t ) M max , P(t ) далее M (t ) M max . Можно интерпретировать такую зависимость (3) как единичную эластичность спроса по цене. Подставляя (2) в (3), получаем линейно растущий потенциал распространения нововведения M (t ) A t T , пока M (t ) M max . P0 (4) Мы зафиксировали начальную долю владельцев телефонов N 0 / K равной 0,54% в начале 1999 г., и предположили, что модель AV справедлива, начиная с этого момента времени. Таким образом, последние два параметра модели AV табл.3.6 были заданы нами заранее. Остальные четыре параметра табл.3.6 были определены нами методом наименьших квадратов при помощи данных Левадацентра и явного выражения для X (t ) , (использующего интеграла Доусона) полученного в нашей работе [122]. Таблица 3.6 Параметры моделей AC и AV Модель M/K q p А N0/K (%) (лет-1) (лет-1) (чел. * руб./сут.) (%) AC 91,3 0,71 2,9∙10-5 – 0 1.09.1991 AV 88,1 1,52 8,4·10-2 10,81 0,54 1.01.1999 t0 Модель BV Модель атомизованного общества объясняет лишь часть доступных данных опросов – данные о личном владении сотовым телефоном, но неспособна объяснить данные о наличии этого устройства в домохозяйстве. В 2001-2006 гг. доля россиян, у которых мобильный телефон есть в домохозяйстве, систематически превышала долю имеющих мобильный телефон в личном пользовании (см.рис.3.3 и рис.3.5). 202 Это наблюдение представляется тривиальным, однако специально не учитывается в моделях атомизованного общества AC и AV. C целью построения количественной модели, объясняющей все описанные ранее данные социологических опросов, нами была изучена модель BC [70,111]. В этой модели единицей, принимающей решение, является домохозяйство, а не индивид, однако потенциал распространения нововведения M (t ) предполагался постоянным, как и в модели АC. Последнее предположение игнорирует имевшее место в реальности значительное удешевление услуг мобильной связи, отмеченное в работах [237,248,249,278]. Модель BV, учитывающая такое удешевление, предлагается в наших работах [116,112,118]. 100% Доля взрослого населения России 80% xB uB M(t) 60% Владельцы 40% Есть в д/х Пользователи Модель B: есть в д/х Модель B: владельцы 20% Потенциал M(t) май.11 ноя.10 май.10 ноя.09 май.09 ноя.08 май.08 ноя.07 май.07 ноя.06 май.06 ноя.05 май.05 ноя.04 май.04 ноя.03 май.03 ноя.02 май.02 ноя.01 май.01 ноя.00 май.00 0% Рис.3.13. Динамика наличия сотового телефона в домохозяйствах (по данным Левада-Центра, ФОМ, ВЦИОМ). На рис.3.13 представлены результаты расчета при помощи модели BV с переменным потенциалом M (t ) . В этом случае уравнению (1) удовлетворяет не количество владельцев телефонов X (t ) , а количество пользователей сотовой связи U (t ) (возможно, использующих устройства, принадлежащие другим членам 203 семьи). Количество владеющих мобильными телефонами домохозяйств численностью i членов выражается формулой X i1 (t ) iU (t ) X i1 (0) iU (0)e H (t ) , (5) которая является аналогом формулы (41) из предыдущего раздела. Здесь используется интегральная функция риска t H (t ) pt q 0 U ( ) d . K (6) В случае линейной функции риска (см.формулу 11 предыдущего раздела) выражения (5) и (6) можно выразить через интеграл Доусона [122] (см. раздел 1.2.2 данной диссертации). Здесь мы рассматриваем лишь наиболее простой для расчетов частный случай пропорциональных начальных условий X i1 (0) iU (0) . Таблица 3.7 Параметры моделей BC и BV Модель А M /K q p (%) (лет-1) (лет-1) (лет) BС 85,84 0,8 1,77·10-5 1,09 1,0 1,0 – BV 95,00 0,8 0,11 1,09 1,0 1,0 10,81 На рис.3.13 (чел. * руб./сут.) потенциал M (t ) изображен пунктирной линией, доли пользователей сотовой связи среди взрослых россиян u B (t ) U (t ) / K и доля владельцев телефонов среди взрослых россиян xB (t ) U (t ) / K – жирной и тонкой линиями. Отметим, что в модели BV потенциал M (t ) возрастает вплоть до 2006 г., а не до 2004 г., как в модели AV. Мы полагаем, что данные опросов совместно с данными об appm не устраняют неопределенность в поведении потенциала M (t ) , поэтому нельзя утверждать, что модель BV ―лучше‖ описывает данные, чем модель BC. Можно лишь утверждать, что модель BV тоже описывает данные приблизительно с той же точностью. Однако модель BV учитывает снижение appm, в то время как модель BC этот факт полностью игнорирует. 204 Отметим также, что, хотя различие в поведении потенциала на рис.3.12 и рис.3.13 кажется не слишком значительным, оно отвечает существенно различному поведению пользователей. В модели AV, соответствующей рис.3.12, потенциал вырос резко (почти скачкообразно), однако индивиды проявили определенную инертность, медленно принимая решение о приобретении телефона. В модели BV, которой соответствует рис.3.13, операторы, постепенно снижая стоимость минуты разговора, плавно увеличивают потенциал M (t ) , после чего домохозяйства существенно быстрее, чем в AV, приобретают сотовые телефоны. В монографии Э.А.Разроева описаны [249] маркетинговые исследования, при помощи которых операторы, снижая цены, пытались определить уровень доходов пользователей, которым доступна услуга, тем самым измеряя потенциал рынка M (t ) . Как показывает табл.3.6, в модели BV оказывается высок параметр внешних воздействий p , а значит, на решения домохозяйств значительное влияние оказывала реклама операторов. Заметим, что приведенный в табл.3.6 набор параметров – лишь один возможных наборов, аппроксимации дающих данных. приблизительно Изучаемая проблема одинаковую ошибку характеризуется обилием правдоподобных решений, поэтому мы имеем возможность указать лишь на еще одно из возможных объяснений, но, безусловно, не можем выделить единственное решение. Подобная неоднозначность вообще характерна для исследований диффузии нововведений, тем более, что потенциал M (t ) , играющий важную роль в модели (1), гораздо сложнее измерить, чем количество пользователей, владельцев или абонентов. Мы полагаем, что однозначные результаты могут быть получены лишь в том случае, если исследователи будут с самого начала планировать опрос как источник данных для построения диффузионных модели распространения нововведения. Замечание о функции распределения задержки gij (t ) В то время как выбранный нами вид плотности распределения задержки gij (t ) в виде дельта-функции (и, соответственно, ступенчатой функции дожития) 205 упрощает расчѐты, более реалистичной альтернативой, по-видимому, является функция дожития в виде гамма-распределение, о чѐм свидетельствует рис.3.14, полученный при помощи онлайн-опросов, проведѐнных автором на портале Рамблер. Доля респондентов Вероятность, что лаг больше заданной величины 100% Второй член д/х 80% Третий член д/х Четвертый член д/х 60% 40% 20% 0% 0,0 1,0 2,0 3,0 4,0 5,0 Величина задержки (годы) Рис.3.14. Распределение величины задержки до приобретения личного сотового телефона (по данным онлайн-опроса). Несмотря на сделанное замечание, мы полагаем, что форма распределения задержки не оказывает существенного влияния на результаты моделирования и не меняет сделанных в этой работе выводов. 3.2 Совместное моделирование компьютерного рынка и парка компьютеров Количество персональных компьютеров (ПК) на душу населения страны − один из ключевых показателей развития информационного общества, используемый при составлении страновых рейтингов ООН и Международного союза электросвязи (МСЭ). В данной работе представлены расчетные оценки размеров российского компьютерного парка и компьютерного рынка России в натуральных величинах. компьютерного парка Построенные нами ранее прогнозы динамики до 2012 г. [134,113,125,179] скорректированы и 206 сопоставлены с новыми данными о продажах компьютеров, и прогнозами Минкомсвязи и Министерства экономического развития (МЭР) [246]. 3.2.1 Модель распределения срока службы компьютера Под эксплуатационным компьютерным парком мы понимаем совокупное количество компьютеров (настольных, мобильных и серверов), которые эксплуатируются пользователями. Компьютерный парк РФ по известным нам оценкам насчитывает от 40 до 63 миллионов устройств. 76,0 91,0 62,0 2011 38,3 52,3 17,2 9,8 15,6 7,4 14,0 9,1 2011 2009 5,8 2007 2003 2001 1999 1997 1995 2011 2009 2007 (c) 7,2 4,9 2005 14,9 2005 2009 31,2 23,0 12,2 3,7 2,6 3,0 1,3 1,4 1,8 1,6 1,6 1,9 2003 1997 2001 1995 1999 3,5 2,2 2,5 2,8 1,9 2007 16,1 15,5 13,0 5,5 1,0 17,0 15,0 2005 13,0 12,0 2003 10,0 11,0 2001 7,3 6,0 1999 4,7 3,7 2,6 1995 2011 16,7 16,3 11,1 1997 65,3 Продажи ПК за год (миллионы штук) 19,8 8,2 (b) 77,5 58,1 Парк компьютеров (миллионы штук) 2009 2007 2005 2003 Накопленное число выбывших из строя компьютеров (миллионы штук) 1,4 48,4 39,3 31,9 26,1 17,5 14,5 11,9 2001 8,5 10,1 1999 6,9 5,1 1997 3,7 1995 21,2 (a) Накопленные продажи ПК (миллионы штук) (d) Рис.3.15. Показатели продаж и парк ПК в РФ в 1995-2010 гг. При анализе годового объема продаж ПК в России в натуральном выражении мы используем осреднение данных трех источников, в числе которых иcследовательские компании IDC Russia, IT-Research и Gartner-Dataquest, публикующие статистику продаж новых компьютеров (см., например, [385,386,280,306]). Компания IDC подразумевает под рынком ПК поставки производителей дистрибьюторам персональных компьютеров, включая настольные, портативные и серверы стандартной архитектуры, сходную методику 207 использует и Gartner. Компания IT-Research оценивает величину рынка иным способом, подсчитывая отгрузку дистрибьюторов в розницу. Все три организации включают в свои оценки не только продажи крупных поставщиков, но и т.н. ‗самосбор‘ ПК из комплектующих мелкими фирмами и непосредственно потребителями. Осредненные продажи изображены на рис.3.15(d), вместе с хорошо аппроксимирующей их в 1999-2007 гг. экспонентой. Добавлена наша оценка продаж за 2010 год и наш наиболее оптимистический прогноз на 20102012 гг. Отметим указанную ранее проблему необходимости разработки ―вспомогательных‖ моделей, своего рода интерфейсов к данным [273,146]22, при попытке применения моделей распространения нововведений для изучения распространения новых информационных технологий. Безусловно, между поставкой компьютеров дистрибьюторам и продажей конечному потребителю протекает некоторое время, таким образом эти показатели отнюдь не тождественны. Различия не сводятся к простой задержке, поскольку в периоды падения спроса в магазинах могут накапливаться нераспроданные устройства. В этом разделе мы, так же как и перечисленные выше компании-измерители, предполагаем, что в стабильной экономической ситуации различия между поставками и продажами незначительны, поэтому считаем их совпадающими. Запишем уравнение баланса парка компьютеров [36,264] Q(t ) N (t ) R(t ) . Здесь Q(t ) (1) – продажи ПК (в ―штуках‖), накопленные за весь период существования рынка (в РФ мы условно начинаем отсчет с 1986 года); N (t ) – парк ПК, который мы определяем как количество компьютеров, которые используются владельцами; R(t ) – накопленные продажи ПК на замену выбывшим из строя, они равны количеству вышедших из строя ПК. 22 Ю.Н.Толстова [273] отмечает: ―Социальные явления настолько сложны, что, каким бы хорошим метод ни был, всегда требуется определенная его подгонка под конкретную ситуацию. Любой метод всегда обрастает методическими наработками, связанными с его адаптацией, привязкой к реальной социологической задаче. Чаще всего упомянутая подгонка осуществляется за счет создания нетривиальных методик сбора данных и интерпретаци получаемых с помощью выбранного метода результатов. При этом каждая конкретная задача требует своих собственных и теоретических, и практических разработок.‖ 208 На рис.3.15(a) изображены накопленные продажи Q(t ) , полученные суммированием продаж за каждый год (рис.3.15(d)), а на рис.3.15(b) показан парк ПК N (t ) за период с 1995 до 2010 г. и прогнозные значения МЭР на 2011 и 2012 годы. При построении рис.3.15(a) и (d) использованы данные IDC, IT-Research, Gartner Dataquest, рис.3.15(b) - данные Минкомсвязи РФ и прогноз МЭР. Данные Минкомсвязи доступны на сайте Minsvyaz.ru в разделе ―Деятельность министерства/Статистика отрасли‖, исторические данные опубликованы в монографии [206]. На рис.3.15(c) все данные использованы совместно. Открытыми символами показаны прогнозные значения. Сплошной линией на рис.3.15(a) и (d) показаны экспоненты, наилучшим образом приближающие продажи за 1999-2007 гг. и отражающие известный факт роста российского рынка ПК устойчивыми темпами прироста около 21% в эти годы. Переписав уравнение баланса парка компьютеров в виде R(t ) Q(t ) N (t ) , (1a) мы получаем формулу для вычисления парка вышедших из строя компьютеров. Вычисления приводят нас к неожиданному результату, который показан на рис.3.15(с). А именно, в 2009 году накопленное количество сломанных компьютеров R(t ) якобы уменьшилось на 6,8 миллионов штук. Однако величина R(t ) не может убывать, поскольку является суммой последовательности положительных чисел, представляющих количество вышедших из строя компьютеров за последовательные годы (или иные интервалы времени). Даже если бы в 2009 году не сломался ни один компьютер, величина R(t ) оставалась бы постоянной, но не могла бы снизиться. Единственным объяснением снижения накопленного числа сломанных компьютеров был бы массовый ремонт вышедших из употребления устройств. Однако для объяснения столь крупных расхождений потребовался бы внезапный ремонт 6,8 миллионов ПК в 2009 году, а столь масштабные работы вряд ли остались бы незамеченными23. Другой 23 В.В. Клочков обратил внимание автора на возможность простоя значительного парка технических устройств, в частности, пригодные к эксплуатации самолѐты могут не использоваться годами [185]. В случае отсутствия средств для покупки новых аппаратов, возможно возвращение в эксплуатацию старых. Мы признаѐм, что 209 причиной расхождений могли бы быть большие отрицательные ошибки в оценке рынка ПК аналитическими агентствами, однако падение рынка ПК, начиная с последнего квартала 2008 года, отмечалось не только в России. Более вероятным нам кажется предположение о том, что претерпела изменения методика Минкомсвязи оценки величины парка ПК, причем смыкание данных было произведено без учета совместимости с данными о продажах ПК. Указанные расхождения побуждают нас построить модель и составить прогнозы компьютерного рынка и компьютерного парка Российской Федерации до 2012 г. При построении модели мы опираемся на подход В.Камакуры и Ш.Баласубраманьяна [392], который учитывает функцию распределения вероятности времени покупки ―на замену‖. Действительно, часть компьютерного парка ежегодно устаревает и нуждается в замене. Гипотеза, которая лежит в основе модели таких покупок, состоит в том, что ―возраст замены‖ есть случайная величина, которая подчиняется распределению вероятностей, аналогичному распределению вероятности поломки продукта. В основе расчетов при этом лежит уравнение теории восстановления t dN q(t ) r (t ) q(t ) q( ) g (t )d , dt t0 где N (t ) – парк компьютеров, q(t ) ―штуках‖), r(t ) (2) dQ – продажи ПК в единицу времени (в dt dR – продажи ПК ―на замену‖ в единицу времени, g (t ) – dt плотность распределения времени жизни ПК; t0 - момент начала продажи компьютеров в изучаемом регионе. Разумеется, распределение срока службы компьютеров меняется от года к году. Например, в год финансового кризиса фирма может отложить замену служебных компьютеров своих сотрудников, а частные пользователи – повременить с покупкой нового компьютера. Однако у нас недостаточно данных, чтобы учесть такие флуктуации. Поэтому мы считаем функцию отклика процесса устаревания доступные данные не позволяют нам отвергнуть теоретическую возможность реализации такого сценария в 2009 году. 210 стационарной во времени. Ошибки, возникающие в результате такого упрощения, не мешают моделировать динамику компьютерного парка РФ с достаточной для наших целей точностью. С целью определить неизвестную нам функцию g (t ) в конце 2004 года мы провели масштабный опрос о сроке службы компьютера на Интернет-портале Rambler. Основной вопрос звучал так: "В каком году был выпущен компьютер, с которого вы сейчас вышли в Интернет?" Вычитая из года проведения опроса год, который назвал респондент, мы вычисляли возраст компьютера. Такой подход позволил отчасти избежать округления возраста респондентами до величин, кратных 5, характерного для ответов на вопрос о возрасте предмета потребления [6], а не о моменте его приобретения. В ходе опроса 56 тысяч респондентов смогли сообщить год выпуска своих компьютеров. Мы учитывали приобретение только новых компьютеров, однако, как показали опросы, доля компьютеров, приобретенных подержанными, невелика. 30% Опрос 2004 г. Опрос 2005 г. Доля респондентов 25% Опрос 2006 г. Опрос 2007 г. 20% Опрос 2008 г. 15% 10% 5% 0% 0-1 1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 9-10 Возраст компьютера (лет) Рис.3.16. Итоги пяти онлайн-опросов о возрасте используемого компьютера. 211 В дальнейшем аналогичный опрос мы повторяли ежегодно в 2005-2008 гг., итоги пяти опросов представлены на рис.3.16. В каждом случае число респондентов измерялось десятками тысяч. Отметим, что частоты (частости), представленные на рис.3.16, оказались весьма близки к полученным в 2004 году результатам дневникового исследования КОМКОН, в котором панелистов спрашивали, как долго они пользуются одним компьютером. Как показывает рис.3.16, итоги опросов за различные годы весьма близки, существенно отличаются лишь ответы за 2008 г., когда доля респондентов, купивших ПК непосредственно в год опроса, была заметно меньше, чем в предыдущие годы. Мы связываем это с резким падением продаж ПК в России в IV квартале, которое (в натуральном выражении) составило 38%. Мы исключили результаты опросов за 2008 год из процедуры определения распределения срока службы компьютера, поскольку использование таких данных требовало бы знания точной формы продаж q(t ) в период их быстрых изменений. Обозначим R(t ) – количество ПК, вышедших из строя между t и t t . Эта величина зависит от возраста компьютеров, и, таким образом, от истории продаж q(t ) t t R(t ) t dL(T ) q( )d , d (3) где L(a ) − т.н. ―функция дожития‖ или функция надежности устройства, представляющая собой вероятность работоспособности устройства, возраст которого равен a ; q(t ) dQ (t ) – интенсивность продаж (в единицу времени). dt При помощи вероятностных рассуждений нетрудно показать, что модель для определения функции надежности L(t ) по данным опроса имеет вид ti i c L(T ) q( )d , (4) ti 1 где i – год, в частности 1998, 1998,…,2008; ti – момент окончания этого года; T – момент проведения опроса; i – теоретическое значение количества 212 респондентов, ответивших, что компьютер, которым они пользуются, заполняя нашу анкету, приобретен новым в i -м году; c – неизвестная нам постоянная, равная доле наших респондентов среди владельцев ПК. Если L(t ) и q(t ) между ti и ti 1 меняются медленно, то для расчета i можно использовать приближение i c L(T ti ) Qi , (5) где Qi – продажи за год i (или иной период измерения) в натуральном выражении (штуках); ti – середина года опроса (данные за 2004 г. мы относим к середине 2004 г. и т.п.). Далее мы не будем использовать это приближение, поскольку для выбранного вида нами функции надежности существует точное аналитическое выражение для i , которое здесь и используется. Для описания функции надежности В.Камакура и Ш.Баласубраманьян применили усеченное нормальное распределение [392], а в наших работах [134,113,125,133] использовалась усеченная логистическая функция L( x ) L( x; , ) 1 exp( ) 1 exp ( x ) (6) с параметрами положения и масштаба . Однако при экспоненциально растущих продажах (которые и имели место в 1999-2007 гг.) q(t ) exp t (7) наиболее удобным видом функции надежности оказывается гамма-распределение (t; , z ) с параметрами и z и плотностью d ( t ) z 1 t g (t ) e . dt ( z ) Подставляя L(t ) (t; , z) и q(t ) (8) вида (7) в формулу (4) находим формулу количества респондентов i c e T f (T ti 1 ) f (T ti ) , (9) где f (a ) 1 z a ( a; z , ) . 1 1 (a; z, )e z ( ) (10) 213 Поскольку расчет гамма-распределения (t; , z ) является стандартной функцией большинства вычислительных пакетов (включая офисный пакет MS Excel), в случае экспоненциально растущего рынка величину (4) можно рассчитать с высокой точностью, не используя численное интегрирование. Для усеченного логистического распределения (6) также можно выразить число респондентов при помощи специальных функций, однако итоговая формула имеет еще более громоздкий вид. Поэтому в данной работе мы используем гамма-распределение. В более общем случае, когда функция продаж имеет произвольную форму, или при желании работать с поквартальными продажами, уравнение (4) следует интегрировать численно. Доля респондентов 30% 25% Данные 20% Модель 15% 10% 5% 0% 0-1 1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 9-10 Возраст компьютера (годы) Рис.3.17. Итоги моделирования данных опросов о возрасте компьютера i . Для определения параметров , z и c мы использовали метод максимального правдоподобия. На рис.3.17. тонкими линиями изображены данные опросов, жирной пунктирной линией − итоги расчетов при помощи формул (9-10) и оптимального набора параметров 0,56 , z 3,4 . Параметр c различен для каждого года, поскольку число респондентов различалось, в 214 дальнейших вычислениях он не требуется. Средний срок службы компьютера при таком наборе параметров составляет 6,12 года. 0,45 Плотность вероятности замены 0,40 z=25 0,35 0,30 0,25 z=10 0,20 z=0,1 z=3,4 0,15 0,10 0,05 0,00 0 1 2 3 4 5 6 7 8 9 10 Срок службы устройства (годы) Рис.3.18. Теоретические плотности распределения срока службы компьютера. Плотность гамма-распределения (8) изображена жирной пунктирной линией на рис.3.18 и весьма близка к плотности усеченного логистического распределения, использованного нами ранее [134,113,125,133]. Заметим, что при росте рынка с постоянными темпами (7), который имел место в 1999-2007 гг., любая из плотностей распределения на рис.3.18 продуцирует одинаковую кривую продаж ‗на замену‘ (3), которая при темпах прироста рынка в 21% задержана по сравнению с первыми продажами на 5,18 года. Сделанное замечание обосновывает необходимость измерения плотности распределения при помощи опросов, поскольку в условиях экспоненциального роста рынка найти g (t ) при помощи известных продаж и парка ПК по формуле (2) невозможно, но для вычисления парка при более сложной зависимости q(t ) при помощи (2) потребуется знать точную форму g (t ) . В 2004-2008 гг. мы проводили опросы о моменте покупки компьютера в конце года, в декабре. Кроме того, дополнительные опросы были проведены в весенние, летние и осенние месяцы, при этом респондентам был задан вопрос о 215 том, в каком месяце они приобрели ПК, что помогло нам определить сезонные множители. Здесь мы ограничимся замечанием о том, что при определении срока службы компьютера предлагаемым нами методом важен месяц проведения опроса, поскольку сезонные колебания продаж весьма сильны, и существуют задержки между покупкой компьютера и подключением его к Интернету, а также между ―поставкой‖ агентства) и компьютера непосредственно (которые продажей. подсчитывают Дальнейшие маркетинговые детали подробно обсуждаются в нашей работе [136]. Парк компьютеров РФ: сценарий F2010 100 90 80 Прогнозы МЭРТ Парк компьютеров (миллионы) 70 59,9 60 51,5 50 44,1 40 35,5 29,9 30 20 10 37,7 24,2 10,8 12,9 7,8 9,2 5,2 6,1 6,9 3,9 2,8 0,6 0,8 1,1 1,3 1,8 15,9 19,5 0 90 91 92 93 94 95 96 97 98 99 00 01 02 03 04 05 06 07 08 09 10 Сценарий F2010 0,6 0,8 1,1 1,3 1,8 2,8 3,9 5,2 6,1 6,9 7,8 9,2 10,8 12,9 15,9 19,5 24,2 29,9 35,5 37,7 44,1 I прогноз МЭРТ 46,9 51,8 63 II прогноз МЭРТ 46,9 51,8 69,5 11 51,5 76,1 93,3 12 59,9 90,5 96,3 Рис.3.19. Компьютерный парк РФ: модель и прогнозы. Нами рассчитаны несколько сценариев роста компьютерного рынка и сопутствующего роста парка компьютеров, при этом проанализированы несколько опубликованных стратегий [134]. В качестве оптимистического сценария роста компьютерного парка нами был предложен представленный на рис.3.19 сценарий, основанный на опубликованных прогнозах продаж с темпами прироста рынка персональных компьютеров в 15% в 2011-12 гг. В этом случае уровень продаж в 2012 г. должен составить чрезвычайно высокую величину − 16 216 миллионов компьютеров, указанную на рис.3.15(d). Мы намеренно используем столь высокое значение, чтобы подчеркнуть, что оно не смягчает диапазон расхождений наших оценок с опубликованными прогнозами МЭР. Опубликованный весной 2010 г. Министерством Экономического развития прогноз парка ПК объемом в 63 миллионов штук [246], подтвержденный позже в публикациях Минкомсвязи оценки в 62 миллиона устройств более, чем на 40% превосходит размеры, которые мы получили путем расчетов по модели (2). Расхождения прогноза Минэкономразвития с нашим прогнозом ‗F‘ на 2011 г. являются почти двукратными (см.рис.3.19). По расчетам министерства к 2012 году по сравнению с 2008 годом количество ПК возрастет более чем в 2 раза, достигнув 97 миллионов. Оптимистический и консервативный прогнозы Минэкономразвития изображены серыми линиями в правом верхнем углу рис.3.19, результаты наших расчетов показаны темными прямоугольниками. Безусловно, одной из причин расхождений может быть грубая ошибка в оценке объема компьютерного рынка агентствами IDC, Gartner и IT-Research, в частности недоучет т.н. ―самосбора‖. Однако методика IT-research использует подсчет количества ввезенных в РФ жестких дисков, которые не производятся внутри страны и не могут быть собраны самостоятельно. Более того, по утверждению компаний, их оценки компьютеры. Расхождения в включают и собранные самостоятельно оценках между агентствами невелики, и использование максимальной оценки вместо средней не привело к существенному снижению обсуждаемых расхождений в размере парка ПК. Наконец, причиной различий может быть ошибка в определении нами плотности вероятности выхода из строя компьютера. Средний срок службы ПК может оказаться выше, чем оценка в 6,12 года, полученная нами путем моделирования ответов пользователей лишь тех компьютеров, которые используются для выхода в Интернет. Не исключено, что компьютеры, не подключенные к Интернету, а используемые в производстве или для ведения личных финансов и набора текстов, используются в среднем значительно дольше. Заметим, однако, что наша оценка отнюдь не 217 является низкой: в работе [199] предполагалось, что период обновления парка ПК составляет 5 лет, а согласно работе [36] серверный парк обновляется в среднем тоже один раз в 5 лет. Альтернативную оценку компьютерного парка можно получить, опираясь на итоги ежегодного федерального государственного статистического наблюдения, которые доступны на сайте Росстата Gks.Ru в сборниках ‗Российский статистический ежегодник‘ за 2001-2009 гг. Это наблюдение охватывает крупные и средние организации, однако, к сожалению, не учитывает субъекты малого предпринимательства, поэтому его итоги, вместе с результатами выборочного обследования домохозяйств Росстатом, позволяют вычислить лишь нижнюю оценку парка ПК. Она оказывается немного ниже нашей оценки, представленной на рис.3.19, причем последнее доступное значение относится к 2009 году и составляет 37,2 млн. компьютеров. Несмотря на сделанные замечания относительно численных значений, наша модель обладает преимуществами внутренней согласованности, и не допускает расхождений между продажами и парком ПК, продемонстрированных на рис.3.19. Мы полагаем, что совместное моделирование данных о продажах компьютеров в РФ и размере компьютерного парка позволяет получать более реалистичные прогнозы обеих величин, избежать грубых рассогласований, подобных продемонстрированным на рис.3.15(c)), а также исследовать влияние регулирования рынка ПК на парк компьютеров. 3.2.2 Прогнозирование парка и рынка ПК, планшетных компьютеров и сотовых телефонов Здесь разработанная в предыдущем разделе модель модифицирована и применена для практического прогнозирования парка и рынка ПК в России. Главное отличие заключается в том, что при прогнозировании используется не оценка продаж q(t ) , выполенная представителями компаний-производителей компьютеров, а величина dN , оцененная при помощи модели распространения dt нововведения в домохозяйствах, разработанной в предыдущей главе. 218 Основным фактором роста компьютерного рынка за последние десять лет выступает спрос домашних хозяйств (а не организаций), которые в условиях роста доходов смогли позволить себе использование Интернета, компьютерных игр, видео и иных услуг, предоставляемых растущим числом поставщиков. По нашим расчѐтам в 2003 году домохозяйства имели приблизительно столько же компьютеров, сколько и корпорации, однако в 2012 году во владении домохозяйств находится 53-56 миллионов ПК, в то время как корпорации используют лишь около 10 миллионов ПК. Таким образом, хотя корпорации обновляют свой парк чаще, покупки частных лиц составляют основную часть продаж компьютерного рынка. Российский рынок ПК в 1996-2007 гг. демонстрировал устойчивые темпы прироста около 21% в эти годы, в последнем квартале 2008 года финансовый кризис вызвал резкое падение продаж, и в 2009 г. рынок провалился на 30%, однако провал был вскоре компенсирован резким ростом на 48% в 2010 году. Далее последовали относительно благополучные для компьютерных компаний 2011 и 2012 год, однако в последнем квартале последнего началось замещение ноутбуков, и в первую очередь – нетбуков, планшетными компьютерами. Наш прогноз на 2012 год, составивший 13,9 миллионов устройств оказался посередине между данными измерений Gartner (13,6 млн.) и IT-Research (14,0 млн.) Мы предполагаем, что в 2013-2016 г. рынок по-прежнему будет определяться спросом со стороны домохозяйств, и мы продолжаем оценивать потенциал проникновения компьютеров (включая любые будущие устройства, способные использовать Интернет, предоставлять возможность играть в цифровые игры, смотреть видео и обрабатывать документы) также в 90%. В основе наших расчетов компьютерного рынка лежит модель динамики распространения ПК в российских домохозяйствах и организациях, аналогичная модели распространения мобильных телефонов, разработанной в предыдущих разделах данной главы. Для каждого из сегментов рынка – домашнего и корпоративного мы строим отдельную модель компьютерного парка, при помощи 219 которой затем рассчитываем величину рынка. Компьютерный парк РФ по нашей оценке в 2012 году составил 52,5 миллионов устройств, и в 2013 году составит 59,5 устройств (см. рис.3.21). Рынок ПК и планшетных компьютеров РФ: данные и прогноз Продажи компьютеров (миллионы единиц) 30 25 20 18,8 17,1 15 13,8 15,0 15,5 12,5 9,1 10 9,8 7,4 4,9 5 1,4 1,8 1,6 1,6 1,9 0 Продажи: данные 2,6 3,0 10,8 9,3 10,4 10,8 7,2 5,8 3,7 3,4 0,7 96 97 98 99 00 01 02 03 04 05 06 07 08 09 1,4 1,8 1,6 1,6 1,9 2,6 3,0 3,7 4,9 5,8 7,4 9,1 9,8 7,2 10 11 12 13F 14F 15F 16F 10,8 12,5 13,8 Прогноз F2013 Продажи планшетов: прогноз: 9,8 14,98 15,48 17,09 18,82 0,7 3,4 9,3 9,8 10,4 10,8 Рис.3.20. Компьютерный рынок России: осредненные опубликованные данные IDC, ITResearch и Gartner, а также наши прогнозы. При моделировании спроса домохозяйств на компьютеры мы используем широко применяемую модель диффузии инноваций Ф.Басса и подбираем ее параметры таким образом, чтобы удовлетворить ежегодно публикуемым данным опросов Левада-центра о наличии или отсутствии компьютера в российских семьях. Кроме того, как свидетельствуют результаты обследований бюджетов домохозяйств Росстатом, некоторая доля российских семей, владеющих ПК, с течением времени приобретает второй и третий компьютеры. Это следует из того, что на 100 домохозяйств в 2012 году приходилось 86 компьютеров, в то время как компьютерами обладали лишь 61% домохозяйств. По нашим оценкам 50% домохозяйств однажды приобретает второй компьютер в дополнение к уже работающему первому, 25% - приобретает и третий, а соответствующие 220 временные лаги – 3 года (для второго дополнительного компьютера) и 6 лет (для третьего). Покупки дополнительных компьютеров также включены в нашу модель, что позволило нам учесть как данные Левада-центра о доле ПК в семьях, так и данные Росстата. Парк компьютеров РФ: данные и прогнозы 100 Парк компьютеров 90 (миллионы устройств) 80 82,1 73,6 65,8 70 59,6 60 52,5 46,3 50 34,2 36,2 40 28,7 30 20 10 0 Прогноз 40,8 9,9 12,0 6,2 7,0 8,4 5,5 4,6 3,3 14,9 18,5 23,1 96 97 98 99 00 01 02 03 04 05 06 07 08 09 10 11F 12F 13F 14F 15F 16F 3 5 5 6 7 8 10 12 15 18 23 29 34 36 41 46 53 I прогноз МЭРТ 46,9 51,8 63 76,1 90,5 II прогноз МЭРТ 46,9 51,8 69,5 93,3 96,3 60 66 74 82 Рис.3.21. Парк компьютеров России: данные, прогнозы Министерства экономического развития и наш прогноз. Что касается корпоративного сегмента рынка, то мы предполагаем, что спрос на компьютеры со стороны российских организаций продолжит расти, однако понижаем темпы прироста с 16% в год до 7% в год (на основе собственной экспертной оценки). Суммируя парки домашних и корпоративных компьютеров, мы получаем итоговый прогноз парка ПК, изображенный на рис.3.21. Заметим, что этот парк не включает планшетные компьютеры, парк которых, по нашим расчѐтам в 2016 году составит 33,6 миллионов устройств, что в 8 раз выше, чем по итогам 2012 года. Итогом расчетов является прогноз продаж компьютеров на российском рынке до 2016 года, который изображен на рис.3.20. 221 На рис.3.20 представлен также наш прогноз рынка планшетных компьютеров. Мы исходили из предположения, что ранними покупателями планшетных компьютеров являются обеспеченные лица, которые способны без ущерба для своего бюджета приобретать дополнительные устройства. Таким образом, их покупки расширяют рынок на 3-4 миллиона устройств. Покупка планшетного компьютера не влияет на их решения о покупке дополнительных ноутбуков или настольных компьютеров. Однако в дальнейшем покупки совершают менее обеспеченные лица, которые ради приобретения планшетного компьютера отказываются от приобретения ноутбука. Таким образом, покупки планшетов снижают объѐм продаж ноутбуков, хотя почти не сказываются на общем размере компьютерного парка. По нашим прогнозам основной рост продаж планшетных компьютеров придѐтся на 2013 год, после чего продажи планшетников в значительной степени стабилизируются. 60 50 40 30 20 10 2014 2013 2012 2011 2010 2009 2008 2007 2006 2005 2004 2003 2002 2001 2000 0 1999 Млн. штук Продажи сотовых телефонов в России Рис.3.22. Продажи сотовых телефонов в России: данные компании ―Евросеть‖ и наш прогнозы. Пунктиром показаны 95%-е доверительные интервалы. 222 Наконец, на рис.3.22 представлен наш прогноз рынка сотовых телефонов. Сплошными кружками показаны данные по 2006 г. включительно, которые были опубликованы компанией ―Евросеть‖ и использованы нами при идентификации параметров модели. Открытыми кружками показаны аналогичные данные, опубликованные в 2007-2013 гг. .Сплошной линией показан наш прогноз продаж сотовых телефон в России. Пунктирными линиями показаны 95%-е доверительные интервалы, рассчитанные методом Монте-Карло; способ расчѐта описан в работах [3,344] и в кандидатской диссертации автора [163]. На рис.3.20 и 3.22 обращают на себя внимание значительные ―провалы‖ рынков ПК и сотовых телефонов: ―обрушения‖ рынка могут достигать 25% от среднего значения. Такие краткосрочные эффекты не учитываются в моделях распространения нововведений, хотя они чрезвычайно важны для игроков компьютерного рынка. Мы полагаем, что полезные для практиков краткосрочные прогнозы могут быть получены путѐм применения моделей, распространения нововведений с экспертными поправками за влияние краткосрочных факторов. Описанные здесь прогнозы парков и рынков технических устройств были использованы ЗАО ФИНАМ при подготовке ряда аналитических отчѐтов. Выводы 1. Разработанные модели, учитывающие наличие в обществе не только индивидов, но и домохозяйств, способны объяснить данные массовых социологических опросов об использовании мобильной связи и персональных компьютеров. Единицей, принимающей решение о приобретении нового устройства и первым его владельцем первоначально является глава домохозяйства, а последующие члены домохозяйства получают устройство в личное владение с задержкой. 2. Разработана модель роста парка технических систем с учетом данных маркетинговых исследований о размере рынка и онлайн-опросов о сроке службы устройства, которая применена для прогнозирования российского парка компьютеров, планшетов и сотовых телефонов. 223 4 ГЛАВА 4. МОДЕЛЬ ВЫБОРА НОВЫХ ИКТ ДЛЯ ИНВЕСТИРОВАНИЯ ВЕНЧУРНЫМ ФОНДОМ При венчурном инвестировании в инновационные проекты в качестве единицы, принимающей решение об использовании нововведения, выступает не индивид или домохозяйство, а организация специального вида – венчурный фонд. Л.В.Ивина и В.А.Воронцов предлагают следующее толкование этого термина: ―«фонд венчурного капитала» – фонд (организация), аккумулирующая частные финансовые средства для инвестирования в высокорисковые высокотехнологичные инновационные проекты. Фонд вкладывает средства путѐм приобретения акций новой компании на ограниченный срок (до тех пор, пока рынок не будет способен вернуть вложенный капитал с существенной прибылью, но обычно не более чем на 7 лет)‖ [175]. Те же авторы определяют стартап (startup) как только что возникшую компанию [175]. В наших работах [76,77,81,91,89,88,158] предложен инструмент выбора (отбора) инновационных проектов в области ИКТ, построенный на основе матрицы первичной оценки бизнес-идеи. П.Л.Виленский и др. определяют проект как ―комплекс допустимых действий (работ, услуг, управленческих операций и решений), обеспечивающих достижение определенных целей (получение определенных результатов)‖ [39]. Авторы определения отмечают, что в теории управления проектами под проектом понимается совокупность действий, исполнителей и средств по выработке определенных целей и их достижению. В данной главе изучена две проблемы, регулярно встречающиеся в деятельности венчурных фондов: 1. проблема низкого качества фильтра нижнего уровня системы (воронки) отбора высокотехнологичных проектов, которая решена при помощи методов теории распознавания образов; 2. проблема длительного обслуживания заявок на нижнем уровне системы отбора инновационных проектов, которая решена при помощи инструмента 224 поддержки принятия решений, позволяющего аналитику обрабатывать заявки и давать заявителям предварительные ответы в течении одного часа. Мы применяем к задаче отбора проектов (стартапов) известный в теории распознавания образов метод обучения с учителем; в роли последнего в нашей работе выступает портфель проектов фонда, в отношении которых лица, принимающие решения, уже сделали выбор. В работе [153] автором и Н.С.Мациевским при помощи этого инструмента проанализированы проблемы венчурного инвестирования в проекты предоставления программного обеспечения в качестве услуги (―software-as-a-service‖). Результаты исследования внедрены ЗАО ФИНАМ при отборе венчурных проектов в сфере ИКТ в 2006-2013 гг., что подтверждается Актом о внедрении от 24.12.2013 (см. приложение Б-4). 4.1 Модель принятия решения об инвестировании в информационные и телекоммуникационные технологии венчурным фондом Венчурные фонды, наряду с центрами трансфера технологий, технопарками, бизнес-инкубаторами и центрами подготовки кадров, составляют инфраструктуру национальной инновационной системы. В Концепции долгосрочного социально-экономического развития Российской Федерации на период до 2020 года [198] развитие механизмов венчурного финансирования в сфере информационно-коммуникационных технологий рассматривается как часть стратегии развития науки, национальной инновационной системы и технологий. Ожидается, что высокие прибыли венчурных инвесторов будут стимулировать привлечение внебюджетных средств в науку и инновации. Венчурное инвестирование можно определить как долгосрочное предоставление средств молодым компаниям, находящимся на ранних стадиях развития, в обмен на долю в этих компаниях [182]. Поскольку будущее новых компаний, в особенности, – их финансовые показатели, характеризуются 225 чрезвычайно высокой неопределенностью, потенциальные инвесторы редко обладают всей информацией, необходимой инструментов оценки для использования традиционных эффективности инвестиций. Для успешного вложения средств венчурному инвестору необходимо обеспечение, в первую очередь – информационно-аналитическое системно-аналитические методы отбора24 проектов ранних стадий (―стартапов‖). В этой главе мы не выйдем за рамки задач венчурного фонда и не будем делать различий между терминами ―проект‖ и ―стартап‖, некоторые определения которых были даны выше. В настоящей работе рассмотрен инструмент отбора инновационных проектов, построенный на основе матрицы первичной оценки бизнес-идеи (МПОБ) [15,16,27] с учетом специфики проектов, поступающих на рассмотрение венчурного фонда. Фонд ФИНАМ ИТ, который послужил базой для результатов, излагаемых в этой работе, фокусируется на молодых компаниях и проектах, работающих в области информационных и телекоммуникационных технологий (ИКТ). На рассмотрение инвестиционного комитета фонда каждый год поступает несколько сотен проектов, основатели которых рассчитывают в перспективе получить высокую прибыль благодаря успешной реализации новой идеи. Наиболее значимыми активами в структуре фонда в 2006-2008 гг., к которым относятся данные, послужившие экспериментальной базой разработанного нами построения инструмента, являлись доли в компаниях ―Мамба‖ и ―Бука‖. Краткое описание этих компаний позволяет составить представление о характерном масштабе стартапов и проиллюстрировать случаи, в которых фонд считает задачу выбора удачно решенной. Термин ―отбор‖ не следует ассоциировать с ―отъемом‖, ―захватом‖, ―отчуждением‖ или экспроприацией. Толковый словарь Д.Н.Ушакова определяет отбор как действие по глаголу ―отобрать‖, но не в значении принудительного изъятия (отнять), а в значении выделения, выбора некоторого количества из общего числа. В толковом словаре В.И.Даля приведены синонимы – ―выбирать‖, ―отделять‖, ―сортировать‖ или ―класть особо‖. В качестве примера употребления приведѐн ―отборный товар‖. Среди синонимов и сходных по смыслу выражений можно назвать ―выбор‖, ―выделение‖, ―селекцию‖, ―кастинг‖ и ―скрининг‖. Последний термин часто употребляется в отношении стартапов. 24 226 Пример инвестированной компании: “Бука” ―Бука‖ (Buka Ltd.) – издатель компьютерных игр, входил в тройку лидирующих игроков рынка. Объем выручки компании ―Бука‖ в 2007 г. составил около 40 млн долларов, показатель EBITDA – более 14 млн долларов. Годовые темпы прироста оборота компании в 2007 г. превышали 50%. В 2008 г. фонд продал ―Буку‖ компании ―1С‖, лидеру российского рынка компьютерных игр. Пример инвестированной компании: ЗАО “Мамба” ЗАО ―Мамба‖ - интерактивный сервис онлайн-знакомств с широкой партнерской сетью, где пользователи оплачивают услуги (в основном – по рекламе своих анкет) при помощи SMS-сообщений, отправляемых через операторов сотовой связи. Основные партнеры – проекты Mail.Ru и Rambler. Оборот компании в 2007 г. составил 405 миллионов рублей, темпы прироста оборота - около 50% в год, рентабельность EBITDA – от 47% до 50%. Фонд планирует продажу ―Мамбы‖ после достижения компанией стоимости в 4-5 млрд рублей. Необходимость разработки формализованной системы отбора стартапов вызвана ростом интенсивности потока проектов, поступающих на рассмотрение инвестиционного комитета фонда. В частности, обсуждаемый в этой работе инструмент отбора (скрининга) был применѐн при обработке полутора тысяч инвестиционных заявок, поступивших на рассмотрение фонда ФИНАМ ИТ в 2006-2012 гг. Ни руководители фонда, ни члены инвестиционного комитета не имеют возможности тщательно рассмотреть все заявки. Поэтому венчурный фонд нанимает одного или несколько аналитиков, которые при отборе заявок должны репрезентировать инвестиционный комитет и выбирать проекты так, как это делал бы комитет, если бы располагал необходимым для этого временем. На практике аналитики зачастую имеют существенно иное видение перспектив развития индустрии ИКТ и иные предпочтения [261]. Необходимо подчеркнуть, что аналитик не является и не может являться экспертом во всех направлениях ИКТ, поскольку спектр этот чрезвычайно широк. Наиболее популярные сейчас 227 направления деятельности стартапов – электронная коммерция [149], социальные сети, поисковые, ―облачные‖, рекламные технологии, технологии видеоконференций, дистанционное образование – слишком различаются, чтобы один эксперт мог глубоко разбираться в соответствующих технологиях и бизнесмоделеях. Поэтому требуется разработка методики, которая позволяла бы аналитику руководствоваться не только личным опытом и соображениями ―здравого смысла‖, но, в первую очередь, – предпочтениями инвестиционного комитета. Сами эти предпочтения могут не быть изложены в виде инструкций, не быть сформулированы или быть сформулированы расплывчато, однако их можно выявить путем анализа портфеля проектов, в которые фонд инвестировал ранее. Многие предложения, являясь инновационными в широком смысле, не соответствуют интересам венчурных инвесторов. Частичная формализация показателей и критериев, которыми руководствуется венчурный фонд при отборе проектов, делает его деятельность более понятной для предпринимателей и изобретателей, которые предлагают свои проекты на рассмотрение. В результате, предложение адаптируется к спросу, и работа обеих сторон становится эффективнее. Система отбора инновационных проектов венчурным фондом (рис.4.1) включает организационную и информационную составляющие. Организационная подсистема включает мероприятия по сбору и обработке данных (в том числе первичный отбор, т.н. первые встречи и последующие встречи с авторами предложений), обсуждение проектов на совещаниях инвестиционного комитета, процедуру принятия решения о необходимости сбора дополнительных данных или о переходе к стадии подписания соглашения о конфиденциальности и тщательного изучения компании (―due diligence‖). На каждой из изображѐнных на рис.4.1 стадий число рассматриваемых фондом проектов, сокращается на порядок, что иллюстрируют при помощи воронки или ―ракеты Дрейпера‖ [182]. На каждой стадии с проектом работают различные специалисты: на этапе предварительного изучения – это бизнес-аналитики, на этапе тщательного 228 изучения возрастает роль юристов и специалистов по бухгалтерскому учету, экспертов по ИКТ, решения принимаются инвестиционным комитетом [150]. Инвестор Стартап договор Предприниматель, совладельцы, бухгалтер Сделка Детальное изучение, финансовый анализ, юридическая экспертиза Предприниматель, совладельцы, бухгалтер Управляющий директор, юрист отчѐтность Управляющий директор, Менеджеры, юристы, финансисты, эксперты презентация Первая встреча, последующие встречи Предприниматель, консультант, специалисты Предварительный отбор проектов для детального изучения Предприниматель, консультант, директор по развитию Менеджер, аналитик заявка, тизер Аналитик Рис.4.1. Система отбора инновационных проектов Указанные группы специалистов, хотя отчасти и пересекаются, но не совпадают, поэтому важно, чтобы их действия были согласованы. Наиболее важно, чтобы первичный отбор проектов репрезентировал предпочтения инвестиционного комитета, а не собственные симпатии аналитиков25. Матрица предварительной оценки бизнес-идеи Метод отбора проектов на основе матрицы предварительной оценки бизнесидеи (МПОБ) принадлежит к классу т.н. балльных моделей и ставит целью быстро, силами малого числа подготовленных аналитиков оценить перспективность большого числа деловых идей [15,16,27]. Процесс расчета 25 Возникает вопрос, действительно ли предварительным отбором предложений занимается или должен заниматься специальный работник (аналитик), а не руководство фонда? Можно заметить, что на мероприятиях, посвященных открытому отбору стартапов, или на специальных телевизионных программах, судьями на конкурсах инновационных проектов выступают узнаваемые ―первые лица‖ – руководители фондов. Однако список финалистов, как правило, составляют отборочные комиссии. Вряд ли слишком смелым будет предположение, что успешные руководители рационально расходуют свое время и умело делегируют полномочия. В общем случае, руководитель работает сам там, где высока ―цена вопроса‖. В случае венчурного фонда можно считать срочными и важными задачи инвестирования крупных денежных средств, и другие вопросы, которые не будучи решенными, повлекут большие потери или значительную упущенную выгоду. Согласно модели делегирования полномочий в виде так называемой ―матрицы Эйзенхауэра‖, популяризованной С.Кови [188], руководитель передает сотрудникам задачи, которые классифицирует как срочные, но не важные. Предварительный отбор (отсев) предложений можно считать срочной, но не важной задачей, и в венчурных фондах его зачастую поручают аналитику. В отличие от венчурной компании, т.н. ―бизнес-ангел‖ – ветеран индустрии, инвестирующий в стартапы личные средства, отсеивает предложения самостоятельно. 229 интегральной оценки привлекательности стартапа по качественным показателям на основе МПОБ можно изобразить при помощи блок-схемы (рис.4.2). Стартап A: x=5%, y=20% в год, z="возможно, удастся использовать существующую сеть партнѐров" Матрица предвар. оценки бизнеса Перевод в баллы: U = f(x), V=g(y), W=h(z) Показатели: U, V, W Веса: u = 1, v = 1, w = 0,5,.. Оценка: s = u*U + v*V +W*w Решающее правило: ЕСЛИ s>10, ТО "ДА" иначе "НЕТ" Решение: подписать NDA Рис.4.2. проекта Алгоритм предварительного отбора Методика предварительной оценки бизнес-идеи требует расчета шести агрегированных показателей, каждый из которых является суммой 3-5 более простых (элементарных) показателей. В таблице 4.1 перечислены агрегированные показатели, и для двух из них – ―привлекательности рынка‖ и ―синергии бизнеса‖ – указаны все элементарные показатели. Остальные элементарные показатели подробно описаны в статье [15] и гл. 3 монографии С.Я. Бабаскина [16]. Элементарные показатели могут быть измерены, оценены или рассчитаны экспертом. элементарные В этой работе мы будем показатели ―признаками‖, хотя для краткости называть они не всегда являются результатами непосредственных измерений. Первоначально набор из 16 признаков, разделенных на 6 групп (по 2-3 признака на группу), был опубликован в работе А.Бретта [27] и предназначался для оценки факторов технологического риска потенциальных коммерческих возможностей. А.Бретт допускал возможность исключения или замены некоторых 230 признаков и добавления небольшого числа новых. Двенадцать новых признаков были добавлены в работах С.Я.Бабаскина [15,16]. Расширенный С.Я.Бабаскиным набор признаков внедрен в корпоративной системе ―4И‖ сбора и обработки предложений сотрудников корпораций, разработанной под руководством В.В.Матохина в корпорации Текора [219]. Таблица 4.1 Матрица предварительной оценки бизнеса [16,27] № Показатель Диапазон изменений 1 Привлекательность рынка (5 признаков) -10..10 1.1. Рыночные перспективы -2..2 1.2. Темпы прироста рынка -2..2 1.3. Барьеры для вхождения на рынок -2..2 1.4.(*) Уровень конкуренции -2..2 1.5.(*) Прибыльность сегмента рынка -2..2 2 Выгоды пользователя (5 признаков) -10..10 3 Обоснованность идеи (5 признаков) -10..10 4 Синергия бизнеса (4 признака) 4.1. Соответствие миссии компании 4.2. Возможность использования -8..8 -2..2 существующей клиентской базы -2..2 4.3. Достаточность знаний и опыта -2..2 4.4.(*) Возможность использования существующего производства и системы распределения -2..2 5 Достаточность ресурсов (4 признака) -8..8 6 Охрана идеи (3 признака) -6..6 Заметим, что иерархические системы показателей, каждый из которых представляет собой сумму или среднее арифметическое элементарных признаков, 231 часто встречаются в задачах отбора или отсева. Так, например, в работе Ю.И.Погорлецкой, посвященной кредитному скорингу в системе банковского риск-менеджмента [243], используются пять показателей, которые характеризуют 1) финансовое состояние эмитента долговой бумаги; 2) экономическое состояние эмитента, 3) деловую репутацию, 4) маркетинговые позиции, 5) организационную структуру и уровень управления. При оценке финансового агрегируются семь групп признаков. Остальные состояния четыре показателя рассчитываются при помощи 4-6 элементарных признаков по формуле средней арифметической. По данным С.В.Уланова в кредитном скоринге количество признаков составляет от 6 до 18 [275]. Можно поставить вопрос о минимально необходимом или оптимальном количестве признаков. По-видимому, 20-30 признаков на практике оказываются достаточными для решения задач отбора/отсеивания компаний или проектов в разумные сроки26. Инвестиционный комитет венчурного фонда, выступающий в роли лица, принимающего решение (ЛПР), или, точнее, единицы, принимающей решение (ЕПР), может использовать МПОБ в качестве одного из инструментов отбора проектов. (В этой работе мы не принимаем во внимание различия между ЛПР и ЕПР, предполагая, что инвестиционные комитеты венчурных фондов состоят из единомышленников). Инструмент должен преобразовывать оценки отдельных признаков, выполненные аналитиками, таким образом, чтобы полученная интегральная оценка соответствовала предпочтениям ЛПР. Модели функции полезности, используемой ЛПР Помимо показателей, необходимо определить вектор весов w , который описывает важность отдельных показателей. Традиционный подход к задаче выбора использует линейную аддитивную модель функции полезности, в которой общая полезность бизнес-идеи представлена в виде взвешенной суммы оценок полезности отдельных показателей: 26 Предлагаемая ниже диаграмма ―Привлекательность – неопределенность бизнес-идеи‖ использует лишь 19 признаков из 28 признаков, предложенных С.Я.Бабаскиным, причем один из признаков (―отрицательные последствия для окружающей среды‖) в сфере ИКТ используется ―вхолостую‖. Таким образом, в нашем способе отбора проектов венчурным фондом ―работают‖ только 18 признаков. 232 K U X kU k X k 1 N U k (X ) wi uki (1) i 1 Mi uki U kij ( xij ) j 1 где U (X) – суммарная оценка полезности бизнес-идеи X ; U k X – полезность бизнес-идеи X , измеренная k -м экспертом; u ki – оценка привлекательности проекта по i -му агрегированному показателю, данная k -м экспертом; xij величина j -го признака (элементарного агрегированного показателя; M i - количество показателя) в составе признаков, образующих – i -го i -й агрегированный показатель; U kij ( xij ) – полезность признака xij , измеренная k -м K экспертом; wi – вес i -го показателя; i – вес мнения i-го эксперта ( i 1 ); N – i 1 число агрегированных показателей, K – число экспертов. Описанная модель явным образом учитывает различия важности мнений отдельных экспертов, при этом, однако, мнению каждого эксперта о полезности каждого частного признака присваивается одинаковый вес. Вес не всегда отражает реальные предпочтения, – в частности, финансист и технолог могут иметь противоположные точки зрения на полезность скорой окупаемости проекта, и это различие во взглядах нередко завершается ―изгнанием‖ технолога из компании. Некоторые авторы рекомендуют учитывать ценность эксперта при помощи векторной функции, а не одного лишь скалярного веса, поскольку эксперты способны точно измерять лишь часть признаков [277]. Подчеркнем, что сами признаки x ij объективно существуют, не зависят от экспертов и становятся доступны экспертам в случае успешного сбора данных. Однако функции полезности U kij ( xij ) различных экспертов, безусловно, могут отличаться, что привносит субъективизм отдельных оценок в традиционные балльные методы и требует погашения отклонений путем осреднения оценок 233 экспертов. Сами эксперты сообщают ЛПР не оценки значений признаков xij (в миллионах рублей, годах или процентах), а только свои оценки их полезности U kij ( xij ) в баллах, причем форма функций полезности может быть неизвестна лицу, принимающему решения. Обычно используется один из двух основных критериев выбора предложений: 1. Принимается предложение X с максимальной полезностью: U (X) max( U (Y), U (Z),...) . 2. (2) Предложение X принимается, если его полезность превосходит заранее заданную допустимую (―пороговую‖) величину U (X) U crit . (3) Отсортировав проекты по U (X ) , можно получить т.н. ―рейтинг‖, который часто используется в качестве инструмента поддержки принятия решений. Особенности предлагаемого подхода Отметим три основных отличия нашего подхода от традиционного [15,16,27]. Во-первых, мы ―настраиваем‖ систему показателей под нужды венчурного ИКТ-фонда, установив соответствие между значениями элементарных показателей (признаков) и их балльными оценками. Мы предположили, что такая процедура позволяет ослабить влияние субъективизма оценок, а также случайные вариации оценок во времени, их зависимость от кратковременных предпочтений и настроений аналитика (который в марте может быть захвачен одной ―горячей‖ идеей, а в апреле – уже совершенно другой). В работе автора, написанной совместно с Е.А.Кобзаревой обсуждается попытка экспериментальной проверки этой процедуры [158]. Мы также предполагаем, что для более или менее сходных проектов заранее определенное соответствие между значениями признаков и количеством баллов может облегчить работу эксперта, при этом если исходные признаки xij близки, то близки окажутся и балльные оценки различных экспертов U kij ( xij ) . 234 Во-вторых, мы визуализируем структуру системы показателей в виде двумерной карты и отмечаем стартапы точками на этой карте (см.рис.4.4,4.5,4.7). В-третьих, мы отказываемся от нормативного задания критерия отбора. Мы рассматриваем задачу отбора как задачу обучения с учителем, где в качестве обучающих множеств выступают выборка проектов, ранее отобранных фондом для тщательного изучения (―due diligence‖), и выборка проектов, отклоненных фондом без детального изучения27. Целью применяемого в данной работе метода когнитивного моделирования является построение модели процесса принятия решений менеджментом [419]. Зачастую опытный инвестор руководствуется опытом и интуицией, не формализуя критерии выбора альтернатив, либо не объясняя эти критерии аналитикам. В то же время, аналитикам доступна обучающая выборка проектов, которые ЛПР уже принял к рассмотрению. Построенная на основе этой выборки модель принятия решений становится инструментом прогнозирования будущих решений ЛПР, и, в случае задачи отбора проектов, позволяет оценить целесообразность тщательного изучения проекта или дополнительного сбора информации о проекте. С течением времени, по мере накопления больших массивов данных, возможно выделение из первой обучающей выборки подмножества финансово успешных проектов. Перевод экспертных оценок в баллы Традиционный способ предназначен для отбора чрезвычайно сильно различающихся проектов, при этом от экспертов требуются глубокие и специфические знания, а балл, присваиваемый экспертом, имеет самостоятельную ценность. Однако венчурный фонд сталкивается с задачей выбора проекта среди десятков однотипных, очень похожих друг на друга представителей общего класса, для которого уже набрана статистика показателей. Мы предлагаем 27 Связь между распознаванием образов и принятием решений обсуждалась уже в классическом труде К.Фукунаги ―Интуитивно ясно, что до некоторой степени процесс принятия решений имеет отношение к распознаванию образов; например, в шахматной игре следующий ход делается в зависимости от ситуации (образа), сложившейся в данный момент времени на шахматной доске; решение о том, покупать или продавать акции на бирже также принимается в результате анализа сложного информационного образа. Поэтому целью создания теории распознавания образов являлось выявление сложных механизмов процессов принятия решений, а также автоматизация этих процессов с помощью средств вычислительной техники. Однако ввиду сложности проблемы распрознавания образов, основные исследования в этой области были сосредоточены на более реальных задачах, таких как распознавание букв латинского алфавита и классификация кривых‖ [283]. 235 устанавливать соответствие между значениями отдельных признаков и ―общепринятыми‖ баллами, которые добавил бы за такие значения ―типичный‖ компетентный специалист, репрезентирующий мнение инвестиционного комитета фонда. Соответствие имеет вид: U kij U ij ( xˆ kij ) , (4) где x̂kij – оценка признака проекта, измеренная k -м экспертом (которая может быть количественной или атрибутивной и измеряется в денежных единицах, годах, процентах и т.п.); U ij – полезность значения признака, выраженная в баллах одинаковым способом для всех аналитиков. Так, например, оценивая проект по показателю ―темпы прироста рынка‖ (см. таблицу 4.1), мы добавим два балла проектам, работающим на рынках с годовыми темпами прироста более 100% , один балл – при темпах от 50 до 100%, ноль баллов – от 20 до 50%; мы вычтем один балл при темпах в 10-20% и два балла - при годовых темпах прироста менее 10%. Оценка функции полезности ЛПР приобретает вид K N Mi U X wikU ij ( xkij ) . k 1 i 1 j 1 (5) Теперь, если два аналитика полагают, что рынок, на который намерен выйти со своей услугой автор проекта, растет на 15% в год, то оба вычтут из оценки привлекательности рынка один балл. При отсутствии единой системы соответствия один эксперт мог бы счесть темпы прироста рынка ―высокими‖ и добавить проекту один балл, а другой – ―чрезвычайно низкими‖, и вычесть у проекта два балла. Общие U ij устраняют такой разброс. Цель введения общих U ij состоит в том, чтобы от субъективных оценок (таких как ―рынок растѐт чрезвычайно быстро‖), которые могут различаться у различных экспертов, перейти к количественным показателям, которые разные эксперты при наличии одинаковой информации оценят единообразно. Разумеется, при таком подходе может потеряться ―здоровый‖ разброс мнений экспертов 236 относительно того, сколько баллов следует присваивать тому или иному значению признака. Составитель руководства по измерению функций полезности может навязать экспертам свою собственную функцию U ij , не близкую к соответствующей функции ЛПР. Поэтому руководства по измерению функций полезности должны составляться с участием ЛПР. Анализ обучающих данных При помощи МПОБ нами были проанализированы результаты отбора 150 идей, проектов и компаний, рассмотренных венчурным фондом ФИНАМ ИТ в первой половине 2007 г. Средняя оценка U (X) коммерческой привлекательности предложений, отобранных фондом для тщательного изучения («due diligence»), оказалась более чем вдвое выше, чем средняя оценка произвольного предлагаемого проекта. Таким образом, оценка, полученная с помощью МПОБ, в целом согласуется с решениями инвестиционного комитета венчурного фонда. Факторный анализ матриц МПОБ позволил нам разделить агрегированные показатели на две группы, соответствующие двум главным компонентам. На рис.4.3 первой главной компоненте соответствует вертикальная ось, второй – горизонтальная. Обнаружилось, что показатели ―привлекательность рынка‖ и ―выгоды для пользователя‖ имеют высокие значения первой главной компоненты и низкие значения второй. Напротив, показатели ―обоснованность идеи‖ и ―синергия бизнеса‖ имеют высокие значения второй главной компоненты и низкие – первой. Показатель ―достаточность ресурсов‖ имеет высокие значения обеих главных компонент. Это логично, поскольку недостаток ресурсов, с одной стороны, не позволяет преодолеть барьеры для входа на рынок и использовать экономию от масштаба, а с другой – увеличивает вероятность провала проекта. Показатель ―охрана идеи‖ показал отрицательную корреляцию с показателями обоснованности идеи и синергии бизнеса. Мы объясняем это тем, что в интернетиндустрии, к которой принадлежит значительное число рассмотренных проектов, быстро клонируются все полезные (и бесполезные) идеи. 237 Вторая главн. комп. ("привлекательность") Агрегированные показатели в базисе двух главных компонент 1,0 Привлекательность рынка 0,8 Выгоды пользователя Охрана идеи 0,6 Достаточность ресурсов 0,4 0,2 Синергия бизнеса 0,0 Обоснованность идеи -0,2 -1 -0,8 -0,6 -0,4 -0,2 0 0,2 0,4 0,6 0,8 1 Первая главная компонента ("знание") Рис.4.3. Агрегированные показатели в базисе главных компонент Близость четырѐх агрегированных показателей к главным компонентам корреляционной матрицы, иллюстрируемая рис.4.3, обосновывает возможность использовать два комплексных28 показателя вместо одного и сравнить полученный результат с обучающей выборкой, состоящей из проектов, отобранных венчурным фондом для тщательного изучения. Карта неопределенность-привлекательность Предлагаемые два комплексных показателя проекта рассчитываются по формулам: N Smk (X ) wmi uki i 1 uki U ij xkij Mi (6) j 1 28 Под комплексным показателем здесь понимается взвешенная сумма показателей табл.4.1, а не комплексное число, состоящее из действительной и мнимой части. Аналогично в теории надежности под комплексным показателем понимают ―показатель надежности, характеризующий несколько свойств, составляющих надежность объекта‖ [ГОСТ 27.002-89]. В качестве примера можно привести коэффициент готовности, который рассчитывается при помощи времени наработки на отказ и среднего времени восстановления работоспособности изделия. 238 где Smk (X) – m -й комплексный показатель проекта X , полученный k -м аналитиком; wmi - матрица весов; i 1..N , m 1..M . Ограничимся только двумя комплексными показателями ( M 2 ). Тогда матрица весов wmj приобретает чрезвычайно простой вид (табл. 4.2). Таблица 4.2 Матрица весов m 1 m2 Привлекательность рынка 1 0 2 Выгоды для пользователя 1 0 3 Обоснованность идеи 0 1 4 Синергия бизнеса 0 1 5 Достаточность ресурсов 0 0 6 Охрана идеи 0 0 i Показатель 1 Условно назовем первый комплексный показатель ( S1k ) показателем ―привлекательности идеи‖, на рис.4.4 ему соответствует вертикальная ось. Второй комплексный показатель ( S 2k ) отражает субъективную29 меру экономической безопасности инвестора. Можно интерпретировать его как показатель ―компетентности‖ инвестора, подразумевая, что он измеряет достаточность опыта и знаний фонда для инвестирования в предлагаемый проект30. На рис.4.4 этот показатель отложен по горизонтальной оси влево. Противоположный ему показатель можно считать мерой воспринимаемой ―неопределѐнности‖ или риска проекта; на рис.4.4 он откладывается по горизонтальной оси вправо31. 29 Подчеркнем, что одной из целей работы является разработка такого инструмента, чтобы субъектом выступал ЛПР, а не аналитик. С целью подчеркнуть субъективный характер оценок, выделенные показатели можно назвать воспринимаемой (субъективной) привлекательностью и воспринимаемой неопределенностью. 30 В финансовой литературе используется термин ―кредитная надѐжность‖ заѐмщика [243], который, на наш взгляд, близок по смыслу. В отличие от венчурного инвестирования, ожидаемая прибыль кредитора заключена в относительно узких диапазонах. В отличие от стартапа, должник не может принести кредитору десятикратный возврат на инвестиции, поэтому при кредитовании показатель ―привлекательности‖ почти постоянен, и двумерное распределение сводится к одномерному. 31 Выбранные нами названия – условны. Мы не утверждаем, что рассчитываемые нами показатели S1k и S 2 k (и составляющие их признаки) операционализуют концепции ―привлекательности‖ и ―неопределенности‖, которые 239 Отметим, что ни в один из двух комплексных показателей мы не включили показатель ―достаточности ресурсов‖, присутствующий в МПОБ, поскольку считаем, что его следует рассматривать уже после прохождения первичного отбора. Действительно, если проект интересный, но ресурсоемкий, то венчурный инвестор может собрать ―пул‖ инвесторов, либо предложить инноватору разбить проект на несколько стадий. Кажется неразумным, чтобы перспективный проект был без учета мнения ЛПР отклонен аналитиком на стадии предварительного изучения по причине ресурсоемкости. В оригинальном варианте [15,16] метод МПОБ решает классификации при помощи линейной дискриминантной функции. задачу Мы предлагаем использовать двумерную карту оценок с использованием двух агрегированных показателей (рис.4.4). Каждому стартапу на такой карте соответствует точка. При классификации таких точек, можно не ограничиваться областями в форме полуплоскостей (как в линейном дискриминантном анализе), но использовать области более сложной прямоугольная трапеция32, в формы, например, угол. На рис.4.4 которую попали проекты, отобранные инвестиционным комитетом, помечена надписью ―Тщательное изучение‖. Тупой угол между правой боковой стороной и основанием трапеции можно описать системой двух неравенств S1k ( X ) 5 S2 k ( X ) 10 S1k ( X ) . (7) используют ЛПР или аналитики, или определяют другие исследователи. Это связано с тем, что приоритет в нашей работе отдается разработке инструмента поддержки принятия решений, который может использоваться и как ―чѐрный ящик‖. Обоснование валидности измерения ―привлекательности‖ и ―неопределенности‖ при помощи матрицы МПОБ А.Бретта и С.Я.Бабаскина в нашей работе не проведено. На этот недостаток внимание автора обратил д.э.н., профессор О.Г.Голиченко. Мы не исключаем, что валидные показатели собственно ―привлекательности‖ и ―неопределенности‖ в понимании ЛПР, могут оказаться как более, так и менее эффективными при попытке предсказания его решений, чем показатели S1k и S 2 k . 32 В работах [76,77,81,91,89,88,153] мы писали, что проекты, отобранные инвестиционным комитетом попадают в угол. Высказывание было бы точным, если бы показатели S1k и S 2 k не были ограничены. Однако, строго говоря, изображающая область тщательного изучения геометрическая фигура на рис.4.4 представляет собой не угол, а четырехугольник (прямоугольную трапецию), поскольку ограничена также максимальными значениями показателей: S1k 20 и S2 k 20 . Четырехугольник описывается четырьмя неравенствами, однако последние два из них при использовании МПОБ выполняются автоматически. Область отклоненных предложений представляет собой пятиугольник, а область сбора информации – семиугольник. 240 Область заведомо неинтересных проектов помечена надписью ―отклонение‖. В нее попадают точки, удовлетворяющие хотя бы одному из неравенств S1k ( X ) 0 S1k ( X ) (10 / 25) (5 S2 k ( X )) . (8) В случае попадания идеи в область, лежащую между двумя, описанными выше, нужно предпринять сбор дополнительной информации, если такой сбор не требует существенных затрат. Привлекательность идеи Тщательное изучение 20 Сбор 15 информации 10 5 0 Отклонение -5 -10 -15 -20 20 15 Безопасность 10 5 0 -5 -10 -15 -20 Неопределѐнность Рис.4.4. Диаграмма ―неопределенность привлекательность бизнес-идеи‖ – Задача отбора стартапа для тщательного изучения превращается в задачу классификации с обучением, при этом требуется предварительное построение решающих поверхностей, исходя из цены ошибки первого и второго рода. На рис.4.4 все рассмотренные проекты изображены ромбами, а проекты, отобранные фондом для тщательного изучения, – закрашенными кружками. Сплошная линия ограничивает область повышенной вероятности принятия решения о проведении тщательного изучения проекта. Пунктирная линия ограничивает область идей, 241 которые со столь высокой вероятностью будут отклонены фондом, что дополнительный сбор информации не требуется. На данном этапе исследований мы ограничились кусочно-линейными решающими поверхностями. Таким образом, в данной главе решены две проблемы, препятствующие деятельности венчурных фондов: 1. Проблема низкого качества фильтра нижнего уровня системы (воронки) отбора высокотехнологичных проектов, вызванная отсутствием прямой коммуникации между руководством фонда и аналитиками (на рис.4.1 между руководством и аналитиками находится несколько звеньев), решена при помощи метода обучения с учителем; 2. Проблема длительного обслуживания заявок решена при помощи разработки позволяет стандартизованного аналитику инструмента обработать заявку обработки и сообщить заявки, который автору заявки предварительный ответ, репрезентирующий предпочтения руководства фонда, в течении одного часа. Применение инструмента при организации первых встреч Разработанный инструмент целесообразно использовать уже при подготовке т.н. первых встреч с авторами идей и проектов, поскольку он помогает определить направление поиска дополнительной информации. Необходимость в дополнительной информации возникает тогда, когда итоговые оценки положения проекта на карте ―Неопределенность – привлекательность‖, определенные несколькими аналитиками, резко различаются, причем некоторые, но не все из получившихся оценок попадают в зону ―тщательного изучения‖. Дополнительная информация должна помочь экспертам определить значения признаков проекта xij точнее. Если эта дополнительная информация решает проблему разброса оценок, то после ее сбора оценки различных экспертов x kij будут мало отличаться от среднего значения признака. Возможна и ситуация, в которой дополнительная информация не поможет согласовать оценки экспертов. В последнем случае ресурсы на поиск информации и повторную 242 оценку расходуются впустую. На практике стоимость поиска дополнительной информации о каждом отдельном проекте ничтожно мала по сравнению с выгодой, упущенной при пропуске перспективной инновации. Однако венчурный фонд работает с многими сотнями проектов. Очевидно, что при среднем потоке заявок в одно предложение в рабочий день один специалист не может тратить на изучение одного проекта в среднем дополнительное специалистов, исследование требуется более одного дня. Поэтому когда проектов нанять превышает дополнительного возможности штата квалифицированного специалиста, а в этом случае совокупные расходы на зарплату, офисное пространство и технику и т.п. уже вполне сравнимы с инвестициями в небольшой стартап. Таким образом, даже на уровне предварительного отбора, аналитикам фонда приходится отсеивать некоторые проекты без дополнительного сбора информации. Привлекательность идеи Тщательное изучение 20 Сбор информации 15 10 5 0 Отклонение -5 -10 -15 -20 20 15 10 5 0 -5 -10 -15 -20 Неопределѐнность Рис.4.5. Изменение предварительной оценки проектов SaaS по итогам ―первых встреч‖. 243 На рис.4.5 стрелками, соединяющими кружки, показано, как изменились представления аналитика фонда о четырех проектах по итогам ―первых встреч‖ с представителями трех молодых компаний, разрабатывающих решения SaaS (software-as-a-service) – услуг по предоставлению возможности использования программного обеспечения (ПО). Этот инновационный вид услуг в последние годы становится популярным направлением деятельности российских разработчиков ПО, и многие молодые коллективы предлагают решения в этой области. Дополнительно на рис.4.5 ромбами показаны еще 15 проектов, разрабатывающих или внедряющих ПО сходного назначения, авторы которых предоставляют или рассчитывают предоставлять ПО как сервис. Каждый из четырех проектов по итогам первоначального изучения предложений попал в ―промежуточную‖ зону, поэтому с целью сбора дополнительной информации были проведены ―первые встречи‖. Как иллюстрирует рис.4.5, информация, которую аналитики фонда приобретают в ходе ―первых встреч‖ может смещать предварительную оценку проекта в различных направлениях, однако амплитуда смещений обычно недостаточно велика, чтобы вывести проекты в область тщательного изучения. В целом, область SaaS, с точки зрения изучаемого в этой работе венчурного фонда, выглядит малопривлекательной и сравнительно малознакомой. Проверка гипотезы о снижении разброса оценок На протяжении шести лет с 2007 по 2012 гг. автору удалось собрать оценки ста проектов по показателям МПОБ, выставленные менеджерами и аналитиками фонда ФИНАМ ИТ. В эксперименте приняли участие два менеджера фонда и аналитик, которые оценили 24, 12 и 64 поступивших в фонд проекта соответственно. Кроме того, всем проектам независимо выставил оценки автор данной работы, работающий в фонде ФИНАМ ИТ в должности аналитика. Суммарное рабочее время, затраченное коллегами автора (исключая самого автора) на участие в эксперименте составило более 50 часов, т.е. больше полной 244 рабочей недели. По этой причине эксперимент не мог быть проведѐн быстро, ибо автор не имел возможности оторвать коллег от рабочих обязанностей на длительный промежуток времени. С точки зрения автора, большое количество оценок, выставленных одним специалистом, помимо плюсов, имеет и недостатки. Во-первых, при большом объеме работы, которая не рассматривается как приоритетная (работа принадлежит к нижнему уровню рис.4.1), оценки могут быть выставлены наспех и неаккуратно. Во-вторых, просьба оценить большое количество проектов может быть воспринята как попытка оценить профессиональную компетентность. Полученные данные позволили автору в совместной работе с Е.А.Кобзаревой [158] проанализировать разброс в оценках привлекательности и неопределенности, uki , полученных различными специалистами. Несмотря на описанную выше попытку стандартизации путем описания методики перевода оценок в баллы, разброс оказался весьма велик, как показывают гистограммы на рис.4.5 (а). Сплошными линиями на этом рисунке изображены теоретические плотности нормальных распределений. 40% 40% 30% 30% 20% 20% 10% 10% 0% 0% -16 -12 -8 -4 0 4 8 12 Различия в оценке привлекательности 16 -16 -12 -8 -4 0 4 8 12 16 Различия в оценке неопределѐнности Рис.4.6. Различия в оценках привлекательности и неопределѐнности проектов, сделанных различными специалистами 245 Оказалось, что разности оценок двух аналитиков 1 и 2 распределены по нормальному закону, что проиллюстрировано на рис.4.6. Проверка нормальности 2 распределения была проведена при помощи критерия . Средние значения и среднеквадратические отклонения разностей вычислены по исходным наблюдениям и приведены в таблице 4.3. Таблица 4.3. Различия в оценке привлекательности Различия в оценке 1 неопределенности Среднее значение 1,02 0,18 Среднеквадратическое 4,20 6,05 2 отклонение Как показывает таблица, разница средних значений оценок оказалась невелика, таким образом, ―в среднем‖ специалисты выставляют оценки с незначительными систематическими смещениями. Автор работы (Специалист 1) оценивает показатель привлекательности проектов в среднем на один балл ниже, чем его коллеги. Систематическое смещение в оценке показателя неопределенности практически отсутствует. Однако показатель неопределенности обладает существенно более высоким значением среднеквадратического отклонения. Здесь можно предложить два объяснения. Первое состоит в том, что автору не удалось стандартизовать признаки, составляющих этот показатель, т.е. дать точные инструкции относительно присвоения баллов. В основном, выставление баллов по этим признакам было оставлено на усмотрение эксперта. Таким образом, меньшее значении среднеквадратического отклонения первого показателя является результатом более удачной стандартизации процедуры оценки. Можно, однако, предположить, что показатель неопределѐнности набора проектов, поступивших на рассмотрение фонда объективно обладает большим разбросом. В таком случае, больший разброс второго показателя – свойство потока предложений, а не дефект процедуры. Оба рассуждения, на наш взгляд, 246 должны стимулировать попытку стандартизации оценки признаков, составляющих показатель неопределѐнности. Исследование дополнительных показателей Мы протестировали дополнительный показатель новизны бизнес-идеи. Для каждого из изученных проектов эксперт-аналитик оценил степень новизны проектов по пяти возможным признакам, выделенным Й. Шумпетером [298]: новый продукт, новый рынок, новый материал, внедрение новой технологии, новая организация производства. Агрегированный показатель новизны суммировал эти пять оценок. Как показал корреляционный анализ, линейный коэффициент корреляции с выделенным нами ранее фактором ―неопределенности‖ составил 0,65, что выше, чем коэффициенты корреляции с показателями обоснованности идеи и синергии бизнеса по отдельности (оба оказались равны 0,54), а корреляция с фактором привлекательности и его составляющими практически отсутствует. Чем новее изобретение, тем оно непонятнее и ―дальше‖ от инвестора, поэтому возросшая неопределенность должна компенсироваться высокой привлекательностью инновации. Можно усмотреть соответствие между выделенными нами факторами привлекательности и неопределенности и другими наборами показателей, в частности, показателями полезности и простоты использования, на которых основаны модели TAM [342] и UTAUT [475], разработанные Ф. Дэвисом, В.Венкатешем и их соавторами при исследовании принятия решений о выборе информационных технологий. Важно также изучить соответствие между выбранными нами показателями и признаками, выделенными Э. Роджерсом [449] и позволяющими прогнозировать относительную скорость распространения инновации, такими совместимость, как относительное превосходство наглядность, возможность нововведения, попробовать и его простота. Предположительно, показатель относительного превосходства соответствует выделенному нами показателю привлекательности, а остальные показатели Э. Роджерса детализируют показатель неопределенности Мы сопоставили также 247 показатель ―неопределѐнности‖ с коэффициентом риска, использованным Н.Л.Карданской [180], который тоже вычисляется в виде взвешенной суммы. Нашу диаграмму неопределенность-привлекательность (рис.4.4) можно разделить на четыре вертикальные полосы равной ширины, соответствующие (слева направо) областям минимального, повышенного, критического и недопустимого риска. Как показывает рис.4.4, послуживший экспериментальной базой для нашей работы фонд ФИНАМ ИТ не выбрал для тщательного изучения ни одно из предложений, попадающих в область недопустимого риска. Безусловно, аналоги используемых нами агрегированных показателей не исчерпываются приведѐнными примерами и могут быть найдены в любой области, где индивиды или организации принимают решения в условиях неопределѐнности, включая столь далѐкие от венчурного инвестирования как исскусствознание [241] и науковедение33. С нашей точки зрения, более высокая точность отсева проектов достигается путем включения агрегирующего третьей координаты S 3k , – ―человеческого фактора‖, информацию об источниках информации о проекте, о рекомендациях известных экспертов, предыдущих успешных проектах ключевых лиц стартапа, об истории сотрудничества предпринимателя-инноватора с фондом. Такие характеристики не учитывались в методе МПОБ, который изначально был предназначен для отбора идей, а не компаний или коллективов. По-видимому, социальные сети лиц, принимающих инвестиционные решения, процесс обмена информацией между членами этих сетей и механизмы их влияния друг на друга должны служить главными источниками сведений, позволяющих совершенствовать инструменты отбора. Не исключено, что для этого потребуется вновь принять во внимание индивидуальные полезности, однако измеряющие уже не оценки аналитиков, осуществляющих предварительный отбор, а предпочтения экспертов, предположительно оказывающих 33 влияние на принятие решения Профессор Д.А.Гусев (Университет Purdue, США) обратил внимание автора на возможность проведения сопоставлений между агрегированными показателями МПОБ и выделенными Л.Б.Баженовым [19] методологическими регулятивами естественнонаучной теории, в число которых входят принципиальная проверяемость, максимальная общность, предсказательная сила, принципиальная простота и системность. 248 (например, известных в индустрии предпринимателей или руководителей конкурирующих венчурных фондов). В этом отношении методика предварительного отбора подобна массовому стандартизованному тестированию школьников, которое решает задачу отсева двоечников, но не позволяет распознавать будущих талантливых ученых. Для решения задачи отбора лучших предназначена стадия тщательного изучения ―due diligence‖. Анализ итогов деловой игры на основе разработанного инструмента отбора С целью выяснить границы применения к задачам отбора феномена ―мудрости толпы‖ [299], состоящего в возможности замены эксперта коллективом потребителей, на основе МПОБ нами была разработана деловая игра, позволяющая участникам составить представление о том, как венчурный фонд отбирает проекты в сфере ИКТ с целью инвестиций34. В ходе игры каждому из тридцати трех студентов-старшекурсников МГУКИ, специализирующихся на мультимедийных и информационных системах, было предложено представить себя в роли руководителей крупных компаний сферы ИКТ, венчурных фондов – частных и с государственным участием, - бизнес-ангелов и т.п. Все участники игры получили одну и ту же информацию о SaaS-проекте Roomix, опубликованную в статье А.Гусакова в журнале ―Секрет фирмы‖ [57], и независимо заполнили соответствующие элементы МПОБ. Заметим, что деловые игры применялись для изучения распространения информации со времѐн первых исследований С.К.Додда [349], в том числе и в нашей стране [276]. 34 249 Привлекательность идеи Тщательное изучение 20 Сбор информации 15 10 5 0 Отклонение -5 -10 -15 -20 20 15 10 5 0 -5 -10 -15 -20 Неопределѐнность Рис.4.7. Разброс оценок одного и того же SaaSпроекта, полученных тридцатью тремя участниками деловой игры SaaS-проект Roomix являлся аналогом (―клоном‖) английского проекта MyDeco и позволял моделировать размещение мебели в квартире при помощи средств трехмерной визуализации. Авторы российского проекта рассчитывали предоставлять эту услугу пользователям Интернета бесплатно и взимать абонентскую плату с мебельных магазинов, чьи предложения размещаются на сайте Roomix.ru. Этот проект не был поддержан инвестиционным комитетом ФИНАМ ИТ, однако осенью 2008 г. другой венчурный фонд, AddVenture, инвестировал в него некоторые средства (не превышающие, по словам представителей фонда, 50 тыс. долларов). Таким образом, мнения венчурных фондов по поводу перспектив одного и того же проекта существенно разошлись. Как показывает рис.4.7, агрегированные оценки, данные проекту студентами по предлагаемой нами методике, также характеризуются весьма существенным разбросом оценок. При этом, по горизонтальной координате разброс оказался значительно выше, чем по вертикальной. Мы связываем это с 250 тем, что для оценок ―привлекательности‖ проекта, которые агрегируются в вертикальной координате, мы составили строгие количественные инструкции, в то время как для оценок обоснованности и синергии, которые агрегируются в горизонтальной координате, предложили использовать пятибалльную шкалу согласия Лайкерта. Средняя оценка участников игры изображена на рис.4.7 закрашенным кружком, а оценка эксперта фонда ФИНАМ ИТ – закрашенным треугольником. В среднем, участники игры оценили привлекательность проекта выше, чем эксперт фонда, тем не менее, их средний результат остался в зоне дополнительного сбора информации, – там же, где и оценка специалиста. Сначала у автора сложилось мнение, что получен обнадѐживающий пример описанного Дж.Шуровьески феномена ―мудрости толпы‖ [299], и аналитика-профессионала позволительно заменить достаточно многочисленной группой студентов – потенциальных пользователей проекта. Однако все последующие деловые игры, проведѐнные автором после 2010 года, давали в итоге систематически более высокие оценки проекту (который уже был закрыт!). Мы предполагаем, что чем менее квалифицирован индивид, выставляющий оценку, тем более он подвержен ―обаянию‖ продавца, в роли которого в данном случае выступает преподаватель. Нельзя также исключить, что студенты высоко оценивают перспективы проекта, поскольку надеются угодить преподавателю, предполагая, что, представляя проект, преподаватель тем самым уже его рекомендует и, соответственно, ожидает для него высоких оценок. Мы заключаем, что ни в практических, ни в исследовательских задачах отбора венчурных проектов не следует опираться на массовые неквалифицированные оценки. С другой стороны, в игровой форме можно отработывать процедуры применения МПОБ, которые позже могут быть предложены, например, сообществам предпринимателей и бизнес-ангелов. Что касается непосредственно Roomix, то в 2009 году, по сообщениям прессы со ссылкой на инвесторов проекта, проект якобы привлек дополнительные 300 тысяч долларов инвестиций. Однако основатели проекта в блогах Интернета 251 утверждали, что в реальности сумма инвестиций была в пять раз меньше, к тому же выражалась не в деньгах, а в рекламной поддержке. В мае 2010 года проект Roomix закрылся ―на реструктуризацию‖ и с тех пор не предоставляет услуг. Стартовавшие позже проекты-аналоги, основанные другими предпринимателями также закрыты, либо сменили направление деятельности. 4.2 Проблемы венчурного инвестирования в новый способ предоставления программного обеспечения В этом разделе, посвященном применению разработанного нами инструмента отбора стартапов и подвергающем определѐнной ревизии статью, написанную нами в 2011 году в соавторстве с Н.С.Мациевским, изложены итоги анализа формирующегося в настоящее время в России рынка SaaS (―software as a service‖), то есть программного обеспечения, предоставляемого в качестве удаленной услуги. Представлены результаты анализа сорока SaaS-проектов [153] при помощи описанного выше инструмента отбора инновационных проектов [7688], на основе матрицы первичной оценки бизнес-идеи (МПОБ) [15,16,27]. В.И. Дрожжинов определяет SaaS как такую модель развертывания ПО, в которой поставщик выдает потребителю лицензию на приложение для использования в качестве услуги по требованию [166]. При этом В.И.Дрожжинов выделяет следующие виды SaaS: государственные приложения, Интернет-услуги; блоги, обзоры и социальные сети; совместное использование информации и знаний (Wiki); связь (e-mail); совместная работа (e-meeting); офисные приложения; пакеты автоматизации проектирования и управления (ERP, CRM и др.). Проанализировав ряд определений SaaS, А.А.Колесов предложил следующее: «SaaS — это бизнес-модель отношений в цепочке ―разработчик — поставщик – пользоватетель‖, при которой поставщик (сервис-провайдер) самостоятельно управляет приложением, предоставляя заказчику доступ к нему через Интернет, а разработчик создает приложение, предназначенное именно для такой схемы работы, передавая право на его развертывание поставщику» [191]. 252 А.А.Колесов предлагает считать 2008-й год отправной точкой российского SaaS и называет компании ―Мегаплан‖ и ―МойСклад‖ в качестве первопродцев, сумевших вырасти до ведущих независимых поставщиков SaaS-решений [192,193]. По оценке издания Cnews, иаиболее востребованными решениями SaaS в России сейчас являются антивирусы, решения для организации совместной работы, а также бухгалтерские системы, CRM, HR-продукты. В качестве целевых потребителей разработчики видят, как правило, средний и малый бизнес (СМБ), которым предлагаются недорогие решения, стоимость аренды которых составляет несколько сотен рублей в месяц. Главными достоинствами SaaS считаются экономия средств и времени, простота использования, легкость изменений, отсутствие затрат на поддержку и обслуживание. Подсистема биллинга Контроль и пополнение баланса Регуляция действий пользователей Списания с баланса за использование сервиса Просмотр и пополнение баланса Интерфейсная подсистема Взаимодействие с пользователем Технологическая подсистема Основная логика продукта Управление функциями продукта Рис.4.8. Схема работы Н.С.Мациевскому [153] SaaS проекта по Cхема работы SaaS-проекта с пользователями включает подсистему биллинга, отвечающую за финансовую логику; интерфейсную подсистему, обеспечивающую взаимодействия с пользователями; технологическую подсистему, которая обеспечивает функционирование логики продукта [153]. Приведем теперь некоторые оценки объема рынка SaaS в мире и в России (табл.4.4). Величина мирового рынка SaaS уже составляет миллиарды долларов: в 253 2009 году компания Gartner оценила его объем в 7,9 млрд. долларов. По предварительной оценке Gartner, в 2010 г. рынок вырос на 15,7% и составил 9,2 млрд. [245]. Крупнейший игрок рынка, компания Salesforce, была создана в 1999 году, а в 2010 году ее выручка составила 1,66 млрд. долларов. В настоящее время капитализация этой компании, акции которой с 2004 года торгуются на НьюЙоркской фондовой бирже, составляет 17,8 миллиардов долларов. Таблица 4.4 Оценки глобального и российского рынка SaaS Рынок SaaS 2007 2008 2009 2010 2011 (прогноз) Глобальный (млрд.долл) Российский (млн.долл) 5,0 6,4 7,5 9,2 10,7 - 1,8 4,8 3,0 - Оценка рынка SaaS-решений в России в 2008 г. составила 1,8 млн. долларов [191]. В 2009 году оценка IDC составила 5,7 млн. долларов, а в 2010 г. основатель компании «Тилби» В.Шабат оценил рынок в 3 млн. долларов [289]. Приведенные оценки разнородны и не позволяют оценить темпы прироста рынка. Активисты индустрии, ссылаясь на прогноз IDC, считают эти темпы чрезвычайно высокими и предрекают взрывной роста рынка до 161 млн. долларов в 2013 году. В качестве препятствий для развития SaaS в России называют высокую монополизацию рынка делового ПО, недостаток средств и опыта в маркетинге и продажах, скептицизм потенциальных заказчиков [191,192]. Аналитическое агентство CNews Analytics отмечает также недостаточную осведомленность потребителей о возможностях модели SaaS и опасения за сохранность данных. Наконец, одним из основных барьеров для распространения SaaS называют нехватку инвестиций. Чтобы выяснить причины отсутствия у венчурных фондов к инвестированию в SaaS, рассмотрим механизм принятия инвестиционных решений. 254 В таблице 4.5 представлен фрагмент заполненной матрицы предварительной оценки бизнеса, при этом каждая колонка соответствует одному из SaaS-проектов, поступивших на рассмотрение венчурного фонда. Наблюдается систематическое отрицательное смещение показателя ―Синергия бизнеса‖, в то время, как показатель ―Выгоды для пользователя‖, как правило, положителен. Таким образом, эксперты венчурного фонда не отрицают, что SaaS-решения позволяют потребителям сокращать издержки. В то же время, не имея опыта инвестирования в SaaS, фонд не находит синергии между предлагаемыми проектами и уже сделанными приобретениями (портфельными проектами). Таблица 4.5 Проект 10 Проект 11 Проект 12 Проект 7 0 3 -1 -6 -1 -2 Проект 6 -3 2 -2 -6 -6 -1 Проект 5 1 3 0 -5 -4 -2 Проект 4 -2 2 -2 -6 -6 0 Проект 3 -1 1 2 4 -2 3 3 5 5 4 3 5 3 4 3 3 4 1 -1 2 0 1 0 -1 -6 -7 -3 -2 -6 -7 -7 -7 1 -3 -2 -2 -1 2 -1 -2 -1 0 1 0 -2 -3 -2 -1 Проект 2 Проект 9 Привлекательность рынка Выгоды для пользователя Обоснованность идеи Синергия бизнеса Потребность в ресурсах Охрана идеи Проект 1 ПОКАЗАТЕЛИ Проект 8 Фрагмент заполненной матрицы предварительной оценки бизнеса Основные отличия нашего подхода к обработке МПОБ от традиционного описаны в работах [77,88] и в первом разделе данной главы. Мы изображаем структуру системы показателей в виде двумерной карты и отмечаем стартапы точками на этой карте. Кроме того, следуя подходу когнитивного моделирования [419], мы отказываемся от нормативного задания критерия отбора, но рассматриваем задачу отбора как задачу обучения с учителем, где в качестве обучающих множеств выступают выборка проектов, ранее отобранных фондом для тщательного изучения (―due diligence‖), и выборка проектов, отклоненных фондом без детального изучения. На рис.4.9 на карте, аналогичной рис.4.4, изображены итоги анализа сорока проектов SaaS. Среднее значение показателя привлекательности для этих проектов составило ―+2,9‖, показателя неопределенности – ―-4,6‖. Таким 255 образом, средний проект SaaS с точки зрения данного венчурного фонда выглядит не слишком привлекательным и малознакомым. Привлекательность идеи Тщательное изучение 20 Сбор информации 15 10 5 0 -5 Отклонение -10 -15 -20 20 15 Безопасность 10 5 0 -5 -10 -15 -20 Неопределѐнность Рис.4.9. Показатели сорока проектов SaaS предварительной оценки С целью сбора дополнительной информации были проведены ―первые встречи‖ с представителями шести проектов SaaS, оценки которых попали в промежуточную зону. Оказалось однако, что информация, которую аналитики фонда приобрели в ходе ―первых встреч‖ может смещать предварительную оценку проекта в различных направлениях, но амплитуда смещений недостаточно велика, чтобы переместить проекты в область тщательного изучения. Детальный анализ агрегированных показателей позволяет уточнить модель представлений венчурного фонда о SaaS-проектах. Шесть средних значений агрегированных показателей изображены на рис.4.10. 256 Привлекательность рынка -0,11 Выгоды для пользователя 3,11 Обоснованность идеи 0,08 Синергия бизнеса -4,58 Потребность в ресурсах -0,75 Охрана идеи -0,89 -6 -4 -2 0 2 4 6 Рис.4.10. Средние агрегированные показатели проектов SaaS Как показывает рис.4.10, средние показатели привлекательности рынка и обоснованности идеи близки к нулю, то есть к среднему значению по всем изученным проектам. Показатель потребности в ресурсах оказался слабо отрицательным, как и показатель охраны идеи. Последний низок, поскольку многие идеи в сфере SaaS имеют западные прототипы, что препятствует выходу россиян на зарубежные рынки. Наиболее важным является высокое отрицательное значение показателя ―синергии бизнеса‖, что говорит не только об отсутствии у фонда опыта на рынке продаж программного обеспечения, но и о том, что фонд не находит выгод для уже проинвестированных компаний от добавления к портфелю SaaS-проекта. Иными словами, становясь на позиции среднего и малого бизнеса, эксперты фонда не видят радикальных преимуществ от использования SaaS портфельными компаниями. Показатель ―Выгода для пользователя‖ умеренно положителен, однако не столь высок, чтобы компенсировать риски. Поэтому венчурные фонды воздерживаются от инвестиций в SaaS, дожидаясь первых отечественных историй успеха. 257 Можно заключить, что, в отличие от разработчиков, венчурные фонды не ожидают в ближайшем будущем большого рынка для отечественных разработок SaaS. По традиции в России компании-интеграторы внедряют решения, разработанные крупными (пока преимущественно – западными) компаниями, что дает потребителю преимущество надежности. Важным барьером для внедрения SaaS является и отсутствие длительной традиции использования легального программного обеспечения. Многие малые и средние компании используют нелегальное программное обеспечение, что лишает SaaS его основного конкурентного преимущества – дешевизны. Чтобы осознать выгоды от использовании SaaS, компании должны иметь опыт использования легального программного обеспечения большим числом сотрудников. Поэтому пионерами в использовании SaaS выступают крупные компании, однако российские стартапы, как правило, ориентируются на малый бизнес, который зачастую вообще не готов платить за программное обеспечение. В силу сказанного, актуальным представляется исследование текущих практик использования программного обеспечения средним и малым бизнесом и механизма принятия решений о потреблении программного обеспечения компаниями СМБ [342]. На наш взгляд, относительно высокие шансы на успех могут иметь SaaS-проекты, которые предлагает услуги компаниям, ведущим бизнес непосредственно в Интернете. Такие компании регулярно используют программное обеспечение и способны оценить эффект сокращения затрат на него; кроме того, быстро меняющаяся внешняя среда требует от них постоянной адаптации программного обеспечения, что создает спрос на дополнительные сервисы разработчиков. Осенью 2013 г. А.А.Колесов констатировал, что в течение прошедшиех с 2008 года пять лет за исключением трѐх игроков рынка, включающих, помимо названных ранее компаний ―Мой склад‖ и ―Мегаплан‖ компанию ―1C-Битрикс‖, не появилось новых лидеров рынка [194]. При этом А.А.Колесов отметил, что все три компании уже являются дочерними или совместными предприятиями традиционных производителей ПО или других крупных компаний. Мы 258 заключаем, что традиционные производители ПО оказались не столь ―неповоротливыми‖, как рассчитывали первопроходцы рынка SaaS, и в течении пяти лет освоили канал распространения ПО как услуги, опередив венчурных инвесторов. Выводы В данной главе изучены и решены две проблемы, регулярно встречающиеся в деятельности венчурных фондов: 1. проблема низкого качества фильтра нижнего уровня системы (воронки) отбора высокотехнологичных проектов, которая решена при помощи методов теории распознавания образов; 2. проблема длительного обслуживания заявок на нижнем уровне системы отбора инновационных проектов, которая преодолена при помощи инструмента поддержки принятия решений, позволяющего аналитику обрабатывать заявки и давать заявителям предварительные ответы в течении одного часа. Результаты данной главы внедрены ЗАО ФИНАМ при отборе венчурных проектов в сфере ИКТ в 2006-2013 гг., что подтверждается Актом о внедрении от 24.12.2013 (см. приложение Б-4). Развивая подход, основанный на матрице предварительной оценки бизнесидеи, мы опробовали новый инструмент поддержки принятия решения – диаграмму ―неопределѐнность - привлекательность‖, которая построена на основе суммирования двух групп показателей. Предложенный нами инструмент отсева инновационных проектов, построенный на основе матрицы первичной оценки (МПО) бизнес-идеи с учетом специфики проектов, поступающих на рассмотрение венчурного фонда, является достаточно простым и эффективным для применения в практике работы венчурных фондов. Диаграмма ―неопределенность – привлекательность‖ способна помочь предпринимателям понять логику принятия венчурным фондом решений по предложенным проектам, обосновать необходимость сотрудничества предпринимателя потенциального инвестора в ходе изучения инновационных предложений. и 259 На основе этого подхода мы обосновываем выбранное нами в этой работе определение нововведений, данное Э.Роджерсом [449] и позволяющее рассматривать диффузию инноваций, как процесс принятия решений большим числом агентов (индивидов, домохозяйств, организаций). Безусловно, данной работой направления исследований информационных процессов, протекающих в венчурных фондах, далеко не исчерпаны. Перспективными нам представляются следующие задачи: рассмотреть каналы распространения информации (заявки, презентации, встречи), их пропускную способность, виды помех, способы повышения пропускной способности каналов; разработать меры по снижению интенсивности ошибок во внутренних и внешних каналах, включая развитие коммуникативных навыков и формата сообщений; разграничить потери информации благодаря отсутствию экспертизы и благодаря неполноте представленной информации; обосновать важность предлагаемой автором методики низкой пропускной способностью канала нижнего уровня; провести сравнительный анализ эффективности передачи информации через традиционные каналы и новых способов коммуникаций, таких как социальные сети венчурных инвесторов; разработать информационные критерии эффективности ―первых встреч‖ и других стадий отбора венчурных проектов; обосновать фокус исследования лишь на нижнем уровне системы - уровне работы аналитика, описать интерфейсы предоставления информации вышеи нижележащим уровням иерархии; исследовать обратную связь в системе и взаимное обучение; рассмотреть систему отбора проектов как самообучающуюся нейронную сеть, состоящую из двух или трѐх слоѐв. 260 ЗАКЛЮЧЕНИЕ Данная диссертационная работа является завершенным научным исследованием, актуальность которого обусловлена интенсивным внедрением новых информационных и телекоммуникационных технологий, ростом числа электронных изданий, разнообразия информационных ресурсов и услуг, предлагаемых через Интернет. Как показал опыт 2006-2013 гг., данные социологических опросов и маркетинговых исследований существенно отклоняются от предсказаний классических логистических моделей. Выявленная проблема делает изучение общих закономерностей, позволяющих объяснить и прогнозировать распространение инфокоммуникационных инноваций, актуальной научной задачей. В исследовании получены следующие научные результаты: 1. Построена количественная неоднородном модель распространения нововведения в (по полу и географии проживания) обществе с учетом демографических процессов и изменения стоимости новинки во времени. Разработанная модель апробирована на данных массовых репрезентативных социологических опросов. Построен и подтвержден прогноз распространения Интернета в России и крупных географических единицах. 2. Разработан способ решения уравнений распространения нововведений в стабильной популяции и проанализированы случаи обучения использованию нововведения в семье и в школе, не поддающиеся решению на основе ранее использованных моделей. 3. Разработаны многостадийные модели распространения Интернета, которые апробированы на данных массовых социологических опросов. На этой основе построены прогнозы распространения Интернета в России до 2023 г. 4. Разработаны и апробированы количественные модели, позволяющие совместно анализировать статистику распространения нововведений в домохозяйствах и среди индивидов. 261 5. Разработана и апробирована модель роста охвата аудитории Интернета в целом по данным социологических опросов и модели роста охвата аудитори крупных информационных ресурсов (поисковых и почтовых сервисов и масс-медиа) по данным онлайн-панелей и счетчиков. 6. Разработаны модель и прогноз распространения компьютерного парка России на основании данных маркетинговых исследований и онлайн-опросов. Обоснована важность системного подхода к моделированию компьютерного парка и необходимость совместного использования данных маркетинговых исследований и онлайн-опросов. Построены прогнозы компьютерного парка и рынка Российской Федерации до 2016 г. 7. Разработан и апробирован метод выбора проектов в сфере ИКТ для венчурного инвестирования. На его основе проанализировано новое направление в предоставлении ИТ-услуг (SaaS), выработаны рекомендации для инвесторов и ИТ-предпринимателей. Реализация результатов исследования. Выводы, модели и прогнозы, полученные в ходе работы, используются руководством ЗАО ФИНАМ для целей стратегического менеджмента. Опубликованные автором данные и прогнозы использованы в инвестиционном холдинге ФИНАМ, ЗАО ―Юду‖, а также руководством официального портала Олимпийских Игр Сочи-2014. Построенные модели нашли применение в учебном процессе при чтении курсов «Социология виртуального пространства», «Поисковые системы Интернета» для студентов специализации «Интернет-журналистика» в МГУ им. Ломоносова и для студентов специализации «Технологии электронного бизнеса», «Технологии информационного бизнеса» в Московском государственном университете культуры и искусств. Соответствующие акты о внедрении приведены в приложении Б к диссертации. 262 Перспективы дальнейшей разработки темы Основными направлениями развития темы исследования в среднесрочной перспективе, с нашей точки зрения, могут стать: 1. Применение разработанных моделей для анализа сценариев и прогнозирования распространения новых устройств (планшеты, смартфоны, 3-D принтеры), информационных технологий и ресурсов (онлайн-обучение, мобильные библиотеки, геоинформационные системы, онлайн-заявки) и практик (мобильный доступ к Интернету, использование государственных услуг онлайн). 2. Разработка алгоритма численного решения уравнений многостадийной модели распространения новых информационных технологий с учѐтом воспроизводства населения, и соответствующего программного кода. 3. Разработка модели распространения нововведения, учитывающей как возраст индивида, так и размер домохозяйства, членом которого индивид является, позволила бы интегрировать результаты первой и третьей главы данной работы, и использовать совместно данные о распространении Интернета среди индивидов и в домохозяйствах. 4. Разработка моделей принятия и реализации решений при управлении информатизацией с целью более надѐжного прогнозирования потенциала распространения новых технологий. 5. Применение результатов, полученных при изучении классической проблемы моментов, с целью аппроксимации неизвестных распределений интенсивности использования информационных ресурсов. 6. Апробация полученных в четвѐртой главе моделей принятия решений венчурным фондом на данных о решениях нескольких инвестиционных фондов с известной специализацией. 7. Применение разработанной модель отбора стартапов, для решения задачи выбора количественных моделей распространения множества моделей-кандидатов. новых технологий из 263 Рекомендации об использовании результатов Теоретические и практические результаты исследования могут использоваться при: 1. Совершенствовании государственной информационной политики, 2. Управлении инфокоммуникационными проектами для прогнозирования распространения новых продуктов и услуг, 3. Медиапланировании крупных информационных ресурсов WWW, 4. Отборе проектов для инвестирования инвестиционными комитетами венчурных фондов и конкурсными комиссиями 5. Разработке учебных планов и образовательных программ по специализации «Технологии электронного бизнеса», бизнеса», «Интернет-журналистика». «Технологии информационного 264 CПИСОК ЛИТЕРАТУРЫ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. Абилов, А.В. Закономерности развития регионального инфокоммуникационного комплекса / А.В. Абилов. − M.: Горячая линия-Телеком, 2008. − 264 с. Абрамов, А. Победитель конкурса интернет-проектов Web Ready 2010 нашел инвестора [Электронный ресурс] / А. Абрамов. − Электрон. текстовые дан. − Режим доступа: http://www.spbit.ru/news/n77717/ . − Загл. с экрана. Айвазян, С.А. Прикладная статистика. Основы эконометрики: учеб. для вузов. В 2 т. 2-е изд., испр. - Т.2. / С.А. Айвазян. − М.: ЮНИТИ-ДАНА, 2001. − 432 с. Алексеева, О.А. Уровень информатизации домашних хозяйств в России / О.А. Алексеева, О.Н. Махрова // Экономическая наука современной России. − 2009. − №2. − С.117-127. Алексеева, О.А. Гендерные аспекты информатизации / О.А. Алексеева, Н.А. Ермакова, В.Н. Жеребин // Народонаселение. − 2013. − №2(60). − С.113-124. Ананьев, А.А. Определение возрастной структуры эксплуатационного парка товаров длительного пользования / А.А. Ананьев, И.М. Ильенков // Экономика и математические методы. − 1980. − т.XVI, вып.3. − С.571-577. Андерсон, Р. Инфекционные болезни человека. Динамика и контроль / Р. Андерсон, Р. Мэй. − М.: Мир, 2004. − 784 с. Антопольский, А.Б. Информационные ресурсы России. Учебное пособие по специальности "Прикладная информатика (в менеджменте)". Вып.1. Информационные ресурсы инновационного развития. / А.Б. Антопольский, О.В. Шлыкова. − M.: ИПКИРМГУКИ, 2006. − 270 с. Аньшин, В.М. Инновационный менеджмент / В.М. Аньшин, А.А.Дагаев (ред.). − М.: Дело, 2003. − 528 с. Афанасьев, В.Н. Анализ временных рядов и прогнозирование / В.Н. Афанасьев, М.М. Юзбашев. − M.: Финансы и статистика, 2001. − 228 с. Афанасьева, К.Е. Идентификация состояния и прогнозирование регионального рынка / К.Е. Афанасьева, В.И. Ширяев // Проблемы управления. − 2007. − №3. − С.63-65. Афанасьева, К.Е. Прогнозирование региональных рынков сотовой связи / К.Е. Афанасьева, В.И. Ширяев // Проблемы прогнозирования. − 2007. − №5. − С.97-105. Ахиезер, Н.И. Классическая проблема моментов и некоторые вопросы анализа, связанные с нею / Н.И. Ахиезер. − М.: Физматлит, 1961. − 312 с. Ахиезер, Н.И. О некоторых вопросах теории моментов / Н.И. Ахиезер, М.Г. Крейн. − Харьков: ГОНТИ, 1938. − 256 с. Бабаскин, С.Я. Использование аппарата нечетких множеств при отборе бизнес-идей / С.Я. Бабаскин // Машиностроитель. − 2005. − №4. − С.36-43. Бабаскин, С.Я. Инновационный проект. Методы отбора и инструменты анализа рисков / С.Я. Бабаскин. − М.: Дело АНХ, 2009. − 240 с. Багатурова, О.С. Математические модели маркетингаАналитический обзор / О.С. Багатурова, А.Г. Мамиконов // Автоматика и телемеханика. − 1991. − 8. − С.3-35. Багриновский, К.А. Современные методы управления технологическим развитием / К.А. Багриновский, М.А. Бендиков, Е.Ю. Хрусталев. − М.: Росспэн, 2001. − 272 с. Баженов, Л.Б. Строение и функции естественнонаучной теории / Л.Б. Баженов. − М.: Наука, 1978. − 232 с. 265 20. Бакман, Ю.А. Рынок сотовой связи России: от экстенсивного развития к интенсивному / Ю.А. Бакман, В.С. Панфилов // Проблемы прогнозирования. − 2008. − №5. − С.36-54. 21. Бароян, О.В. Моделирование и прогнозирование эпидемий гриппа для территории СССР. / О.В. Бароян, Л.А. Рвачев, Ю.Г. Иванников. − М.: ИЭМ им. Н.Ф. Гамалеи, 1977. − 546 с. 22. Бартоломью, Стохастические модели социальных процессов / Д.Бартоломью. − М.: Финансы и статистика, 1985. − 296 с. 23. Барютин, Л.С. Основы инновационного менеджмента. Теория и практика: Учебник. – 2-е изд., перераб. и доп. / Л.С. Барютин и др.. − М.: ЗАО: ―Издательство ―Экономика‖, 2004. − 518 с. 24. Березин, И.С. Сколько в России абонентов мобильной связи? / И.С. Березин // РОМИРМониторинг. − 2007. − 19 февраля. 25. Бешенков, С.А. Моделирование и формализация. Методическое пособие / С.А. Бешенков, Е.А. Ракитина. − М.: Лаборатория Базовых Знаний, 2002. − 336 с. 26. Болдырев, Р.Л. Моделирование диффузии инноваций с учетом ценового фактора / Р.Л. Болдырев, И.Б. Руссман, И.Н. Щепина // Труды конф. "Математическое моделирование систем. Методы, приложения и средства", Воронеж, 1998. 27. Бретт, А. Оценка коммерциализуемости технологий / А. Бретт // Коммерциализация технологий. Мировой опыт – российским регионам / сост. и общ. Ред. Н.М.Фонштейн. – Пер. с англ.. − 1995. − С.7-47. 28. Булгак, В.Б. Новые методы прогнозирования развития телекоммуникаций и их применение в отрасли "Связь Российской Федерации" / В.Б. Булгак, Л.Е. Варакин, Н.Н. Каледина, В.Д. Москвитин, Л.Ф. Шамаева. − М.: МАС, 2000. − 105 с. 29. Вабищевич, П.Н. Численные методы. Вычислительный практикум / П.Н. Вабищевич. − М.: Книжный дом "Либроком", 2010. − 320 с. 30. Вайдлих, В. Социодинамика.Системный подход к математическому моделированию в социальных науках. Пер. с англ. С.Л.Котлярова, под ред. Ю.С.Попкова, А.Е.Семечкина. Изд. 2-е, стереотипное / В. Вайдлих. − М.: Едиториал УРСС, 2005. − 480 с. 31. Варакин, Л.Е. 25 лет инфокоммуникационной революции / Л.Е. Варакин, ред.. − М.: МАС, 2006. − 264 с. 32. Варакин, Л.Е. Информационно-экономический закон. Взаимосвязь инфокоммуникационной инфраструктуры и экономики / Л.Е. Варакин. − М.: МАС, 2006. − 160 с. 33. Вартанова, Е.Л. Ч.2. Северная модель: государство всеобщего информационного благоденствия? / Е.Л. Вартанова // Национальные модели информационного общества / Отв. ред. и сост. Е.Л.Вартанова, науч.ред. Н.В.Ткачева. − М.: ИКАР. − 2004. − . − С.83-112. 34. Вартанова, Е.Л. Ч.1. Новые неравенства большой Европы / Е.Л. Вартанова, Я.Н. Засурский // Национальные модели информационного общества / Отв. ред. и сост. Е.Л.Вартанова, науч.ред. Н.В.Ткачева. − М.: ИКАР. − 2004. − С.83-112. 35. Варшавский, Л.Е. Исследование динамики показателей рынков наукоемкой продукции (на примере рынков компонентов персональных компьютеров) / Л.Е. Варшавский // Экономика и математические методы. − 2004. − т.40, №1. − С.101-116. 36. Васильев, В.В. Мониторинг информатизации: показатели, методология оценки и прогнозирования / В.В. Васильев, Т.Ю. Салютина. − М.: Палеотип, 2005. − 160 с. 266 37. Вентцель, Е.С. Теория случайных процессов и ее инженерные приложения: Учеб. пособие для втузов. — 2-е изд. / Е.С. Вентцель, Л.А. Овчаров. − М.: Высшая школа, 2000. − 383 с. 38. Вершинская, О.Н. Международные индексы готовности стран к информационному обществу / О.Н. Вершинская, О.А. Алексеева // Труды института системного анализа Российской академии наук. − 2011. − Т.61,№2. − С.19-25. 39. Виленский, П.Л. Оценка эффективности инвестиционных проектов: Теория и практика: учеб. Пособие. – 4-е изд., перераб. и доп / П.Л. Виленский, В.Н. Лившиц, С.А. Смоляк. − М.: Дело АНХ, 2008. − 1104 с. 40. Вишневский, В.М. Теоретические основы проектирования компьютерных сетей / В.М. Вишневский. − М.: Техносфера, 2003. − 512 с. 41. Влэдуц, Г.Э. Научная и техническая информация как одна из задач кибернетики / Г.Э. Влэдуц, В.В. Налимов, Н.И. Стяжкин // Успехи физических наук. − 1959. − Т. 69. − № 1. − С.13–56. 42. Вольтерра, В. Математическая теория борьбы за существование / В. Вольтерра. − Москва-Ижевск: Институт компьютерных исследований, 2004. − 288 с. 43. Вороненкова, Г.Ф. Интернет для всех: германский путь в ―e-society‖ ? / Г.Ф. Вороненкова // Национальные модели информационного общества / Отв. ред. и сост. Е.Л.Вартанова, науч.ред. Н.В.Ткачева. − М.: ИКАР. − 2004. − С.50-64. 44. Гаврилец, Ю.Н. Моделирование динамики социальной установки (отношение к коммерческой рекламе на телевидении) / Ю.Н. Гаврилец, Ю.В. Фомина // Социология: 4M - методология, методы, математические модели. − 2002. − №15. − С.110-134. 45. Гаврилов, Л.А. Биология продолжительности жизни / Л.А. Гаврилов, Н.С. Гаврилова. − М.: Наука, 1991. − 276 с. 46. Галицкий, Е.Б. Заветные десять процентов / Е.Б. Галицкий // Независимая газета. − 2003. − 4 июля. 47. Галицкий, Е.Б. Почти 10 миллионов / Е.Б. Галицкий // Независимая газета. − 2003. − 23 мая. 48. Галицкий, Е.Б. Не исключено, что нас ждет пессимистический сценарий развития Интернета / Е.Б. Галицкий // Интернет-маркетинг. − 2007. − №1(37). − С.10-25. 49. Гельман, Л.М. Модели инновационных процессов (обзор зарубежной литературы) / Л.М. Гельман, М.И. Левин // Экономика и математические методы. − 1989. − Т.25, №6. 50. Гиляревский, Р.С. Основы информатики: курс лекций / Р.С. Гиляревский. − М.: Экзамен, 2003. − 319 с. 51. Голиченко, О.Г. Современная технологическая революция и новые возможности инновационного развития "догоняющих" стран / О.Г. Голиченко // Инновации. − 2010. − 3. − С.12-22. 52. Госкомстат России, / Госкомстат России. − М.: Госкомстат России, 2001. − 397 с. 53. Григоров, Ю.Н. Система интерактивного проектирования программ развития парков технических систем / Ю.Н. Григоров, Ю.Н. Павловский, В.Б. Соколов // Вопросы кибернетики: моделирование человеко-машинных кибернетических систем.. − 1984. − С.133-145. 54. Григоров, Ю.Н. Проблемы использования технологии математического моделирования в народном хозяйстве (на примере моделей возрастных структур парков технических 267 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 68. 69. систем) / Ю.Н. Григоров, П.В. Данилов, Ю.Н. Павловский // Математическое моделирование. − 1991. − т.3. - №4. − С.57-66. Громыко, Г.Л. Теория статистики: Учебник. - 2-е изд., / Г.Л. Громыко, ред.. − ИНФРАМ, 2006. − 476 с. Губанов, Д.А. Социальные сети: модели информационного влияния, управления и противоборства / Д.А. Губанов, Д.А. Новиков, А.Г. Чхартишвили. − М.: Изд-во физикоматематической литературы, 2010. − 228 с. Гусаков, А. Трехмерный уют / А. Гусаков // Секрет фирмы. − 2008. − №41 (273). − С.48-49. Гуц, А.К. Математическая социология / А.К. Гуц, Л.А. Паутова, Ю.В. Фролова. − Омск: ОМГУ, 2003. − 191 с. Дворкина, М.Я. Как долго длится инновация / М.Я. Дворкина // Библиосфера. − 2009. − №4. − С.15-18. Деарт, Ю.В. Анализ тенденций развития сетей связи как объектов диффузии инноваций / Ю.В. Деарт // Вопросы экономических наук. − 2005. − №3. − С.24-28. Деарт, Ю.В. Прогноз развития сотовой связи в России / Ю.В. Деарт // Вестник связи. − 2005. − №4. − С.32-34. Деарт, Ю.В. Прогноз количества пользователей Интернет в России / Ю.В. Деарт, А.Ю. Цым, И.В. Бурцев // Электросвязь. − 2005. − №6. − С.16-18. Делицын, Л.Л. Динамика роста российского Интернета и крупных Интернет-порталов / Л.Л. Делицын // Информационно-аналитическая деятельность в России: состояние и перспективы. Материалы Всероссийской научно-практ. конф. аналитических работников / Под. ред. А.И. Селиванова, Н.А. Слядневой. – М.: ИПК Госслужбы, 2004. – Ч.2. – C. 7981. Делицын, Л.Л. Проблема цифрового неравенства и потенциал развития Интернета в России / Л.Л. Делицын // Информационные процессы. – 2006. – Т.6. -№2. - С. 124-130. Делицын, Л.Л. Две модели распространения сотовой связи в России / Л.Л. Делицын // Вопросы структуризации экономики. - №3. – Махачкала: ИСЭИ ДНЦ РАН. – 2008. – С. 3640. Делицын, Л.Л. Количественный анализ распространения Интернета среди мужчин и женщин / Л.Л. Делицын // Сборник статей V Междунар. научно-практ. конф. «Женщина в политике и обществе»/Под ред. А.И. Кравченко, Т.И.Королевой. – Пенза. Приволжский Дом знаний. – 2008. – С.18-22. Делицын, Л.Л. Кумулятивные кривые охвата и проблема динамики аудитории российского Интернета / Л.Л. Делицын // Интернет-Маркетинг. – 2008. – №5. – С. 280 — 292. Делицын, Л.Л. Моделирование распространения Интернета в России с учетом цен и демографических процессов / Л.Л. Делицын // Материалы VI всерос. научно-практ. конф. ―Проблемы информатизации социальных систем: региональный аспект‖, Чебоксары, 24-26 апреля 2008г./ Отв. редактор проф. Н.В.Софронова. - Чебоксары. – 2008. – С. 67-70. Делицын, Л.Л. Моделирование распространения Интернета с учетом демографических процессов и стоимости доступа / Л.Л. Делицын // Интернет и современное общество. Сборник тезисов докладов объединенной конференции 28-30 октября 2008 г. / СПб.: Издво СПБГУ. – 2008. – С. 48-51 268 70. Делицын, Л.Л. Моделирование распространения нововведения с учетом распределения размеров домохозяйств / Л.Л. Делицын // Материалы 5-й междунар. заочной научн. конф. «Синергетика природных, технических и социально– экономических систем». - Тольятти. ТГУС. - 2008. – С.189-195. 71. Делицын, Л.Л. Модель распространения нововведений в домохозяйствах на примере мобильной связи // / Л.Л. Делицын // Информационно-вычислительные технологии и их приложения: сб. статей VIII Междунар. научно-техн. конф./ Под ред. проф. А.Н.Кошева. – Пенза: РИО ПГСХА. – 2008. – C. 130-133. 72. Делицын, Л.Л. Можно ли согласовать данные социологических опросов об интенсивности использования Интернета? / Л.Л. Делицын // Интернет-Маркетинг. – 2008. – №6. – C. 334-352. 73. Делицын, Л.Л. О неединственности представления логистической модели распространения инноваций в форме вероятностной смеси / Л.Л. Делицын // Высокие технологии, фундаментальные и прикладные исследования, образование. Сб. трудов Шестой междунар. научно-практ. конф. ―Исследование, разработка и применение высоких технологий в промышленности‖ :16-17 октября 2008 г./ Под ред. А.П. Кудинова, Г.Г. Матвиенко. – СПб.: Изд-во Политехн. ун-та. – 2008. – С.32-34. 74. Делицын, Л.Л. Об одном применении теории вероятностей для сравнения моделей распространения инноваций / Л.Л. Делицын // Инновационные процессы в менеджменте: сб. статей V Междунар. научно-практ. конф./ Под ред. Л.С. Егоровой, Г.С. Широкаловой, Г.В.Синцова. – Пенза. Приволжский Дом знаний. – 2008. – С. 15-19. 75. Делицын, Л.Л. Развитие информационных и телекоммуникационных технологий в России как процесс распространения инноваций в неоднородном обществе / Л.Л. Делицын // Социология инноватики: Социальные механизмы формирования инновационной среды. Материалы II международной конференции / Под ред. Ю.А. Карповой. − 2008. − С.293313. 76. Делицын, Л.Л. Разработка инструмента отбора стартапов для финансирования венчурным фондом / Л.Л. Делицын // Высокие технологии, фундаментальные и прикладные исследования, образование. Т.12: Сб. трудов Пятой междунар. научно-практ. конф. ―Исследование, разработка и применение высоких технологий в промышленности‖/ Под ред. А.П. Кудинова, Г.Г. Матвиенко. – СПб.: Изд-во Политехн. ун-та. – 2008. – С. 8-9. 77. Делицын, Л.Л. Распознавание стартапов для финансирования венчурным фондом / Л.Л. Делицын // Информационные технологии в профессиональной деятельности и научной работе: сб. материалов всерос. научно-практ. конф. Ч.2./ – Йошкар-Ола: Марийский государственный технический университет. – 2008. – C. 29-31 78. Делицын, Л.Л. Распространение инноваций с учетом цен и демографических процессов: модель с непрерывным временем / Л.Л. Делицын // Информационно-вычислительные технологии и их приложения: сб. статей VIII Междунар. научно-техн. конф./ Под ред. проф. А.Н.Кошева. – Пенза: РИО ПГСХА. – 2008. – C. 134-137. 79. Делицын, Л.Л. Распространение Интернета в неоднородном обществе / Л.Л. Делицын // Высокие технологии, фундаментальные и прикладные исследования, образование. Т.12: Сб. трудов Пятой междунар. научно-практ. конф. ―Исследование, разработка и применение высоких технологий в промышленности‖/ Под ред. А.П. Кудинова, Г.Г. Матвиенко. – СПб.: Изд-во Политехн. ун-та. – 2008. – С. 68-69. 269 80. Делицын, Л.Л. Распространение информации в социальных сетях как случайный процесс / Л.Л. Делицын // Высокие технологии, фундаментальные и прикладные исследования, образование. Сб. трудов Шестой междунар. научно-практ. конф. ―Исследование, разработка и применение высоких технологий в промышленности‖ :16-17 октября 2008 г./ Под ред. А.П. Кудинова, Г.Г. Матвиенко. – СПб.: Изд-во Политехн. ун-та. – 2008. – С.3436. 81. Делицын, Л.Л. Система отбора инновационных проектов венчурным фондом / Л.Л. Делицын // Материалы IV международной научной конференции «Инновационное развитие и экономический рост». Москва. РУДН, 6-7 ноября 2008 г./ М.:РУДН – 2008. – C.466-470. 82. Делицын, Л.Л. Совместное моделирование численности пользователей и владельцев нового товара / Л.Л. Делицын // Составляющие научно-технического прогресса: Сб. материалов 4-й междунар. научно-практ. конф.: 23-24 апреля 2008 г. / – Тамбов: Издательство ТАМБОВПРИНТ. 2008. – C. 27-30. 83. Делицын, Л.Л. Способ расчета теоретических кумулятивных кривых охвата аудитории WWW-сайтов / Л.Л. Делицын // Высокие технологии, фундаментальные и прикладные исследования, образование. Сб. трудов Шестой междунар. научно-практ. конф. ―Исследование, разработка и применение высоких технологий в промышленности‖ :16-17 октября 2008 г./ Под ред. А.П. Кудинова, Г.Г. Матвиенко. – СПб.: Изд-во Политехн. ун-та. – 2008. – С.88-90. 84. Делицын, Л.Л. Сравнение моделей распространения нововведений на основе исторических рядов динамики / Л.Л. Делицын // Инновационные процессы в менеджменте: сб. статей V Междунар. научно-практ. конф./ Под ред. Л.С. Егоровой, Г.С. Широкаловой, Г.В.Синцова. – Пенза. Приволжский Дом знаний. – 2008. – C. 19-24. 85. Делицын, Л.Л. Чтобы поднять аудиторию, надо уронить цены / Л.Л. Делицын // Информкурьерсвязь. - №11. - 2008. – C.45-47. 86. Делицын, Л.Л. Бета-биномиальная модель поведения онлайн-панели / Л.Л. Делицын // Информационные технологии и мѐатематическое моделирование (ИТММ-2009): Материалы VIII Всероссийской научно-практической конференции с международным участием (13-14 ноября 2009 г.). - Томск: Изд-во Томского ун-та, 2009. 87. Делицын, Л.Л. Вероятностные модели распространения мобильной связи в России / Л.Л. Делицын // Труды междунар. конф. «Перспективы развития телекоммуникационных систем и информационные технологии». Под ред. д-ра экон. наук, проф. А.В.Бабкина, д-ра техн. наук, проф. В.А.Кежаева. – СПб.: Изд-во Политехн. ун-та. – 2009. – С.378-394. 88. Делицын, Л.Л. Инструментарий для отбора венчурным фондом инновационных проектов / Л.Л. Делицын // Научно-технические ведомости СПбГПУ. Экономические науки. – 2009. - №4. – С.296-307. 89. Делицын, Л.Л. Когнитивное моделирования принятия решений инвестиционным комитетом венчурного фонда / Л.Л. Делицын // Когнитивный анализ и управление развитием ситуацией (CASC'2009): Труды международной конференции (17-19 ноября 2009 г., Москва). – М.: ИПУ РАН. – 2009. – С.169-172. 90. Делицын, Л.Л. Кумулятивные кривые охвата аудитории WWW-ресурса для неубывающего количества пользователей / Л.Л. Делицын // Тезисы доклада на междунар. научно-практ. конф. «Наука и производство – 2009». – Брянск, БГТУ. – 2009. – С131-133. 270 91. Делицын, Л.Л. Методика отсева инновационных проектов в сфере ИКТ венчурным фондом / Л.Л. Делицын // Труды всерос. конф. «Инновационная экономика и промышленная политика региона». / Под ред. д-ра экон. наук, проф. А.В.Бабкина. – СПб.: Изд-во Политехн. ун-та. – 2009. – С.58-74. 92. Делицын, Л.Л. Многостадийные модели распространения ИКТ в России / Л.Л. Делицын // Системное моделирование социально-экономических процессов: труды 32-й Междунар. научной школы-семинара, Вологда, 5-10 октября 2009 г.: в 3 ч./под ред. В.Г.Гребенникова, И.Н.Щепиной, В.Н.Эйтингона. – Воронеж: ИПЦ ВГУ. – 2009. – С. 145-151. 93. Делицын, Л.Л. Многостадийные модели распространения Интернета в России / Л.Л. Делицын // Высокие технологии, фундаментальные исследования, образование. Т2: Сб. трудов Седьмой междунар. научно-практ. конф. ―Исследование, разработка и применение высоких технологий в промышленности‖ / Под ред. А.П. Кудинова, Г.Г. Матвиенко. – СПб.: Изд-во Политехн. ун-та. – 2009. – С54-56. 94. Делицын, Л.Л. Моделирование данных социологических опросов о распространении мобильной связи в России / Л.Л. Делицын // Научно-технические ведомости СПбГПУ, 2009. - №1. – С.96-104. 95. Делицын, Л.Л. Моделирование данных социологических опросов о распространении мобильной связи в России / Л.Л. Делицын // Научно-технические ведомости СПбГПУ. Информатика. Телекоммуникации. Управление. – 2009. – №1. – С.96-104. 96. Делицын, Л.Л. Моделирование охвата аудитории информационного ресурса с учетом оттока пользователей / Л.Л. Делицын // Высокие технологии, фундаментальные исследования, образование. Т2: Сб. трудов Седьмой междунар. научно-практ. конф. ―Исследование, разработка и применение высоких технологий в промышленности‖/ Под ред. А.П. Кудинова, Г.Г. Матвиенко. – СПб.: Изд-во Политехн. ун-та. – 2009. – С.57-59. 97. Делицын, Л.Л. Моделирование распространения нововведений при положительном скачке потенциала / Л.Л. Делицын // Инноватика - 2009: Труды междунар. конф. – Ульяновск: УлГУ. – 2009. – С. 310-311. 98. Делицын, Л.Л. Неединственность моделей охвата аудитории WWW-ресурсов в условиях замены файлов cookies / Л.Л. Делицын // Современные проблемы информатизации в проектировании и информационных системах. Сб. трудов. Вып. 14/ Под ред. д.т.н. проф. О.Я.Кравца – Воронеж: ―Научная книга‖. – 2009. – С.487-491. 99. Делицын, Л.Л. Некоторые вопросы расчета кумулятивных кривых растущего охвата аудитории WWW-ресурсов / Л.Л. Делицын // «Актуальные проблемы и инновации в экономике, управлении, образовании, информационных технологиях». Матер. междунар. научн. конф. (12-15 мая 2009 г., Ставрополь-Кисловодск). – В 4 т. Вып.5.т.3. – Ставрополь. – 2009. – С.89-92. 100. Делицын, Л.Л. Некоторые иерархические многостадийные модели распространения нововведений / Л.Л. Делицын // Научно-технические ведомости СПбГПУ. Экономические науки. – 2009. – №5. – С.279-287. 101. Делицын, Л.Л. Необходимые условия роста использования Интернета в регионах России в период мировой экономической рецессии / Л.Л. Делицын // Доклад на Второй ежегодн. межрег. научно-практ. конф. ―Инфокоммуникационные технологии в региональном развитии‖. – Смоленск: Администрация Смоленской области. – 2009. – Электрон. текстов. ресурс. - http://expo.smolensk.ru/dokald_09/delicin.doc 271 102. Делицын, Л.Л. О проблемах использования кумулятивных кривых аудитории WWWресурсов при оттоке пользователей / Л.Л. Делицын // Сб. матер. IV-й Междунар. научнопракт. конф. «Маркетинг и общество». – Казань: КГФЭИ. – 2009. – С.87-90. 103. Делицын, Л.Л. О проблеме согласования различных способов подсчета охвата аудитории WWW-ресурсов / Л.Л. Делицын // Научно-технические ведомости СПбГПУ. Информатика. Телекоммуникации. Управление. – 2009. - №1. – С.164-170. 104. Делицын, Л.Л. Применение многостадийной модели диффузии инноваций для исследования процесса распространения Интернета в России / Л.Л. Делицын // Маркетинг взаимодействия в инновационной экономике. Материалы междунар. научн. конф. 27-29 сент. 2009. Ч.1 / Под ред. д.э.н., проф. И.А.Максимцева. – СПб.: СПбГУЭФ. – 2009. – С.1016. 105. Делицын, Л.Л. Применение многостадийной модели диффузии нововведений для объяснения показателей распространения Интернета в России / Л.Л. Делицын // «Синергетика природных, технических и социально– экономических систем»: Сб. статей VI междунар. заочн. научн. конф. (май 2009) - Тольятти. Изд-во ПВГУС. – 2009. – С.112119. 106. Делицын, Л.Л. Прогнозирование распространения Интернета в России при помощи модели диффузии нововведений / Л.Л. Делицын // Матер. V междунар. научно-практ. конференции ―Экономическое прогнозирование: модели и методы‖. – Воронеж. – 2009. – C.112-120. 107. Делицын, Л.Л. Простейшая многостадийная модель распространения Интернета в России и в Москве / Л.Л. Делицын // Сб. статей VI междунар. научно-практ. конф. «Инновационные процессы в менеджменте». - Под ред. А.И.Кравченко, Г.В.Синцова, Г.С. Широкаловой. – Пенза: Приволжский Дом Знаний. – 2009. – С.11-15. 108. Делицын, Л.Л. Распространение информационных и телекоммуникационных технологий в России как многостадийный процесс диффузии нововведения в неоднородном обществе / Л.Л. Делицын // Социология инноватики: Человек в инновационном мире. Материалы III междунар. конф. / Под ред. Ю.А. Карповой. – М.: Инион РАН. – 2009 . – С.68-73 . 109. Делицын, Л.Л. Стохастическая модель охвата аудитории WWW-ресурсов в условиях замены файлов cookies / Л.Л. Делицын // Труды междунар. конф. «Перспективы развития телекоммуникационных систем и информационные технологии». / Под ред. д-ра экон. наук, проф. А.В.Бабкина, д-ра техн. наук, проф. В.А.Кежаева. – СПб.: Изд-во Политехн. ун-та. – 2009. – С.195-212. 110. Делицын, Л.Л. Эпидемическая SIR-модель жизненного цикла нововведения / Л.Л. Делицын // Сб. статей VII междунар. научно-практ. конф. «Инновационные технологии научных исследований социально-экономических процессов». - Под ред. д.п.н. В.П. Линьковой. – Пенза: Приволжский Дом Знаний. – 2009. – С.38-43. 111. Делицын, Л.Л. Количественные модели распространения нововведений в сфере информационных и телекоммуникационных технологий / Л.Л. Делицын. − М.: МГУКИ, 2009. − 106 с. 112. Делицын, Л.Л. Анализ динамики проникновения сотовой связи в домохозяйствах и среди индивидов на основе модели диффузии нововведений с растущим потенциалом проникновения / Л.Л. Делицын // Посткризисные очертания инновационных процессов: Материалы Десятых Друкеровских чтений // Под ред.Р.М.Нижегородцева. М. − Новочеркасск: ЮРГТУ (НПИ), 2010. – с.320-329. 272 113. Делицын, Л.Л. Анализ итогов совместного прогнозирования компьютерного рынка и парка компьютеров РФ на основе новых статистических данных / Л.Л. Делицын // Труды всерос. конф. «Экономика и инновации в промышленности». Под ред. д-ра экон. наук, проф. А.В.Бабкина. – СПб.: Изд-во Политехн. ун-та. – 2010. – С.18-25. 114. Делицын, Л.Л. Вычисление количества пользователей инновации с экспоненциально растущим потенциалом при помощи обобщенного интеграла Доусона / Л.Л. Делицын // Приоритетные направления современной российской науки. Сб.матер. междунар. научнопракт. конф. 25-26.01.2010. – Тамбов. Тамбовпринт. – 2010. – С.30-35. 115. Делицын, Л.Л. Демографическое обоснование модели диффузии нововведения с линейно растущим потенциалом / Л.Л. Делицын // «Маркетинг и общество»: Сб. матер. V Междунар. научно-практ. конф. – Казань: Изд-во КГФЭИ. – 2010. – С.57-59. 116. Делицын, Л.Л. Интерпретация данных массовых опросов об использовании мобильной связи при помощи модели диффузии нововведений с растущим потенциалом распространения / Л.Л. Делицын // Сб. статей VII междунар. научно-практ. конф. «Инновационные процессы в менеджменте». - Под ред. А.И.Кравченко, Г.С. Широкаловой. – Пенза: Приволжский Дом Знаний. – 2010. – С.22-29. 117. Делицын, Л.Л. Использование специальных функций для вычисления количества пользователей инновации с растущим потенциалом распространения / Л.Л. Делицын // «Актуальные вопросы современной науки». Матер. VII Междунар. Интернет-конф. (Таганрог, 31 янв. 2010 г.); Сб.научн. трудов/ под ред. д.пед.н., проф.Г.Ф.Гребенникова. – М.:Спутник+. – 2010. – С.341-344. 118. Делицын, Л.Л. Количественная модель распространения сотовой связи как инновации с линейно растущим потенциалом распространения / Л.Л. Делицын // Научные труды вольного экономического общества России. − 2010. − т.137. − С.884-900. 119. Делицын, Л.Л. Моделирование распространения Интернета с учетом неоднородности структуры влияния в обществе, процессов воспроизводства населения и снижения стоимости доступа / Л.Л. Делицын // //Труды Третьей Междунар. конф. ―Математическое моделирование социальной и экономической динамики (MMSED-2010). 23-25 июня 2010 г. / Науч.ред. М.Г.Дмитриев, А.П.Петров, Н.П.Третьяков. – М.:ЛЕНАНД. – 2010 г. – С.8789/. 120. Делицын, Л.Л. Моделирование распространения Интернета в Москве / Л.Л. Делицын // Математика. Компьютер. Образование. Тезисы докл. XVII междунар. конф. г.Дубна 25-30 янв. 2010 / - М.-Ижевск. - 2010. – C.335. 121. Делицын, Л.Л. Модель диффузии нововведений в обществе, неоднородном по склонности реципиентов распространять информацию / Л.Л. Делицын // Шестые Курдюмовские чтения Международная междисциплинарная научная конференция «Синергетика в естественных науках» с элементами научной школы для молодежи. – Тверь: Твер. Гос. Ун-т. – 2010 г. – С.87-90. 122. Делицын, Л.Л. Некоторые модели диффузии инноваций в маркетинге инфокоммуникационных услуг / Л.Л. Делицын // Труды вольного экономического общества России. – 2010. – т.130. – С.412-420. 123. Делицын, Л.Л. О близости результатов расчетов при помощи двух моделей распространения нововведений при помощи двух принципиально различных моделей / Л.Л. Делицын // Высокие технологии, фундаментальные исследования, промышленность. Т4: Сб. трудов Девятой междунар. научно-практ. конф. ―Исследование, разработка и 273 124. 125. 126. 127. 128. 129. 130. 131. 132. 133. 134. применение высоких технологий в промышленности‖.22-23.04.2010, СПб./ Под ред. А.П. Кудинова. – СПб.: Изд-во Политехн. ун-та. – 2010. – С.98-103. Делицын, Л.Л. О верхней оценке количества пользователей инновации с экспоненциально растущим потенциалом / Л.Л. Делицын // Системный анализ в проектировании и управлении: cб. науч. трудов XIV междунар. научно-практ. конф. Ч.1. СПб.: Изд-во Политехн. ун-та, 2010. – С. 291-298. Делицын, Л.Л. Опыт совместного прогнозирования компьютерного рынка и парка компьютеров Российской Федерации / Л.Л. Делицын // Материалы VI междунар. научнопракт. конференции ―Экономическое прогнозирование: модели и методы‖, 6 апреля 2010: в 2.ч./под общ.ред.В.В. Давниса, В.И.Тиняковой. – Воронеж: ИПЦ ВГУ – 2010. – С.130135. Делицын, Л.Л. Применение интегральной показательной функции для расчета количества пользователей инновации с экспоненциально растущим потенциалом / Л.Л. Делицын // Методы и алгоритмы прикладной математики в технике, медицине и экономике: матер. IХ Междунар. научно-практ. конф. – 26/02/2010. – Новочеркасск: ЮРГТУ (НПИ). – 2010. – С.50-59. Делицын, Л.Л. Применение модели диффузии нововведений для стратегического планирования распространения Интернета в России / Л.Л. Делицын // Тезисы доклада на XI всерос. симпозиуме ―Стратегическое планирование и развитие предприятий‖. – М.: ЦЭМИ РАН. – 13-14 апр. 2010. – С.68-70. Делицын, Л.Л. Прогнозирование распространения Интернета в России при помощи модели диффузии нововведений / Л.Л. Делицын // Научно-технические ведомости СПбГПУ. Информатика. Телекоммуникации. Управление. – 2010. - №1. – С.74-82. Делицын, Л.Л. Прогнозы распространения Интернета в США и Швеции на основе модели диффузии инновации с линейно растущим потенциалом / Л.Л. Делицын // Приоритетные направления современной российской науки. Сб.матер. междунар. научнопракт. конф. 25-26.01.2010. – Тамбов. Тамбовпринт. – 2010. – С.15-18. Делицын, Л.Л. Распространение инноваций в однородном обществе как стационарный поток событий / Л.Л. Делицын // Инноватика-2010. Труды междунар. конф. Под ред. Булярского С.В. – Ульяновск: УлГУ, 2010. – С.233-234. Делицын, Л.Л. Расчет количества пользователей инновации с линейно растущим потенциалом распространения при помощи интеграла Доусона / Л.Л. Делицын // «Теория и практика управления инновационным развитием социально-экономических систем». Труды междунар. научно-практ. конф. Ростов-на-Дону (24-25 дек.2009). Часть I. – Ростовна-Дону: СКАГС, 2010. – С.48-55. Делицын, Л.Л. Скоро ли пользователь Интернета станет похож на среднего россиянина? / Л.Л. Делицын // Онлайн-исследования в России 2.0. Под ред. Шашкина А.В., Девятко И.Ф., Давыдова С.Г. – М.: РИЦ ―Северо-Восток‖. – 2010. – С. 31-42. Делицын, Л.Л. Совместное моделирование компьютерного рынка и парка компьютеров на основе системного подхода / Л.Л. Делицын // Системный анализ в экономике. Материалы научно-практ.конф. Москва, 24-25 ноября 2010. / Под ред. чл.-корр.РАН, Г.Б.Клейнера. – М.: ЦЭМИ РАН, 2010. – с.54-56. Делицын, Л.Л. Совместное прогнозирование компьютерного рынка и парка компьютеров при помощи модели распространения нововведения / Л.Л. Делицын // Труды вольного экономического общества России. – 2010. – т.130. – С.421-429. 274 135. Делицын, Л.Л. Согласование данных массовых опросов об интенсивности использования Интернета при помощи отрицательного биномиального распределения вероятностей / Л.Л. Делицын // Интернет и современное общество. Труды XVIII Всероссийской объединенной конференции, 19-22 октября 2010 г. / СПб.: Изд-во СПБГУИТМО. – 2010. – С. 23-26. 136. Делицын, Л.Л. Способ оценки индекса сезонности продаж при помощи онлайн-опросов для оценки распределения продолжительности жизни товара / Л.Л. Делицын // Труды всерос. конф. «Экономика и инновации в промышленности». / Под ред. д-ра экон. наук, проф. А.В.Бабкина, д-ра.экон.наук, проф.В.В.Кобзева. – СПб.: Изд-во Политехн. ун-та, 2010. –С.18-25. 137. Делицын, Л.Л. Сравнение бета-биномиальной и дискретной моделей поведения онлайнпанелей / Л.Л. Делицын // Современные проблемы информатизации в экономике и обеспечении безопасности: Сб. трудов. Вып. 15 / под ред. д.т.н. проф. О.Я.Кравца. – Воронеж: Научная книга. – 2010. – С.71-76. 138. Делицын, Л.Л. Сравнение способов контакта групп, принимающих решение, при моделировании распространения мобильной связи в домохозяйствах / Л.Л. Делицын // Труды Третьей Междунар. конф. ―Математическое моделирование социальной и экономической динамики‖ (MMSED-2010). 23-25 июня 2010 г. / Науч.ред. М.Г.Дмитриев, А.П.Петров, Н.П.Третьяков. – М.:ЛЕНАНД. – 2010 г. – С.89-91. 139. Делицын, Л.Л. Сравнительный анализ распространения Интернета в России и некоторых европейских странах / Л.Л. Делицын // Вестник МГУ. Серия журналистика. – №4, 2010. – С.23-39. 140. Делицын, Л.Л. Статистика распространения Интернета в Москве и в Швеции: чего ждать дальше? / Л.Л. Делицын // Интернет маркетинг. – 2010. – №2. – C.66-82. 141. Делицын, Л.Л. Элементы префигуративного типа культуры в системе неопросветительства / Л.Л. Делицын // Феномен неопросветительства / Под ред. А.Ю.Алексеева, С.Ю.Карпук. – М.: ИИнтелл, 2010. – С.158-164. 142. Делицын, Л.Л. Моделирование охвата аудитории WWW-сайтов при помощи бетабиномиальной вероятностной смеси / Л.Л. Делицын // Междунар. конф. Информационное общество: Состояние и тенденции межгосударственного обмена научно-технической информацией в СНГ. – М.: ВИНИТИ РАН, 2011. – С.45-47. 143. Делицын, Л.Л. Совместное моделирование компьютерного рынка и парка компьютеров на основе статистических данных / Л.Л. Делицын // Научно-технические ведомости СПбГПУ. Экономические науки. – 2011. - №1. – С.265-272. 144. Делицын, Л.Л. Количественная модель распространения Интернета среди городского и сельского населения России / Л.Л. Делицын // Вестник Костромского государственного университета им. Н.А. Некрасова. — 2012. — Т. 18, № 6. — С. 52–56. 145. Делицын, Л.Л. Об одном обобщении модели CGS распространения нововведения / Л.Л. Делицын // Системы компьютерной математики и их приложения, 2013. № 14. С. 148-150. 146. Делицын, Л.Л. Разработка и применение количественных моделей распространения новых информационных технологий / Л.Л. Делицын // Научно-техническая информация. Серия 1: Организация и методика информационной работы. − 2014. − №5. − С.24-32. 147. Делицын, Л.Л. Состояние российского Интернета на сегодняшний день / Л.Л. Делицын, И.И. Засурский // Маркетинг в России и за рубежом. − 2003. − №2. − С.80 - 86. 275 148. Делицын, Л.Л. Состояние российского Интернета на сегодняшний день / Л.Л. Делицын, И.И.Засурский // Маркетинг в России и за рубежом. — 2003. — №2. — С. 80–86. 149. Делицын, Л.Л. Традиционный бизнес пошѐл в Интернет / Л.Л. Делицын, И.И. Засурский // Интернет-Маркетинг. − 2003. − №3. − С.2-10. 150. Делицын, Л.Л. Проблемы оценки стоимости бизнеса малых и средних компаний / Л.Л. Делицын, С.А. Харченко // Фактор риска. – 2006. – Сентябрь-октябрь. – С.18-19. 151. Делицын, Л.Л. Моделирование распространения нововведения в неоднородной социально-экономической системе при помощи свободного программного обеспечения / Л.Л. Делицын, С.А. Белоцерковский // Открытое образование. – 2011. – №2(86). – Ч.2 – С.159-262. 152. Делицын, Л.Л. Модель распространения нововведения в обществе с функцией дожития первого типа / Л.Л. Делицын, С.А. Белоцерковский // Вторая всерос. научно-практ. Конф. "Проблемы анализа и моделирования региональных социально-эконономических процессов", 21-22 апреля 2011 г.– Казань: Изд-во КГФЭИ. – 2011. – С.124-127. 153. Делицын, Л.Л. Некоторые вопросы информационно аналитической поддержки венчурного инвестирования в новый способ предоставления программного обеспечения / Л.Л. Делицын, Н.С. Мациевский // Вестник Академии экономической безопасности МВД России. - 2011. - № 7. – C. 76-83. 154. Делицын, Л.Л. Об одном способе обобщения модели CGS распространения нововведения / Л.Л. Делицын, Т.А. Подлесная // Седьмые Курдюмовские чтения Международная междисциплинарная научная конференция «Синергетика в естественных науках» с элементами научной школы для молодежи. – Тверь: Твер. Гос. Ун-т. – 2011 г. 155. Делицын, Л.Л. Решение уравнений CGS распространения нововведения в стабильной популяции / Л.Л. Делицын, С.А. Белоцерковский // Математическое моделирование и краевые задачи. Труды восьмой Всероссийской научной конференции с международным участием. Ч.3.: Дифференциальные уравнения и краевые задачи. - Самара: СамГТУ, 2011. С.46-49. 156. Делицын, Л.Л. Точные решения уравнений распространения нововведения в стабильной популяции с функцией дожития Гомперца-Мейкема / Л.Л. Делицын, С.А. Белоцерковский // XI Международная науч.-практ.конф. "Моделирование. Теория, методы и средства". Новочеркасск: ЮРГТУ (НПИ) - 2011. - С.55-63. 157. Делицын, Л.Л. / Л.Л. Делицын, С.А. Белоцерковский // Некоторые точные решения уравнений распространения нововведений в стабильной популяции с возрастной структурой / Методы и алгоритмы прикладной математики в технике, медицине и экономике: матер. ХI Междунар. научно-практ. конф. – 26/02/2011. – C.23-29. 158. Делицын, Л.Л. Скрининг венчурных проектов в отрасли ИКТ / Л.Л. Делицын, Е.А. Кобзарева // Научные труды вольного экономического общества России. − 2012. − Т.174. 159. Делицын, Л.Л. Прогнозирование глобальной аудитории Интернета на основе динамики ее региональных сегментов / Л.Л. Делицын, Н.С. Матвеева // Научные труды вольного экономического общества России. − 2013. − Т.179. − С.248-256. 160. Делицын, Л.Л. Моделирование охвата аудитории WWW-сайтов при помощи смеси бетабиномиальных распределений / Л.Л. Делицын, Т.А. Подлесная // Труды вольного экономического общества России. – 2011. – т.155. – C.120-128. 161. Делицын, Л.Л. Стохастические модели распространения новых идей в социальных сетях / Л.Л. Делицын, Т.А. Подлесная // Открытое образование, 2011. №2(86). – Ч.2 – С.242-244. 276 162. Делицын, Л.Л. Коллективный разум / Л.Л. Делицын, И.И. Засурский, И.Г. Куринной // Информационное общество. − 2003. − вып. 3. − С.32-49. 163. Делицын, Л.Л. Развитие информационных и телекоммуникационных технологий в России как процесс распространения инноваций. Дисс. ...канд. техн. наук / Л.Л. Делицын. − МГУКИ, 2006. − 293 с. 164. Делицын, Л.Л. Обобщенная модель CGS распространения нововведения в растущей популяции / Л.Л. Делицын // Труды вольного экономического общества России. – 2010. – т.164. – С.412-420. 165. Дмитриев, М.Г. Интегро-дифференциальные краевые задачи, возникающие в модели "Власть-общество-экономика" / М.Г. Дмитриев, Г.И. Лаптев // Ученые записки РГСУ. − 2009. − №13. − С.216-221. 166. Дрожжинов, В.И. Что дает госсектору внедрение SaaS, PaaS и IaaS? [Электронный ресурс] Доклад на круглом столе «SaaS: расширение сервиса», организованном CNews Analytics и CNews Conferences [Электронный ресурс] / В.И. Дрожжинов. − Электрон. текстовые дан. − Режим доступа: http://www.cnews.ru/reviews/ppt/04_03_2010/drozhzhinov.ppt. − Загл. с экрана. 167. Дуброва, Т.А. Статистические методы прогнозирования / Т.А. Дуброва. − М.: ЮНИТИ, 2003. − 208 с. 168. Ершова, Т.В. Использование ИКТ домохозяйствами и населением России: результаты исследований и актуальных рейтингов / Т.В.Ершова // Экономика, Статистика и Информатика. Вестник УМО: Научно-практический журнал. − 2011. − №5. − С.152-156. 169. Ершова, Т.В. Опрос населения и домохозяйств как инструмент развития информационного общества / Т.В. Ершова, С.Б. Шапошник // Информационное общество: научно-аналитический журнал. − 2011. − №6. − С.12-31. 170. Жеребин, В.М. Информационная составляющая в бюджете российской семьи / В.М. Жеребин // ФЭС: Финансы. Экономика. Стратегия. − 2010. − №8. − С.35-40. 171. Жожикашвили, В.А. Сети массового обслуживания. Теория и применение к сетям ЭВМ / В.А. Жожикашвили, В.М. Вишневский. − М.: Радио и связь, 1988. − 192 с. 172. Засурский, Я.Н. К мобильному обществу: утопия и реальность / Я.Н.Засурский (ред.). − М.: МГУ, 2009. − 304 с. 173. Земсков, А.И. Электронные библиотеки: учеб. для вузов / А.И. Земсков, Я.Л. Шрайберг . − М.: Либерея, 2003. − 351 с. 174. Иванов, И.Ф. Использование логистической кривой для оценки стоимости компании на развивающемся рынке / И.Ф. Иванов // Корпоративные финансы. − 2008. − №1(5). − С.4762. 175. Ивина, Л.В. Венчурный бизнес. Толковый словарь труднопереводимых англоязычных терминов. / Л.В. Ивина, В.А. Воронков. − М.: Финансы и статистика; Финансовый контроль, 2006. − 232 с. 176. Измоденова, К.В. Об оптимальном управлении процессом распространения информации / А.П. Михайлов, К.В.Измоденова // Математическое моделирование. − 2005. − Т.17, №6. − С.67-76. 177. Казанцев, С.Ю. Состояние и потенциал развития инфокоммуникационного комплекса России / С.Ю. Казанцев, И.Э. Фролов // Проблемы прогнозирования. − 2005. − №3. − С.1740. 277 178. Казанцев, С.Ю. Условия и потенциал развития российского инфокоммуникационного комплекса / С.Ю. Казанцев, И.Э. Фролов // Проблемы прогнозирования. − 2006. − №4. − С.80-97. 179. Караева, Э.А. Прогнозы проникновения информационно-коммуникационных технологий в России / Э.А. Караева, Л.Л. Делицын // Макромодели Василия Леонтьева и перспективы развития российской и мировой экономики. Материалы XX междисциплинарной дискуссии / Под ред. В.И. Кушлина, Г.Ю. Ивлевой, Ю.В. Яковца. М.:Проспект. - 2006. - с.225-230. 180. Карданская, Н.Л. Управленческие решения / Н.Л. Карданская. − М.: Юнити-ДАНА, 2009. − 440 с. 181. Карпова, Ю.А. Введение в социологию инноватики: Учебное пособие / Ю.А. Карпова. − СПб: Питер, 2004. − 192 с. 182. Каширин, А.И. Венчурное инвестирование в России / А.И. Каширин, А.С. Семенов. − М.: Вершина, 2007. − 320 с. 183. Кепман, М. АИБ ищет россиян среди кукисов [Электронный ресурс] / М. Кепман. − Электрон. текстовые дан. − Режим доступа: http://telnews.ru/Mihail_Kepman/c37571 . − Загл. с экрана. 184. Клейнрок, Л. Теория массового обслуживания. Пер. с англ. / Пер. И.И. Грушко; ред. В.И. Нейман. / Л. Клейнрок. − М.: Машиностроение, 1979. − 432 с. 185. Клочков, В.В. Проблемы прогнозирования спроса на перспективные гражданские самолеты российского производства / В.В. Клочков, Т.М. Гусманов // Проблемы прогнозирования. − 2007. − 2. − С.16-31. 186. Кобленц-Мишке, Ю.А. Пороговые модели спроса на предметы длительного пользования с насыщаемой потребностью. Модели анализа и планирования показателей уровня жизни. / Ю.А. Кобленц-Мишке // Пороговые модели спроса на предметы длительного пользования с насыщаемой потребностью // Модели анализа и планирования показателей уровня жизни. − М.: ЦЭМИ АН СССР. − 1987. − с.31-42 187. Кобленц-Мишке, Ю.А. Моделирование зависимости потребления предметов длительного пользования от динамики распределения доходов // Дисс. ...канд. экон.наук / Ю.А. Кобленц-Мишке. − М.: ЦЭМИ РАН, 1994. 188. Кови, С. Семь навыков высокоэффективных людей: Мощные инструменты развития личности / С. Кови. − М.: Альпина Паблишер, 2012. − 374 с. 189. Колесин, И.Д. Математические модели субкультур / И.Д. Колесин. − СПб.: изд. СПбГУ, 2007. − 134 с. 190. Колесин, И.Д. Математические модели самоорганизации в социокультурных системах / И.Д. Колесин. − СПб.: изд. СПбГУ, 2009. − 148 с. 191. Колесов, А.А. Есть ли SaaS в России? [Электронный ресурс] / А.А. Колесов. − Электрон. текстовые дан. − Режим доступа: http://www.itoday.ru/16070.html. − Загл. с экрана. 192. Колесов, А.А. Затянувшиеся роды SaaS в России [Электронный ресурс] / А.А. Колесов. − Электрон. текстовые дан. − Режим доступа: http://www.itoday.ru/32982.html. − Загл. с экрана. 193. Колесов, А.А. Анатомия SaaS: истоки и суть модели [Электронный ресурс] / А.А. Колесов. − Электрон. текстовые дан. − Режим доступа: http://www.pcweek.ru/its/article/detail.php?ID=147721. − Загл. с экрана. 278 194. Колесов, А.А. Российские SaaS-разработчики смотрят в будущее с оптимизмом [Электронный ресурс] / А.А.Колесов. − Электрон. текстовые дан. − Режим доступа: http://www.pcweek.ru/its/article/detail.php?ID=157353. − Загл. с экрана. 195. Колин, К.К. Информационное неравенство – новая проблема XXI века // Социология, социальность, современность. - М.:Союз. - 1998. / К.К. Колин // Информационное неравенство – новая проблема XXI века // Социология, социальность, современность. − М.:Союз. − 1998. 196. Колин, К.К. Фундаментальные основы информатики: социальная информатика: Учебное пособие для вузов / К.К. Колин. − М.: Академический Проект; Екатеринбург: Деловая книга., 2000. − 350 с. 197. Количество российских пользователей интернета выросло в 2007 году на 29% [Электронный ресурс] / . − Электрон. текстовые дан. − Режим доступа: http://aib.ru/node/54. − Загл. с экрана. 198. Концепция долгосрочного социально-экономического развития Российской Федерации на период до 2020 года. Утверждена распоряжением Правительства Российской Федерации от 17 ноября 2008 г. № 1662-р 199. Конявский, В.А. Прогноз развития российского сегмента сети Интернет до 2010 г. / В.А. Конявский // Управление защитой информации. − 2003. − Т.7. − №3. 200. Корн, Г. Справочник по математике для научных работников и инженеров / Г. Корн, Т. Корн. − М.: Наука, 1984. − 831 с. 201. Корнышев Ю.Н. Теория телетрафика / Ю.Н. Корнышев, А.П. Пшеничников, А.Д. Харкевич. − М.: Радио и связь, 1996. − 272 с. 202. Коротков, А.В. Преодоление цифрового неравенства как стратегия развития информационного общества. Дисс. ... канд. филол. наук /А.В. Коротков. − М.: 2003. −183с. 203. Крамин, Т.В. К оценке потенциала и структуры спроса на услуги сотовой связи в регионах России / Т.В. Крамин // Проблемы современной экономики. − 2004. − №1-2. − С.152-155. 204. Кристенсен, К.М. Дилемма инноватора. Как из-за новых технологий погибают сильные компании / К.М. Кристенсен. − Альпина Бизнес Букс, 2004. − 240 с. 205. Кристенсен, К.М. Решение проблемы инноваций в бизнесе. Как создать растущий бизес и успешно поддерживать его рост / К.М. Кристенсен, М.Е. Рейнер. − Альпина Бизнес Букс, 2004. − 290 с. 206. Кузовкова, Т.А. Анализ и прогнозирование развития инфокоммуникаций / Т.А. Кузовкова, Л.С. Тимошенко. − М.: ѐ, 2009. − 224 с. 207. Лаврентьева, Н. Российский стартап получил $500 тыс. на ―облачное‖ ПО [Электронный ресурс] / Н. Лаврентьева. − Электрон. текстовые дан. − Режим доступа: http://www.cnews.ru/news/top/index.shtml?2011/03/05/430977. − Загл. с экрана. 208. Лахути, Д.Г. Милль, Пирс и Поппер о логике научного открытия / // Вопросы философии. − 2012. − №3. − С.101-109. 209. Лебедев, П.А. Российский Интернет в марте 2009: базовые параметры, медиапредпочтения и Интернет-сервисы / П.А. Лебедев, Е.Б.Галицкий // Доклад на объединенной конференции РИФ+КИБ. − 2009. − 22.04.2009. 210. Лебедева, Н.М. Культура и инновации: к постановке проблемы / Н.М. Лебедева, Е.Г.Ясин // Форсайт. − 2009. − №2(10). 279 211. Левин, М.И. Модели развития Интернета в России / М.И. Левин, Е.Б. Галицкий, В.Ю. Ковалева, И.Н. Щепина // Интернет-маркетинг. − 2006. − №4. − С.194-207. 212. Линдеман, Е.В. Современные тенденции и проблемы использования комплекса информационных ресурсов в библиотечных сервисах / Е.В. Линдеман // Современные тенденции и проблемы использования комплекса информационных ресурсов в библиотечных сервисах // Доклад на XVII международной конференции «LIBCOM-2013: Информационные технологии, компьютерные системы и издательская продукция для библиотек». − Суздаль. − 2013. 213. Линдеман, Е.В. Информационные сервисы библиотеки с электронными ресурсами: как не нарушить закон / Е.В. Линдеман, М.В. Гончаров, К.А. Колосов // Университетская книга. − 2012. − 8. − С.58-65. 214. Лисин, Б.К. Стратегический ресурс инноваций / Б.К. Лисин. − М.: Институт стратегических инноваций, 2000. − 48 с. 215. Лопатина, Н.В. Социология управления информатизацией: методологический статус и позиции в структуре современной социологии / Н.В. Лопатина // Вестник МГУКИ. − 2008. − 2. − С.78-82. 216. Лопатина, Н.В. Управление информатизацией как приоритетная задача социального развития / Н.В. Лопатина // Информационные ресурсы России. − 2005. − №1. − С.23-25. 217. Максиянова, Т.В. Международные показатели интенсивности использования Интернета в системе Интернет-экономики / Т.В. Максиянова // Вопросы современной науки и практики. Университет им. В.И.Вернадского. − 2012. − №4(42). − С.272-280. 218. Марчук, Г.И. Математические модели в иммунологии. Вычислительные методы и эксперименты / Г.И. Марчук (ред.). − М.: Наука, 3-е изд., 1991. − 276 с. 219. Матохин, В.В. Корпоративная система сбора и обработки предложений ("Информационный Инкубатор Инновационных Идей")[Электронный ресурс]«Система 4И» [Электронный ресурс] / В.В. Матохин. − Электрон. текстовые дан. − Режим доступа: http://www.4ionline.ru/. − Загл. с экрана. 220. Медынский, В.Г. Инновационный менеджмент / В.Г. Медынский. − М.: Инфра-М, 2008. − 295 с. 221. Мид, М. Культура и мир детства. Избранные произведения / Сост. и предисл. И.С.Кона. / М. Мид. − М.: Наука, 1983. − 429 с. 222. Михайлов, А.И. Основы информатики / А.И. Михайлов, А.И. Черный, Р.С. Гиляревский. − М.: Наука, 1968. − 756 с. 223. Михайлов, А.П. Модели информационной борьбы / А.П. Михайлов, Н.А. Маревцева // Математическое моделирование. − 2011. − Т.23, №10. − С.19-32. 224. Михайлов, А.П. Поведенческие гипотезы и математическое моделирование в гуманитарных науках / А.П. Михайлов, А.П. Петров // Математическое моделирование. − 2011. − Т.23,№6. − С.18-32. 225. Михайлов, А.П. О пределах инновационных заимствований / А.П. Михайлов, В.Ж. Келле, В.А. Шведовский // Социология: 4M - методология, методы, математические модели. − 2001. − №13. − С.114-123. 226. Московкин, В.В. Основы концепции диффузии инноваций / В.М. Московкин // Бизнес-информ. − 1998. − №17-18. − С.41-48. 280 227. Мышкис, А.Д. Смешанные функционально-дифференциальные уравнения / А.Д, Мышкис // Новые проблемы теории функционально-дифференциальных уравнений, СМФН. − 2003. − 4. − С.5-120. 228. Национальные модели, Национальные модели информационного общества / Отв. ред. и сост. Е.Л. Вартанова, науч. ред. Н.В.Ткачева. − М.: Икар, 2004. − 412 с. 229. Национальные модели, Национальные модели информационного общества / Отв. ред. и сост. Е.Л. Вартанова, науч. ред. Н.В.Ткачева. − М.: Икар, 2004. − 412 с. 230. Нижегородцев, Р.М. Логистическое моделирование экономической динамики, Ч.I. / Р.М. Нижегородцев // Проблемы управления. − 2004. − 1. − С.46-53. 231. Нижегородцев, Р.М. Логистическое моделирование экономической динамики, Ч.II. / Р.М. Нижегородцев // Проблемы управления. − 2004. − 2. − С.52-58. 232. Нижегородцев, Р.М. Модели клеточных автоматов в теории диффузии инноваций / Р.М. Нижегородцев, В.Д. Секерин, С.В. Лисафьев // Вопросы новой экономики. − 2012. − 3. 233. Операторы предполагают снижать объемы строительства сетей ШПД, Операторы предполагают снижать объемы строительства сетей ШПД [Электронный ресурс] / . − Электрон. текстовые дан. − Режим доступа: http://www.telecomru.ru/article/?id=5090&PHPSESSID=811b2506b328a071e3228cd2e3818bd3 . − Загл. с экрана. 234. Ослон, А.А. Интернет: реалии и возможности // Доклад на круглом столе Института современного развития [Электронный ресурс] / А.А. Ослон. − Электрон. текстовые дан. − Режим доступа: 1. http://bd.fom.ru/pdf/int0209.pdf. − Загл. с экрана. 235. Ослон, А.А. Интернет: реалии и возможности // Доклад на круглом столе Института современного развития [Электронный ресурс] / А.А. Ослон. − Электрон. текстовые дан. − Режим доступа: 1. http://bd.fom.ru/pdf/int0209.pdf. − Загл. с экрана. 236. Павловский, Ю.Н. Имитационное моделирование / Ю.Н. Павловский, Н.В. Белотелов, Ю.И. Бродский. − М.: Академия, 2008. − 240 с. 237. Панкратова, О. Рынок мобильной индустрии России и СНГ / О. Панкратова // Доклад на форуме РУССОФТ . − 2009. − 11 июня. 238. Перфильев, Ю.Ю. Территориальная организация российского интернет-пространства / Ю.Ю. Перфильев // Интернет и российское общество / Под ред. И. Семенова; Моск. Центр Карнеги − М.: Гендальф, 2002. − С.21-47. 239. Перцев, Н.В. Исследование решений одной системы интегродифференциальных уравнений, возникающей в моделях динамики популяций / Н.В. Перцев // Вестник Омского университета. − 1996. − №1. − С.24-26. 240. Перцев, Н.В. Об асимптотическом поведении одной системы линейных дифференциальных уравнений с последействием / Н.В. Перцев // Известия высших учебных заведений. Математика.. − 1996. − №9. − С.48-52. 241. Петров, В.М. Количественные методы в исскуствознании / В.М. Петров. − М.: Академический проект, 2004. − 432 с. 242. Плотинский, Ю.М. Модели социальных процессов / Ю.М. Плотинский. − М.: Логос, 2001. − 296 с. 243. Погорлецкая, Ю.И. Кредитный скоринг в системе банковского риск-менеджмента// Автореф. Дисс. на соискание ученой степени канд. экон. Наук / Ю.И. Погорлецкая // 281 244. Полтерович, В.М. Эволюционная модель взаимодействия процессов создания и заимствования технологий / В.М. Полтерович, Г.М.Хенкин // Экономика и математические методы. − 1988. − Т.XXIV, вып.6. − С.1071-1083. 245. Попсулин, С. Мировой рынок SaaS растет на 15% в год [Электронный ресурс] / С. Попсулин. − Электрон. текстовые дан. − Режим доступа: http://www.cnews.ru/news/top/index.shtml?2010/12/14/420016. − Загл. с экрана. 246. Прогноз социально – экономического развития российской федерации на 2010 год и на плановый период 2011 и 2012 годов , Прогноз социально – экономического развития российской федерации на 2010 год и на плановый период 2011 и 2012 годов [Электронный ресурс] / . − Электрон. текстовые дан. − Режим доступа: http://www.economy.gov.ru/minec/activity/sections/macro/prognoz/doc1254407742765. − Загл. с экрана. 247. Пэлфри, Дж. Дети цифровой эры / Джон Пэлфри, Урс Гассер. − М.: Эксмо, 2011. − 368 с. 248. Радаев, В.В. Обычные и инновационные практики в деятельности российского среднего класса / В.В. Радаев // Мир России. − 2003. − Т.12. - №4. − С.89-119. 249. Разроев, Э.А. Инфокоммуникационный бизнес: управление, технологии, маркетинг / Э.А. Разроев. − СПб.: Профессия, 2003. − 352 с. 250. Родионов, И.И. Рынок информационных услуг и продуктов / И.И. Родионов, Р.С. Гиляревский, В.А. Цветкова, Г.З. Залаев. − М.: МК-Периодика, 2002. − 509 с. 251. Романов, П.C. Проблемы адаптации научных библиотек к инновационным процессам в зарубежном библиотековедении / П.С. Романов // Библиосфера. − 2010. − 1. − С.42-45. 252. Россия в цифрах, Россия в цифрах. 2001: кратк. стат. сб. / М.: Госкомстат России, 2001. − 397 с. 253. Россия в цифрах, Россия в цифрах. 2005: кратк. стат. сб. / М.: Росстат, 2005. − 477 с. 254. Россия: Сотовых телефонов стало на 8 млн меньше, Россия: Сотовых телефонов стало на 8 млн меньше / // Cnews. − 2008. − 17 февраля. 255. Росстат, Число крестьянских (фермерских) хозяйств и индивидуальных предпринимателей [Электронный ресурс] / Росстат. − Электрон. текстовые дан. − Режим доступа: http://www.gks.ru/bgd/regl/b08_47/IssWWW.exe/Stg/html/2-14.htm. − Загл. с экрана. 256. Рязанов, Ю.Г. Медиапланирование / Ю.Г. Рязанов, Г.А. Шматов, ред.. − Екатеринбург: Изд. Уральский рабочий, 2002. − 312 с. 257. Самарский, А.А. Математическое моделирование / А.А. Самарский, А.П. Михайлов. − М.: Наука, 2001. − 320 с. 258. Сахал, Д. Технический прогресс: концепции, модели, оценки / Пер. с англ.; Под ред. и вступ. статья А.А. Рывкина / Д. Сахал. − М.: Финансы и статистика, 1985. − 366 с. 259. Секерин, В. Д. Инновации в маркетинге / В.Д. Секерин, Р.М. Нижегородцев, А.Е. Горохова, Д.В. Секерин. − Изд. МГУИЭ, 2013. − 252 с. 260. Сладкова, О.Б. Количественные методы в исследовании социокультурного пространства / О.Б. Сладкова // Личность, культура, общество: Междисциплинарный научнопрактический журнал социальных и гуманитарных наук. − 2007. − Том 9., вып. 3. − С.113124. 261. Сляднева, Н.А. Информационно-аналитическая деятельность: проблемы и перспективы / Н.А. Сляднева // Информационно-аналитический журнал "Факт". − 2006. − №6. 282 262. Смолян, Г.Л. Интернет в России. Перспективы развития / Г.Л. Смолян, В.Н. Цыгичко, Д.Д. Хан-Магомедов. − М.: Едиториал УРСС, 2004. − 200 с. 263. Соколов, А.В. Общая теория социальной коммуникации: Учебное пособие / А.В. Соколов. − СПб.: Изд-во Михайлова В.А., 2002. − 461 с. 264. Соколов, В.Б. Модели динамики парков искусственных объектов / В.Б. Соколов // Математическое моделирование. − 1990. − Т.2.-№5. − С.28-39. 265. Староверов, О.В. Азы математической демографии / О.В. Староверов. − М.: Наука, 1997. − 158 с. 266. Столяров, Ю.Н. Сущность информации / Ю.Н. Столяров. − М.: МАИ, 2000. − 120 с. 267. Столяров, Ю.Н. Библиотековедение, библиографоведение и книговедение как единая научная специальность: Полный курс лекций для аспирантов и соискателей / Ю.Н. Столяров. − Орѐл: Орловский гос. Ин-т культуры и искусств. ООО ПФ "Оперативная полиграфия", 2007. − 266 с. 268. Сухомесова, И. Сотовое перемирие / И. Сухомесова // Новый Компаньон. Пермская деловая и политическая газета. − 2004. − №21 (314) от 22 июня . 269. Тараканов, К.В. Информатика / К. В. Тараканов. − М.: Книга, 1986. − 304 с. 270. Тараканов, К.В. Аналитическое моделирование систем / К. В. Тараканов, Л.А. Овчаров, А.Н. Тырышкин. − М.: Советское Радио, 1974. − 240 с. 271. Тард, Ж.-Г. Законы подражания / Ж.-Г. Тард. − М.: Академический Проект, 2011. − 304 с. 272. Тимошенко, Л.С. Стратегия устойчивого роста / Л.С. Тимошенко // Информкурьерсвязь. − 2004. − №12. − С.43-48. 273. Толстова, Ю.Н. Основы многомерного шкалирования: учебное пособие / М.: КДУ, 2006. − 160 с. 274. Тявкин, И.В. Математическая модель информационного поиска и оценка эффективности поисковой системы / И.В. Тявкин, В.М. Тютюнник // Вестник Тамбовского государственного технического университета. − 2007. − Т.14,№3. − С.630-643. 275. Уланов, С.В. Скоринговые модели и средства управления рисками для поддержки принятия кредитных решений. Дисс. ...канд.экон.наук / С.В. Уланов. − Ижевск: Ижевский ГТУ, 2007. − 152 с. 276. Ухин, Ю.Ю. Деловая игра "Избирательное распространение информации" / Ю.Ю. Ухин, О.П. Щеглова. − М.: ИПКИР, 1981. − 87 с. 277. Файзуллин, Р.Т. Система оперативного принятия решений на основе экспертных оценок / Р.Т. Файзуллин, Б.И. Ефимов // Информационные системы моделирования и управления. − 2006. − 4(29). − С.527-535. 278. Федорова, Ю. Игра по правилам и без / Ю. Федорова // Связьинвест. Единая техническая политика. − 2010. − №2 (92). − С.57-58. 279. Федорюк, М.В. Обыкновенные дифференциальные уравнения. – 2-е изд., перераб. и доп. / М.В. Федорюк. − М.: Наука. Главная ред. физ.-мат. литературы, 1985. − 448 с. 280. Филиппов, С. Барская любовь / С. Филиппов // Компания. − 2002. − №221. 281. Фонд "Общественное мнение", Интернет в России, Выпуски 1-33 [Электронный ресурс] / Фонд "Общественное мнение". − Электрон. текстовые дан. − Режим доступа: http://bd.fom.ru/report/map/projects/internet/. − Загл. с экрана. 283 282. Фонд "Общественное мнение", СМИ и Интернет [Электронный ресурс] / Фонд "Общественное мнение". − Электрон. текстовые дан. − Режим доступа: http://fom.ru/SMI-iinternet/. − Загл. с экрана. 283. Фукунага, К.Е. Введение в статистическую теорию распознавания образов. Пер. с англ / К. Фукунага. − М.: Наука. Главная ред. физ.-мат. литературы, 1979. − 368 с. 284. Хиршман, И.И. Преобразования типа свертки. Пер.с англ. В.П.Потапова под ред.А.О.Гельфонда. / И.И. Хиршман, Д.В. Уиддер. − М.: Изд-во иностранной литературы, 1958. − 312 с. 285. Хмелевский, Ю.И. Самовоспроизводящиеся системы / Ю.И. Хмелевский. − М.: Наука, 1991. − 432 с. 286. Цыгичко, В.Н. Прогнозирование социально-экономических процессов: научное издание. – Изд. 2-е, перераб. и доп. / В.Н. Цыгичко. − М.: КомКнига, 2007. − 240 с. 287. Чугунов, А.В. Российская интернет-аудитория в зеркале социологии / А.В. Чугунов. − СПб.: Изд-во С-Пб. Университета, 2006. − 320 с. 288. Чугунов, А.В. Социология Интернета: методика и практика исследований Интернетаудитории: учеб. пособ. / А.В. Чугунов. − СПб.: Факультет филологии и искусств СПбГУ, 2007. − 130 с. 289. Шабат, В. SaaS-проекта в России – репортаж с передовой. [Электронный ресурс] / В. Шабат. − Электрон. текстовые дан. − Режим доступа: http://www.slideshare.net/vshabat/saa-s-5741368. − Загл. с экрана. 290. Шведовский, В.А. Моделирование распространения информации в смежных социальных группах / В.А. Шведовский // Математические методы в социологическом исследовании. - М.: Наука, 1981. - С.109-167. 291. Шматов, Г.А. Основы медиапланирования. Эвристический подход. Учеб. Пособие / Г.А. Шматов. − Екатеринбург: Изд-во Урал. ун-та, 2005. − 332 с. 292. Шматов, Г.А. Математическая теория медиапланирования / Г.А. Шматов. − Екатеринбург: Институт экономики УРО РАН, 2009. − 330 с. 293. Шрайберг, Я.Л. Первое десятилетие информационного века: влияние информационноэлектронной среды на роль и позицию библиотек в развивающемся обществе ежегодный доклад конференции «Крым». Год 2010 / Я.Л. Шрайберг // Судак; Москва: изд.ГПНТБ России, 2010. - 77 с. 294. Шрайберг, Я.Л. Интеграция библиотек в развивающееся информационное общество: что нас ждет впереди?: ежегодный доклад конференции "Крым", год 2012 / Я.Л. Шрайберг // Москва : ГПНТБ России, 2012. - 63 с. 295. Шрайберг, Я.Л. Электронная информация, библиотеки и общество: что нам ждать от нового десятилетия информационного века? : ежегодный доклад Конференции "Крым", год 2011 / Я.Л. Шрайберг // Научн. и техн. б-ки, - 2012. - 63 с. 296. Шрайберг, Я.Л. Электронная книга, будущее библиотеки и общественное сознание: попытка осмысления и предвидения: ежегодный доклад Конференции "Крым", год 2013 / Я.Л. Шрайберг // Москва : ГПНТБ России, 2013. - 71 с. 297. Шрайберг, Я.Л. Интернет-ресурсы и услуги для библиотек. В 2 ч. / Я.Л. Шрайберг, М.В. Гончаров, О.В. Шлыкова. − М.: Либерея, 2001 - 2002. − Ч.1. – 72 с. – (С компьютером на «ты»: Учебно-справочное пособие. Вып. 6). Ч.2. – 104 с. – (С компьютером на «ты»: Учебно-справочное пособие. Вып. 7). с. 284 298. Шумпетер, Й.А. Теория экономического развития. Капитализм, социализм и демократия / Й.А. Шумпетер. − М.: Эксмо, 2007. − 864 с. 299. Шуровьески, Д. Мудрость толпы. Почему вместе мы умнее, чем поодиночке, и как коллективный разум формирует бизнес, экономику, общество и государство. / Д.Шуровьески. − М.: 2007. − 304 с. 300. Щепина, И.Н. Модели диффузии и замещения нововведений (обзор литературы) / И.Н. Щепина. − М.: ЦЭМИ РАН, 1990. 301. Юрина, Э.А. ―Эпидемиологические" модели распространения мобильной связи и Интернета в России / Э.А. Юрина, Л.Л. Делицын // Интернет-маркетинг. − 2008. − №1(43). − С.2-15. 302. Яблонский, А.И. Математические модели в исследовании науки / А.И. Яблонский. − М.: Мысль, 1986. − 352 с. 303. Яковец, Ю.В. Эпохальные инновации XXI века / Ю.В.Яковец. − М.: Междунар. Ин-т П. Сорокина – Н. Кондратьева. – М.: ЗАО ―Издательство ―Экономика‖, 2004. − 444 с. 304. Янч, Э. Прогнозирование научно-технического прогресса / Э. Янч. − М.: Прогресс, 1974. − 568 с. 305. Abramowitz, М. Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables / M. Abramowitz, and I. Stegun. − New York: Dover, 1964. 306. Andreev, A. Russian Technology: In the crucible [Электронный ресурс] / A. Andreev. − Электрон. текстовые дан. − Режим доступа: Russian Technology: In the crucible. − Загл. с экрана. 307. Arbesman, S. 2011 preview: Peak Internet comes into view [Электронный ресурс] / S. Arbesman, R. Courtland. − Электрон. текстовые дан. 308. Armstrong, J.S. Sales forecast for existing consumer products and services: Do purchase intentions contribute to accuracy? [Электронный ресурс] / J.S. Armstrong, V.G. Moritz, V. Kumar. − Электрон. текстовые дан. − Режим доступа: http://wwwmarketing.wharton.upenn.edu/ideas/pdf/armstrong-salesintentions.pdf. − Загл. с экрана. 309. Ausubel, J.H. Elektron: Electrical systems in retrospect and prospect / J.H. Ausubel, C. Marchetti // Daedalus. − 1996. − 125(3). − С.139-169. 310. Ausubel, J.H. Toward green mobility: The evolution of transport / J.H. Ausubel, C. Marchetti, P.S. Meyer // European Review. − 1998. − 6(2). − С.143-162 . 311. Bagozzi, R.P. The legacy of the technology acceptance model and a proposal for a paradigm shift / R.P. Bagozzi // Journal of the Association for Information Systems. − 2007. − 8(4). − С.244-254. 312. Bagozzi, R.P. Development and test of a theory of technological learning and usage / R.P. Bagozzi, F.D. Davis, P.R. Warsaw // Human relations. − 1992. − 45(7). − С.660-686. 313. Bailey, N.T.J. The elements of stochastic processes with applications to natural sciences / N.T.J. Bailey. − New York: Wiley, 1964. − 268 с. 314. Banks, R.B. Growth and Diffusion Phenomena: Mathematical Frameworks and Applications (Texts in Applied Mathematics) / R.B. Banks. − Springer, 1993. − 455 с. 315. Bass, F.M. A New Product Growth for Model Consumer Durables / F.M. Bass // Management Science. − 1969. − vol. 15. − С.215-227. 316. Bass, F.M. Heterogeneity in purchase intention, diffusion and exogenous influence / F.M. Bass // In Research Traditions in Marketing, ed. Gilles Laurent, Gary L. Lilien, and Bernard Pras,. − 1994. − . − С.224-226. 285 317. Bass, F.M. Modeling the marketing-mix influence in new-product diffusion / F.M. Bass, D. Jain, T. Krishnan // New -product diffusion models. International series in quantitative marketing. − 2000. − vol. 11. − С.99-122. 318. Bass, F.M. Modeling the marketing-mix influence in new-product diffusion / F.M. Bass, D. Jain, T. Krishnan // International series in quantitative marketing. − 2000. − vol. 11. − С.99-122. 319. Bass, P.I. Generational Diffusion Model Data: The IBM Mainframe Case [Электронный ресурс] / P.I. Bass. − Электрон. текстовые дан. − Режим доступа: http://www.basseconomics.com/Downloads/Papers/Bass%202003.pdf. − Загл. с экрана. 320. Bass, P.I. Multiple Generation Diffusion Model Estimation Using Adaptive Nonlinear Least Squares Algorithm NL2SOL. [Электронный ресурс] / P.I. Bass, J. Isaacson. − Электрон. текстовые дан. − Режим доступа: http://www.basseconomics.com/Downloads/Papers/Bass%20and%20Isaacson%202003.pdf. − Загл. с экрана. 321. Bass, P.I. IT Waves: Two Completed Generational Diffusion Models [Электронный ресурс] / P.I. Bass, F.M. Bass. − Электрон. текстовые дан. − Режим доступа: http://www.basseconomics.com/Downloads/Papers/Bass%20and%20Bass%202004.pdf. − Загл. с экрана. 322. Bemmaor, A.C. Modeling the diffusion of new durable goods: word-of-mouth effect versus consumer heterogeneity / A.C. Bemmaor // In Research Traditions in Marketing, ed. Gilles Laurent, Gary L. Lilien, and Bernard Pras,. − 1994. − С.201-223. 323. Berndt, E.R. Econometric estimates of price indexes for personal computers in the 1990's / E.R. Berndt, Z. Griliches, N.J. Rappoport // Journal of Econometrics. − 1995. − Vol.68, Issue 1. − С.243-258. 324. Bewley, R. A flexible logistic growth model with applications in telecommunications / R. Bewley, Fiebig D.G. // International journal of forecasting. − 1988. − 4. − С.177-192. 325. Botelho, A. The diffusion of cellular phones in Portugal / A. Botelho, L.C. Pinto // Telecommunications Policy. − 2004. − vol.28 (5-6). − С.427-437. 326. Brauer, F. Mathematical models in population biology and epidemiology / F. Brauer, C. Castillo-Chavez. − New York: Springer Verlag, 2001. − 416 с. 327. Castells, M. A. Mobile communication and society: a global perspective / A project of the Annenberg Research Network on international communication / M. Castells, M. FernandezArdevol, J.L. Qiu, A. Sey. − The MIT Press, 2007. − 331 с. 328. Centrone, F. Bass-type model for a dynamic market with logistic growth / F. Centrone, E. Salinelli // Aspects of mathematical modeling ed. By R.J.Hosking and E.Venturino.Mathematics and Biosciences in Interaction. − 2008. − . − С.343-362. 329. Centrone, F. Demographic processes in a model of innovation diffusion with a dynamic market / F. Centrone, F. Goia, E. Salinelli // Technological Forecasting and Social Change. − 2007. − 74. − С.247-266. 330. Chandon, J.-L. J. comparative study of media exposure models. Ph.D. dissertation / J.-L. J. Chandon. − 1976. 331. Chatfield, C. A Consumer Purchasing Model with Erlang Inter-Purchase Times / C.Chatfield, G.J. Goodhardt // Journal of the American Statistical Association. − 1973. − vol.68, No.344. 332. Chatfield, C. Progress on a Simplified Model of Stationary Purchasing Behavior / C. Chatfield, A.S.C. Ehrenberg, G.J. Goodhardt // J.R. Statist. Soc. Series A (General). − 1966. − Vol.129, No.3. − С.317-367. 286 333. Chow, S.G. Technological Change and the Demand for Computers / S.G. Chow // The American Economic Review. − 1967. − Vol. 57, No. 5. − С.1117-1130. 334. Christensen, C.M. Seeing what's next?: using the theories of innovation to predict industry change / C.M. Christensen, C.D. Anthony, E.A. Roth. − Boston, MA: Harvard Business School Publishing, 2004. − 312 с. 335. Chu, W. Diffusion of mobile telephony: An empirical study in Taiwan / W. Chu, F. Wu, K. Kao, D. Yen // Telecommunications Policy. − 2009. − vol.33. − С.506-520. 336. Cohen, M.A. Operation planning in the presence of innovation diffusion dynamics / M.A. Cohen, T.H. Ho, H. Matsuo // International series in quantitative marketing. − 2000. − vol. 11. − С.237-259. 337. Coleman, J. The diffusion of an Innovation Among Physicians / J. Coleman, E. Katz, H. Menzel // Sociometry. − 1957. − Vol.20, No.4. − С.253-270. 338. Cortes, J.-C. Age-structured mathematical modeling approach to short-term diffusion of electronic commerce in Spain / J.-C. Cortes, I.-C.Lombana, R.-J. Villanueva // Mathematical and computer modeling. − 2010. − Vol.52, Issues 7-8. − P.1045-1051. 339. Cox, D.R. The Theory of Stochastic Processes / D.R. Cox, H.D. Miller. − Chapman and Hall/CRC, 1977. 340. Danaher, P.J. Three-Parameter Generalization of the Beta-Binomial Distribution with Applications. FSU Technical report M760, AFOSR Technical Report 87-208 / P.J. Danaher. − 1987. - 19 p. 341. Danaher, P.J. Optimal Internet Media Selection / P.J. Danaher, J. Lee, L. Kerbache // Marketing Science. − 2010. − Vol.29, No.2, March-April. − P.336-347. 342. Davis, F.D. Perceived usefulness, perceived ease of use, and user acceptance of information technology / F.D. Davis // MIS Quarterly. − 1989. − 13(3). 343. De Roos, A.M. Demographic analysis of continuous-time life-history models / A.M. de Roos // Ecol. Lett.. − 2008. − 11(1). − P.1-15. 344. Debecker, A. Determination of the uncertainties in S-curve logistic fits / A. Debecker, T. Modis // Technol. Forecast. Soc. Change. − 1994. − 46. − P.153-173. 345. Delitsin, L.L. Dynamics of Internet Diffusion in Russia and some European Countries: a comparative analysis / L.L. Delitsin // World of Media. Yearbook of Russian Media and Journalism Studies.. − 2011. − №2. − P.273-293. 346. Diekmann, O. Mathematical Epidemiology of Infectious Diseases: Model Building, Analysis and Interpretation / O. Diekmann, J.A.P. Hesterbeek. − Wiley, 2000. - 320 p. 347. Dijkstra, D. A continued fraction expansion for a Generalization of Dawson‘s Integral / D. Dijkstra // Mathematics of Computation. − 1977. − Vol.31, No. 138. − P.503-510. 348. Dixon, R. Hybrid corn revisited / R. Dixon // Econometrica. − 1980. − Vol. 48, No.6. − P.1451-1461. 349. Dodd, S.K. Formulas for Spreading Opinions / S.K. Dodd // The Public Opinion Quarterly. − 1958. − Vol. XXII. - No.4. − P.537-554. 350. Dodson, J.A. Models for new product diffusion through advertising and word of mouth / J.A. Dodson, E.Muller // Management Science. − 1978. − №24. − P.1568-1578. 351. Durlauf, S.N. Social Dynamics: Economic Learning and Social Evolution / S.N. Durlauf, H. Peyton Young, eds.. − London: The MIT Press, 2001. - 238 p. 352. Dutton, W.H. The Internet in Britain: 2009 / W.H. Dutton, E.J. Helsper, M.M. Gerber. − Oxford Internet Institute, University of Oxford., 2009. 287 353. Easingwood, C.J. A nonsymmetric responding logistic model for technological substitution / C.J. Easingwood, E.Muller, V.Mahajan // Technological Forecasting and Social Change. − 1981. − vol. 20. − P.199-213. 354. Easingwood, C.J. A nonsymmetric responding logistic model for technological substitution / C.J. Easingwood, E.Muller, V.Mahajan // Technological Forecasting and Social Change. − 1981. − vol. 20. − P.199-213. 355. Easingwood, C.J. A nonsymmetric responding logistic model for technological substitution / C.J. Easingwood, E.Muller, V.Mahajan // Technological Forecasting and Social Change. − 1981. − vol. 20. − P.199-213. 356. Easingwood, C.J. A nonuniform influence innovation diffusion model of new product acceptance / C.J. Easingwood, E.Muller V.Mahajan // Marketing Science. − 1983. − vol. 2. − P.273-295. 357. Economidies, N. Critical mass and network size with application to the US FAX market [Электронный ресурс] / N. Economidies, C. Himmelberg. − Электрон. текстовые дан. 358. Efron, B. An Introduction to the Bootstrap / B. Efron, R.J. Tibshirani. − New York, NY: Chapman and Hall, 1993. 359. Ehrenberg, A. The pattern of consumer purchases / A. Ehrenberg // Applied Statistics. − 1959. − 8. − P.26-41. 360. Ehrenberg, A. Repeat-buying. Facts, Theory and Applications / A. Ehrenberg. − New York: Oxford University Press, 1988. 361. Elderkin, R.H. Seed dispersal in a patchy environment with global age-dependence / R.H. Elderkin // J. Math. Biol.. − 1982. − 13. − P.283-303. 362. Fader, P.S. "Counting Your Customers" the Easy Way: An Alternative to the Pareto/NBD Model / P.S. Fader, B.G.S. Hardie, K.L. Lee // Marketing Science. − 2008. − 24 (Spring). − P.275-284. 363. Findahl, O. The Internet in Sweden / O. Findahl. − World Internet Institute, 2008. 364. Fisher, J. A simple substitution model of technological change / J. Fisher, R. Pry // Technological Forecasting and Social Change. − 1971. − vol. 3. − P.75-88. 365. Fornerino, M. Internet adoption in France / M. Fornerino // The Service Industries Journal. − 2003. − Vol. 23, Issue 1. − P.119-135. 366. Frank, L. An analysis of the effect of the economic situation on modeling and forecasting the diffusion of wireless communications in Finland / L. Frank // Technological Forecasting and Social Change. − 2004. − Vol.71, Issue 4, May 2004. − P.391-403. 367. Giovanis, A.N. A new modeling approach investigating the diffusion speed of mobile telecommunication services in EU-15 / A.N. Giovanis, C.H. Skiadas // Computational economics. − 2007. − vol.29, issue 2. − P.96-106. 368. Goldenberg, J. Talk of the network: a complex systems look at the underlying process of wordof-mouth / J. Goldenberg, B. Libai, E. Muller // Marketing Letters. − 2001. − 12(3). − P.209-221. 369. Greenwood, M. An Enquiry into the Nature of the Frequency Distributions Representative of Multiple Happenings, with Particular Reference to theOccurrence of Multiple Attacks of Disease or Repeated Accidents / M. Greenwood, G.U. Yule // J.R. Statist. Soc.A.. − . − 83. − P.255-279. 370. Griliches, Z. Hybrid Corn: An Exploration in the Economics of Technological Change / Z. Griliches // Econometrica. − 1957. − vol. 25. − P.501-522. 371. Griliches, Z. Hybrid corn revisited. A reply / Z. Griliches // Econometrica. − 1980. − Vol.48, No.6. − P.1463-1465. 288 372. Griliches, Z. Hedonic price indexes for personal computers: Intertemporal and interspatial comparisons / Students, Z.Griliches, D.S. Hammermesh // Economic letters. − 1994. − Vol.44, Issue 4. − P.353-357. 373. Gruber, H. The economics of mobile telecommunications / H.Gruber. − New York: Cambridge University Press, 2005. - 323 p. 374. Gruber, H. The diffusion of Mobile Telecommunications Services in the European Union / H. Gruber, F. Verboven // European Economic Review, Elsevier. − 2001. − vol.45(3). − P.577588. 375. Grübler, A. The Rise and Fall of Infrastructures / A. Grübler. − New-York: SpringerVerlag, 1990. - 305 p. 376. Grübler, A. Time for a change: On the patterns of diffusion of innovation / A. Grübler // Technological Trajectories and the Human Environment − Washington, DC: National Academies Press, 1997. 377. Grübler, A. Technology and Global Change / A. Grübler. − Cambridge University Press, 1998. 378. Gurtin, M.E. Nonlinear age-dependent population dynamics / M.E. Gurtin, R.C. MacCamy // Arch. Rat. Mech. Anal.. − 1974. − 54. − P.281-300. 379. Gurtin, M.E. Some simple models for nonlinear age-dependent population dynamics / M.E. Gurtin, R.C. MacCamy // Mathematical Biosciences. − 1979. − Vol.43, Iss.3-4. − P.199-211. 380. Helbing, D. Quantitative Sociodynamics: Stochastic Methods and Models of Social Interaction Processes / D. Helbing. − Springer, 2nd ed., 2010. - 350 p. 381. Hethcote, H.W. An age-structured model for pertussis transmission / H.W. Hethcote // Math. Biosci.. − 1997. − 145. − P.89-136. 382. Hoppensteadt, F.C. Mathematical theories of populations: demographics, genetics and epidemics / F.C. Hoppensteadt. − SIAM, 1975. - 72 p. 383. Huang, C.-Y. Global Digital Divide: A Dynamic Analysis based on the Bass Model / C.Y. Huang, H.N. Chen // J. of Public Policy and Marketing 2010. − 2010. − Vol.29, No.2. − P.248264. 384. Ianelli, M. Gender Structured Population Modeling: Mathematical Methods, Numerics, and Simulations / M. Ianelli,M.Marcheva, F.A. Milner. − Philadelphia: SIAM, 2005. - 175 p. 385. IT-research, IT Research: российский рынок десктопов "просел" на 30% [Электронный ресурс] / . − Электрон. текстовые дан. − Режим доступа: http://www.itoday.ru/news/11109.html. − Загл. с экрана. 386. IT-research, IT-research подводит итоги 2009 г. и дает прогноз на 2010 г. [Электронный ресурс] / . − Электрон. текстовые дан. − Режим доступа: http://www.itresearch.ru/presscenter/news/detail.php?ID=13310 . − Загл. с экрана. 387. Jain, D. Effect of price on the demand for durables / D. Jain, R.C. Rao // Journal of business and economic statistics. − 1990. − vol. 8. − P.163-170. 388. Jeuland, A. heterogeneity into parsimonious models of diffusion of innovation. Working paper. / A. Jeuland. − Chicago : University of Chicago, Center for Research in Management, 1981. 389. Jupiter Communications, Accurate web site visitor measurement crippled by cookie blocking and deletion, Jupiter research finds [Электронный ресурс] / Jupiter Communications. − Электрон. текстовые дан. − Режим доступа: 289 390. 391. 392. 393. 394. 395. 396. 397. 398. 399. 400. 401. 402. 403. 404. 405. 406. 407. 408. http://www.jupitermedia.com/corporate/releases/05.03.14-newjupresearch.html. − Загл. с экрана. Kalish, S. A new-product Adoption Model with Price, Advertising and Uncertainty / S. Kalish // Management Science. − 1985. − 31 (December). − P.1569-1585. Kamakura, W.A. Long-term forecasting with innovation diffusion models: the impact of replacement purchases / W.A. Kamakura, S.K. Balasubramanian // Journal of forecasting. − 1987. − vol. 6. − P.1-19. Kamakura, W.A. Long-term forecasting with innovation diffusion models: the impact of replacement purchases / W.A. Kamakura, S.K. Balasubramanian // Journal of forecasting. − 1987. − vol. 6. − P.1-19. Kermack, W.O. Contributions to the mathematical theory of epidemics / W.O. Kermack, A.G. McKendrick // of the Royal Society of London . − 1927. − Series A, 115 . − P.700-721 . Keyfitz, N. Applied Mathematical Demography (Statistics for Biology and Health) / N. Keyfitz, H. Caswell. − Springer, 3rd edition, 2005. - 558 p. Kiiski, S. Cross-country diffusion of the Internet / S. Kiiski, M. Pohjola // Information Economics and Policy. − 2002. − Vol.14, Issue 2.. − P.297-310. Kremer, M. Population growth and technological change: one million B.C. to 1990. / M. Kremer // The quarterly journal of economics. − 1993. − vol. 108. − P.681-716. Krishnan, T.V. Impact of a late entrant on the diffusion of a new product/service / T.V. Krishnan, F.M. Bass, V. Kumar // Management Science. − 2000. − vol. 45. − P.1650-1663. Lasswell, H.D. The structure and function of communication in society / H.D. Lasswell // In Lyman Bryson (ed.) The communication of ideas. − 1948. − . − P.37-51. Lawrence, K.D. Application of Diffusion Models: Some Empirical Results / K.D. Lawrence, W.H. Lawton // New Product Forecasting / Y. Wind, V. Mahajan, and R.C. Cardozo, eds., − Lexington Books: Lexington, 1981. − P.529-541. Lee, J. Internet Media Planning: An Optimization Model / J. Lee, L. Kerbache // KDI School of Pub Policy & Management. 1. . Paper No. 05-02. Lekvall, P. A Study of Some Assumptions Underlying Information Diffusion Functions / P. Lekvall, C. Wahlbin // The Swedish Journal of Economics. − 1973. − Vol.75. - No.4. − P.362377. Linz, P. Analytical and Numerical Methods for Volterra Equations / P. Linz. − Philadelphia, Pa.: SIAM Studies in Appl. Math., SIAM, 1985. Loomis, D.G. Forecasting the Internet. Understanding the Explosive Growth of Data Communications / D.G. Loomis, L.D. Taylor (Eds). − Springer, 2002. - 272 p. Lotka, A.J. Elements of Physical Biology / A.J. Lotka. − Baltimore MD: Williams and Wilkins, 1925. Macklin, B. The New European Internet Hot Spots. [Электронный ресурс] / B. Macklin, K. Von Abrams. − Электрон. текстовые дан. − Режим доступа: http://www.emarketer.com/Article.aspx?R=1005935. − Загл. с экрана. Mahajan, V. Innovation diffusion in a dynamic potential adopter population / V. Mahajan, R.A. Peterson // Management Science. − 1978. − No.24. − P.1589-1597. Mahajan, V. Innovation diffusion and new product growth models in marketing / V. Mahajan, E. Muller // Journal of marketing. − 1979. − vol. 43. − P.55-68. Mahajan, V. Models for Innovation Diffusion / V. Mahajan, R. Peterson. − Beverly Hills, CA: Sage, 1985. 290 409. Mahajan, V. Timing, diffusion and substitution of successive generations of technological innovations: The IBM mainframe case / V. Mahajan, E. Muller // Technological Forecasting and Social Change. − 1996. − vol. 51. − P.109-132. 410. Mahajan, V. Determination of adopter categories by using innovation diffusion models / V. Mahajan, E. Muller, R.K. Srivastava // Journal of marketing research. − 1990. − vol. 27 (1). − P.37-50. 411. Mahajan, V. New-product diffusion models in marketing: a review and directions for research / V. Mahajan, E. Muller, F.M. Bass // Journal of marketing. − 1990. − vol. 54. − P.1-26. 412. Mahajan, V. New-product diffusion models: from theory to practice / V. Mahajan, E. Muller, R. Wind, eds. // International series in quantitative marketing. − 2000. − vol. 11. − P.3-26. 413. Mansfield, E. Technical Change and the Rate of Imitation / E. Mansfield // Econometrica. − 1961. − vol. 29. − P.741-766. 414. Marchetti, C. Society as a Learning System / C. Marchetti // Technological Forecasting and Social Change. − 1980. − vol. 18. − P.267-282. 415. Marchetti, C. The Future / С. Marchetti // Sinergetica ed Instabilitа Dinamiche (Synergetics and Dynamical Instabilities) / G.Caglioti, and H. Haken (eds) − Bologna, Italy: Societа Italiana di Fisica, 1988. 416. Marchetti, C. The dynamics of energy systems and the logistic substitution model / C. Marchetti, N. Nakicenovic // IIASA Research Report RR-79-13 − Laxenburg, Austria: 1979. 417. Marchetti, C. Human Population Dynamics Revisited with the Logistic Model: How Much Can Be Modeled and Predicted? / C. Marchetti, P.S. Meyer, J.H. Ausubel // Technological Forecasting and Social Change. − 1996. − vol. 52. − P.1-30. 418. Martino, J.P. Technological Forecasting for Decision Making / J.P. Martino. − New York: Americal Elsevier, 1975. 419. Martino, J.P. R&D project selection / J.P. Martino. − New York: J. Wiley & Sons, 1995. 420. McKendrick, A.G. Applications of mathematics to medical problems / A.G. McKendrick // Proc. Edin. Math. Soc.. − 1926. − vol. 14. − P.98-130. 421. Meade, N. Technological forecasting – Model selection, model stability, and combining models / N. Meade, T. Islam // Management Science. − 1998. − Vol.44, No.8. − P.1115-1130. 422. Meade, N. Modelling and forecasting the diffusion of innovation - a 25-year review / N. Meade, T. Islam // International journal of forecasting. − 2006. − Vol. 22. − P.519-545. 423. Messina, R. Riccati euqation-based generalization of Dawson's integral function / R. Messina, M.A. Jivulescu, A. Messina, A. Napoli // Mathematical Methods in the Applied Science. − 2007. − 30. − P.2055-2064. 424. Metheringham, R.A. Measuring the Net Cumulative Coverage of a Print Campaign / R.A. Metheringham // Journal of Advertising Research. − 1964. − 4. − P.23-28. 425. Meyer, P.S. Bi-Logistic Growth / P.S. Meyer // Technological Forecasting and Social Change. − 1994. − vol. 47. − P.89-102. 426. Michalakelis, C. Diffusion models of mobile telephony in Greece / C. Michalakelis, D. Varoutas, T. Sphicopoulos // Telecommunications Policy. − 2008. − vol.32. − P.234-245. 427. Mickens, R.E. Nonstandard finite difference models of differential equations / R.E. Mickens. − World Scientific Publishing Company, 1994. - 249 p. 428. Midgley, D.F. A simple mathematical theory of innovative behavior / D.F. Midgley // J.Consum. Res. − 1976. − 3(1). − P.31-41. 291 429. Modis, T. The end of the Internet Rush / T. Modis // Technological Forecasting and Social Change. − 2005. − Vol.72, Issue 8. − P.938-943. 430. Moldovan, S. Cellular automata modeling of resistance to innovations: Effects and solutions / S. Moldovan, J.Goldenberg // Technological Forecasting & Social Change. − 2004. − 71. − P.425-442. 431. Morrison, D.G. Generalizing the NBD Model for Customer Purchases: What Are the Implications and Is It Worth the Effort? / D.G. Morrison, D.C. Schmittlein // Journal of business and economic statistics. − 1988. − 6 (April). − P.145-159. 432. Moshier, S.L. Methods and Programs for Mathematical Functions / S.L. Moshier. − Chichester, England: Ellis Horwood, 1989. 433. Nakicenovic, N. Software package for the logistic substitution model / N. Nakicenovic // IIASA Research Report RR-79-12 − Laxenburg, Austria: 1979. 434. Nakicenovic, N. Growth to Limits: Long Waves and the Dynamics of Technology / N. Nakicenovic. − Vienna, Austria: 1984. 435. Nakicenovic, N. Diffusion of Technologies and Social Behaviour / N. Nakicenovic. − Berlin, Germany: Springer-Verlag, 1991. 436. Nielsen, J. Bass curves for the diffusion of innovations [Электронный ресурс] / J. Nielsen. − Электрон. текстовые дан. − Режим доступа: http://www.useit.com/alertbox/basscurves.html. − Загл. с экрана. 437. Olson, J. A product diffusion model incorporating repeat purchases / J. Olson, S. Choi // Technological forecasting and social change. − 1985. − vol. 27. − P.385-3987. 438. Ozga, S.A. Imperfect markets through lack of knowledge / S.A. Ozga // The Quarterly Journal of Economics. − 1960. − Vol.74. - No.1. − P.29-52. 439. Park, Y.-H. Modeling browsing behavior at multiple sites / Y.-H.Park, P.S. Fader // Marketing Science. − 2004. − Vol.23, No.3. − P.280-303. 440. Parker, P. Aggregate diffusion forecasting models: a critical review / P. Parker // International journal of forecasting. − 1994. − vol. 10. − P.353-380. 441. Pearl, R On the rate of growth of the population of the United States since 1790 and its mathematical representation / R. Pearl, L.J. Reed // Proceedings of the National Academy of Sciences. − 1920. − vol. 6. − P.275-288. 442. Perez, R. Innovation diffusion and new product growth models: a critical review and research directions / R. Perez, E. Muller, V. Mahajan // Intern. J. of Research in Marketing . − 2010. − vol.27. − P.91-106. 443. Pessemier, E.A. Product Management, Strategy and Organization / E.A. Pessemier. − New York: John Wiley and sons, 1977. 444. Peterka, V. The dynamics of energy systems and the logistic substitution model. Volume 2: Theoretical part / V. Peterka, F. Fleck // Administrative Report AR-78-1C, International Institute for Applied Systems Analysis, 1978. 445. Press, W.H. Numerical Recipes in Fortran: The Art of Scientific Computing / W.H. Press, S.A. Teukolsky, W.T. Vetterling, B.P. Flannery. − Cambridge, UK: Cambridge University Press, 1992. 446. Putsis, W.P. Estimation techniques for macro diffusion models / W.P. Putsis Jr., S. Srinivasan // International series in quantitative marketing. − 2000. − vol. 11. − P.263-291. 292 447. Ratchford, B.T. Diffusion models with replacement and multiple purchases / B.T. Ratchford, S.K. Balasubramanian, W.A. Kamakura // International series in quantitative marketing. − 2000. − vol. 11. − P.123-140. 448. Roberts, J.H. Disaggregated level diffusion models / J.H. Roberts, J.M. Lattin // International series in quantitative marketing. − 2000. − vol. 11. − P.207-236. 449. Rogers, E.M. Diffusion of Innovations, 5th Edition / E.M. Rogers. − Free Press, 2003. - 576p. 450. Rose, R. / R. Rose. − Oxford: Oxford Internet Institute Research Report. – 2006. 451. Rossiter, J.R. Advanced Media Planning / J.R. Rossiter, P.J. Danaher. − Kluwer, 1998. 112p. 452. Rust, R. Advertising media models. A practical guide / R. Rust. − 1986. - 159 p. 453. Sabavala, D.J. A Nonstationary Model of Binary Choice Applied to Media Exposure / D.J. Sabavala, D.G. Morrison // Management science. − 1981. − 27 (June). − P.637-657. 454. Schmittlein, D.C. Counting Your Customers: Who They Are and What They Will Do Next? / D.C. Schmittlein, D.G. Morrison, R. Colombo // Management science. − 1987. − 33. − P.1-24. 455. Sciadas, C.H. Two generalized models for forecasting innovation diffusion / C.H. Skiadas // Technological Forecasting and Social Change. − 1985. − vol.27. − P.39-61. 456. Sciadas, C.H. Innovation diffusion models expressing asymmetry and/or positively or negatively influencing forces / C.H. Skiadas // Technological Forecasting and Social Change. − 1986. − vol.30. − P.313-330. 457. Sharif, M.N. A generalized model for forecasting technological substitution / M.N. Sharif, C. Kabir // Technological Forecasting and Social Change. − 1976. − vol. 8. − P.353-364. 458. Sharif, M.N. The Weibull distribution as a general model for technological forecasting / M.N. Sharif, Islam M.N. // Technological Forecasting and Social Change. − 1980. − vol. 18. − P.247-256. 459. Sharif, M.N. Polynomial innovation diffusion models / M.N. Sharif, K.Ramanathan // Technological Forecasting and Social Change. − 1981. − vol. 21. − P.301-323. 460. Skellam, J.G. ) A probability distribution derived from the binomial distribution by regarding the probability of success as a variable between sets of trials. J.R.Statist.Soc. B / J.G. Skellam // . − 1948. − 10. − P.257-265. 461. Steffens, P. A mathematical model for new product diffusion: the influence of innovators and imitators / P. Steffens, D. Murthy // Mathematical and computer modeling. − 1992. − Vol.16, No.4. − P.11-26. 462. Steffens, P.R. An aggregate sales model for consumer durables incorporating a time varying mean replacement age / P.R. Steffens // Journal of forecasting. − 1991. − vol. 20. − P.63-77. 463. Stoneman, P. The economics of technological diffusion / P. Stoneman. − Wiley-Blackwell, 2002. - 328 p. 464. Tarde, G. The laws of imitation / G. Tarde. − New York: Holt, Rinehart and Winston Inc., 1903. 465. Teng, J.T.C. Information technology innovations: general diffusion patterns and its relationship to innovation characteristics / J.T.C. Teng, V. Grover, W. Guttler // IEEE transactions on engineering management. − 2002. − vol. 49. − No. 1. − P.13-27. 466. Thieme, H.R. Mathematics in Population Biology (Princeton Series in Theoretical and Computational Biology) / H.R. Thieme. − NY: Princeton University Press, 2003. - 568 p. 293 467. Thirtle, C.G The role of demand and supply in the generation and diffusion of technical change / C.G. Thirtle, V.W. Ruttan. − Harwood academic publishers, 1987, 1994. - 172 p. 468. Tsoularis, A. Analysis of logistic growth models / A. Tsoularis // Res. Lett. Inf. Math. Sci.. − 2001. − Vol.2. − P.23-46. 469. Valente, T. Network models of the diffusion of innovations / T. Valente. − Hampton press, 1995, 1999. - 171 p. 470. Van den Bulte, C. Social contagion and income heterogeneity in new product diffusion: a meta-analytic test / C. Van den Bulte, S. Stremersch // Management science. − 2004. − vol.23. − No.4. − P.530-544. 471. Van den Bulte, C. New product diffusion with Innovators and Imitators / C. Van den Bulte, Y.V. Joshin // Marketing Science. − 2007. − №3. − P.400-421. 472. Vanston, L.K. / L.K. Vanston, J.H. Vanston. − Technology Futures Inc., 1996. 473. Vanston, L.K. Technology forecasting for telecommunications / L.K. Vanston, R.L. Hodges // Telektronikk. − 2004. − N.4. − P.32-42. 474. Varian, H.R. Economics of information technology [Электронный ресурс] / H.R. Varian. − Электрон. текстовые дан. − Режим доступа: http://www.sims.berkeley.edu/~hal/Papers/mattioli/mattioli.html. − Загл. с экрана. 475. Venkatesh, V. User Acceptance of Information Technology: Toward a Unified View / V.Venkatesh, M.G.Morris, G.B.Davis, F.D.Davis // 27(3). − 2003. − MIS Quarterly. − P.425478. 476. Verhulst, P.-F. Notice sur la loi que la population suit dans son accroisment / P.-F. Verhulst // Correspondance Mathematique et Phusique, publiee par A. Quetelet . − 1838. − vol. 10. − P.113. 477. Verhulst, P.-F. Recherches Mathematiques sur la loi d‘accroissement de la population / P.-F. Verhulst // Nouveaux Memoires de l‘Academie Royale des Sciences, des Lettres et des BeauxArts de Belgique . − 1845. − vol. 18. − P.1-32. 478. Vishvanath, A. / A. Vishvanath, G.A. Barnett, eds. // The Diffusion of Innovations: A Communication Science Perspective / edited by A.Vishwanath, G.A.Barnett / Peter Lang Publishing Inc. – 2011. – 239 p. 479. Von Foerster, H. Some Remarks on Changing Populations / H. Von Foerster // The Kinetics of Cellular Proliferation / F. Stohlman Jr. (Hg.) − New York: Grune and Stratton, 1959. − P.382–407. 480. Von Foerster, H. Friday, November 13, AD 2026 / H. Von Foerster // Science. − 1960. − vol. 132. − P.1291–1295. 481. Wright, M. A validation of the Bass new product diffusion model in New Zealand / M. Wright // Marketing Bulletin. − 1997. − vol. 8. − P.15-29. 482. Yule, G.U. On the distribution of deaths with age when the causes of death act cumulatively, and similar frequency distributions / G.U. Yule // J.R. Statist. Soc.. − 1910. − 73. − P.26-38. 294 ПРИЛОЖЕНИЕ A. 295 ПРИЛОЖЕНИЕ Б. 296 297 298 299
Отзывы:
input Авторизуйтесь, чтобы оставить отзыв