- Любовные романы
- Фантастика и фэнтези
- Ненаучная фантастика
- Ироническое фэнтези
- Научная Фантастика
- Фэнтези
- Ужасы и Мистика
- Боевая фантастика
- Альтернативная история
- Космическая фантастика
- Попаданцы
- Юмористическая фантастика
- Героическая фантастика
- Детективная фантастика
- Социально-психологическая
- Боевое фэнтези
- Русское фэнтези
- Киберпанк
- Романтическая фантастика
- Городская фантастика
- Технофэнтези
- Мистика
- Разная фантастика
- Иностранное фэнтези
- Историческое фэнтези
- LitRPG
- Эпическая фантастика
- Зарубежная фантастика
- Городское фентези
- Космоопера
- Разное фэнтези
- Книги магов
- Любовное фэнтези
- Постапокалипсис
- Бизнес
- Историческая фантастика
- Социально-философская фантастика
- Сказочная фантастика
- Стимпанк
- Романтическое фэнтези
- Ироническая фантастика
- Детективы и Триллеры
- Проза
- Юмор
- Феерия
- Новелла
- Русская классическая проза
- Современная проза
- Повести
- Контркультура
- Русская современная проза
- Историческая проза
- Проза
- Классическая проза
- Советская классическая проза
- О войне
- Зарубежная современная проза
- Рассказы
- Зарубежная классика
- Очерки
- Антисоветская литература
- Магический реализм
- Разное
- Сентиментальная проза
- Афоризмы
- Эссе
- Эпистолярная проза
- Семейный роман/Семейная сага
- Поэзия, Драматургия
- Приключения
- Детская литература
- Загадки
- Книга-игра
- Детская проза
- Детские приключения
- Сказка
- Прочая детская литература
- Детская фантастика
- Детские стихи
- Детская образовательная литература
- Детские остросюжетные
- Учебная литература
- Зарубежные детские книги
- Детский фольклор
- Буквари
- Книги для подростков
- Школьные учебники
- Внеклассное чтение
- Книги для дошкольников
- Детская познавательная и развивающая литература
- Детские детективы
- Домоводство, Дом и семья
- Юмор
- Документальные книги
- Бизнес
- Работа с клиентами
- Тайм-менеджмент
- Кадровый менеджмент
- Экономика
- Менеджмент и кадры
- Управление, подбор персонала
- О бизнесе популярно
- Интернет-бизнес
- Личные финансы
- Делопроизводство, офис
- Маркетинг, PR, реклама
- Поиск работы
- Бизнес
- Банковское дело
- Малый бизнес
- Ценные бумаги и инвестиции
- Краткое содержание
- Бухучет и аудит
- Ораторское искусство / риторика
- Корпоративная культура, бизнес
- Финансы
- Государственное и муниципальное управление
- Менеджмент
- Зарубежная деловая литература
- Продажи
- Переговоры
- Личная эффективность
- Торговля
- Научные и научно-популярные книги
- Биофизика
- География
- Экология
- Биохимия
- Рефераты
- Культурология
- Техническая литература
- История
- Психология
- Медицина
- Прочая научная литература
- Юриспруденция
- Биология
- Политика
- Литературоведение
- Религиоведение
- Научпоп
- Психология, личное
- Математика
- Психотерапия
- Социология
- Воспитание детей, педагогика
- Языкознание
- Беременность, ожидание детей
- Транспорт, военная техника
- Детская психология
- Науки: разное
- Педагогика
- Зарубежная психология
- Иностранные языки
- Филология
- Радиотехника
- Деловая литература
- Физика
- Альтернативная медицина
- Химия
- Государство и право
- Обществознание
- Образовательная литература
- Учебники
- Зоология
- Архитектура
- Науки о космосе
- Ботаника
- Астрология
- Ветеринария
- История Европы
- География
- Зарубежная публицистика
- О животных
- Шпаргалки
- Разная литература
- Зарубежная литература о культуре и искусстве
- Пословицы, поговорки
- Боевые искусства
- Прочее
- Периодические издания
- Фанфик
- Военное
- Цитаты из афоризмов
- Гиды, путеводители
- Литература 19 века
- Зарубежная образовательная литература
- Военная история
- Кино
- Современная литература
- Военная техника, оружие
- Культура и искусство
- Музыка, музыканты
- Газеты и журналы
- Современная зарубежная литература
- Визуальные искусства
- Отраслевые издания
- Шахматы
- Недвижимость
- Великолепные истории
- Музыка, танцы
- Авто и ПДД
- Изобразительное искусство, фотография
- Истории из жизни
- Готические новеллы
- Начинающие авторы
- Спецслужбы
- Подростковая литература
- Зарубежная прикладная литература
- Религия и духовность
- Старинная литература
- Справочная литература
- Компьютеры и Интернет
- Блог
Netflix. Инсайдерская история компании, завоевавшей мир - Джина Китинг
Шрифт:
Интервал:
Закладка:
К моменту объявления соревнования Netflix Prize подписчики проставили миллиард рейтингов 60 000 фильмам и сериалам – богатый набор данных, но функция Cinematch не раскрыла его тонкостей.
BellKor и другие команды написали свои алгоритмы рекомендаций с нуля и в течение нескольких месяцев изучили кривую обучаемости, на что у Netflix ушли годы, и затем превзошли ее. Построенные ими алгоритмы обнаружили нюансы в огромном массиве данных, совершенно незнакомые Волынскому, Беллу и Корену. Алгоритмы проанализировали паттерны, созданные рейтингами подписчиков, и присвоили свои собственные описания фильмам, которые были обширнее и точнее, чем такие ярлыки, как «режиссер», «актер» и «жанр», но не имели никакого смысла для человеческого восприятия.
Например, Белл заметил, что алгоритм «определил», что подписчики, которым нравились фильмы Вуди Аллена, часто обращают внимание только на определенные типы фильмов Аллена – например, снятые в определенную эпоху его карьеры или в особой обстановке, где действие происходит в определенном месте, – и не рекомендуют другие работы режиссера.
На второй год конкурса прогресс замедлился, особенно после того, как BellKor раскрыла свои методы в документе, как требовали того правила Netflix Prize, и команда наблюдала за тем, как другие пытаются ее обогнать, используя их же собственные методы. Они застряли на показателе улучшения алгоритма Cinematch на 8,6 %.
Ближе к середине второго года конкурса Корен устроился на работу в исследовательский центр Yahoo! в Израиле и, будучи неуверенным в том, сможет ли он заниматься проектом дальше, прежде чем уйти, рьяно взялся за решение головоломки. Их динамика роста замедлилась до полпроцента здесь и десятой доли пункта там, поэтому Белл и Волынски решили обратиться к доске лидеров за «свежей кровью», чтобы вытащить себя из застоя.
Новая команда под названием Big Chaos – два молодых австрийских математика, которые писали алгоритмы на основе, заложенной BellKor в первый год конкурса, и взлетели в рейтинге, – привлекла внимание Белла и Волынски. Белл отправил электронное письмо Андреасу Тошеру и Майклу Джаре из Commendo Research, устроив нечто вроде научного свидания вслепую, чтобы выяснить, возможно ли объединение и подходят ли они по характеру и по подходу к проблеме. В своих письмах Тошер и Джара дали понять команде BellKor, что они не против, и согласились провести трансатлантическую телеконференцию, чтобы объединить силы, взяв название BellKor in Big Chaos.
Затем они принялись искать экологические и психологические факторы, которые влияли на то, как и почему люди оценивали фильмы так, а не иначе. Были ли подписчики более или менее лояльны, когда оценивали фильмы на выходных, а не в будние дни? Какой эффект имело оценивание одновременно большого количества фильмов? Оценивали ли люди фильмы по-разному в зависимости от их настроения, и если это так, то как это можно определить? Менялась ли со временем склонность человека быть строгим или добродушным критиком, и если да, то как и почему?
Каждый из этих вопросов стал сам по себе уравнением, которое нужно было проверить, и если результаты были последовательными и существенными, то они добавлялись к остальным уравнениям, которые представляли собой их победную формулу.
По мере того как улучшения Cinematch накапливались из выстраданных полпроцентов и десятых долей процента, небольшое подмножество фильмов ускользало от классификации и на второй год превратилось в главный барьер между конкурсантами Netflix Prize и их выигрышем в 1 млн долларов. Эти фильмы, как правило, носили иронический или полемический характер, и мнения аудитории и критиков по поводу того, были ли они шедеврами или полной ерундой, резко разделились.
Главным среди этой группы был странный независимый фильм «Наполеон Динамит» (лента, на которую приходился наибольший процент ошибок во всех моделях BellKor), а также политические поляризационные фильмы, такие как «Фаренгейт 9/11» – документальная лента режиссера Майкла Мура о террористических атаках на Нью-Йорк и Вашингтон и о второй войне в Ираке.
Прогнозы, в какую крайность впадут подписчики, оценивая такие фильмы, как «Взломщики сердец», «Трудности перевода», «Водная жизнь» и «Страсти Христовы», были чистой лотереей. Невозможно было оценить по предыдущим рейтингам, как люди отнесутся к этим фильмам.
Белл рассудил, что решение проблемы «Наполеона Динамита» заключается не только в том, чтобы найти похожие фильмы, но и в обучении алгоритма, когда у него недостаточно информации о подписчике, чтобы он сделал хоть какой-нибудь прогноз. В результате было получено уравнение, в котором вообще не учитывался подписчик, который слишком редко оценивал фильмы, или который проставлял слишком много рейтингов однотипным фильмам, или же предоставлял малое количество стабильно высоких или низких оценок.
Несмотря на основополагающие идеи второго года, команды смогли добиться улучшения только на один процент по сравнению с предыдущим. Команда BellKor in Big Chaos забрала еще одно вознаграждение Progress Prize в размере 50 000 долларов, чтобы пополнить свою сокровищницу наград, которая включала китчевую копию звезды Аллеи славы Голливуда, которую они выиграли в прошлом году и разместили ее в вестибюле AT&T Shannon Laboratory.
Беннет из Netflix, который ушел на пенсию в 2009 году, задавался вопросом, достанется ли приз в 1 млн долларов хоть кому-нибудь. В январе на конкурсе разгорелась серьезная борьба; доска лидеров «вернулась к жизни», поскольку команды изо всех сил пытались сократить разрыв в менее чем 1 % в улучшении по сравнению с командой BellKor in Big Chaos. Все хотели забрать большой приз.
Команды начали объединяться во все более крупных масштабах, в надежде на то, что сочетание их методологий поможет им преодолеть последние несколько десятых процента и перейти порог в 10 %. Команда BellKor in Big Chaos также принялась искать свежие идеи. Они нашли двух программистов франко-канадского происхождения, Мартина Шаббера и Мартина Пьйотт, которые атаковали доску лидеров, объединив победную формулу, получившую Progress Prize, со своими нестандартными решениями.
Ни Шаббер, ни Пьйотт, которые называли себя Pragmatic Theory, не имели никакого официального образования в сфере интеллектуального анализа данных, и в течение первых двух лет они намеренно воздерживались от проведения научных исследований в рамках конкурса. Они говорили, что предпочитают подходить к решению проблемы, находя закономерности в данных или психологических аспектах подписчиков, и превращать их в рабочие модели ПО. Они отказались от внешней информации о фильмах и сосредоточились на прогнозировании рейтингов, а не на попытках объяснить их с помощью формул.
«Алгоритмы, которые находят фактические закономерности в данных, в бесчисленных оттенках серого, намного мощнее любого вида метаданных, которые отличают лишь черное и белое», – сказал Шаббер.
Их креативность продвинула их объединенную команду, которая теперь называлась BellKor’s Pragmatic Chaos,

