-
ДоступенЗанятОтсутствуюНе определено
Баттл твипов - Создание предиктивных - против - Парсинг ВКонтакте


Создание предиктивных или классифицирующих моделей
Предиктивная модель - эффективный инструмент поддержки принятия бизнес-решений. Создание такой модели - процесс поиска закономерностей с использованием алгоритмов машинного обучения (Mashine Lerning) в существующем наборе исторических данных (обучение модели) для предсказания наиболее вероятных вариантов развития событий в будущем (применение модели).
Классифицирующая модель позволяет разбить большой массив данных на группы (классы), характеризующиеся сходным набором признаков, используя явные и неявные закономерности. Применение такой модели, позволяет, например, определить группы пользователей, характеризующихся определенным поведением и сделать им предложения, интересные именно для них.
Для обеспечения качества работы модели необходим тщательный отбор и подготовка входных данных. Также может возникнуть необходимость во внешних данных. Результатом моей работы будет:
1) сама модель в формате, определяемом выбранной моделью (например, в случае линейных моделей это будет вектор весов каждого из факторов. Вес фактора определяет степень его влияния на результат)
2) отчет о валидности (точности предсказания) модели
3) файл с результатами применения модели к исследуемому набору данных

Предлагаю сбор целевой аудитории в социальной сети Вконтакте (без собачек и ботов). Настраиваемые фильтры:
- Пол
- Возраст
- Страна, Город
- По количеству подписчиков
- По количеству друзей
- По Количеству постов на стене
- Семейное положение
- Когда пользователь последний раз был online
- Без сбора удалённых и заблокированных пользователей
- Без сбора тех, у кого нет аватарки
Как показывает практика из полумиллиона собранных аккаунтов, активных только 7 - 13 тыс.
Парсер участников сообществ.
Парсинг фотографий с группы, сообщества, страницы.
Данные отдаю в файле txt, xls на ваш выбор.
Стоимость одного спарсенного контакта 0,10 копеек.