Анализ данных с Jupyter Notebooks


Недавно открыл для себя такую штуку, как Jupyter Notebooks. Это такой инструмент для интерактивных вычислений.

Вот например я делал анализ статистики корректирующих патчей для OpenBSD. Собрал общедоступные данные о патчах в таблицу, построил графики и скриншоты этих графиков выложил на гитхаб. И хотя я опубликовал скрипт для сбора этой статистики, но вряд ли кто-то захочет проверить эти графики и даже мне нужно будет потратить некоторое время чтобы обновить их для новых выпусков OpenBSD. C Jupyter Notebook мы получаем воспроизводимость для анализа данных, все необходимые куски кода, данных и комментарии к ним находятся в одном месте - в ноутбуке.

То же самое с расчётами #RaceTheTube для Московского метро - всё источники данных, манипуляции над ними я опубликовал, но всё это разрозненно и нужно потратить время, чтобы повторить расчёты. С Jupyter Notebook у вас не будет этой проблемы.

Чтобы попробовать Jupyter Notebook в деле я сделал анализ результатов полумарафона “Лужники”, в котором сам участвовал в прошлом месяце. Комментарий к этому анализу я написал отдельным постом в ФБ.

Ещё начал делать анализ статистики о разработке в проектах CRIU и OpenBSD, но там я пока сделал не все, что хотел.

Метки: opensource openbsd