Задание:
В VirtualBox нужно сделать конвеер hdfs и обработать данные из таблицы, есть два примера других курсовых, по сути всё должно быть идентично, но с другими данными. Прогнать данные через конвеер хадупа (hdfs, MariaDB, Hive, Spark, Spool, Kafka) и ответить на 5 вопросов по теме.
Образ для виртуалки на котором экосистема хадупа настроена пришлю если необходимо. Теоретическую часть пропишу сам при необходимости, главное это практическая часть.