Hadoop в действии.
Авторы: Чак Лэм
Издательство: ДМК-Пресс
ISBN 978-5-94074-785-7; 2012 г.
Кол-во страниц: 424
О книге:
Обработка огромных массивов данных с помощью обычных СУБД может оказаться трудным делом. Apache Hadoop - это каркас для разработки приложении, предопределенных для исполнения в распределенном кластере, без использования SQL. Такие дополнения отлично масштабируются и могут обрабатывать гигантские массивы данных. Если вам требуется произвести анализ данных, то Hadoop как раз то, что надо. Прочитав эту книгу, вы познакомитесь с предметом и научитесь писать программы в стиле MapReduce. После нескольких простых примеров автор быстро переходит к вопросу об пользовании Hadoop для решения более непростых задач анализа данных. Описаны рекомендованные приемы и паттерны проектирования, полезные при программировании для MapReduce. Для чтения книги требуется знание основ языка Java. Некоторое знакомство с математической статистикой поможет определиться в более непростых примерах.