Изучаем Spark. Молниеносный анализ данных
Халдеи Карау, Энди Конвински, Патрик Венделл, Матей Захария
Объем обрабатываемых данных во всех областях человеческой деятельности продолжает расти быстрыми темпами. Существуют ли эффективные приемы работы с ним? В этой книге рассказывается об Apache Spark, открытой системе кластерных вычислений, которая позволяет быстро создавать высокопроизводительные программы анализа данных. С помощью Spark вы сможете манипулировать огромными объемами данных посредством простого API на Python, Java и Scala. Написанная разработчиками Spark, эта книга поможет исследователям данных и программистам быстро включиться в работу. Она рассказывает, как организовать параллельное выполнение заданий всего несколькими строчками кода, и охватывает примеры от простых пакетных приложений до программ, осуществляющих обработку потоковых данных и использующих алгоритмы машинного обучения.
Categorias:
Ano:
2015
Editora:
ДМК Пресс
Idioma:
russian
Páginas:
303
ISBN 10:
1449358624
ISBN 13:
9781449358624
Arquivo:
PDF, 15.68 MB
IPFS:
,
russian, 2015