Data Analytics with Hadoop. An Introduction for Data Scientists - Bengfort Benjamin, Kim Jenny

Data Analytics with Hadoop. An Introduction for Data Scientists - Bengfort Benjamin, Kim Jenny

Ready to use statistical and machine-learning techniques across large data sets? This practical guide shows you why the Hadoop ecosystem is perfect for the job. Instead of deployment, operations, or software development usually associated with distributed computing, you...ll focus on particular analyses you can build, the data warehousing techniques that Hadoop provides, and higher order data workflows this framework can produce.Data scientists and analysts will learn how to perform a wide range of techniques, from writing MapReduce and Spark applications with Python to using advanced modeling and data management with Spark MLlib, Hive, and HBase. You...ll also learn about the analytical processes and data systems available to build and empower data products that can handle-and actually require-huge amounts of data.Understand core concepts behind Hadoop and cluster computingUse design patterns and parallel analytical algorithms to create distributed data analysis jobsLearn about data management, mining, and warehousing in a distributed context using Apache Hive and HBaseUse Sqoop and Apache Flume to ingest data from relational databasesProgram complex Hadoop and Spark applications with Apache Pig and Spark DataFramesPerform machine learning techniques such as classification, clustering, and collaborative filtering with Spark...s MLlib źródło opisu: Helion źródło okładki: Helion

język polski
kategoria informatyka i matematyka
ISBN 9781491913758
data wydania czerwiec 2016 (data przybliżona)
Aby oceniać i komentować zarejestruj się!
Rejestracja jest za darmo i jest bardzo szybka! Kliknij tutaj aby założyć konto. Trwa to tylko 15 sekund!.

Podobne wpisy do Data Analytics with Hadoop. An Introduction for Data Scientists - Bengfort Benjamin, Kim Jenny

Mężczyźni, którzy nienawidzą kobiet. Księga II

Druga księga komiksu opartego na bestsellerowej trylogii Stiega Larssona „Millennium: Mężczyźni, którzy nienawidzą kobiet”. Pewnego wrześniowego dnia w 1966 roku szesnastoletnia Harriet Vanger znika bez śladu. Prawie czterdzieści lat później Mikael B...

Django. Ćwiczenia praktyczne - Piotr Maliński

Django nie jest kolejnym frameworkiem napisanym w języku PHP. To elitarne rozwiązanie, wykorzystujące język Python, oparte na wzorcu projektowym MVC. Pierwotnie Django zostało opracowane z myślą o stronach "prasowych", z dużą ilością newsów. Pierwsza...

FreeBSD 7 Instalacja i Konfiguracja - Bryan Hong

FreeBSD -- bezpłatnie udostępniany i rozbudowany system operacyjny -- ze względu na swą wydajność i niezawodność często obsługuje nawet najbardziej obciążone serwisy internetowe. Standardowa dystrybucja tego systemu zawiera wciąż modyfikowany i uleps...

Apache 2. Leksykon kieszonkowy - Andrew Ford

kategoria informatyka i matematyka język polski ISBN 9788324621798

Hadoop. Komplety przewodnik. Analiza i przechowywanie danych - Tom White

Platforma Apache Hadoop to jedno z zaawansowanych narzędzi informatycznych. Dzięki niej można przeprowadzać różne operacje na dużych ilościach danych i znacznie skrócić czas wykonywania tych działań. Wszędzie tam, gdzie potrzebne jest szybkie sortowa...

Red Hat Linux 7.3. Księga eksperta - Ball Bill

Red Hat to jedna z najwcześniej powstałych i najpopularniejszych dystrybucji Linuksa. Książka "Red Hat Linux 7.3. Księga eksperta" to kompletne omówienie tej dystrybucji. Znajdziesz w niej wszystkie informacje niezbędne, aby zainstalować i skonfiguro...

Logowanie
Rejestracja