Zaawansowana analiza danych w PySpark : metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark /Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills ; przekład Andrzej Watrak.

Książka

W koszyku

oceń

Zaawansowana analiza danych w PySpark : metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark /Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills ; przekład Andrzej Watrak. - Gliwice : Helion, copyright 2023. - 188, [4] strony ; 24 cm.

Autor

Tandon Akash. Autor Ryza Sandy. Autor Laserson Uri. Autor Owen Sean Autor Wills Josh. Autor Watrak Andrzej. Tłumaczenie

Forma i typ

Książki Publikacje dydaktyczne

Odbiorca

Programiści

Temat

Analiza danych Apache Spark Python (język programowania) Metody statystyczne

Gatunek

Podręcznik

Dziedzina i ujęcie

Informatyka i technologie informacyjne

Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych. Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy. Dzięki książce poznasz: model programowania w ekosystemie Spark, podstawowe metody stosowane w nauce o danych, pełne implementacje analiz dużych publicznych zbiorów danych, konkretne przypadki użycia narzędzi uczenia maszynowego, kod, który łatwo dostosujesz do swoich potrzeb PySpark: systemowa odpowiedź na problemy inżyniera danych!

zob. w.bibliotece.pl

Status dostępności:

CN1 (św. Wincentego 85)

Egzemplarze są dostępne wyłącznie na miejscu w bibliotece: sygn. 58702 (1 egz.)

Strefa uwag:

Tytuł oryginału: Adanced analytics with PySpark : patterns for learning from dta at scale using Python and Spark