dc.description | Книга розглядає теоретичні та практичні аспекти обробки та аналізу великих даних. Частина I фокусується на теоретичних аспектах великих даних, включаючи розділи про інструменти обробки великих даних, такі як Hadoop, Apache Spark, Hive, та інші. Також розглядаються аспекти роботи з базами даних для великих даних, такі як реляційні та NoSQL бази даних. Частина II концентрується на PySpark, починаючи з вступу в PySpark та його архітектури. Розділи присвячені різним аспектам програмування в PySpark, включаючи вирішення найпростіших задач, створення RDD та DataFrames, використання операцій Spark, і багато іншого. Книга призначена для студентів та всіх, хто цікавиться аналізом великих даних та їх обробкою. | uk_UA |