PySpark SQL Recipes: With HiveQL, Dataframe and Graphframes

Автор: literator от 18-06-2019, 13:51, Коментариев: 0

Категория: КНИГИ » ПРОГРАММИРОВАНИЕ

Название: PySpark SQL Recipes: With HiveQL, Dataframe and Graphframes
Автор: Raju Kumar Mishra, Sundar Rajan Raman
Издательство: Apress
ISBN: 148424334X
Год: 2019
Страниц: 343
Язык: английский
Формат: pdf (true), epub
Размер: 10.16 MB

Carry out data analysis with PySpark SQL, graphframes, and graph data processing using a problem-solution approach. This book provides solutions to problems related to dataframes, data manipulation summarization, and exploratory analysis. You will improve your skills in graph data analysis using graphframes and see how to optimize your PySpark SQL code.

PySpark SQL Recipes starts with recipes on creating dataframes from different types of data source, data aggregation and summarization, and exploratory data analysis using PySpark SQL. You’ll also discover how to solve problems in graph analysis using graphframes.

On completing this book, you’ll have ready-made code for all your PySpark SQL tasks, including creating dataframes using data from different file formats as well as from SQL or NoSQL databases.

What You Will Learn:
Understand PySpark SQL and its advanced features
Use SQL and HiveQL with PySpark SQL
Work with structured streaming
Optimize PySpark SQL
Master graphframes and graph processing

Who This Book Is For:
Data scientists, Python programmers, and SQL programmers.




Скачать с облака






Нашел ошибку? Есть жалоба? Жми!
Пожаловаться администрации
Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь.
Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.
Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.