9 кращих нових книг по R

У мережі можна знайти багато онлайн-курсів та довідників для тих, хто хоче освоїти мову статистичної обробки і візуалізації R. Однак проходженням подібних курсів вивчення мови не завершується і постає необхідність удосконалювати свої навики. Отже, час перейти до серйозної літератури з R – заглибитись у написання функцій, розібратися у алгоритмах машинного навчання, навчитись на найвищому рівні подавати проведений аналіз. Якщо ви хочете зробити саме це, то можемо вас привітати – ви перейшли за правильним лінком!

Мова R активно розвивається, щотижня виходять нові бібліотеки (їх появу можна відсідковувати на ресурсі r-bloggers.com), а також з’являється нова література.

Ми підготували підбірку найфундаментальніших книг, присвяченим R, які виходили в останні роки. Вони присвячені дуже різноманітним аспектам роботи у цьому середовищі.

1. Garrett Grolemun. Hands-On Programming with R

Світлина від Факультет соціології КНУ імені Тараса Шевченка.Книга присвячена основам програмуванням в R. Її автором є один із головних розробників компанії RStudio, яка є передовою в розвитку середовища R. Книга допоможе розібратися в основі написання функцій, у форматах даних, бібліотеках, циклах, об’єктах, притаманними R. Книга пояснює не тільки те, як писати базові програми, а і як зробити їх швидшими, придатними для масового використання.

2. Garrett Grolemund, Hadley Wickham. R for Data Science

Світлина від Факультет соціології КНУ імені Тараса Шевченка.Ця книга охоплює дуже широкий спектр роботи в R, що цілком збігається із спектром роботи соціолога, який займається аналізом соціальних даних. У книзі розказується про імпорт і очистку даних, маніпуляції над ними, їх візуалізацію, створення на їх основі моделей та представлення результатів аналізу. Головною специфікою цієї книги є акцент на роботі з набором пакетів tidyverse. До нього входять у першу чергу ggplot2 (для візуалізації даних), dplyr (для маніпулювання даними), tidyr (для очищення даних), readr (для імпорту даних), purrr (для функціонального програмування), tibble (робота з таблицями даних). Це дійсно найновіші інструменти для роботи з даними в R

3. Winston Chang. R Graphics Cookbook

Світлина від Факультет соціології КНУ імені Тараса Шевченка.Книга присвячена базовим аспектам візуалізації в R. Основна увага присвячена візуалізації в base R та ggplot2. У книзі описано те, як робити основні типи графіків (точкова, лінійна графіка, стовпчикові діаграми, гістограми та інше) та проводити маніпуляції із елементами графіки (міняти їх розміри, колір, робити власні теми). Великим плюсом книги є наявність маси прикладів коду для сторення візуалізацій.

4. Hadley Wickham. ggplot2 – Elegant graphics for data analysis.

Більш детально про візуалізацію в ggplot2 можна прочита в книзі автора цієї бібліотеки, СЕО RStudio Hadley Wickham. Принцип візуалізації в ggplot2 помітно відрізняється від того, що закладено в базовий R. Його головною ідеєю є нанесення елементів графіку та геометричних об’єктів графіки шарами, подібно до Photoshop.

5. Colin Gillespie, Robin Lovelace. Efficient R programming

Світлина від Факультет соціології КНУ імені Тараса Шевченка.У книзі розповидається про те, як зробити роботу коду на R ефективнішою. Проблема швидкості роботи коду в середовищі дуже актуальна, коли даних стає дуже багато. Сам R має схильність дуже сильно навантажувати в роботі оперативну пам’ять комп’ютера. Як уникнути цієї та інших проблем, пов’язаних із функціонуванням написаного коду, можна прочитати у цій книзі.

6. Max Kuhn. The caret Package

Ця книга присвячена основноній бібліотеці R, яка використовується для машинного навчання, зокрема для задач класифікації. Бібліотеці caret притаманний чудовий функціонал, що дозволяє поєднати препроцесинг даних, навчання моделі та її крос-валідацію в невеликому коді.

7. Hadley Wickham. Advanced R

Світлина від Факультет соціології КНУ імені Тараса Шевченка.Книга присвячена продвинутим аспектам програмування в R. Вона чудово підійде для тих людей, які хочуть поринути глибше в R і вивчати нові стратегії для вирішення різних проблем. Її читання буде корисним для тих, хто вже давно працює в R.

8. Yihui Xie. Dynamic Documents with R and knitr, Second Edition

Світлина від Факультет соціології КНУ імені Тараса Шевченка.R це не тільки робота зі статистичними даними та написання програм для їх обробки, це і створення продуктів, які презентують результати досліджень. Вже стало нормою подавати аналіз даних, зроблений в R через документи бібліотеки RMarkdown. У цій книзі розповідається про те, як робити інтерактивні сторінки (формату html) через бібліотеки knitr та RMarkdown.

9. Julia Silge and David Robinson. Welcome to Text Mining with R

Cover imageАналіз текстових масив – задача, з якою, мабуть стикався кожен соціолог. R пропонує свої інструменти для кількісної обробки тексових масивів. Компанія Rstudio пропонує свою альтернативу для аналізу текстових масивів через свій набір пакетів tidyverse. Виклад цієї концепції представлено у книзі.

Звісно, це не повний перелік нової літератури з R. Якщо хочете бути в курсі найновіших розробок і публікацій, то вам варто підписуватися на розсилки із блогів, зокрема на розсилку r-bloggers.com.

Успіхів!

Роман Кириченко

Advertisements

Микола Рябчук: «Погано не те, що в нас є політтехнологи, а те, що в нас розмита межа між політологією як наукою та політтехнологіями»

Соціальний дослідник, політичний аналітик та есеїст Микола Рябчук належить до числа тих публічних інтелектуалів, яких, мабуть, немає сенсу розлого представляти. Для когось дисидент і андеґраундний організатор самвидаву, для когось насамперед критик і публіцист, для когось – письменник, а ще для когось – соціальний науковець, М. Рябчук вже невід’ємний, незалежно від виміру, в якому розглядати його особу, від української культури та громадського життя. Continue reading “Микола Рябчук: «Погано не те, що в нас є політтехнологи, а те, що в нас розмита межа між політологією як наукою та політтехнологіями»”