9 кращих нових книг по R

У мережі можна знайти багато онлайн-курсів та довідників для тих, хто хоче освоїти мову статистичної обробки і візуалізації R. Однак проходженням подібних курсів вивчення мови не завершується і постає необхідність удосконалювати свої навики. Отже, час перейти до серйозної літератури з R – заглибитись у написання функцій, розібратися у алгоритмах машинного навчання, навчитись на найвищому рівні подавати проведений аналіз. Якщо ви хочете зробити саме це, то можемо вас привітати – ви перейшли за правильним лінком!

Мова R активно розвивається, щотижня виходять нові бібліотеки (їх появу можна відсідковувати на ресурсі r-bloggers.com), а також з’являється нова література.

Ми підготували підбірку найфундаментальніших книг, присвяченим R, які виходили в останні роки. Вони присвячені дуже різноманітним аспектам роботи у цьому середовищі.

1. Garrett Grolemun. Hands-On Programming with R

Світлина від Факультет соціології КНУ імені Тараса Шевченка.Книга присвячена основам програмуванням в R. Її автором є один із головних розробників компанії RStudio, яка є передовою в розвитку середовища R. Книга допоможе розібратися в основі написання функцій, у форматах даних, бібліотеках, циклах, об’єктах, притаманними R. Книга пояснює не тільки те, як писати базові програми, а і як зробити їх швидшими, придатними для масового використання.

2. Garrett Grolemund, Hadley Wickham. R for Data Science

Світлина від Факультет соціології КНУ імені Тараса Шевченка.Ця книга охоплює дуже широкий спектр роботи в R, що цілком збігається із спектром роботи соціолога, який займається аналізом соціальних даних. У книзі розказується про імпорт і очистку даних, маніпуляції над ними, їх візуалізацію, створення на їх основі моделей та представлення результатів аналізу. Головною специфікою цієї книги є акцент на роботі з набором пакетів tidyverse. До нього входять у першу чергу ggplot2 (для візуалізації даних), dplyr (для маніпулювання даними), tidyr (для очищення даних), readr (для імпорту даних), purrr (для функціонального програмування), tibble (робота з таблицями даних). Це дійсно найновіші інструменти для роботи з даними в R

3. Winston Chang. R Graphics Cookbook

Світлина від Факультет соціології КНУ імені Тараса Шевченка.Книга присвячена базовим аспектам візуалізації в R. Основна увага присвячена візуалізації в base R та ggplot2. У книзі описано те, як робити основні типи графіків (точкова, лінійна графіка, стовпчикові діаграми, гістограми та інше) та проводити маніпуляції із елементами графіки (міняти їх розміри, колір, робити власні теми). Великим плюсом книги є наявність маси прикладів коду для сторення візуалізацій.

4. Hadley Wickham. ggplot2 – Elegant graphics for data analysis.

Більш детально про візуалізацію в ggplot2 можна прочита в книзі автора цієї бібліотеки, СЕО RStudio Hadley Wickham. Принцип візуалізації в ggplot2 помітно відрізняється від того, що закладено в базовий R. Його головною ідеєю є нанесення елементів графіку та геометричних об’єктів графіки шарами, подібно до Photoshop.

5. Colin Gillespie, Robin Lovelace. Efficient R programming

Світлина від Факультет соціології КНУ імені Тараса Шевченка.У книзі розповидається про те, як зробити роботу коду на R ефективнішою. Проблема швидкості роботи коду в середовищі дуже актуальна, коли даних стає дуже багато. Сам R має схильність дуже сильно навантажувати в роботі оперативну пам’ять комп’ютера. Як уникнути цієї та інших проблем, пов’язаних із функціонуванням написаного коду, можна прочитати у цій книзі.

6. Max Kuhn. The caret Package

Ця книга присвячена основноній бібліотеці R, яка використовується для машинного навчання, зокрема для задач класифікації. Бібліотеці caret притаманний чудовий функціонал, що дозволяє поєднати препроцесинг даних, навчання моделі та її крос-валідацію в невеликому коді.

7. Hadley Wickham. Advanced R

Світлина від Факультет соціології КНУ імені Тараса Шевченка.Книга присвячена продвинутим аспектам програмування в R. Вона чудово підійде для тих людей, які хочуть поринути глибше в R і вивчати нові стратегії для вирішення різних проблем. Її читання буде корисним для тих, хто вже давно працює в R.

8. Yihui Xie. Dynamic Documents with R and knitr, Second Edition

Світлина від Факультет соціології КНУ імені Тараса Шевченка.R це не тільки робота зі статистичними даними та написання програм для їх обробки, це і створення продуктів, які презентують результати досліджень. Вже стало нормою подавати аналіз даних, зроблений в R через документи бібліотеки RMarkdown. У цій книзі розповідається про те, як робити інтерактивні сторінки (формату html) через бібліотеки knitr та RMarkdown.

9. Julia Silge and David Robinson. Welcome to Text Mining with R

Cover imageАналіз текстових масив – задача, з якою, мабуть стикався кожен соціолог. R пропонує свої інструменти для кількісної обробки тексових масивів. Компанія Rstudio пропонує свою альтернативу для аналізу текстових масивів через свій набір пакетів tidyverse. Виклад цієї концепції представлено у книзі.

Звісно, це не повний перелік нової літератури з R. Якщо хочете бути в курсі найновіших розробок і публікацій, то вам варто підписуватися на розсилки із блогів, зокрема на розсилку r-bloggers.com.

Успіхів!

Роман Кириченко

АЛЬФА Й ОМЕГА: походження європейського словника

Європейський словник, організований алфавітно, символізує собою відхід від натурфілософського підходу до світобудови як відповідності між стихіями і істотами, вкладаючи світ у схему, не пов’язану з природними протиставленнями і циклами

 

Коли «стався» перший словник[1]? Хоча традиція грецької ученості має на це точну відповідь (у середовищі александрійських книжників ІІІ ст. до н.е.), проте її нам явно недостатньо. Європейський словник – це взагалі особливе явище, у якому відобразилася сама європейська культура. І то навіть на рівні «композиції» словника як тексту.

Анатоль Франс в одному есеї назвав словник «усесвітом в алфавітному порядку». Так, ніби алфавітний порядок – це річ, споконвіку притаманна словникам. Якраз навпаки: розташувати слова в порядку літер алфавіту, всупереч природному для людського світосприйняття членуванню лексики (як і світу) на тематичні групи, – це річ абсолютно не очевидна. Щось мало вплинути на людей, навіть книжних, аби аж так порвати з принципом очевидності.

Адже наука укладання словників досить давня, з’являється вона в багатьох місцях одразу і, судячи з усього, майже незалежно в різних традиціях. При цьому, що особливо цікаво, скрізь панує принцип тематичної організації, починаючи з перших лексичних списків для заучування, створених в Аккаді для вивчення сакральної шумерської мови.

Особливо витонченої розгалуженості досяг тематичний принцип організації в давньому Китаї: починали словник групи, що стосувалися неба і світил, потому наводилися об’єкти ландшафту, різновиди коштовних шат правителя, а далі вже йшлося про інші людські справи.

Щось мало вплинути на людей, навіть книжних, аби аж так порвати з принципом очевидності.

Можна подумати, що китайцям із їхньою ієрогліфічною писемністю не було іншого виходу, як організувати словник тематично. Насправді ж у сучасних словниках китайської мови прийнятий принцип організації за головним графічним елементом ієрогліфа («ключем»), хоча принципи писемності не змінилися.

Аргумент проти безпосереднього зв’язку алфавітного принципу організації словника з наявністю самого алфавіту надає давньоіндійська традиція: санскрит записували алфавітним письмом (яке, врешті, походить від складового), однак словники («Амаракоша», наприклад) організовані тематично, зі збереженням світової ієрархії, уже відомої нам із китайських словників.

Тож для розмови про походження європейського (і українського як його частини) словника необхідно дати собі раду з принципом алфавітності. Відкіля він узявся? Навіщо він знадобився?

Алфавіт – це винахід фінікійців, хитромудрість якого була відчутна ще в середньовіччі, коли один китайський мандрівник в подорожніх нотатках записав, що народи на заході для письма користуються невеликою кількістю вигадливо перетасованих знаків. Тому десь неподалік від фінікійців і треба шукати перші зразки. Хоч від самої (колись багатої) літератури фінікійців не збереглося нічого, однак надзвичайно близьким до їхньої літератури є Старий Завіт. Отож першими алфавітно організованими текстами, відомими в Європі (точніше – в єдиному культурному середземноморському ареалі), були псалми, перекладені грецькою якраз у ІІІ ст. до н.е., в часи першої елліністичної «глобалізації». Сакральність самого порядку літер алфавіту осмислювалася потім в кабалі.

Вражаючою знахідкою були елліністичні гімни, присвячені давньогрецьким богам, в яких у гекзаметричний метр іще традиційні епітети богів були вкладені не за принципом географічним чи міфологічним (тобто тематичним), а за алфавітом! Ці гімни своєю формою розвивали ті тенденції, які стануть у культурі центральними. Адже потім християнський Бог був названий «альфою й омегою» в Апокаліпсисі Іоанна. А текст, який св. Кирило створив, напевне, водночас зі створенням слов’янських алфавітів, – глаголиці і кирилиці – це «Абеткова молитва», організована відповідно до порядку нововинайденої абетки.

Таким чином, від самого початку принцип алфавітності стає притаманним саме європейським словникам, на противагу східним лексикографічним традиціям. Бажання вирвати найменування (а відповідно, і сам предмет) зі звичного, очевидного тематичного принципу організації тексту надзвичайно суголосне європейські філософській думці, яка на момент появи перших словників була ще доволі новою. В обох сферах помітний той самий принцип долання очевидності. Більш показовою особливістю є те, що в європейських текстах принцип алфавітності поступово почав відображати своєрідний порядок світобудови, а тексти, організовані алфавітно, сприйматися як проекція світового порядку.

Тобто європейський книжник, бажаючи відтворити ієрархію світобудови, йшов не від неба до землі, а від альфи до омеги.

thesaurus
(c) Stanistav Kirkilewski 

В європейських текстах принцип алфавітності поступово почав відображати своєрідний порядок світобудови, а тексти, організовані алфавітно, сприйматися як проекція світового порядку.

Чи відповідають за змістом цьому принципові перші європейські словники? Найперші з них – Аристофана Візантійського, наприклад, – не збереглися, але візантійські компілятори невтомно зберігали їхню традицію, цілком чи частково інкорпоруючи старші лексикони до складу нових. Чи не підсумком такої багатовікової традиції став словник «Суда» (інакше «Свіда»). Гасла словника – це глоси (малозрозумілі слова) із грецьких класиків і грецького перекладу Біблії, до нього також уміщені енциклопедичні статті про всіх головних творців давньогрецької культури. Комбінація еллінської пайдеї і християнського благочестя. «Суда» – це словник для створення людини візантійського зразка.

Діонісієві Ареопагіту, який набуває великої популярності в Візантії приблизно тоді, коли могли компілювати «Суду», приписують трактати «Про божественні імена» і «Про небесну ієрархію». «Суда» – це божественні імена, розташовані відповідно до небесної ієрархії алфавіту.

Із новою силою зацікавлення словникарським спадком Візантії відроджується в Європі, коли Візантії вже не було як держави, але її культура залишалася. У 1499 році в Мілані видають один зі словників, близьких за традицією до «Суди». Його призначення на диво не збігалося з тим, як ми сьогодні розуміємо словник. Автор передмови до видання на взір базарного крикуна рекламує користь від цієї грубезної (понад 1000 сторінок) книги: «гебрейські, латинські і грецькі речі, гідні запам’ятовування (memoranda), всілякі історії стисло охоплює, школи і вислови філософів, оповідки поетів дивовижним відповідним чином повідомляє, відкриває покрови байок, темряву таємниць, тонкі смисли незліченнних приказок».

Дуже скоро почали укладати нові словники. Але функції за ними залишилися ті самі. Італієць Амброджо Калепіно на початку XVI століття уклав тлумачний словник латинської мови, який потім іще понад 120 років перевидавали, весь час додаючи до латинських гасел їхні переклади іншими європейськими мовами. Врешті, в останніх перевиданнях латинські слова перекладалися 11-ма і більше мовами. Цей величезний фоліант був неодмінним товаришем в освітніх подорожах молодих ренесансних шляхтичів. Він теж був синтетичним, як і всі словники, згадувані раніше: суто лінгвістична інформація зведена до мінімуму, зате енциклопедичний і «культурологічний» коментар, як би ми назвали його сьогодні, займає ледве не декілька абзаців.

Завдання такого словника – радше бути поводирем, ніж просто інформатором.

У найсхіднішому форпості тогочасного європейського світу, у Речі Посполитій, з небаченою синхронністю, менш ніж за одне десятиліття, з’являються словники мов трьох ключових народів цієї держави: польсько-латино-грецький (Г. Кнапський, Краків, 1621), церковнослов’янсько-староукраїнський (Памво Беринда, Київ, 1627), польсько-латино-литовський (К. Ширвід, Вільнюс, 1629).

Суто лінгвістична інформація зведена до мінімуму, зате енциклопедичний і «культурологічний» коментар, як би ми назвали його сьогодні, займає ледве не декілька абзаців.

Набір мов і їхня ієрархія настільки промовисті, що майже не потребують коментарів. У кожному з них національна мова зіставлена з мовами, що володіли більшим культурним престижем як мови науки, культу, справоздання.

Памво Беринда, лексикограф і друкар, найменше думав про «лексикографію». Видаючи свій словник, за яким іще кілька століть вивчали церковнослов’янську мову в багатьох православних країнах (як і за виданою трохи раніше граматикою Мелетія Смотрицького), Беринда мав на меті інше: через те, що книжна мова «трудности теж слов до вырозумінятемных многії в собі маєт, зачим и самая церков россійская многим власним сынам своим в огиду приходит». Пафос його праці – той самий, що в полемічної літератури: сформувати православного свідомого вірянина.

«Лексикон» Памви Беринди як явище культурне проступає у всій повноті лише на тлі епохи бароко, поза контекстом якої він не прочитується адекватно. Адже в літературі бароко часто натрапляємо на образи алфавіту, букваря чи словника як упорядкованого всесвіту. Приміром, твір св. Димитрія Туптала «Алфавіт духовний» чи «Разговор, называемый алфавит, или букварь мира» Григорія Сковороди. У філософії Сковороди середохресним є вчення про «сродну працю», коли кожен займає своє місце. І світ, який би був побудований за таким принципом, безсумнівно, нагадував би словник. Адже словники організовано «в алфавітному порядку» (лат. alphabeticeordine), а лат. ordо – це і є «розподіл і розміщення кожної речі на своє (відповідне) місце» (так його пояснює А. Калепіно).

Для користувачів старовинних словників, а тим паче для їхніх укладачів, словник був текстом над текстами, який мав допомогти у засвоєнні культової і культурної класики (античні тексти, Біблія). А в епоху бароко були доведені до повного вираження ті тенденції, які були закладені в ідеї європейського словника в момент його появи. Показово, що саме в осьову епоху К. Ясперса три незалежні лінгвістичні традиції – китайська, індійська, антична – спромоглися на достатній рівень лінгвістичної рефлексії, аби представити лексичне багатство своїх мов у формі суцільного списку слів. І вже в цьому, доволі простому, здавалося б, завданні вони виявили свою світоглядну розбіжність.

Потяг до алфавітності був настільки сильний у період становлення європейської модерності, що навіть перший європейський бібліографічний покажчик був алфавітно, а не тематично організованим, хоч останнє було б набагато зручніше. Творець цього монументального твору – Конрад Геснер, лікар і полімат, – видав його під назвою «Bibliotheca Universalis» 1545 року, рівно через сто років після Гутенбергового винаходу, і зібрав у ньому всі книги, як друковані, так і рукописні, які були йому доступні під час численних подорожей Європою. І тільки через три роки, 1548 року, він видає як доповнення до попередньої праці тематично організований покажчик з усіх галузей тогочасного знання (у порядку від граматики до християнського теології). Отак принцип тематичної організації поступився місцем алфавітності навіть там, де можна було б очікувати протилежного.

Європейський словник, організований алфавітно, символізує собою відхід від натурфілософського підходу до світобудови (втіленого в східних тематичних словниках) як відповідності між стихіями і істотами, вкладаючи світ у схему, не пов’язану з природними протиставленнями і циклами (небо – земля і т.д.).

Потяг до алфавітності був настільки сильний у період становлення європейської модерності, що навіть перший європейський бібліографічний покажчик був алфавітно, а не тематично організованим, хоч останнє було б набагато зручніше.

Учення атомістів було можливе там, де існує алфавіт, спершу як метафора: лат. elementumне що інше, як «а-бе-тка», але названа за першими літерами другої половини алфавіту. А «Алфавіт» і «буквар» світу можливий там, де світ членується згідно з порядком неочевидності, тобто – теорії, головного винаходу європейської цивілізації.

 

Назарій Назаров,
головний редактор часопису «Мова та історія»

 

[1]Необхідну бібліографію можна знайти в монографії автора: Назаров Н.А. Теоретичні засади та принципи української етимологічної лексикографії. – К., 2013.

Від родини до нації: мікросоціологія громадівського руху 1860-1890-х років

Урешті це один із тих випадків, коли славетне українське «кумівство» не гальмувало модернізацію, а сприяло їй через піднесення егалітарного та поступового національного руху, компенсуючи становим ресурсом брак модерних громадянських інститутів.

Практики громадської діяльності традиційно розглядають як важливий вимір модерного суспільства, а їхню активізацію – як чинник деструкції домодерних і ранньомодерних соціальних структур та ідентичностей, насамперед, станових. Останні М. Вебер визначав[1] через низку індикаторів, особливе місце серед яких належало престижу походження, і підкреслював, що станова соціалізація характеризується спільним способом життя й виховання, а відтворюється насамперед через шлюб. Continue reading “Від родини до нації: мікросоціологія громадівського руху 1860-1890-х років”

(НЕ)ідентичні окупації: що може розповісти Twitter про Донбас і Крим

Комунікація знаходиться поза інституційним контролем з боку держав та розвивається незалежно від них. Через це можливим є використання стратегії реінтеграції окупованих територій через більш активну комунікацію у соціальних мережах.

Розвиток комунікацій, поширення інтернет-покриття сприяє тому, що все більше інформації про населення соціологи можуть здобувати, не виходячи за межі свого робочого кабінету. Насамперед тут ідеться про технології Big Data (великих даних). Дедалі частіше звучать думки, що у соціолога тепер немає потреби вриватися в особисте життя громадян, адже шалене збільшення кількості оцифрованої інформації призвело до того, що «приватності більше не існує». Continue reading “(НЕ)ідентичні окупації: що може розповісти Twitter про Донбас і Крим”

Радикальна утопія Дони Гарвей: від кіборгів до хтонічних могутностей

Заклик Гарвей – перетворити цих незвичних/непомітних для нас, але надзвичайно значимих Інших у повноцінних членів суспільства, по суті, включити їх у суспільний договір, зробити частиною політичного поля, більше того, породичатися з деякими з них, а деяких ізолювати як небезпечних суперників.

Богиня vs кіборгиня

Вже пройшло понад три десятиліття відтоді, як було вперше опубліковано знаменитий «Манфест кіборгів»[1] Дони Гарвей. Цей надзвичайно провокативний, але водночас концептуально насичений текст став своєрідним зразком лівого феміністичного утопізму, створивши особливий інтелектуальний простір, де потужні імажинативні практики парадоксальної іронічної міфотворчості супроводжувались цілою низкою непомірно важливих теоретичних інтуїцій. Згодом ці інтуїції були освоєні широким колом дослідниць і дослідників, серед котрих лише частина належить до власне жіночого руху. Сама Гарвей вже давно перетворилася на персонажа масової культури, на її ім’я та ідеї можна натрапити на сторінках науково-фантастичних книг, у кіберпанківських інсталяціях, на транспарантах мітингувальників і навіть у фільмах-аніме[2]. Continue reading “Радикальна утопія Дони Гарвей: від кіборгів до хтонічних могутностей”

Діти, педофілія та педоістерія

Термін «педофілія» походить з медичного дискурсу західного суспільства. Тому педофілія початково визначалася як патологія. Проте ситуація, коли люди підлягають дискримінації просто за власні бажання, підозріло нагадує ситуацію з гомосексуальністю в ХХ сторіччі.

Часто ви думаєте про дітей? «Подумайте про дітей!» – яро гукає кожен політик, від консерватора до ліворадикала, закликаючи до порядку. «А що, як діти побачать?» – жахається гомофоб публічних поцілунків геїв і лесбійок. При цьому не боїться він, що діти побачать калюжі крові та зламані кістки тих самих, хто насмілився цілуватись на вулиці. Не знаю, як ви, але всі чомусь думають про дітей. Причому завжди у контексті захисту від тієї чи тієї напасті. Особливо – від усього, що пов’язано з сексуальністю. У зв’язку з цим найтемнішим демоном постає в сучасному світі педофіл – людина, що наважилася волею чи неволею порушити сакральний кордон між дорослим і дитячим світом. Навіть у в’язниці педофіли нижче будь-якої касти. Вони «недоторкані». Якщо геєві ще можна зламати палець чи ніс у разі супротиву сексуальним домаганням, то педофіла буквально не можна чіпати. Їм неформально заборонено навіть заходити до тюремної вбиральні, поки там перебувають «нормальні». Звідки така злостивість? Чому педофілія постає найгострішою проблемою сучасного дискурсу сексуальності? Чому нас закликають «думати про дітей»? З чого зароджується масштабна педоістерія західного світу? Continue reading “Діти, педофілія та педоістерія”

Як знайти роботу і не загубити професію: репортаж і кілька думок

Якщо вища освіта забезпечуватиме якісну міждисципланірну базу та розвиток так званих soft skills, це надаватиме людині більше простору для трансформації «верхівки» своїх знань та робитиме її значно вільнішою у прийнятті рішень.

Наприкінці цієї весни ми, тобто «СВОЄ», відвідали фінал конкурсу студентських наукових робіт із маркетингу «SMART START». Вже кілька років поспіль компанія TNS Україна проводить його в пам’ять Ігоря Ткаченка, даючи студентам можливість здійснити апробацію академічних здобутків у реальному полі та «включитися» в професійне середовище. Continue reading “Як знайти роботу і не загубити професію: репортаж і кілька думок”