Wednesday, March 6, 2013

Школа інфографіки, модуль перший

В суботу 2 березня я сходив на першу частину школи інфографіки, яку підготували люди з "Текстів". Ця тема викликає зараз великий інтерес, і мене в той же вечір друзі просили розповісти, що я там побачив-почув. Спробую тут все викласти.

Відразу зазначу, що побачив і почув я не так багато, бо це був лише перший "модуль", найбільш загальний і теоретичний. Всього їх має бути чотири, але між ними чомусь планується робити дуже великі паузи, що не зовсім сприятиме ефективному навчанню. Коли наступний модуль, поки неясно, десь у квітні чи травні.

***

Одне з найважливіших питань у зв'язку з темою: що є інфографікою і що нею не є? Парадоксально, але з усіх важливих питань саме цього на суботній школі не поставили :) Можливо, злякались його потенційної невирішуваності, або ж пішли по Вітгенштейну і замість визначення слова зосередились на обставинах його вжитку. Однак плутанина лишається. Приміром, нещодавні картинки журналу "Фокус" про бюджетні витрати на Януковича багато хто називає інфографікою.



Але це не інфографіка. Графічні елементи, різного роду картинки, тут відокремлені від даних і ніяк від них не залежать. Графіка тільки супроводжує інформацію. В інфографіці ж графіка репрезентує інформацію. Дані в буквальному сенсі візуалізовано.

Стаття на російському сайті "Infographer" пояснює цей момент, пропонуючи ставити уявний експеримент із кожним зображенням, щодо "інфографічності" якого виникають сумніви. Потрібно уявити ту саму картинку, але без жодного тексту і цифр, за винятком заголовку. Якщо зробити цю операцію з графікою "Фокусу", ми побачимо лише набір іконок, які самі по собі нам нічого не говорять. Подібні зображення з цифрами зараз стали популярними, як і інфографіка, тож не дивно, що їх плутають. Однак по суті це лише красиво оформлений дайджест корисної інформації на якусь тему, не більше.

Отже, в інфографіці картинка репрезентує дані, найчастіше - якісь цифри. Тому інфографікою, хай примітивною, є будь-який графік із Microsoft Excel чи Google Spreadsheets. Приміром, ось цей недолугий, який я зробив наприкінці модуля, в довгоочікуваній практичній частині:



Також інфографікою є географічні мапи, де дані зображено через зміни інтенсивності кольору на різних ділянках. Класний інтерактивний інструмент такого роду, про безробіття в різних регіонах Данії, наведено серед прикладів у викладеному "Текстами" підручнику з журналістики даних.

Інфографіка обмежується не цими прикладами, а винятково фантазією авторів. Головне - щоб дані справді було візуалізовано, а не просто прикрашено.

***

Дивлячись на свій конспект із суботнього модулю, я не вловлюю жорсткої логіки у викладі матеріалу. Слідом за вступом розповіли про відкриті бази даних, переважно українські урядові. Далі вже інший викладач, Анатолій Бондаренко: говорив про типові помилки в інфографіці; назвав найвідоміших майстрів жанру; розповів про принципи, якими варто керуватись у роботі над інфографікою; показав, як відрізняються різні типи даних; нарешті, назвав найкорисніші інструменти для роботи з даними. Я йтиму у такому ж порядку.

***

Де брати дані українському суспільно-політичному журналісту чи блогеру-активісту:
  • Сайт Верховної ради. Є інформація щодо всіх депутатів, у тому числі минулих скликань. По кожному депутату - подані ним законопроекти та депутатські запити; інформація про електронну та письмову реєстрацію в сесійній залі; всі голосування депутата; є також стенограми пленарних засідань ВР від 1991 року.
  • Сайт ЦВК. Інформація про вибори різних років. Передвиборні програми, декларації кандидатів, результати голосування; є розбиття за регіонами та округами, і ще багато всього можна нарити, особливо у післявиборній гарячці.
  • Держкомстат, куди ж без нього. Дизайн зразка 1993 року, зате всілякі макроекономічні показники, промислове та с/г виробництво, зарплати і багато всього іншого, за чим країну міряють. Актуальні дані завжди є в розділі "Статистична інформація", але більш детально все викладено у "публікаціях" та "експрес-випусках". Важливо: в розділі ЄДРПОУ => Отримання інформації з ЄДРПОУ написано, як за 13 гривень придбати у Держкомстату інформацію про будь-яке підприємство, внесене у державний реєстр. Не знаю, наскільки глибоко можна таким чином копнути, але для журналістського розслідування має згодитись.
  • Національний банк. Тут інформація досить неочевидно розміщена: крім розділу "Статистика" особливо стане в пригоді "Банківський нагляд" (там шукати власників банків та їхню фінансову звітність).
  • Закон про державний бюджет. У додатках (zip) - велетенські excel-таблиці, в які можна занурюватись на багато годин, шукаючи необґрунтовані витрати на чиновників чи ледь помітні бюджетні скорочення для науки і культури.
  • Інформаційно-ресурсний центр. Тут є єдиний державний реєстр із базовою інформацією про юридичних та фізичних осіб-підприємців (хоча даних дають мало), а також "єдиний ліцензійний реєстр".
  • SMIDA. База даних з різною інформацією про підприємства, їх акціонерів і т.д. Треба розбиратись у жаргоні фондового ринку.
  • stockmarket.gov.ua - додатковий ресурс на ту ж тему.
  • Реєстри на сайту Мін'юсту. Справді великий перелік: всілякі довіреності, нотаріуси, судові експертизи. Особливо корисними можуть бути реєстри громадських об'єднань та формувань.
  • Вісник державних закупівель. Це не шукабельна база даних, "Тексти" для свого сервісу про закупівлі мусили писати складний скрипт.
  • Державний борг України. Статистика оновлюється щомісяця.
  • Перевірка надійності бізнес-партнера. Якщо ви плануєте мати бізнес-партнера, податкова пропонує такий ось сервіс.
  • Митна вартість імпортованих товарів. У таблиці мені не все зрозуміло, але розібратись, мабуть, можна.
  • Антидемпінгові заходи Мінекономіки. Як уряд національного виробника захищає, таблиці з переліком спеціальних мит.
  • Статистика злочинності на сайті МВС. Досить детальна.
  • Споживання енергії в Україні. Дивимось, як падає імпорт газу та постачання нафти, і як зростає видобуток вугілля та експорт електрики.
  • Топ-100 забруднювачів довкілля (rar). Такий собі хіт-парад від Мінекології.
  • "Все про здоров'я українців" (rar). Статистика МОЗ у формі окремої програмки, яку вкрай важко знайти, не маючи прямого лінка. Але програмка калічна якась, чесно кажучи.
Про міжнародні бази даних майже не йшлось. Тут від себе: на них постійно посилається англійська вікіпедія в статтях на будь-які теми, особливо в статтях типу "List of countries...". Із того, що перше спадає на думку - шукати слід на сайтах UN, UNESCO, ILO (та іншіих відгалужень ООН), IMF, World Bank, CIA Factbook, OECD тощо. Для шанувальників науки - багато статистики на сайті Sciencewatch.

***

Надихатись нам запропонували видатними майстрами інфографіки. Очевидно, в кожного з них є сайт і він легко гуглиться. От тільки не певен, що правильно записав усі прізвища :)
  • Edward Tufte
  • Alberto Cairo
  • Ben Fry
  • Stephen Few
  • Francesco Franchi
  • Robert Felton
***
Частина з цих гуру також долучились до вироблення принципів хорошої інфографіки, які намагались викласти нам на школі. Серед цих принципів, мабуть, основний - це принцип співвідношення між даними і чорнилами. Це співвідношення має бути на користь даних: потрібно намагатись подати якомога більше інформації дуже помірними графічними засобами. Такий собі принцип мінімалізму, про який часто забувають у гонитві за бездумним прикрашальництвом. В усякому разі мені такий принцип імпонує.
Інші важливі принципи:
  • Не слід боятись порожнього простору. Краще хай буде пустота, ніж зайві прикраси чи додаткові дані, які тільки ускладнять сприйняття основної інформації.
  • Один візуальний атрибут = один його різновид. Тобто якщо використовуються шрифти, то варто обмежитись одним шрифтом; якщо є лінії - вони мають бути однієї товщини (за винятком випадків, коли товщина репрезентує інформацію).
  • Кольорів має бути небагато. Якщо кожен колір репрезентує якусь інформацію (наприклад, країну в круговій діаграмі), то людині важко запам'ятати прив'язку більш ніж трьох кольорів. Більше п'яти кольорів узагалі майже не сприймається.
  • Слід шукати найбільш ефективний спосіб подачі головних даних, пробуючи різні варіанти. Універсального рецепту немає. Приклад того, як The Economist шукав, як показати статистику з проекту Kickstarter - за лінком.
  • Хоча універсальних рецептів немає, але якісь спільні для більшості людей особливості сприйняття - є. Від них слід відштовхуватись. Наприклад, людині простіше побачити різницю у довжині, ніж у площі (це одна з причин, чому не радять використовувати пай-чарти, вони ж кругові діаграми). Людині погано даються кутові відстані (тому зображати довжини красивими зігнутими півколом лініями - немає сенсу). І так далі.
Взагалі, для різних типів даних - свої ефективні способи візуалізації. Можна визначати різні типи даних, у нас на школі класифікація була такою (ті, хто вчив соціологію чи статистику, побачать знайомі речі):
  • категорійні дані ("Янукович, Яценюк, Тягнибок");
  • порядкові дані ("голосуватиму за Януковича", "мабуть, за Януковича", "не визначилась", "точно не за Януковича");
  • кількісні дані ("33,2% за Януковича, 24,67% за Яценюка, 14,88% за Тягнибока");
  • реляційні дані (менш вживане, стосується відношень між об'єктами в мережі);
  • позиційні дані (наприклад, географічні координати).
Зрозуміло, що для різних даних - різне представлення. Але в деталі цього ми поки що не вдавались.

На "Текстах" є конспект іншої лекції того ж Анатолія Бондаренка, де він говорив подібні, але не зовсім ті самі речі.

***

Нарешті, нам трохи розповіли про ресурси, які допомагають у створенні інфографіки, особливо новачкам. Деякі з них відомі всім: навіть досвідчені "журналісти даних" не гребують скористатись Microsoft Excel. І зрозуміло, що для графічного дизайну найпотужнішим програмним забезпеченням є Adobe Illustrator, а для збору і обробки даних чи створення інтерактивних візуалізацій незамінним є програмування на Python, Ruby, JavaScript.

Повний список інструментів та веб-сайтів - в цій гугл-таблиці від авторів курсу. Нам особливо радили (для різних цілей), хоч і не встигли докладно описати: Google Fusion, Google Refine, Color Brewer, cartodb.com, gephi.org, NodeBox, R.
***
За один день я дізнався досить багато речей, якими ось і поспішаю поділитись. Але ясно, що ми не могли навчитись нічого практичного за такий короткий час. Більше того, навіть якщо буде іще три одноденних модулі, навряд чи це зробить із відвідувачів школи просунутих інфограферів. Журналістика даних у таких конторах, як Guardian та The Economist, передбачає співпрацю журналістів, програмістів та графічних (чи веб-) дизайнерів. На школі інфографіки в суботу були переважно просто молоді журналіст(к)и, більшість із яких не стане перевчатись на іншу спеціалізацію, навіть якщо вона стає актуальною в сучасних медіа.

Це той пункт, у якому школа інфографіки навряд чи досягне мети - спеціаліста за 4 дні зробити неможливо. Але вона, з іншого боку, може дати до цього поштовх. І головне, принаймні, для мене, - вона може дати грамотність у питаннях, які виходять за межі власне інфографіки. 
Деякі учасниці суботнього модулю на кава-брейках обурювались, мовляв, нам тут впарюють щось про квадратні корені і переконують у важливості вивчення програмування - а ми ж гуманітарії, нас такому не вчили і ми такого вчити не хочемо! Я ж більше схильний погодитись із викладачами від "Текстів": базове знання двох-трьох мов програмування (чи хоча б одного Пайтона), розуміння принципів графічного дизайну та навички роботи зі спеціальним програмним забезпеченням - усе це є, або стає, елементами необхідної грамотності для сучасної людини. Журналісти та інші гуманітарії за останні кільканадцять навчились працювати у "Ворді" та вивчили англійську, хоча колись цього від них не вимагалось. Тепер ось додались нові вимоги. Але якщо вивчили англійську, то вивчать і Пайтон, коли в цьому буде нагальна потреба :) Так мені здається. Все йде до того, що потреба буде. Тому починати варто вже зараз.

No comments:

Post a Comment