top of page
  • szudejkomichal

KNIME: Przydatne i darmowe narzędzia do tworzenia wizualizacji, poradnik

Zaktualizowano: 7 gru 2023

Ten post jest czwartym z mini cyklu, w którym przedstawiam przydatne, darmowe i proste w obsłudze narzędzia, które umożliwiają tworzenie efektownych wizualizacji.


Dziś skupię się na narzędziu KNIME.

Heatmap, obraz wygenerowany w ChatGPT i DALL-E 3

KNIME

KNIME to platforma analityczna używana do przetwarzania, analizy i modelowania danych. Charakteryzuje się modelem dystrybucji typu open source i interfejsem graficznym, który umożliwia użytkownikom tworzenie przepływów pracy bez konieczności pisania kodu. Dzięki zestawowi gotowych do użycia węzłów, które można przeciągać i upuszczać, użytkownicy mogą realizować różnorodne zadania, od prostego czyszczenia danych po zaawansowane analizy i uczenie maszynowe.


KNIME jest używany w różnych dziedzinach gdzie analiza danych odgrywa kluczową rolę, ale jego wydajność i zakres możliwości mogą się różnić w zależności od złożoności zadania i wielkości danych. Jako narzędzie open source, KNIME jest rozwijane przez społeczność, co oznacza, że jego funkcjonalności mogą być nierównomierne, a wsparcie techniczne opiera się głównie na dokumentacji i społeczności użytkowników.


W dzisiejszym poście skupimy się na jednej z wielu możliwości KNIME, jaką jest generowanie wizualizacji. Jak za chwilę zobaczycie, nie są może one specjalnie efektowne. Niemniej, do zalet KNIME należy łatwość ich przygotowania oraz to, że można to zrobić całkowicie lokalnie.

Rodzaje wizualizacji dostępne w KNIME.
Rodzaje wizualizacji dostępne w KNIME. Zrzut ekranu wykonany przez autora.

Pracę z KNIME przedstawię na przykładzie wykresu mapy ciepła (ang. heatmap chart).

Przykład heatmapy. Obraz wygenerowany przez autora na podstawie syntetycznych danych.
Przykład heatmapy. Obraz wygenerowany przez autora na podstawie syntetycznych danych.

Mapa ciepła (heatmap) to graficzna reprezentacja danych, w której wartości w macierzy są reprezentowane za pomocą kolorów. Służy ona do wizualizacji złożonych danych i pomaga w identyfikacji wzorców, korelacji oraz wyróżnianiu obszarów o wysokiej i niskiej intensywności. Jest często stosowana w statystyce, analizie danych, bioinformatyce (np. do przedstawiania poziomu ekspresji genów) oraz w wielu innych dziedzinach, gdzie potrzebne jest przedstawienie danych w postaci dwuwymiarowej macierzy.


Jak przygotować wizualizację w KNIME?

Krok 1. Zdobądź i przygotuj dane.

Rozpocznij od zebrania i starannego przygotowania potrzebnych danych. Upewnij się, że są one wiarygodne i kompleksowe. W tym etapie zwróć uwagę na selekcję istotnych informacji. Po wybraniu narzędzia, konieczne może być też dostosowanie danych do jego wymagań.

Na potrzeby dzisiejszego postu, wygenerowałem syntetyczne dane w ChatGPT oraz Advanced Data Analysis.


Dekalog wizualizacji, to zbiór fundamentalnych zasad, które pomogą Ci stworzyć wizualizacje wspierające narrację opartą na danych. Szerzej opisałem go w tym artykule.


Krok 3. Wybierz typ wizualizacji.

Projektowanie wizualizacji odbędzie się w KNIME. Skorzystamy z wykresu "Heatmap".


Krok 4. Wprowadź dane i przygotuj wizualizację.

Pierwszym krokiem będzie pobranie i uruchomienie KNIME. Niezbędny zestaw plików pobieramy z witryny https://www.knime.com/download. Niekiedy występuje trudność w pobraniu plików (ja również napotkałem ten problem). Wtedy sugeruję weryfikację informacji ze strony https://www.knime.com/installation-problems-on-windows. W moim przypadku konieczne było skorzystanie z alternatywnego linka do pobrania programu. Samo KNIME nie wymaga instalacji, wystarczy rozpakować pliki do wybranego katalogu. Po rozpakowaniu uruchamiamy program.


Ikona programu KNIME.
Ikona programu KNIME. Zrzut ekrany wykonany przez autora.

W samym programie, najpierw tworzymy nowy Workflow.

Tworzenie nowego workflow w KNIME.
Tworzenie nowego workflow w KNIME. Zrzut ekranu wykonany przez autora.

Aby dodać dane, przeciągamy i upuszczamy ikonę pliku, w którym je zapisaliśmy do okna workflow.

Dodanie źródła danych.
Dodanie źródła danych. Zrzut ekranu wykonany przez autora.

Po dwukrotnym kliknięciu na ikonę pobranego pliku możemy dokonać jego transformacji np. ukryć niepotrzebne wiersze czy kolumny oraz np. zmienić format danych.

Następnie dodajemy wizualizację heatmapy. W tym celu przeciągamy odpowiednią ikonę do pola workflow.


Dodanie kreatora wykresu Heatmap.
Dodanie kreatora wykresu Heatmap. Zrzut ekranu wykonany przez autora.

W menu "Configure" wykresu heatmap, w tabie "View Configuration" zaznaczamy opcję "Create image at outport". Dzięki temu będziemy mogli później wygenerować obrazek z naszą wizualizacją.

Konfiguracja wykresu heatmap.
Konfiguracja wykresu heatmap. Zrzut ekranu wykonany przez autora.

Kolejnym etapem jest połączenie obydwu węzłów naszego przepływu. W tym celu zaznaczamy obydwa lewym przyciskiem myszy trzymając jednocześnie wciśnięty klawisz Ctrl. Następnie klikamy na którykolwiek węzeł prawym przyciskiem myszy i wybieramy "Connect selected nodes".

Łączenie węzłów.
Łączenie węzłów. Zrzut ekranu wykonany przez autora.

Ostatnim krokiem jest uruchomienie całego przepływu.

W tym celu wybieramy polecenie "Execute and Open Views.

Uruchomienie przepływu.
Uruchomienie przepływu. Zrzut ekranu wykonany przez autora.

I otrzymujemy naszą wizualizację. Zwróćcie uwagę, iż jest ona interaktywna.

Podgląd wizualizacji w programie KNIME.
Podgląd wizualizacji w programie KNIME. Zrzut ekranu wykonany przez autora.

Jeżeli chcielibyśmy wygenerować obrazek z naszą wizualizacją, np. celem zamieszczenia go w prezentacji, dodajemy node "Image Writer (Port)" i łączymy go z poprzednim krokiem.

Dodanie węzła zapisu do obrazka.
Dodanie węzła zapisu do obrazka. Zrzut ekranu wykonany przez autora.

Ostatnim krokiem jest wskazanie ścieżki do zapisu pliku oraz jego nazwy. Dodatkowo zaznaczyłem opcję "Create missing folders", co umożliwia dotworzenie brakujących folderów ze wskazanej przez nas ścieżki oraz "Overwrite" aby nadpisać plik jeżeli chciałbym kilkakrotnie go wygenerować.

Konfiguracja generowania obrazka z wizualizacją.
Konfiguracja generowania obrazka z wizualizacją. Zrzut ekranu wykonany przez autora.

A oto produkt końcowy.

Wizualizacja wygenerowana w KNIME.
Wizualizacja wygenerowana w KNIME.

Podsumowanie

Niniejszy post jest czwartym z serii traktującej o darmowych i prostych narzędziach do tworzenia wizualizacji danych. Dziś pokazałem Wam możliwości KNIME, na przykładzie wykresu mapy ciepła.


Zalety KNIME to m.in.

  • duży wybór wizualizacji,

  • prosty w obsłudze, graficzny interface,

  • interaktywność wizualizacji,

  • bardzo prosta obsługa "drag & drop";

  • łatwość pobrania wizualizacji (np. do pliku *.svg);

  • możliwość wprowadzania danych lokalnie;

  • brak konieczności instalacji plików.

Wady to:

  • praca z programem w pierwszych minutach może przytłaczać;

  • generowane wizualizacje nie są najbardziej atrakcyjne wizualnie.

 

Źródła:

  1. Michał Szudejko, Dekalog wizualizacji


Wcześniej w tej serii opublikowano:

 
Ikona subskrypcji

Podobał się Ci ten post? Zachęcam do subskrypcji!

Comentarios


bottom of page