ensemble modeling
Ensemble modeling jest procesem uruchamiania dwóch lub więcej powiązanych, lecz różnych modeli analitycznych, a następnie syntetyzowania wyników w pojedynczy wynik lub rozkład w celu poprawy dokładności analityki predykcyjnej i aplikacji eksploracji danych.
W modelowaniu predykcyjnym i innych rodzajach analityki danych, pojedynczy model oparty na jednej próbce danych może mieć błędy, wysoką zmienność lub jawne niedokładności, które wpływają na wiarygodność jego wniosków analitycznych. Stosowanie określonych technik modelowania może mieć podobne wady. Łącząc różne modele lub analizując wiele próbek, naukowcy i inni analitycy danych mogą zmniejszyć skutki tych ograniczeń i dostarczyć decydentom biznesowym lepszych informacji.
Jednym z powszechnych przykładów modelowania zespołowego jest model lasu losowego. To podejście do eksploracji danych wykorzystuje wiele drzew decyzyjnych, rodzaj modelu analitycznego, który jest przeznaczony do przewidywania wyników na podstawie różnych zmiennych i reguł. Model lasu losowego łączy drzewa decyzyjne, które mogą analizować różne próbki danych, oceniać różne czynniki lub różnie ważyć wspólne zmienne. Wyniki różnych drzew decyzyjnych są następnie przekształcane w prostą średnią lub agregowane poprzez dalsze ważenie.
Modelowanie zespołowe zyskało na popularności, ponieważ więcej organizacji wdrożyło zasoby obliczeniowe i zaawansowane oprogramowanie analityczne potrzebne do uruchomienia takich modeli. Ponadto, pojawienie się Hadoop i innych technologii big data doprowadziło firmy do przechowywania i analizowania większych ilości danych, tworząc zwiększony potencjał do uruchamiania modeli analitycznych na różnych próbkach danych.
.