ensemble modellezés
Az ensemble modellezés két vagy több kapcsolódó, de különböző analitikus modell futtatásának folyamata, majd az eredmények szintetizálása egyetlen pontszámban vagy szórásban, a prediktív analitikai és adatbányászati alkalmazások pontosságának javítása érdekében.
A prediktív modellezésben és más típusú adatelemzésben az egyetlen adatmintán alapuló modellnek lehetnek torzításai, nagyfokú változékonysága vagy egyenesen pontatlanságai, amelyek befolyásolják az analitikai eredmények megbízhatóságát. Az egyedi modellezési technikák alkalmazása hasonló hátrányokkal járhat. Különböző modellek kombinálásával vagy több minta elemzésével az adattudósok és más adatelemzők csökkenthetik e korlátok hatásait, és jobb információkkal szolgálhatnak az üzleti döntéshozók számára.
Az együttes modellezés egyik gyakori példája a véletlen erdőmodell. Az adatbányászat ezen megközelítése több döntési fát hasznosít, egy olyan elemzési modelltípust, amelyet arra terveztek, hogy különböző változók és szabályok alapján előrejelezzen eredményeket. A véletlen erdőmodell olyan döntési fákat vegyít, amelyek különböző mintaadatokat elemeznek, különböző tényezőket értékelnek vagy a közös változókat különbözőképpen súlyozzák. A különböző döntési fák eredményeit ezután vagy egyszerű átlaggá alakítják, vagy további súlyozással aggregálják.
Az együttes modellezés egyre népszerűbbé válik, mivel egyre több szervezet telepíti az ilyen modellek futtatásához szükséges számítási erőforrásokat és fejlett analitikai szoftvereket. Emellett a Hadoop és más big data technológiák megjelenése arra késztette a vállalkozásokat, hogy nagyobb mennyiségű adatot tároljanak és elemezzenek, ami nagyobb lehetőséget teremtett az analitikai modellek különböző adatmintákon történő futtatására.