Referenties

Voorspel annulaties van treinvrachtvervoer met AI

Een groep bedrijven die in Europa zowat vijfenzeventig procent van het gecombineerde spoorvervoer uitvoert beheert train freight en trein terminals in Europa. Er worden meer dan 5 miljoen transporten verzorgd per jaar. Volle wagons zorgen voor rendabel goederenvervoer via het spoor. Het komt er dus op aan zo flexibel mogelijk om te gaan met geannuleerde boekingen en die vlot te vervangen door andere vracht. De groep had een oplossing gebaseerd op artificiële intelligentie nodig om te voorspellen hoeveel vrachtannulaties er zullen zijn.

Kun je een annulering zien aankomen?

Klanten reserveren het treinvervoer van hun loading units via een digitale hub. Het gaat dan bijvoorbeeld om een trip van Moskou naar Hamburg met de vrachtwagen, en daarna verder naar Noorwegen via het spoor. Om rendabel te zijn moet een goederentrein minstens voor negentig procent volgeboekt zijn. In de realiteit is echter niet altijd alle verwachte vracht aanwezig op het moment dat de trein vertrekt. Er zijn twee scenario’s van annulaties. Ofwel zijn deze annulaties gedaan door de klant (gedeclareerd) en de klant geeft dit in op de digitale hub. Ofwel zijn de annuleringen niet gedeclareerd en kunnen er verschillende redenen hiervoor zijn: vrachtwagen is in panne, de klant vergeet de boeking te annuleren, de vrachtwagen zit vast in het verkeer en beslist om het transport toch niet per trein te laten gebeuren maar om het traject per vrachtwagen verder te zetten, enz.

Operatoren hadden geen idee wanneer een klant een boeking zou kunnen annuleren of wanneer een vracht niet tijdig zou aankomen in de vertrekterminal. In zulke situaties is het niet evident om de capaciteit van de treinen te optimalieren. Dit is echter wel belangrijk omdat de trein aan een vaste trein wordt geboekt. Indien de capaciteit onder een bepaalde drempel komt, is dit niet meer rendabel.

Een oplossing op basis van artificiële intelligentie (AI)

SII Belgium stelde een voorspellend model op voor de annulering van geboekte vracht op Europese goederentreinen. De groep C.T. operatoren (combined transport) ging uit van één à twee procent annuleringen. In het archief bevinden zich ruim dertig miljoen records, maar data over geannuleerde opdrachten zijn daar niet bij. Wanneer een klant een boeking afzegt, is die informatie niet meer relevant voor de verdere planning van de treinen. Daarom waren er over de annuleringen geen historische data beschikbaar.

Via de analyse van de data hoopte SII Belgium verbanden te ontdekken tussen de kans op annulering en andere elementen, zoals de opdrachtgever, de chauffeur, bestemming, enzovoort. Het CRISP model werd gehanteerd. Deze methodiek werd gehanteerd in de uitvoering van het data mining project. Het data mining model werd getraind en geëvalueerd om de fouten eruit te halen.

Voor de eigenlijke analyse maakte SII Belgium gebruik van de Cortana Intelligence-suite van Microsoft, en dan vooral van de module voor machine learning. De analyse gebeurde met data uit de productiedatabank – op drie verschillende momenten – en nam ongeveer dertig mandagen in beslag. Met de two-class classification model werd data erin geïnjecteerd om dan analyseren welke grafiek geproduceerd wordt. Op basis daarvan konden we zien of het model goed was. De eerste analyse had 60.000 records als basis. Bij de tweede en derde oefening was het datavolume al gegroeid tot (B slides) 140.000 en 800.000 records. Uit de analyse kwam naar voren dat van alle reservaties gemiddeld 10,7 procent op een annulering uitdraait.

Accuraatheid van de correlaties

Er is geen significante correlatie met de beschikbare features om met zekerheid te voorspellen of een transport geannuleerd zal worden. De best scorende predictieve modellen geven geen hoge waarschijnlijkheid weer om correct te voorspellen of een loading unit niet zal aankomen in de vertrek terminal. Een substantiële correlatie tussen de annulering van een boeking en andere elementen kon het onderzoek dus niet aanwijzen. Om echt van een voorspellende analyse te kunnen spreken, moet de probabiliteit voldoende hoog liggen. Het onderzoek vond geen verbanden die toelaten om voldoende accuraat te kunnen voorspellen of een bepaalde boeking op een annulering zal uitlopen. Het feit dat er geen verbanden boven water komen, is op zich natuurlijk ook al nuttig. Het sluit alvast bepaalde veronderstellingen uit.