Comparison of machine learning algorithms for real-time vehicle selection in transport management

This thesis compares algorithms for a dynamic pickup and delivery problem, when new orders are arriving throughout the day. The dispatchers job is to assign incoming orders to a fleet of vehicles. Historical data is used to train the algorithms, where the objective is to select the same vehicle as t...

Full description

Bibliographic Details
Main Author: Fagerlund, David
Format: Others
Language:English
Published: KTH, Skolan för elektroteknik och datavetenskap (EECS) 2018
Subjects:
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-240591
id ndltd-UPSALLA1-oai-DiVA.org-kth-240591
record_format oai_dc
spelling ndltd-UPSALLA1-oai-DiVA.org-kth-2405912018-12-21T05:56:57ZComparison of machine learning algorithms for real-time vehicle selection in transport managementengJämförelse av maskininlärnigsmodeller för transportledningsbeslut i realitidFagerlund, DavidKTH, Skolan för elektroteknik och datavetenskap (EECS)2018Computer and Information SciencesData- och informationsvetenskapThis thesis compares algorithms for a dynamic pickup and delivery problem, when new orders are arriving throughout the day. The dispatchers job is to assign incoming orders to a fleet of vehicles. Historical data is used to train the algorithms, where the objective is to select the same vehicle as the human dispatchers based on the information about the delivery and vehicles. The idea is to learn latent variables, which are common in the real world but difficult to incorporate in route optimization. The data set is compiled from deliveries from a courier company located in Stockholm, Sweden.The studied algorithms are: logistic regression, support vector machine, decision tree, feedforward neural network, and permutation invariant neural network. An additional data set based on the same deliveries is used to add all current orders for each active vehicle which is used in the permutation invariant neural network. The results show that feedforward neural networks and decision trees performed best with top 1 accuracy and top 3 accuracy respectivelly. The best performing technique for class imbalance mitigation was oversampling (duplicating samples from the minority class) which outperformed undersampling (removing samples from the majority class) and weighted cost function (additional cost when misclassifying the minority class). Rapporten jämför algoritmer för ett dynamiskt hämtningsoch leveransproblem, med nya ordrar som kommer in under hela dagen. Trafikledarens jobb är att tilldela inkommande order till en fordonsflotta. Historisk data används för att träna algoritmerna, där målet är att välja samma fordon som de mänskliga trafikledarna baserat på information om ordern och fordonen. Tanken är att lära sig latenta variabler som är vanliga i den dagliga verksamheten men svåra att använda i ruttoptimering. Datan har sammanställs från leveranser från ett budföretag i Stockholm, Sverige. Algoritmerna som studerades är: logistisk regression, stödvektormaskin, beslutsträd, artificiellt neuronnät och permutationsinvariant neuronnät. Ett ytterligare dataset baserat på samma leveranser används för att lägga till alla aktuella ordrar för varje aktivt fordon som används i det permutationsinvarianta neuronnätet. Resultaten visar att artificiella neuronnät och beslutsträd hade bäst prestanda baserat på topp 1 noggrannhet respektive topp 3 noggrannhet. Den bästa metoden för minskad klassobalans var översampling (duplicering av prov från minoritetsklassen), vilket presterade bättre än undersampling (borttagning av prov från majoritetsklassen) och viktad kostnadsfunktion (extra kostnad vid klassificering av minoritetsklassen). Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-240591TRITA-EECS-EX ; 2018:710application/pdfinfo:eu-repo/semantics/openAccess
collection NDLTD
language English
format Others
sources NDLTD
topic Computer and Information Sciences
Data- och informationsvetenskap
spellingShingle Computer and Information Sciences
Data- och informationsvetenskap
Fagerlund, David
Comparison of machine learning algorithms for real-time vehicle selection in transport management
description This thesis compares algorithms for a dynamic pickup and delivery problem, when new orders are arriving throughout the day. The dispatchers job is to assign incoming orders to a fleet of vehicles. Historical data is used to train the algorithms, where the objective is to select the same vehicle as the human dispatchers based on the information about the delivery and vehicles. The idea is to learn latent variables, which are common in the real world but difficult to incorporate in route optimization. The data set is compiled from deliveries from a courier company located in Stockholm, Sweden.The studied algorithms are: logistic regression, support vector machine, decision tree, feedforward neural network, and permutation invariant neural network. An additional data set based on the same deliveries is used to add all current orders for each active vehicle which is used in the permutation invariant neural network. The results show that feedforward neural networks and decision trees performed best with top 1 accuracy and top 3 accuracy respectivelly. The best performing technique for class imbalance mitigation was oversampling (duplicating samples from the minority class) which outperformed undersampling (removing samples from the majority class) and weighted cost function (additional cost when misclassifying the minority class). === Rapporten jämför algoritmer för ett dynamiskt hämtningsoch leveransproblem, med nya ordrar som kommer in under hela dagen. Trafikledarens jobb är att tilldela inkommande order till en fordonsflotta. Historisk data används för att träna algoritmerna, där målet är att välja samma fordon som de mänskliga trafikledarna baserat på information om ordern och fordonen. Tanken är att lära sig latenta variabler som är vanliga i den dagliga verksamheten men svåra att använda i ruttoptimering. Datan har sammanställs från leveranser från ett budföretag i Stockholm, Sverige. Algoritmerna som studerades är: logistisk regression, stödvektormaskin, beslutsträd, artificiellt neuronnät och permutationsinvariant neuronnät. Ett ytterligare dataset baserat på samma leveranser används för att lägga till alla aktuella ordrar för varje aktivt fordon som används i det permutationsinvarianta neuronnätet. Resultaten visar att artificiella neuronnät och beslutsträd hade bäst prestanda baserat på topp 1 noggrannhet respektive topp 3 noggrannhet. Den bästa metoden för minskad klassobalans var översampling (duplicering av prov från minoritetsklassen), vilket presterade bättre än undersampling (borttagning av prov från majoritetsklassen) och viktad kostnadsfunktion (extra kostnad vid klassificering av minoritetsklassen).
author Fagerlund, David
author_facet Fagerlund, David
author_sort Fagerlund, David
title Comparison of machine learning algorithms for real-time vehicle selection in transport management
title_short Comparison of machine learning algorithms for real-time vehicle selection in transport management
title_full Comparison of machine learning algorithms for real-time vehicle selection in transport management
title_fullStr Comparison of machine learning algorithms for real-time vehicle selection in transport management
title_full_unstemmed Comparison of machine learning algorithms for real-time vehicle selection in transport management
title_sort comparison of machine learning algorithms for real-time vehicle selection in transport management
publisher KTH, Skolan för elektroteknik och datavetenskap (EECS)
publishDate 2018
url http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-240591
work_keys_str_mv AT fagerlunddavid comparisonofmachinelearningalgorithmsforrealtimevehicleselectionintransportmanagement
AT fagerlunddavid jamforelseavmaskininlarnigsmodellerfortransportledningsbeslutirealitid
_version_ 1718804876742361088