Comparison of machine learning algorithms for real-time vehicle selection in transport management
This thesis compares algorithms for a dynamic pickup and delivery problem, when new orders are arriving throughout the day. The dispatchers job is to assign incoming orders to a fleet of vehicles. Historical data is used to train the algorithms, where the objective is to select the same vehicle as t...
Main Author: | |
---|---|
Format: | Others |
Language: | English |
Published: |
KTH, Skolan för elektroteknik och datavetenskap (EECS)
2018
|
Subjects: | |
Online Access: | http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-240591 |
id |
ndltd-UPSALLA1-oai-DiVA.org-kth-240591 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-UPSALLA1-oai-DiVA.org-kth-2405912018-12-21T05:56:57ZComparison of machine learning algorithms for real-time vehicle selection in transport managementengJämförelse av maskininlärnigsmodeller för transportledningsbeslut i realitidFagerlund, DavidKTH, Skolan för elektroteknik och datavetenskap (EECS)2018Computer and Information SciencesData- och informationsvetenskapThis thesis compares algorithms for a dynamic pickup and delivery problem, when new orders are arriving throughout the day. The dispatchers job is to assign incoming orders to a fleet of vehicles. Historical data is used to train the algorithms, where the objective is to select the same vehicle as the human dispatchers based on the information about the delivery and vehicles. The idea is to learn latent variables, which are common in the real world but difficult to incorporate in route optimization. The data set is compiled from deliveries from a courier company located in Stockholm, Sweden.The studied algorithms are: logistic regression, support vector machine, decision tree, feedforward neural network, and permutation invariant neural network. An additional data set based on the same deliveries is used to add all current orders for each active vehicle which is used in the permutation invariant neural network. The results show that feedforward neural networks and decision trees performed best with top 1 accuracy and top 3 accuracy respectivelly. The best performing technique for class imbalance mitigation was oversampling (duplicating samples from the minority class) which outperformed undersampling (removing samples from the majority class) and weighted cost function (additional cost when misclassifying the minority class). Rapporten jämför algoritmer för ett dynamiskt hämtningsoch leveransproblem, med nya ordrar som kommer in under hela dagen. Trafikledarens jobb är att tilldela inkommande order till en fordonsflotta. Historisk data används för att träna algoritmerna, där målet är att välja samma fordon som de mänskliga trafikledarna baserat på information om ordern och fordonen. Tanken är att lära sig latenta variabler som är vanliga i den dagliga verksamheten men svåra att använda i ruttoptimering. Datan har sammanställs från leveranser från ett budföretag i Stockholm, Sverige. Algoritmerna som studerades är: logistisk regression, stödvektormaskin, beslutsträd, artificiellt neuronnät och permutationsinvariant neuronnät. Ett ytterligare dataset baserat på samma leveranser används för att lägga till alla aktuella ordrar för varje aktivt fordon som används i det permutationsinvarianta neuronnätet. Resultaten visar att artificiella neuronnät och beslutsträd hade bäst prestanda baserat på topp 1 noggrannhet respektive topp 3 noggrannhet. Den bästa metoden för minskad klassobalans var översampling (duplicering av prov från minoritetsklassen), vilket presterade bättre än undersampling (borttagning av prov från majoritetsklassen) och viktad kostnadsfunktion (extra kostnad vid klassificering av minoritetsklassen). Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-240591TRITA-EECS-EX ; 2018:710application/pdfinfo:eu-repo/semantics/openAccess |
collection |
NDLTD |
language |
English |
format |
Others
|
sources |
NDLTD |
topic |
Computer and Information Sciences Data- och informationsvetenskap |
spellingShingle |
Computer and Information Sciences Data- och informationsvetenskap Fagerlund, David Comparison of machine learning algorithms for real-time vehicle selection in transport management |
description |
This thesis compares algorithms for a dynamic pickup and delivery problem, when new orders are arriving throughout the day. The dispatchers job is to assign incoming orders to a fleet of vehicles. Historical data is used to train the algorithms, where the objective is to select the same vehicle as the human dispatchers based on the information about the delivery and vehicles. The idea is to learn latent variables, which are common in the real world but difficult to incorporate in route optimization. The data set is compiled from deliveries from a courier company located in Stockholm, Sweden.The studied algorithms are: logistic regression, support vector machine, decision tree, feedforward neural network, and permutation invariant neural network. An additional data set based on the same deliveries is used to add all current orders for each active vehicle which is used in the permutation invariant neural network. The results show that feedforward neural networks and decision trees performed best with top 1 accuracy and top 3 accuracy respectivelly. The best performing technique for class imbalance mitigation was oversampling (duplicating samples from the minority class) which outperformed undersampling (removing samples from the majority class) and weighted cost function (additional cost when misclassifying the minority class). === Rapporten jämför algoritmer för ett dynamiskt hämtningsoch leveransproblem, med nya ordrar som kommer in under hela dagen. Trafikledarens jobb är att tilldela inkommande order till en fordonsflotta. Historisk data används för att träna algoritmerna, där målet är att välja samma fordon som de mänskliga trafikledarna baserat på information om ordern och fordonen. Tanken är att lära sig latenta variabler som är vanliga i den dagliga verksamheten men svåra att använda i ruttoptimering. Datan har sammanställs från leveranser från ett budföretag i Stockholm, Sverige. Algoritmerna som studerades är: logistisk regression, stödvektormaskin, beslutsträd, artificiellt neuronnät och permutationsinvariant neuronnät. Ett ytterligare dataset baserat på samma leveranser används för att lägga till alla aktuella ordrar för varje aktivt fordon som används i det permutationsinvarianta neuronnätet. Resultaten visar att artificiella neuronnät och beslutsträd hade bäst prestanda baserat på topp 1 noggrannhet respektive topp 3 noggrannhet. Den bästa metoden för minskad klassobalans var översampling (duplicering av prov från minoritetsklassen), vilket presterade bättre än undersampling (borttagning av prov från majoritetsklassen) och viktad kostnadsfunktion (extra kostnad vid klassificering av minoritetsklassen). |
author |
Fagerlund, David |
author_facet |
Fagerlund, David |
author_sort |
Fagerlund, David |
title |
Comparison of machine learning algorithms for real-time vehicle selection in transport management |
title_short |
Comparison of machine learning algorithms for real-time vehicle selection in transport management |
title_full |
Comparison of machine learning algorithms for real-time vehicle selection in transport management |
title_fullStr |
Comparison of machine learning algorithms for real-time vehicle selection in transport management |
title_full_unstemmed |
Comparison of machine learning algorithms for real-time vehicle selection in transport management |
title_sort |
comparison of machine learning algorithms for real-time vehicle selection in transport management |
publisher |
KTH, Skolan för elektroteknik och datavetenskap (EECS) |
publishDate |
2018 |
url |
http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-240591 |
work_keys_str_mv |
AT fagerlunddavid comparisonofmachinelearningalgorithmsforrealtimevehicleselectionintransportmanagement AT fagerlunddavid jamforelseavmaskininlarnigsmodellerfortransportledningsbeslutirealitid |
_version_ |
1718804876742361088 |