Proxyserver för passiv informationssökning

In today’s society the average person is flooded by information from everywhere. This is in particular the case when using the Internet; consider for a moment the fact that a decent search engine at this moment scans 8 058 million homepages. For a user that repeatedly comes back to the same site, th...

Full description

Bibliographic Details
Main Authors: Ahlin, Daniel, Jartelius, Martin, Tingdahl, Johanna
Format: Others
Language:Swedish
Published: Växjö universitet 2005
Subjects:
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:vxu:diva-59
id ndltd-UPSALLA1-oai-DiVA.org-vxu-59
record_format oai_dc
spelling ndltd-UPSALLA1-oai-DiVA.org-vxu-592018-01-14T05:13:26ZProxyserver för passiv informationssökningsweAhlin, DanielJartelius, MartinTingdahl, JohannaVäxjö universitetVäxjö universitetVäxjö universitet2005InformationssökningComputer SciencesDatavetenskap (datalogi)In today’s society the average person is flooded by information from everywhere. This is in particular the case when using the Internet; consider for a moment the fact that a decent search engine at this moment scans 8 058 million homepages. For a user that repeatedly comes back to the same site, the case is often that they know what they are looking for. The problem is to isolate the important information from all the other information embedding it. We would like to state that we have found one possible solution to this problem, where the user himself can define what information he is looking for at a specific server, then scan the server when visiting it with his browser. The information is then saved and made easily accessible to the user, independent of what system he is using. Our solution is based on a proxy-server, through which the user makes his connections. The server is configurable as to what information to scan for and where, as well as in what format, the data should be saved. Our method with an independent proxyserver is not as efficient as including this support into a browser, but it is enough to give proof of the concept. For high-speed connections to a server on the same network as the user, it might be possible for a user to notice that it is slowing down the connection, but it’s a matter of fractions of a second, and surfing under normal conditions the user is very unlikely to be bothered by the proxy. The actual loss in performance is the time required to make a second TCP-connection for each call, as well as a slight loss of efficiency due to Java’s thread synchronization. I dagens samhälle översvämmas vi ofta av information. Detta gäller i allra högsta grad på Internet; betänk att en bra sökmotor i skrivande stund genomsöker 8 058 miljoner hemsidor. Det händer ofta att användare vet vad de söker för typ av information, svårigheten ligger i att snabbt kunna hitta den i det gytter av annan information som den ligger inbakad i. Vi anser att vi hittat en möjlig lösning till detta problem, där användaren själv kan ange vilken information som söks på en specifik server och sedan besöka de sidor som är intressanta. Informationen sparas och görs lättillgänglig för användaren. Vår lösning är baserad på en proxyserver, genom vilken användaren ansluter, som kan konfigureras för att spara olika typer av information. Vår metod med en fristående proxyserver är inte lika effektiv som att integrera lösningen i en webbläsare, men den bevisar att konceptet är fungerande. För mycket snabba anslutningar till en webbserver är det möjligt, om än svårt, att märka att proxyservern ligger mellan användaren och servern. Tidsförlusten är tidsskillnaden mellan att öppna en eller två TCP-anslutningar, samt till viss del förlust av tid på grund av Javas trådsynkronisering. Vid normala förhållanden med surfande mot servrar som inte står på det egna nätverket är tidsförlusten marginell. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:vxu:diva-59application/pdfinfo:eu-repo/semantics/openAccess
collection NDLTD
language Swedish
format Others
sources NDLTD
topic Informationssökning
Computer Sciences
Datavetenskap (datalogi)
spellingShingle Informationssökning
Computer Sciences
Datavetenskap (datalogi)
Ahlin, Daniel
Jartelius, Martin
Tingdahl, Johanna
Proxyserver för passiv informationssökning
description In today’s society the average person is flooded by information from everywhere. This is in particular the case when using the Internet; consider for a moment the fact that a decent search engine at this moment scans 8 058 million homepages. For a user that repeatedly comes back to the same site, the case is often that they know what they are looking for. The problem is to isolate the important information from all the other information embedding it. We would like to state that we have found one possible solution to this problem, where the user himself can define what information he is looking for at a specific server, then scan the server when visiting it with his browser. The information is then saved and made easily accessible to the user, independent of what system he is using. Our solution is based on a proxy-server, through which the user makes his connections. The server is configurable as to what information to scan for and where, as well as in what format, the data should be saved. Our method with an independent proxyserver is not as efficient as including this support into a browser, but it is enough to give proof of the concept. For high-speed connections to a server on the same network as the user, it might be possible for a user to notice that it is slowing down the connection, but it’s a matter of fractions of a second, and surfing under normal conditions the user is very unlikely to be bothered by the proxy. The actual loss in performance is the time required to make a second TCP-connection for each call, as well as a slight loss of efficiency due to Java’s thread synchronization. === I dagens samhälle översvämmas vi ofta av information. Detta gäller i allra högsta grad på Internet; betänk att en bra sökmotor i skrivande stund genomsöker 8 058 miljoner hemsidor. Det händer ofta att användare vet vad de söker för typ av information, svårigheten ligger i att snabbt kunna hitta den i det gytter av annan information som den ligger inbakad i. Vi anser att vi hittat en möjlig lösning till detta problem, där användaren själv kan ange vilken information som söks på en specifik server och sedan besöka de sidor som är intressanta. Informationen sparas och görs lättillgänglig för användaren. Vår lösning är baserad på en proxyserver, genom vilken användaren ansluter, som kan konfigureras för att spara olika typer av information. Vår metod med en fristående proxyserver är inte lika effektiv som att integrera lösningen i en webbläsare, men den bevisar att konceptet är fungerande. För mycket snabba anslutningar till en webbserver är det möjligt, om än svårt, att märka att proxyservern ligger mellan användaren och servern. Tidsförlusten är tidsskillnaden mellan att öppna en eller två TCP-anslutningar, samt till viss del förlust av tid på grund av Javas trådsynkronisering. Vid normala förhållanden med surfande mot servrar som inte står på det egna nätverket är tidsförlusten marginell.
author Ahlin, Daniel
Jartelius, Martin
Tingdahl, Johanna
author_facet Ahlin, Daniel
Jartelius, Martin
Tingdahl, Johanna
author_sort Ahlin, Daniel
title Proxyserver för passiv informationssökning
title_short Proxyserver för passiv informationssökning
title_full Proxyserver för passiv informationssökning
title_fullStr Proxyserver för passiv informationssökning
title_full_unstemmed Proxyserver för passiv informationssökning
title_sort proxyserver för passiv informationssökning
publisher Växjö universitet
publishDate 2005
url http://urn.kb.se/resolve?urn=urn:nbn:se:vxu:diva-59
work_keys_str_mv AT ahlindaniel proxyserverforpassivinformationssokning
AT jarteliusmartin proxyserverforpassivinformationssokning
AT tingdahljohanna proxyserverforpassivinformationssokning
_version_ 1718610898822627328