De topologie van het Web en het land van de porno

Reactie op ‘Internet bestaat grotendeels uit porno’ uit het NRC Next van 22 oktober 2012, door Reinier Kist.

In de rubriek NRC Checkt reageert Reinier Kist op de bewering dat het internet voor de helft uit porno bestaat. Hij doet hierbij een poging om de populariteit van porno op het internet in kaart te brengen en dat is niet gemakkelijk. Kijken naar het aandeel van pornosites in het totale dataverkeer blijkt geen oplossing: filmpjes nemen nu eenmaal veel ruimte in. Ook het aantal websites geeft geen goed beeld, want dat de sites bestaan wil niet zeggen dat ze ook bezocht worden. Wat overblijft is het internetverkeer, het aantal bezoekers dat een website trekt, maar ook dat is geen goede indicator, stelt Kist. Want nog altijd weet niemand hoe groot het internet daadwerkelijk is, niet alle pagina’s zijn door middel van zoekmachines te vinden en hierdoor wordt ook veel internetverkeer niet geregistreerd.

Dat het internet moeilijk in kaart te brengen is is al lang bekend. Toch worden er steeds weer pogingen gedaan om de grootte ervan in te schatten en om orde te scheppen in de overvloed aan websites. In 2002 schrijft Albert-László Barabási dat het de structuur van het World Wide Web is dat dit zo moeilijk maakt:

The World Wide Web is a scale-free network, dominated by hubs and nodes with a very large number of links. But, as we will see next, this large-scale topology coexists with numerous small-scale structures that severely limit how much we can explore simply by clicking our way along the links (Barabási 2002).

Barabási stelt dat het Web uit vier continenten bestaat, die elk hun eigen verkeersregels hanteren. Het eerste continent is de central core, die ongeveer een kwart van alle websites omvat (167). Dit zijn veelal grote websites zoals Facebook.com en CNN.com, die meestal naar elkaar linken en daarom makkelijk te navigeren zijn. De tweede en derde continenten noemt Barabasi de IN en OUT continenten, die al moeilijker te bereiken zijn. Vanaf het IN continent is de central core makkelijk te bereiken, maar de central core linkt niet terug naar het IN continent. Voor het OUT continent geldt het tegenovergestelde: deze is vanaf de central core te bereiken maar het OUT continent linkt niet terug naar de grote websites. Dan zijn er nog de tendrils en disconnected islands, die wel aan elkaar gelinkt zijn maar los zijn van het ‘vasteland’, de central core en de IN en OUT continenten. Het is vaak zo dat website met dezelfde standpunten en bedoelingen naar elkaar linken, stelt Cas Sunstein in Republic.com (59). Hier zit een mechanisme achter die de topologie van het web verandert:

The four continents are not the only isolated structures of the Web. On a smaller scale, these continents are sprinkled with vibrant villages and metropoli. These are Websites brought together by a joint idea, hobby, or habitat, forming communities of shared interests (Barabási 168).

Links spelen dus een fundamentele rol bij de ordening en navigeerbaarheid van het Web, maar ook bij de vorming van gemeenschappen. Ook bij het online pornonetwerk blijkt dit zo te zijn, laat Ruslan Enikeev met The Internet Map zien. Daar vormen de pornosites bijna een land, even groot als Brazilië, dat zo’n vijf procent van het totale internetverkeer in beslag neemt. Gilbert Wondracek et al. brengen de porno-industrie op het internet wat gedetailleerder in kaart en maken een onderscheid tussen verschillende soorten websites die elk een andere functie in het netwerk bezetten. De eerste website die zij noemen is de paysite, die fungeert als de leverancier van content en economisch centrum, omdat bezoekers moeten betalen voor toegang tot de inhoud van de website (Wondracek et al. 6). De links die paysites ontvangen komen van de zogenoemde link collections, websites die gratis content aanbieden en uiteindelijk doorlinken naar de paysites. Dit is een constructie waar de link collections mee verdienen, omdat ze elke link als advertentie zien en hiervoor betaald worden. De link collections leveren zelf geen content maar geven alleen weer wat de paysites aanbieden. Opmerkelijk is dat de paysites zelf ook clusters vormen van sites met dezelfde eigenaren, omdat sites worden opgesplitst om een grotere diversiteit aan te bieden (7). Ook sites die gratis content bieden vormen een netwerk op zich, maar in tegenstelling tot de paysites linken de websites ook naar elkaar als ze door verschillende eigenaren worden beheerd. Dit betekent dat de websites samenwerken om meer bezoekers te kunnen krijgen. Hoe meer hyperlinks de websites namelijk verzamelen, hoe sneller ze zullen worden opgemerkt door zoekmachines. Hierdoor stijgt de relevantie van de sites en haalt elke site uiteindelijk voordeel uit de samenwerking.

Deze uitwerking van het pornocluster gaat een stapje verder dan de beschrijving van de topologie van het internet die Barabási introduceert. Zoals Barabási al stelde bestaan de vier continenten uit kleinere clusters van websites die bij elkaar worden gehouden door interesse en functie en dat laat de analyse van Wondracek et al. goed zien. Het in kaart brengen van de populariteit van porno op het internet heeft Reinier Kist al grotendeels gedaan, hoewel dit voor geen enkel cluster precies gedaan kan worden vanwege de enorme groei en grootte van het web. Wel helpt een benadering waarbij wordt gekeken naar links binnen een netwerk om een beter beeld te krijgen van hoe een netwerk in elkaar zit.

 

Bronnen

Barabási, Albert-László. 2002. Linked: How Everything Is Connected to Everything Else and What It Means. Cambridge, MA: Perseus, 161-178.

Sunstein, Cass. 2001. Republic.com. Princeton: Princeton University Press, 51-88.

Wondracek, Gilbert. et al. 2010. “Is the internet for porn? An insight into the online adult industry”. In Proc. (online) WEIS’10, Cambridge, MA. <http://iseclab.org/papers/weis2010.pdf>

Dit artikel is geschreven door op 02/11/2012 en is terug te vinden onder Metareports, nrc.next, WG01. Het artikel is getagged met , , , , .
Blijf op de hoogte van reacties middels RSS 2.0 feed. Je kunt een reactie achter laten, of een trackback vanaf je eigen site maken.

2 Responses to “De topologie van het Web en het land van de porno”

  1. MKerssens on 06/11/2012 at 12:38

    Interessante metareport. Het lijkt mij ook vrij lastig om het hele web in kaart te brengen, vooral omdat websites ook ophouden te bestaan. Links zijn inderdaad een effectieve manier om het verkeer op het internet in kaart te brengen, maar zegt natuurlijk niet alles. Porno is een populair onderwerp hierin, maar het lijkt mij toch ook een heel moeilijk onderwerp om in kaart te brengen, aangezien iedereen het in principe zou kunnen plaatsen op het internet.
    Van alle auteurs die je aanhaalt, denk ik dat Gilbert Wondracek de beste manier toepast, door de verschillende websites op te delen en zo te kijken naar hoe de links onderling tot stand komen. Of internet inderdaad voor de helft uit porno bestaat, lijkt me bijna onmogelijk.

  2. Steven on 06/11/2012 at 16:40

    Van alle clusters van websites, lijken de porno websites me het meest afgesloten van de rest van de wereld. Waar veel ‘eilanden’ niet met elkaar verbonden zijn door een gebrek aan connectie tussen content, speelt bij porno de grote factor van taboe en schaamte ook mee. De links komen niet of nauwelijks tot stand naar dit eiland omdat het ongepast en in veel gevallen zelfs aanstootgevend kan zijn om te linken naar dit soort content. Onderling linken ze wel vaak, omdat dit natuurlijk grote commerciele voordelen heeft.

Leave a Reply

Recente reacties

Recente nieuwsberichten

Tags