133TB aan tweets opgeslagen in Library of Congress

Twitter heeft op 10 april 2010 een overeenstemming ondertekend waarbij het toestemming geeft aan de Library of Congress, de Amerikaanse Nationale Bibliotheek, dat het elke tweet die op het sociale netwerk geplaatst wordt mag opslaan in een archief. Op dit moment worden er via Twitter zo’n 500 miljoen tweets per dag verstuurt, wat betekent dat er op dit moment zo’n 170 miljard tweets zijn opgeslagen in de database van de Library of Congress.

De Library of congress beschikt over alle Tweets die ooit zijn verzonden en gaat nu proberen om de data beschikbaar te maken voor wetgevers en onderzoekers. De overeenkomst biedt ruimte voor de bibliotheek om een half jaar na publicatie van de tweet, deze vrij te geven, mits deze niet gebruikt wordt voor winstbejag of herdistributie.

Het volledige Twitter-archief bestaat op dit moment uit 133,2 terabyte aan data. Er zijn twee kopieën van die bewaart worden op verschillende locaties om de veiligheid te garanderen.

De Library of Congress geeft aan dat het inmiddels al 400 aanvragen heeft gehad van onderzoekers die toegang willen tot de tweets. De verzoeken zijn zeer verschillend, zo zijn er aanvragen voor onderzoeken naar burgerjournalistiek, vaccinatie-tarieven en trends op de beurs.

De hele collectie van de Library of Congress bestaat uit meer dan 34,5 miljoen boeken en 66,6 miljoen manuscripten. Officieel is de bibliotheek bedoelt voor het U.S. Congress, maar in de praktijk wordt de bibliotheek gebruikt door het hele land.

Lees meer over Infrastructure

Expert aan het woord

Tech calendar

133TB aan tweets opgeslagen in Library of Congress

Blijf op de hoogte, abonneer!

GitHub Copilot, AI-assistent van het eerste uur, staat zwaar onder druk

Claude Fable 5 en Mythos 5 geblokkeerd: is AI nu te gevaarlijk?

Scaling at speed: Hoe AI de blauwdruk van het moderne datacenter herschrijft

AI zet decennia cybersecurity op zijn kop

Buying GPUs doesn't deliver AI value, according to AWS

Why enterprises are choosing HPE for private cloud AI

Why observability is critical for AI code generation success

How HPE brought two networking giants together in under one year

De strategische opdracht: bouwen aan een AI-stack waar Europa op kan vertrouwen

De rol van een WMS systeem in de moderne IT-architectuur

Liquid cooling dwingt datacenters tot andere ontwerpkeuzes

Slimmer vergaderen begint met het juiste ecosysteem

GITEX AI EUROPE 2026

GOTO Copenhagen 2026

Tijd om virtualisatie te evalueren

Klarrio: Architectuur is grootste knelpunt of grootste versneller

Zo gaat jouw IT-organisatie van reactief trainen naar roadmap-gedreven skills-opbouw