Twitter heeft op 10 april 2010 een overeenstemming ondertekend waarbij het toestemming geeft aan de Library of Congress, de Amerikaanse Nationale Bibliotheek, dat het elke tweet die op het sociale netwerk geplaatst wordt mag opslaan in een archief. Op dit moment worden er via Twitter zo’n 500 miljoen tweets per dag verstuurt, wat betekent dat er op dit moment zo’n 170 miljard tweets zijn opgeslagen in de database van de Library of Congress.
De Library of congress beschikt over alle Tweets die ooit zijn verzonden en gaat nu proberen om de data beschikbaar te maken voor wetgevers en onderzoekers. De overeenkomst biedt ruimte voor de bibliotheek om een half jaar na publicatie van de tweet, deze vrij te geven, mits deze niet gebruikt wordt voor winstbejag of herdistributie.
Het volledige Twitter-archief bestaat op dit moment uit 133,2 terabyte aan data. Er zijn twee kopieën van die bewaart worden op verschillende locaties om de veiligheid te garanderen.
De Library of Congress geeft aan dat het inmiddels al 400 aanvragen heeft gehad van onderzoekers die toegang willen tot de tweets. De verzoeken zijn zeer verschillend, zo zijn er aanvragen voor onderzoeken naar burgerjournalistiek, vaccinatie-tarieven en trends op de beurs.
De hele collectie van de Library of Congress bestaat uit meer dan 34,5 miljoen boeken en 66,6 miljoen manuscripten. Officieel is de bibliotheek bedoelt voor het U.S. Congress, maar in de praktijk wordt de bibliotheek gebruikt door het hele land.