Facebook maakt PyText-framework voor natural language-systemen open source

Abonneer je gratis op Techzine!

Facebook heeft een nieuw modeling-framework voor natural language processing (NLP) systemen open source gemaakt. Het gaat om PyText, dat het gat tussen het experimenteren met zulke systemen en het draaiend krijgen van de systemen moet dichten. Dat meldt Silicon Angle.

PyText is volgens de ontwikkelaars van Facebook handig, omdat het bouwen van de neurale netwerken die je voor NLP-systemen nodig hebt traditioneel vaak een lastig onderdeel is. Er zit namelijk een verschil tussen de frameworks geoptimaliseerd voor het experimenteren en die geoptimaliseerd voor productie.

Het bouwen van een NLP-systeem vereist veelal uitgebreide trainingen en het testen van tientallen AI-modellen. Veel van het trainen en testen gebeurt op frameworks die zich richten op onderzoek. Volgens Facebook zijn die handig, omdat ze een eenvoudige interface bieden die het maken van de modellen sneller laten gaan.

Maar die frameworks zijn niet geschikt voor het draaien van NLP-systemen die in productie zijn. Reden is dat de modellen die zulke systemen gebruiken last hebben van een verhoogde latency en geheugengebruik. Er bestaan al wel frameworks voor productie die deze problemen kunnen oplossen, maar die zouden het moeilijk maken om dynamische representaties van tekst te creëren. Dat is een vereiste voor ieder betrouwbaar NLP-systeem, aldus het bedrijf.

PyText

Daarom besloot Facebook om het open source PyText te ontwikkelen. Dat is een software library, gebouwd op het open source PyTorch deep learning-framework. PyText is gemaakt om aan de specifieke eisen van het maken van NLP-modellen te voldoen. Dit doet het door een eenvoudigere workflow te bieden waarmee het mogelijk is om sneller te experimenteren. Daarnaast biedt het toegang tot diverse vooraf gemaakte architecturen voor modellen, evenals tools voor het verwerken van tekst en het managen van de vocabulaire.

Ook kan PyText toegang krijgen tot het bredere PyTorch-ecosysteem. Dat heeft zijn eigen tools en modellen voor NLP-systemen. PyText maakt het mogelijk om zowel te experimenteren met NLP-systemen als om ze te in productie te plaatsen voor taken als het classificeren van documenten en semantic parsing.