2min

De nieuwe infrastructure libraries maken het eenvoudiger om een lokaal draaiende generatieve AI-stack naar de cloud te verplaatsen.

“De GenAI-techstack is nieuw en in opkomst, maar bestond doorgaans uit een LLM-service en een vector data store. Het draaien van deze stack op een laptop is vrij eenvoudig, maar het in productie krijgen is veel moeilijker. Het meeste hiervan gebeurt handmatig via een CLI of een webconsole, wat handmatige fouten en herhaalbaarheidsproblemen met zich meebrengt die de veiligheid en betrouwbaarheid van het product beïnvloeden”, verklaart Pulumi.

Nieuwe libraries

Het bedrijf introduceert daarom nieuwe libraries die de “snelste manier om Infrastructure as Code te leren en bouwen” zijn. De technologie van Pulumi is ontworpen om de complexiteit van cloudinfrastructuurprovisioning en -management aan te pakken. Om generatieve AI verder te vereenvoudigen, heeft Pulumi samenwerkingen aangekondigd met Pinecone en Langchain.

De integratie met Pinecone betekent dat het Pulumi-platform nu functionaliteiten biedt om Pinecone-indexen te beheren. Deze serverless vector database maakt het voor ontwikkelaars mogelijk AI-applicaties met hoge prestaties te bouwen en te implementeren. Vooral voor large language models, generatieve AI en semantic search is een vector database handig. Daarnaast biedt Pulumi een template voor het draaien van Langchain LangServe in de containerbeheerdienst Amazon ECS.

Pulumi biedt een Infrastructure as Code (IaC)-platform. Het platform is ontworpen om snel en effectief moderne applicaties te ontwikkelen. Er zijn echter enkele uitdagingen, aangezien de cloud specifieke eisen stelt aan ontwikkelaars. De nieuwe infrastructure libraries zijn ontworpen om deze obstakels aan te pakken en de applicatieontwikkeling te vereenvoudigen.

Lees ook ons achtergrondverhaal waarin we de technologie van Pulumi uitleggen: Pulumi brengt Infrastructure-as-Code naar hoger niveau