2min

Tags in dit artikel

, , ,

Een onderzoeksteam binnen Salesforce ontwikkelt een systeem dat zakelijke gebruikers ertoe in staat stelt met databases te communiceren zonder bijvoorbeeld kennis van SQL te hoeven hebben. Het systeem draagt de naam Seq2SQL en is in feite een neuraal netwerk. Dat zet natuurlijke taal om naar SQL-queries.

Dat schrijft ZDNet in een bericht over het onderzoek. Zo kunnen gebruikers een vraag invoeren als “welke accounts hebben de laagste klanttevredenheidsscores”, waarop het systeem op zoek gaat naar de juiste database en met resultaten komt. Salesforce lijkt een oplossing gevonden te hebben voor een belangrijk probleem.

“We hebben meer dan één manier om een query op een correcte manier op te stellen,” legt onderzoeker Victor Zhong uit tegenover de site Techcrunch. “Als ik een natuurlijke vraag stel, zijn er twee of drie manieren om de query op te stellen. We gebruiken reinforcement learning om het gebruik van queries die hetzelfde resultaat opleveren te gebruiken.” Er wordt dus aan gewerkt om het aantal mogelijke vertalingen voor woorden of zoekopdrachten te minimaliseren. Precies daardoor zou het systeem nauwkeurige resultaten moeten opleveren.

WikiSQL

Een andere belangrijke bijdrage van Salesforce aan deze ontwikkeling, is de samenstelling van een WikiSQL dataset. Die werd gebruikt om het model te helpen bouwen. Het gaat om een opensource dataset, die op dit moment al meer dan 87.000 vragen in natuurlijke taal, SQL-queries en SQL-tabellen bevat.

Ook andere bedrijven werken aan het vereenvoudigen van SQL-gebruik. Meestal staat echter een vrij star vertaalmodel centraal. Als er geen match is in de vertaaldatabase, maakt dat het vinden van overeenkomsten moeilijk. Machine learning kan daar een belangrijke oplossing in vormen. De oplossing van Salesforce is in die zin dus veelbelovend.

Klik op de volgende link om de paper (in PDF-formaat) van Salesforce over Seq2SQL te lezen.