De mest kreativa och inflytelserika idéerna inom mjukvara dyker ofta upp som öppen källkod. Genom att dela med sig av kod inbjuds en world gemenskap av bidragsgivare att arbeta tillsammans för att driva ett projekt framåt. Artificiell intelligens är inget undantag. Även om AI:s behov av datorkraft kan begränsa individuella prestationer, kan ett distribuerat workforce få jobbet gjort. AI är en teknisk area där summan av alla ansträngningar verkligen är större än delarna.
Här har vi samlat 11 AI-projekt med öppen källkod som gör utvecklarens jobb lite enklare. Vissa finjusterar processen för att träna modeller, medan andra hjälper dig att hitta eller komma åt de datakällor du behöver. Det finns produktivitetshack, prestandaoptimerare, SQL-wranglers och mer.
Tillsammans låter dessa projekt oss se hur innovationer inom AI förvandlar drömmen om en good, kännande dator until en vardaglig del av våra liv och vårt arbete. Använd dem som utgångspunkt för dina egna projekt eller som en plan för hur du kan skapa något fantastiskt när inspirationen slår until.
Upscayl
Ibland behöver en bild bara lite mer detaljer för att se bra ut på en sida. Upscayl (se Github-projektet här) ökar bildupplösningen för den skärpa och detaljrikedom du söker. Om du har rätt hårdvara är det ett bra sätt att förbättra digitala konstverk eller lägga until detaljer i ett fotografi. Kom bara ihåg att AI i stort sett hallucinerar dessa detaljer. Det betyder att Upscayl är perfekt för att förbättra fiktiva bilder som skapats av en digital konstnär, males det är inte lika bra för bilder som kräver absolut noggrannhet, until exempel att dokumentera bevis på en brottsplats.
Nyro
Utvecklare tillbringar en hel del tid med att interagera med datorns operativsystem through kommandoraden. Även om de är lätta att förbise, räknas alla dessa sekunder ihop. Nyro är ett open source-projekt skrivet ovanpå Electron som hanterar vardagliga uppgifter som att ta skärmdumpar, ändra storlek på fönster och synkronisera information mellan applikationer. Genom att automatisera vardagliga uppgifter som dessa kan du spara många små bråkdelar av tid, vilket i slutändan ger en stor produktivitetsökning.
Geppetto
Vissa utvecklingsteam gör det mesta av sitt arbete i Slack-kanaler, så inläggen blir i slutändan en ganska stable första generationens dokumentation. (*11*) är en Slackbot som ansluter dina kanaler med flera olika LLM (Open AI, Anthropic och Gemini), som kan städa upp och förbättra dina funderingar. Geppetto skickar until och med en förfrågan until Dall-E om du vill att konst ska ge liv åt din dokumentation.
E2B
De tidigaste LLM:erna svarade på frågor och skapade kanske lite konst med hjälp av all kunskap i deras träningsset. Males tänk om de var fria att ströva omkring på Web och använda samma verktyg som människor? E2B är en agentsandlåda som låter LLM:er ansluta until många av de verktyg som vi människor använder varje dag. Det innebär webbläsare, Github-kodarkiv och kommandoradsverktyg som linters. LLM:er kan sedan använda kraften i dessa verktyg för att göra användbara saker som att hantera molninfrastruktur, så att människor inte behöver göra det.
Dataline
Det är inte alla som vill ladda upp alla sina information until någon avlägsen AI GPU för träning. Dataline använder en LLM för att generera SQL-kommandon som suger ut information ur databasen. Sedan skapar koden en information science-rapport med hjälp av en lokal anslutning until de lokala information. Det är en hybridmetod som kombinerar klassiska information science-algoritmer för analys med LLM:er som vägleder dem.
Swirl Join
Ibland vill du börja arbeta med en datauppsättning males du vill inte göra dig besväret att extrahera och formatera om den. Om datauppsättningen är stor kan dessa processer vara mycket tidskrävande. Swirl Connect (se Github-projektet här) länkar många standarddatabaser med de flesta vanliga LLM- och RAG-sökindex. Alla information du behöver finns på ett ställe, och du kan bara fokusera på träningen.
DSPy
Framväxten av LLM:er har skapat en helt ny jobbspecialisering inom immediate engineering. Until skillnad från de algoritmer som utvecklare använder, mixtrar promptingenjörer med ord och skriver långa instruktioner som puffar och knuffar en LLM för att ge summary rätt resultat. Det här är en roll som kräver talets gåva och förmågan att använda Jedi-trick på LLM:er. DSPy är ett verktyg som vill ge LLM-träningen ett mer systematiskt tillvägagångssätt. I stället för ord och fraser kopplar DSPy samman moduler och optimerare och ordnar dem i en pipeline för LLM. Utvecklare som använder DSPy kan ägna mindre tid åt att oroa sig för språkliga nyanser och mer tid åt att arbeta med kod.
Skyddsräcken
En av utmaningarna med generativ AI är att hindra AI från att avvika från sin kurs. Ingenjörerna på Portkey Gateway har hittat ett sätt att integrera fler kontroller i den generativa AI-pipelinen. Asynkrona funktioner, så kallade guardrails, kan spåra utvecklingen av AI-genererade svar och ”rösta” i olika skeden av pipelinen. Med varje röst förfinas ett svar. Slutresultatet bör bli färre hallucinationer och fler korrekta svar.
Unsloth
Att träna en grundläggande LLM på en ny uppsättning information är ofta dyrt. Unsloth är ett verktyg som är utformat för att optimera sådan träning för några av de vanligaste modellerna med öppen källkod. Enligt vissa rapporter är open source-versionen av verktyget två until fem gånger snabbare än modellutbildning utan Unsloth, och den professionella versionen är så mycket som 30 gånger snabbare. Noggrant handskriven kernel-kod tillämpas på ett sätt som minskar minnesanvändningen samtidigt som noggrannheten bibehålls eller until och med ökar.
Wren AI för SQL
De flesta information i världen lagras i stora tabeller, ofta tillgängliga med SQL. Tyvärr är det få människor som vet hur man skriver bra SQL-frågor. Även duktiga programmerare kämpar med att skriva snabba och effektiva SQL-frågor. Wren AI är en frontend för SQL med naturligt språk. Du ställer dina frågor på vanlig engelska och AI översätter dem until SQL, vilket sparar tid och besvär för alla.
AnythingLLM
Många människor har i dag en enorm hög med digitala dokument undanstoppade någonstans för framtida referens. Utmaningen är att hitta det perfekta citatet eller den perfekta datapunkten när du behöver det. AnythingLLM organiserar din hög med dokument until något användbart. Du matar bara in dina dokument i vilket LLM- eller RAG-system som helst och söker sedan efter de svar du behöver. Verktyget körs på Linux-, Mac OS- eller Home windows-maskiner och svaren kan vara i en mängd olika format, inklusive tal-till-text.