home All News open_in_new Full Article

Eleuther AI släpper jättesamling med licensierad och öppen träningsdata

AI-forskningsorganisationen Eleuther AI har lanserat en massiv textdatabas, Common Pile v0.1, som kan användas för att träna AI-system, rapporterar Techcrunch. Databasen på 8 terabyte består uteslutande av offentligt licensierade texter, eller texter som klassas som allmän egendom. Common Pile v0.1 ska tagits fram under två års tid tillsammans med bland annat Poolside, Hugging Face, Library of Congress och University of Toronto. Datasamlingen släpps efter att en debatt uppstått kring att flera AI-företag använt upphovsrättsskyddat material för att träna upp sina AI-system, utan tillåtelse från upphovsägarna. Eleuther AI låg också bakom samlingen The Pile som blivit en central punkt i den debatten, men vill nu med Common Pile v0.1 visa att träningen är möjlig utan upphovsrättsskyddat material. Common Pile v.01 ska ha använts för att träna AI-modellerna Comma v0.1-1T och Comma v0.1-2T, som Eleuther AI påstår presterar lika bra som Metas första Llama-modell vad gäller programmering, bi...


today 5 d. ago attach_file Politics

attach_file Politics
attach_file Politics
attach_file Politics
attach_file Politics
attach_file Politics
attach_file Politics
attach_file Politics
attach_file Politics
attach_file Politics
attach_file Politics
attach_file Politics
attach_file Politics
attach_file Politics
attach_file Politics
attach_file Politics
attach_file Politics
attach_file Politics
attach_file Politics
attach_file Politics
attach_file Politics


ID: 642760295
Add Watch Country

arrow_drop_down