По словам разработчиков, диффузионная модель Stable Audio обучалась на наборе из текстовых метаданных и коллекции из 800 000 аудиофайлов. Среди данных присутствовали
Модель из Испании пристыдили за откровенную фотосессию в запретной для туристов зоне — пещере Эль-Танкон