MuseNet to głęboka sieć neuronowa stworzona przez OpenAI, która potrafi generować 4-minutowe kompozycje muzyczne z wykorzystaniem 10 różnych instrumentów, a także łączyć style od country po Mozarta po Beatlesów. Wykorzystuje ona tę samą ogólnego przeznaczenia nienadzorowaną technologię co GPT-2, model transformers o dużej skali, który został przeszkolony w przewidywaniu następnego tokena w sekwencji, bez względu na to, czy jest to dźwięk czy tekst. Model jest trenowany na danych pochodzących z plików MIDI i może generować próbki w wybranym stylu, rozpoczynając od podpowiedzi. Wykorzystuje różne osadzenia takie jak osadzenia pozycyjne, osadzenie czasowe i osadzenia strukturalne, aby dostarczyć modelowi więcej kontekstu.