Menurut mereka, teknologi tersebut dapat digunakan untuk meningkatkan ekuitas pendidikan, meningkatkan aksesibilitas bagi orang yang memiliki tantangan komunikasi, serta menghadirkan teman berbicara sekaligus pendukung terapi bagi yang membutuhkan.
Menurut publikasi ilmiah tentang teknologi tersebut, VASA-1 dilatih menggunakan VoxCeleb2 Dataset yang berisi lebih dari satu juta ucapan untuk 6.112 selebritas yang diambil dari video YouTube.
Walau dilatih menggunakan wajah tokoh asli, VASA-1 juga dapat bekerja pada gambar-gambar artistik seperti Mona Lisa, yang oleh para peneliti digabungkan dengan berkas audio aktris Anne Hathaway.