Jishnu Girija
സിനിമയുടെ ഭാവി എന്താണ് എന്ന് ഒരിക്കൽ ഒരു ഇന്റർവ്യൂവിൽ കമൽ ഹാസനോട് ചോദിക്കുകയുണ്ടായി.. അതിന് അദ്ദേഹം പറഞ്ഞ മറുപടി ഇപ്രകാരമായിരുന്നു :-“സിനിമയുടെ ഭാവി ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിന്റെ കയ്യിൽ ആണ്.. ഏതൊരാൾക്കും ലോകത്തിന്റെ എത് കോണിൽ ഇരുന്നും സിനിമയുണ്ടാക്കാൻ സാധിക്കും.. അവരുടെ മനസ്സിലെ കഥയ്ക്ക് അവർ ആഗ്രഹിക്കുന്ന നടന്മാരെ കാസ്റ്റ് ചെയ്ത് അവരുടെ മനസ്സിലെ ഷോട്ടുകൾ നിർമ്മിച്ചു അവർക്ക് അവരുടെ സിനിമ കാണാൻ സാധിക്കും.. അങ്ങനെ ഒരു ഭാവി ആണ് വരാനിരിക്കുന്നത്.”
AI പ്രചാരത്തിൽ വരുന്നതിനും എത്രയോ മുൻപ് ദീർഘ ദർശിയായ കമൽ പറഞ്ഞ വാക്കുകൾ ആണ് ഇത് എന്ന് ഓർക്കണം. ഇന്ന് ഇപ്പോൾ ആർക്കും AI വഴി തങ്ങളുടെ മനസ്സിലെ മനോഹരമായ ആശയങ്ങളും സംഘല്പങ്ങളും ചിത്രങ്ങൾ ആക്കുവാൻ സാധിക്കുന്നു.ഇപ്പോൾ പുറത്ത് വരുന്ന വാർത്തകൾ പ്രകാരം സമാന രീതിയിൽ ആർക്കും സംഗീതം നിർമ്മിക്കാനുള്ള AI ഗൂഗിൾ വികസിപ്പിച്ചിരിക്കുന്നു എന്നാണ്.. നമ്മൾ വരികൾ എഴുതി കൊടുത്താൽ മതിയത്രേ..,എത് സ്വഭാവത്തിൽ ഉള്ള, ജോണറിലുള്ള, രാഗത്തിലുള്ള, സംഗീതവും തയ്യാറാകും. “MusicLM” AI എന്ന വമ്പനെ ഉടൻ ലോഞ്ച് ചെയ്യാൻ ഒരുങ്ങുകയാണ് ഗൂഗിൾ..
പല സംഗീത സംവിധായകർക്കും ഭാവിയിൽ ഇവൻ ഭീഷണി ആകുമെന്ന് ഉറപ്പാണ് ! കമൽ ഹാസൻ പറഞ്ഞ സിനിമയുടെ AI കാലവും വിദൂരമല്ല !
**
എന്താണ് MusicLM (എഡിറ്റർ കൂട്ടിച്ചേർക്കുന്നത് )
ടെക്സ്റ്റ് ടു മ്യൂസിക് സോഫ്റ്റ് വെയർ ആയ മ്യൂസിക്എൽഎം ഗൂഗിൾ അവതരിപ്പിക്കുന്നു. ടെക്സ്റ്റ് പ്രോംപ്റ്റുകളിൽ നിന്ന് ഇതിന് മൾട്ടി-മിനിറ്റ് ട്രാക്കുകൾ സൃഷ്ടിക്കാൻ കഴിയും.ഇമേജുകൾക്കായുള്ള ജനറേറ്റീവ് AI മോഡലുകൾ മനുഷ്യ കലാകാരന്മാരുടെ ദൃശ്യ നിലവാരത്തിലേക്ക് ഇതിനകം എത്തിയിട്ടുണ്ടെങ്കിലും, ഓഡിയോ, സംഗീത മോഡലുകൾ ഇപ്പോഴും വളരെ പിന്നിലാണ്. ഒരു “ഡാൾ-ഇ ഫോർ മ്യൂസിക്” തിരിച്ചറിയാൻ പ്രയാസമാണ്. Meta’s AudioGen, Riffusion അല്ലെങ്കിൽ Google’s AudioLM പോലെയുള്ള സമീപനങ്ങളുണ്ട്, പക്ഷേ ഇതുവരെ ജനറേറ്റീവ് മ്യൂസിക് മോഡൽ ബോധ്യപ്പെടുത്തുന്നില്ല. സംഗീതത്തിനായുള്ള സങ്കീർണ്ണമായ പകർപ്പവകാശ സാഹചര്യത്തിന് പുറമേ, താൽക്കാലിക മാനം ഒരു പ്രധാന വെല്ലുവിളിയാണ്: ചിത്രങ്ങൾ നിശ്ചലമാണ്, സംഗീത മാറ്റങ്ങൾ. സംസ്കാരത്തെ ആശ്രയിച്ച്, ഈ മാറ്റങ്ങൾ ചില നിയമങ്ങൾ പാലിക്കുന്നു – എന്നാൽ തകർക്കാനും കഴിയും.
Google-ന്റെ MusicLM സംഗീതം സൃഷ്ടിക്കുന്നു
AudioLM ഭാഷ, ഓഡിയോ, സംഗീതം എന്നിവയ്ക്കായുള്ള ഒരു ജനറേറ്റീവ് AI മോഡലാണ്. AudioLM വലിയ തോതിലുള്ള ഭാഷാ മോഡലുകളിൽ നിന്നുള്ള സാങ്കേതിക വിദ്യകൾ ഉപയോഗിക്കുന്നു: ഓഡിയോ (w2v-BERT) യ്ക്കായി പ്രത്യേകം തയ്യാറാക്കിയ BERT മോഡൽ, ഭാഷയുടെ സ്വരസൂചകങ്ങൾ അല്ലെങ്കിൽ പ്രാദേശിക മെലഡികൾ, ഹാർമണികൾ അല്ലെങ്കിൽ താളങ്ങൾ എന്നിവ പിടിച്ചെടുക്കാൻ കഴിയുന്ന ഓഡിയോ തരംഗരൂപങ്ങളിൽ നിന്ന് സെമാന്റിക് ടോക്കണുകൾ നിർമ്മിക്കുന്നു. SoundStream എന്ന് വിളിക്കപ്പെടുന്ന ഒരു എൻകോഡർ, ശബ്ദ തരംഗരൂപങ്ങളുടെ സൂക്ഷ്മമായ വിശദാംശങ്ങൾ അക്കൌസ്റ്റിക് ടോക്കണുകളിൽ പകർത്തുന്നു, ഇതിനു ഉയർന്ന നിലവാരമുള്ള ഓഡിയോ സിന്തസിസിന് ഉത്തരവാദിത്തമുണ്ട്.
ഇപ്പോൾ ഗൂഗിൾ മ്യൂസിക് എൽഎം അവതരിപ്പിക്കുന്നു, ഓഡിയോ എൽഎം മറ്റൊരു മോഡലുമായി സംയോജിപ്പിക്കുന്ന ജനറേറ്റീവ് എഐ സിസ്റ്റം. ഈ മൂന്നാമത്തെ ഘടകത്തെ മുലാൻ എന്ന് വിളിക്കുന്നു, കൂടാതെ പത്ത് പ്രൊഫഷണൽ സംഗീതജ്ഞർ സൃഷ്ടിച്ച 10 സെക്കൻഡ് ഓഡിയോ സ്നിപ്പെറ്റുകളും പൊരുത്തപ്പെടുന്ന ടെക്സ്റ്റ് വിവരണങ്ങളും ഉപയോഗിച്ച് Google പരിശീലിപ്പിച്ചതാണ്. 5,500 സംഗീത ക്ലിപ്പുകളുടെയും ടെക്സ്റ്റ് വിവരണങ്ങളുടെയും മ്യൂസിക് ക്യാപ്സ് പരിശീലന ഡാറ്റാസെറ്റ് Google പ്രസിദ്ധീകരിച്ചു.
പ്രോംപ്റ്റ്
ഒരു ഗായകസംഘം, ഒരു ഗ്രിഗോറിയൻ ഗാനം ആലപിക്കുന്നത്, ഒരു താളാത്മകമായ ബീറ്റ് സൃഷ്ടിക്കുന്ന ഒരു ഡ്രം മെഷീൻ എന്നിവ നമുക്ക് കേൾക്കാം. സ്ട്രിംഗുകളുടെ സാവധാനവും ഗംഭീരവുമായ ശബ്ദങ്ങൾ ഫ്യൂച്ചറിസ്റ്റിക് ഇലക്ട്രോണിക് സംഗീതത്തിന്റെ വേഗതയേറിയതും സങ്കീർണ്ണവുമായ ശബ്ദങ്ങൾക്ക് ശാന്തമായ പശ്ചാത്തലം നൽകുന്നു.
മ്യൂസിക്എൽഎം മെലഡികൾ ഉപയോഗിച്ച് നിയന്ത്രിക്കാനാകും സ്ലോ റെഗ്ഗെ ഗാനം മുതൽ ആർക്കേഡ് ഗെയിം സൗണ്ട് ട്രാക്ക് വരെ, വിശ്രമിക്കുന്ന ജാസ് മുതൽ ഗ്രിഗോറിയൻ ഗാനങ്ങൾ വരെയുള്ള ഫലങ്ങൾ. ഒരു ചെറിയ വാചകം ഉപയോഗിച്ചോ വിശദമായ വിവരണങ്ങൾ ഉപയോഗിച്ചോ MusicLM നിയന്ത്രിക്കാനാകും.ഒരു ആർക്കേഡ് ഗെയിമിന്റെ പ്രധാന സൗണ്ട് ട്രാക്ക്. ആകർഷകമായ ഇലക്ട്രിക് ഗിറ്റാർ റിഫിനൊപ്പം ഇത് വേഗതയേറിയതും ഉന്മേഷദായകവുമാണ്. സംഗീതം ആവർത്തിച്ചുള്ളതും ഓർമ്മിക്കാൻ എളുപ്പവുമാണ്, പക്ഷേ കൈത്താളം ക്രാഷുകൾ അല്ലെങ്കിൽ ഡ്രം റോളുകൾ പോലെയുള്ള അപ്രതീക്ഷിത ശബ്ദങ്ങൾ.
MusicLM Output
ഒരു അക്കോസ്റ്റിക് ഗിറ്റാറിന്റെ മെലഡിയെ സിന്തിലേക്ക് പരിവർത്തനം ചെയ്യുന്നത് പോലെയുള്ള മെലഡിയുടെയും വരികളുടെയും സംയോജനവും MusicLM-ന് പ്രോസസ്സ് ചെയ്യാൻ കഴിയും.MusicLM-ന് ഇപ്പോഴും വോക്കൽ, പ്രോംപ്റ്റുകളിലെ നിഷേധങ്ങൾ, ടെമ്പറൽ സീക്വൻസുകൾ എന്നിവയിൽ പ്രശ്നങ്ങളുണ്ട്. ഭാവിയിൽ ഈ പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ ടീം പദ്ധതിയിടുന്നു, കൂടാതെ ജനറേറ്റ് ചെയ്ത ഓഡിയോയുടെ ഗുണനിലവാരം മെച്ചപ്പെടുത്താനും പദ്ധതിയിടുന്നു.