بازیگر نامرئی صنعت موسیقی

 یک مطالعه‌ جدید هم نشان می‌دهد که شنوندگان دیگر نمی‌توانند به‌طور قابل اعتماد میان موسیقی ساخته‌شده توسط انسان و آهنگ‌هایی که کاملا توسط هوش مصنوعی تولید شده‌اند، تمایز قائل شوند.

به گزارش مجله اپل، این یافته‌ها نشان می‌دهد مدل‌های یادگیری ماشین تا چه اندازه در بازآفرینی بیان موسیقایی، بافت صوتی و تونالیته‌ احساسی پیشرفت کرده‌اند که این امر نگرانی‌های فزاینده‌ای را میان هنرمندان، پلتفرم‌های استریم و نهادهای قانون‌گذار درباره‌ مالکیت اثر، حق نشر و اصالت کار خلاقه ایجاد کرده است.

مرز باریک خلاقیت و تکنولوژی

این مطالعه که در چندین بازار بزرگ موسیقی انجام شد، از شرکت‌کنندگان خواست تشخیص دهند نمونه‌های صوتی پخش‌شده توسط یک آهنگ‌ساز انسانی ساخته شده‌اند یا توسط سیستم‌های هوش مصنوعی تولید شده‌اند؛ سیستم‌هایی که بر پایه‌ پایگاه‌های عظیمی از داده‌های صوتی دیجیتال آموزش دیده‌اند. نتایج نشان داد که نرخ خطا بیش از ۸۰ درصد بوده است. یعنی بیشتر پاسخ‌دهندگان قادر نبودند میان آهنگ‌های الگوریتمی و موسیقی سنتی تفاوتی تشخیص دهند.تلاش‌های اولیه برای تولید موسیقی با ماشین اغلب به خاطر فقدان ظرافت مورد انتقاد قرار می‌گرفتند.

ملودی‌ها تکراری، دینامیک‌ها ثابت و پیشرفت احساسی تقریبا غایب بود. اما با ظهور مدل‌های بزرگ تولیدکننده‌ صوت، این وضعیت به سرعت تغییر کرد. این مدل‌ها با استفاده از فرآیندهای دیفیوژن و توالی‌سازی عصبی، آهنگ‌ها را نُت به نُت می‌سازند و الگوهای‌ هارمونیک آموخته‌شده را با تقلید سبکی در هم می‌آمیزند.

مدل‌های امروزی، از جمله آن‌هایی که بر روی‌ میلیون‌ها قطعه‌ دارای مجوز یا متعلق به قلمرو عمومی آموزش دیده‌اند، قادرند تیمبر سازها، جمله‌بندی‌های بیانی و حتی فضای محیطی را بازسازی کنند. حتی ناهنجاری‌ها و نقص‌هایی که زمانی ویژگی منحصربه‌فرد اجرای انسانی شمرده می‌شد، اکنون توسط این مدل‌ها بازتولید می‌شود. برخی سیستم‌ها می‌توانند یک قطعه کامل چندلایه تولید کنند؛ همراه با وکال و افکت‌های تولیدی که بافت کار حرفه‌ای استودیویی را تقلید می‌کند.

توانایی هوش مصنوعی در بازآفرینی عناصر ظریف انسانی از جمله نوسانات زمانی، عمق ریورب، و ناهنجاری‌های تونال عامل مهمی در سردرگمی شنوندگان بوده است. آهنگ‌های استفاده‌شده در این آزمایش طیف گسترده‌ای از ژانرها را شامل می‌شدند: از پیانوی کلاسیک و جَز گرفته تا پاپ و موسیقی الکترونیک. عملکرد هوش مصنوعی به‌ویژه در ژانرهای ساختارمند مانند EDM، امبینت و موسیقی متن ارکسترال بسیار قوی بوده است.

این یافته‌ها در زمانی منتشر می‌شوند که صنعت موسیقی با عدم قطعیت عمیقی روبه‌روست. شرکت‌های نشر، پلتفرم‌های استریم و نهادهای حق‌رسانی(collecting societies) در تلاش‌اند تعریف کنند که «تألیف اصیل» در دورانی که موسیقی می‌تواند در چند ثانیه به‌صورت الگوریتمی ساخته شود، دقیقا چیست.

چند پلتفرم بزرگ استریم پیشاپیش سیستم‌های برچسب‌گذاری محتوای هوش مصنوعی را اجرا کرده‌اند و برخی دیگر در حال سرمایه‌گذاری روی فناوری واترمارک‌گذاری‌اند تا بتوانند آثار مصنوعی را که در میان آپلودهای کاربران قرار می‌گیرد، شناسایی کنند. با این حال، چارچوب‌های حقوقی همچنان پراکنده و نامنسجم‌اند.

در بیشتر حوزه‌های قضایی، قوانین حق نشر خالقان غیرانسانی را به رسمیت نمی‌شناسند؛ بنابراین آثاری که به‌طور خودکار توسط هوش مصنوعی تولید می‌شوند فاقد مالکیت مشخص‌اند. برخی دادگاه‌ها حکم داده‌اند که تنها فرایندهایی که در آن نقش انسان از طریق خلاقیت یا تصمیم‌های ویرایشی قابل اثبات باشد، شایسته‌ دریافت حمایت حقوقی هستند.

این ابهام، پرسش‌های پیچیده‌ای برای موسیقی‌دانانی ایجاد می‌کند که از ابزارهای هوش مصنوعی در روند کار خود استفاده می‌کنند. برخی هنرمندان با مدل‌های مولد مانند یک «سازِ همکار» رفتار می‌کنند. درحالی‌که دیگران معتقدند موسیقی تولیدشده توسط هوش مصنوعی که بر پایه‌ آثار انسانی آموزش دیده، خطر بازتولید بی‌جبران سبک‌های هنری را به همراه دارد. ائتلاف‌های صنعتی در ایالات متحده و اروپا لابی‌هایی را برای وضع الزامات افشاگری آغاز کرده‌اند تا توزیع‌کنندگان را ملزم کنند آثار مصنوعی را به‌طور صریح مشخص کنند.

در همین حال، پلتفرم‌های استریم موسیقی تحت فشارند تا هجوم گسترده‌ محتوای تولیدشده با هوش مصنوعی را مدیریت کنند. گزارش‌هایی وجود دارد که نشان می‌دهد روزانه ده‌ها هزار آهنگ مصنوعی آپلود می‌شود؛ موضوعی که چالش‌های نظارتی ایجاد کرده و بحث‌هایی را درباره‌ی نظام‌های جبران منصفانه برای موسیقی‌دانان انسانی برانگیخته است.

نقطه‌ عطف

با وجود جنجال‌ها، گسترش توانایی‌های خلاقانه‌ هوش مصنوعی افق‌های تازه‌ای نیز برای آزمایش و نوآوری گشوده است. هنرمندان مستقل روزبه‌روز بیشتر از ابزارهای مولد برای طراحی صدا، تنظیم و کمک به آهنگسازی استفاده می‌کنند و اغلب خروجی الگوریتمی را با اجراهای شخصی خود ترکیب می‌کنند تا آثاری ترکیبی پدید آورند که مرز میان انسان و ماشین را محو می‌کنند.

شرکت‌های بزرگ فناوری نیز به‌طور فعال وارد این عرصه شده‌اند. اوپن‌ای‌آی، گوگل دیپ‌مایند، متا و استبیلیتی هوش مصنوعی همگی سیستم‌های تولید موسیقی را عرضه یا معرفی کرده‌اند که بر مجموعه‌های عظیم صداهای ضبط‌شده آموزش دیده‌اند. این مدل‌ها می‌توانند قطعات ‌سازی تولید کنند، خوانندگان را شبیه‌سازی کنند، یا بر اساس دستورهای متنی درباره‌ حالت، تمپو یا احساس، قطعه‌های موجود را تغییر دهند.

دموکراتیزه‌شدن چنین ابزارهایی هم هیجان و هم نگرانی به همراه داشته است. از یک سو، خالقان اکنون به امکانات تولیدی دسترسی دارند که پیش‌تر فقط در اختیار استودیوهای بزرگ بود؛ و از سوی دیگر، سهولت تقلید می‌تواند بازار را اشباع کرده و یگانگی هنر انسانی را کمرنگ کند.

تحلیلگران صنعت معتقدند چالش اصلی نه در متوقف‌کردن موسیقی تولیدشده با هوش مصنوعی بلکه در بازتعریف مفهوم اصالت است. اینکه شنوندگان در عصری که هر صدا می‌تواند به‌طور ریاضی بازتولید شود، «نیت»، «تألیف» و «ابتکار» را چگونه ارزش‌گذاری می‌کنند.

با پیشرفت مداوم هوش مصنوعی در درک ریتم،‌ هارمونی و طنین احساسی، تمایز میان خلق انسانی و تولید الگوریتمی شاید برای مخاطبان کمتر اهمیت داشته باشد و در عوض، به موضوعی مرکزی برای چارچوب‌های حقوقی و اخلاقی تبدیل شود که مالکیت خلاقانه را تعریف می‌کنند. نتیجه‌ این نظرسنجی روشن و قطعی است: از نظر ملودی، حال‌وهوا و بافت صوتی، هوش مصنوعی از آستانه‌ ادراکی عبور کرده است. آنچه زمانی کنجکاوی فنی به شمار می‌رفت، اکنون به بازیگری نامرئی در موسیقی معاصر بدل شده است.

بازیگری که می‌نویسد، تقلید می‌کند و حتی گاه از دست هنرمند انسانی که زمانی تعریف‌کننده‌ صدای هنر بود، قابل تشخیص نیست. این تحول، پرسش‌های بنیادی درباره‌ خلاقیت، اصالت و آینده‌ صنعت موسیقی ایجاد کرده است و شاید تنها نکته‌ مسلم این باشد که در دنیای موسیقی قرن بیست‌ویکم، انسان و ماشین هر دو نقش‌آفرینانی جدی هستند و مرزهای بین آنها روزبه‌روز محوتر می‌شود.