HYBE là hãng âm nhạc K-pop đã mang nhóm BTS đến với thế giới. Hãng này đã dùng AI phát hành bài hát Masquerade của ca sĩ MIDNATT bằng 6 thứ tiếng gồm Hàn Quốc, Việt Nam, Anh, Tây Ban Nha, Trung Quốc và Nhật Bản vào tháng 5 vừa qua.
Ca sĩ Hoàng Dũng là người đảm nhận vai trò sáng tác lời Việt cho ca khúc Masquerade.
"Dù không phải sáng tác mới, nhưng vì cần đảm bảo nội dung bài hát không thay đổi, thậm chí bám sát vào những ý tứ và góc nhìn của ca khúc gốc nên quy trình viết lời của tôi gặp một số thử thách nhất định. Đặc biệt, đặc trưng của tiếng Việt là dấu câu, nên tôi cần chọn từ ngữ sao cho vừa đúng với nội dung, đúng ý tứ và vừa đảm bảo khi hát lên được tự nhiên và không cưỡng âm", Hoàng Dũng nói.
Hoàng Dũng cho biết anh và HYBE sửa phần lời khoảng 3 lần và không tốn quá nhiều thời gian.
Theo HYBE, một số ca sĩ K-pop đã tung ra các bài hát bằng tiếng Anh và tiếng Nhật ngoài tiếng mẹ đẻ của họ, nhưng việc áp dụng AI để phát hành đồng thời 6 ngôn ngữ là lần đầu tiên trên toàn cầu và có thể mở đường cho việc sử dụng công nghệ này bởi các nhóm nhạc phổ biến hơn.
“Đầu tiên chúng tôi sẽ lắng nghe phản ứng, tiếng nói của người hâm mộ, sau đó quyết định bước tiếp theo là gì”, Chung Wooyong, người đứng đầu bộ phận truyền thông tương tác của HYBE, nói trong một cuộc phỏng vấn của Reuters tại studio công ty.
Lee Hyun (40 tuổi, nghệ danh MIDNATT, chỉ nói được tiếng Anh và tiếng Trung hạn chế ngoài tiếng Hàn) đã thu âm bài hát Masquerade bằng mỗi ngôn ngữ (6).
Lee Hyun cho biết những người nói tiếng Việt Nam, Anh, Tây Ban Nha, Trung Quốc, Nhật Bản đọc to lời bài hát và sau đó hai bản thu âm bài hát Masquerade (tiếng Hàn cùng thứ tiếng còn lại) được kết hợp liền mạch với sự trợ giúp của công nghệ âm nhạc AI nội bộ của HYBE.
Masquerade là dấu hiệu mới nhất cho thấy ảnh hưởng ngày càng tăng của AI trong ngành công nghiệp âm nhạc vào thời điểm đơn vị tổ chức lễ trao giải Grammy đưa ra các quy tắc mới cho việc sử dụng công nghệ và các bản mash-up bài hát do AI tạo ra đang tràn ngập trên mạng xã hội.
Chung Wooyong cho biết: "Chúng tôi đã chia một đoạn âm thanh thành các phần khác nhau - cách phát âm, âm sắc, cao độ và âm lượng. Chúng tôi tập trung vào cách phát âm liên quan đến chuyển động của lưỡi và sử dụng trí tưởng tượng của mình để xem có thể tạo ra kết quả như thế nào bằng công nghệ của mình".
Trong so sánh trước và sau được trình bày cho Reuters, một nguyên âm kéo dài đã được thêm vào từ twistedtrong lời bài hát tiếng Anh để nghe tự nhiên hơn, dù không có sự thay đổi nào dễ nhận thấy với giọng ca sĩ.
Choi Hee-doo, Giám đốc điều hành của Supertone, cho biết việc sử dụng deep learning (học sâu) dựa trên khung NANSY (Neural Analysis and Synthesis) do công ty này phát triển giúp bài hát nghe tự nhiên hơn so với dùng phần mềm không phải AI.
HYBE đã công bố thương vụ mua lại Supertone trị giá 45 tỉ won (36 triệu USD) vào tháng 1. HYBE cho biết đã lên kế hoạch làm cho một số công nghệ AI được sử dụng trong bài hát của MIDNATT có thể tiếp cận được với người sáng tạo và công chúng, nhưng không nói rõ liệu có tính phí hay không.
'Trải nghiệm sâu hơn với âm nhạc của tôi'
MIDNATT nói việc sử dụng AI đã cho phép anh có "một loạt biểu cảm nghệ thuật rộng hơn".
"Tôi cảm thấy rằng rào cản ngôn ngữ đã được dỡ bỏ và người hâm mộ toàn cầu sẽ dễ dàng có trải nghiệm sâu hơn với âm nhạc của tôi", MIDNATT nói.
Valerio Velardo, nhà sáng lập và lãnh đạo The Sound of AI (dịch vụ tư vấn về âm nhạc và âm thanh AI có trụ sở tại Tây Ban Nha), nói: "Dù công nghệ này không phải là mới nhưng đây là một cách sáng tạo để sử dụng AI trong âm nhạc”.
Valerio Velardo cho biết không chỉ các nhạc sĩ chuyên nghiệp mà nhiều người hơn sẽ được hưởng lợi từ công nghệ âm nhạc AI trong dài hạn.
"AI sẽ giảm rào cản trong việc sáng tạo âm nhạc. Nó hơi giống Instagram với hình ảnh, nhưng trong trường hợp của âm nhạc", Valerio Velardo nhận xét.
Hiện công nghệ sửa lỗi phát âm của HYBE mất "tuần hoặc thậm chí vài tháng" để hoàn thành nhiệm vụ, nhưng khi quá trình này tăng tốc, nó có thể phục vụ nhiều mục đích hơn, chẳng hạn như thông dịch trong các cuộc họp video, theo Choi Jin-woo, nhà sản xuất của bài hát Masquerade của MIDNATT. Choi Jin-woo được biết đến với nghệ danh Hitchhiker.
"Âm nhạc chứa các yếu tố do AI tạo vẫn có thể giành được giải Grammy"
Để giành được giải Grammy, bạn cần có một bài hát hay, bản hòa âm phối khí xuất sắc và sự sáng tạo.
Các quy tắc mới được Recording Academy (Viện Hàn lâm Khoa học và Nghệ thuật Thu âm quốc gia Mỹ), đơn vị tổ chức lễ trao giải Grammy, công bố vào tháng trước xác định rằng giải thưởng cao nhất của ngành công nghiệp âm nhạc chỉ dành cho "những nhà sáng tạo là con người" và thẳng thừng từ chối bất kỳ tác phẩm nào "không có sự tham gia, đóng góp từ con người".
Thế nhưng, điều đó không đồng nghĩa con người không thể sử dụng AI để tạo ra một đĩa đơn hoặc album xứng đáng với giải Grammy, miễn là họ chỉ ra những đóng góp tương ứng của mình, Harvey Mason Jr. (Giám đốc điều hành Recording Academy) nói trong một cuộc phỏng vấn với hãng tin AP.
"Âm nhạc có chứa các yếu tố do AI tạo ra hoàn toàn đủ điều kiện để tham gia và được xem xét cho đề cử Grammy. Đó là sự thật. Điều sẽ không xảy ra là chúng tôi sẽ không trao đề cử Grammy cho hạng mục AI", Harvey Mason Jr. cho biết thêm.
Giống như hầu hết các giải thưởng, Grammy công nhận những đóng góp sáng tạo khác nhau để tạo ra âm nhạc tuyệt vời ở nhiều thể loại như sáng tác, sản xuất và biểu diễn.
Nói cách khác, nếu biểu diễn những lời do AI viết, một ca sĩ sẽ không được ghi nhận là sáng tác. Nếu AI thực hiện việc biểu diễn, con người có thể được ghi nhận là nhà sản xuất.
Harvey Mason Jr. nói: “Miễn là con người đang đóng góp nhiều hơn mức tối thiểu, điều mà theo chúng tôi là đóng góp một cách có ý nghĩa thì họ đang và sẽ luôn được xem xét cho đề cử hoặc giành giải. Chúng tôi không muốn thấy công nghệ thay thế khả năng sáng tạo của con người. Chúng tôi muốn đảm bảo rằng công nghệ đang tăng cường, tô điểm hoặc bổ sung cho khả năng sáng tạo của con người".
Tin tức này xuất hiện ngay sau hướng dẫn từ nhóm gồm 24 trường đại học hàng đầu ở Vương quốc Anh, gồm cả Oxford và Cambridge, cho phép sinh viên và nhân viên sử dụng generative AI trong học thuật, miễn là họ sử dụng công nghệ này một cách có đạo đức.
Generative AI là một loại trí tuệ nhân tạo được lập trình để tự động tạo ra nội dung mới, như văn bản, hình ảnh, âm thanh và video. Nó khác với các hệ thống AI khác như máy học sâu hoặc học máy trong việc dự đoán kết quả từ dữ liệu đã có sẵn. Thay vì dựa trên dữ liệu huấn luyện, hệ thống generative AI có khả năng tự tạo ra dữ liệu mới và phong phú hơn.
Harvey Mason Jr. cho biết quá trình xác định các quy tắc cho giải thưởng này mất khoảng 6 tháng để thực sự hoàn thiện và ông kỳ vọng sẽ có nhiều tác phẩm tham gia bao gồm cả các yếu tố AI.
"Chúng tôi sẽ xem xét liệu một số tác phẩm trong đó có được đề cử hay không, nhưng tôi chắc chắn sẽ có một số tác phẩm được gửi đăng ký", ông nói.