Doanh nghiệp

Spotify dùng AI để phiên dịch giọng nói

2 năm trước

Ty Roush

Ngày 25.9, Spotify công bố hợp tác với OpenAI để ứng dụng trí tuệ nhân tạo (AI) dịch podcast sang các ngôn ngữ khác.

Công ty sẽ phát hành phiên bản thử nghiệm tính năng “phiên dịch giọng nói.” Tính năng này sẽ dịch podcast sang các ngôn ngữ khác giống với giọng và phong cách của người nói nguyên gốc.

Công ty hợp tác với OpenAI tạo ra tính năng trên. OpenAI cũng công bố sẽ ra mắt phiên bản ChatGPT mới với “khả năng nói chuyện và tạo hình ảnh.” Chatbot AI có “giọng nói giống con người được tạo ra chỉ từ văn bản và lời mẫu trong một vài giây.” Với phiên bản mới này, người dùng có thể nói chuyện với chatbot AI.

Spotify sẽ sử dụng tính năng mới từ OpenAI có thể tạo ra “giọng nói giống như giọng của con người.” Ảnh: The Associated Press/ Forbes

Do những lo ngại về quyền riêng tư và sự an toàn nên OpenAI ra mắt phiên bản đó sau khi công ty cảnh báo các tính năng mới có thể gây ra thêm rủi ro, bao gồm “mạo danh người nổi tiếng hoặc thực hiện hành vi lừa đảo.”

Tính năng mới của Spotify dựa trên công cụ nhận dạng giọng nói Whisper của OpenAI. Công cụ này ghi lại lời nói tiếng Anh đồng thời dịch các ngôn ngữ khác sang tiếng Anh.

Công ty sẽ thí điểm ứng dụng AI để dịch ba chương trình podcast đầu tiên – bao gồm Lex Fridman Podcast, Armchair Expert và The Diary of a CEO with Steven Bartlett – sang tiếng Tây Ban Nha. Cả người thuê bao và người chưa đăng ký kênh đều nghe được phiên bản đã dịch này.

Ngoài ra, công ty sẽ tiếp tục dịch thêm chương trình podcast sang tiếng Pháp và tiếng Đức “trong những ngày và tuần tới.”

Spotify sẽ tạo ra cũng như thường xuyên cập nhật “mục lưu trữ podcast đã được dịch sang các ngôn ngữ khác.” Theo công ty, podcast trên Spotify thu hút 100 triệu người nghe thường xuyên.

Không chỉ có Spotify mà các công ty khác cũng bắt đầu tích hợp AI tạo sinh vào sản phẩm trong những tháng gần đây. Đầu tháng 8, Meta đã ra mắt AudioCraft, công cụ AI cho phép người dùng tạo nhạc và âm thanh từ đoạn văn bản đầu vào mô tả nội dung cần thực hiện.

Cùng tháng, Financial Times đưa tin Google đang thảo luận với Universal Music Group về việc cấp phép sử dụng giai điệu và giọng hát của nghệ sĩ trong bản nhạc do AI tạo ra. Đầu tháng 9, Google cũng thông báo đã tích hợp chatbot AI Bard vào các ứng dụng khác, bao gồm YouTube, Gmail và Drive.

Biên dịch: Gia Nhi

———————-

Xem thêm:

OpenAI công bố phiên bản mới nhất GPT-4 cho ChatGPT
DJ sử dụng AI của Spotify thu hút nhiều người nghe, mở rộng sang thị trường châu Âu