Công nghệ

DeepL, mô hình dịch thuật máy học thế hệ mới từ AI tạo sinh

2 tháng trước
Rashi Shrivastava

Share
this:

Thành thạo ba ngôn ngữ Đức, Ba Lan, Anh, Jaroslaw Kutylowski nay có thể đọc và viết thêm khoảng ba mươi thứ tiếng nữa với sự trợ giúp từ DeepL, phần mềm dịch thuật dựa trên AI do công ty khởi nghiệp cùng tên của anh phát triển.

Được thành lập năm 2017, DeepL phát triển phần mềm mà công ty tuyên bố có khả năng đưa ra kết quả chính xác hơn khá nhiều so với những đối thủ cạnh tranh như Google. Mức độ chính xác như vậy có được nhờ sự kết hợp giữa công nghệ AI và dữ liệu đầu vào từ những người thông thạo tiếng bản địa.

DeepL sử dụng kiến trúc mạng nơ ron nhân tạo độc quyền, một dạng máy học cho phép máy tính tiếp nhận thông tin tương tự như bộ não của con người. Kiến trúc này được đào tạo dựa trên cơ sở dữ liệu khổng lồ từ các văn bản song ngữ (đã được dịch) và đơn ngữ (bản gốc chưa dịch) bằng 31 thứ tiếng khác nhau, bao gồm tiếng Trung Quốc, Nga, Tây Ban Nha và Ý.

Con số này chỉ bằng một phần rất nhỏ so với khối lượng 130 ngôn ngữ mà Google Translate có thể dịch. Tuy vậy, các bản dịch của DeepL được điều chỉnh theo phong thái của đội ngũ biên tập viên và những người thành thạo ngôn ngữ bản địa. DeepL có hai mươi biên tập viên nội bộ, hơn 1.000 biên dịch viên và người bản ngữ trên toàn thế giới làm công việc đánh giá chất lượng bản dịch từ mô hình của DeepL để điều chỉnh, cải thiện độ chính xác.

“Chúng tôi cần rất nhiều bản dịch chất lượng cao từ con người, để giúp AI hiểu rõ về các điểm đặc trưng của ngôn ngữ khi dịch cả văn bản thông thường lẫn trang trọng,” Kutylowski cho biết.

DeepL có hơn mười triệu người dùng hằng tháng, 500 ngàn người trong số đó trả mức phí sử dụng từ 9-59 đô la Mỹ/tháng. Khách hàng của DeepL bao gồm những bậc ông bà sử dụng phần mềm này để trò chuyện với cháu bằng tiếng mẹ đẻ và các cặp đôi gặp rào cản ngôn ngữ.

Tuy vậy, phần lớn hoạt động kinh doanh của DeepL phục vụ hai mươi ngàn khách hàng doanh nghiệp gồm Mercedes Benz, Fujitsu và công ty vận hành đường sắt Deutsche Bahn (Đức). Những công ty này sử dụng DeepL để dịch nhiều nội dung khác nhau, từ trang web, hợp đồng dịch vụ pháp lý, thỏa thuận khách hàng đến văn bản tiếp thị và bài trình bày PowerPoint.

Vào tháng 1.2023, công ty có trụ sở tại Cologne, Đức đã huy động khoảng 100 triệu đô la Mỹ từ các quỹ đầu tư mạo hiểm toàn cầu gồm Institutional Venture Partners (IVP), Atomico và Bessemer Venture Partners. Theo Pitchbook, lần gọi vốn này định giá DeepL ở mức một tỉ đô la Mỹ. Nhà sáng lập kiêm CEO Jaroslaw Kutylowski không xác nhận tổng số vốn mà DeepL đã huy động cho đến nay.

Phần mềm dịch thuật của DeepL đã được tải xuống trên hai mươi lăm triệu thiết bị. Tuy chỉ là con số khiêm tốn so với một tỉ lượt tải của Google Translate, nhưng DeepL được người dùng đánh giá tốt về tính chính xác.

Nina Gafni, dịch giả chuyên nghiệp tại Washington, DC, từng làm nhà ngôn ngữ học và biên dịch viên cho cục Điều tra liên bang Mỹ (FBI), đã sử dụng DeepL để dịch tiếng Pháp, Đức và Ý sang Anh. Cô nhận xét, tuy hệ thống máy học không thể đạt đến sự hoàn hảo, nhưng các bản dịch từ DeepL mang sắc thái văn hóa và chính xác hơn hầu hết những công cụ khác.

“Các bản dịch đôi khi quá sát nghĩa và điều đó là hạn chế rất lớn. Nếu gặp nội dung khó, tôi cho rằng mình có thể tin tưởng vào bản dịch của DeepL hơn Google Translate,” Gafni chia sẻ.

Kết quả này có được nhờ con người cung cấp lượng lớn dữ liệu dùng để đào tạo DeepL. Dữ liệu này bao gồm phụ đề phim, bản dịch sách và bằng sáng chế cũng như các cuộc trò chuyện trên những diễn đàn.

Chia sẻ với Forbes, Akiko Taguchi, người bản địa Nhật Bản làm việc tại DeepL, cho biết cô dành phần lớn thời gian đảm bảo rằng các bản dịch của DeepL đúng ngữ cảnh và diễn đạt tự nhiên. “Tôi phản hồi khi hệ thống máy học nhầm lẫn cấu trúc ngữ pháp sử dụng trong cách viết tiếng Nhật. Đến nay, hệ thống đã cải thiện đáng kể,” Taguchi nói.

Phát triển từ công cụ hỗ trợ dịch thuật Linguee, DeepL cho phép người dùng dịch mọi loại tài liệu gồm PDF, Word và PowerPoint mà vẫn giữ nguyên định dạng gốc. Phần mềm này gợi ý các bản dịch thay thế và điều chỉnh cách diễn đạt, đồng thời cho phép người dùng xây dựng từ điển để xác định cách dịch một số từ nhất định.

Jaroslaw Kutylowski, tốt nghiệp tiến sĩ chuyên ngành khoa học máy tính, đã phát triển công nghệ máy học làm nền tảng cho DeepL từ năm 2016. Vào thời điểm đó, các nhà nghiên cứu của Google cũng đang phát triển Transformers, thuật toán xử lý ngôn ngữ tự nhiên mang tính đột phá. Đây là công nghệ đằng sau ChatGPT.

Tuy nhiên, Kutylowski cho biết DeepL hiện nay không sử dụng Transformers cũng như các mô hình ngôn ngữ lớn (LLM) để dịch ngôn ngữ, và anh từ chối đưa ra chi tiết về việc phần mềm của anh dùng kiến trúc nào. “Chúng tôi biết rằng kiến trúc mạng nơ ron nhân tạo sẽ trở thành công nghệ chủ đạo trong ngành dịch thuật. Chúng tôi cũng tin các phương pháp dịch trước đó, chẳng hạn như dịch máy thống kê, sẽ trở nên lỗi thời trong tương lai,” anh nhận định.

Karthik Ramakrishnan, giám đốc tại IVP, quỹ đầu tư đã dẫn dắt vòng huy động vốn series B trị giá 100 triệu đô la Mỹ của DeepL hồi tháng 1.2023, cho biết điều đó đã được kiểm chứng. Thị trường về dịch thuật trên toàn thế giới hiện có quy mô 27,9 tỉ đô la Mỹ và còn rất nhiều dư địa để phát triển.

“Phần lớn quy trình dịch thuật vẫn được thực hiện thủ công theo phương pháp đã lỗi thời. Mọi người phụ thuộc vào những đơn vị dịch thuật bên ngoài, thường mất vài ngày hoặc thậm chí nhiều tuần để hoàn thành đúng hạn,” Ramakrishnan nói.

Với những đánh giá tích cực và mức định giá một tỉ đô la Mỹ, DeepL đang có vị thế tốt để nắm bắt cơ hội từ thị trường dịch thuật mà Ramakrishnan hướng tới. Nhưng các công ty khác cũng vậy. Tuy có thể không chính xác như DeepL, nhưng Google Translate hỗ trợ 130 ngôn ngữ và có sự hậu thuẫn từ chính Google, tập đoàn đã đầu tư vào AI trong nhiều thập niên qua. Một đối thủ công nghệ lớn khác là Microsoft Translator, công cụ hỗ trợ hơn 100 ngôn ngữ và tiếng địa phương được nhiều tập đoàn như Volkswagen Group sử dụng.

Trong khi đó, ChatGPT – chatbot được nhận định có vai trò quan trọng giúp AI phổ biến rộng rãi hơn – có thể dịch sang 50 thứ tiếng khác nhau. Hiện tại, ChatGPT gặp nhiều vấn đề trong dịch thuật, ví dụ như bản dịch không dựa trên dữ liệu đầu vào hoặc dịch sai thuật ngữ bình dân. Tuy nhiên, điều này sẽ được cải thiện nhờ vào sự phát triển liên tục của các mô hình ngôn ngữ lớn từ công ty mẹ OpenAI.

DeepL chưa có mô hình ngôn ngữ lớn riêng. Kutylowski cho biết anh có kế hoạch phát triển mô hình ngôn ngữ lớn nội bộ cho DeepL và kết hợp với mô hình dịch nhỏ hơn của công ty hiện nay để có kết quả tốt hơn. Nhằm hoàn thành mục tiêu này, DeepL đang xây dựng thêm nguồn tài nguyên tính toán và sử dụng trung tâm dữ liệu của Nvidia ở Thụy Điển để huấn luyện các mô hình AI.

“AI tạo sinh sẽ mở ra cơ hội rất lớn, cho phép chúng tôi phát triển thêm các tính năng bên cạnh dịch thuật, giúp phần mềm tương tác hoặc giao tiếp tự nhiên hơn với người dùng,” anh chia sẻ.