Hãy nhớ lại, khi trước các dịch giả thường đưa ra những câu vô lý đến mức meme tự viết ra được không? Ví dụ như hướng dẫn sử dụng hàng Trung Quốc khuyên "ủi mèo ngược lông để bật chế độ". Thật buồn cười, nhưng khi cần gấp dịch một tài liệu quan trọng hoặc giải thích cho khách hàng nước ngoài tại sao lại trễ deadline - thì không còn là chuyện đùa nữa. May mắn thay, thời đã thay đổi. Các mạng lưới thần kinh dịch thuật hiện đại đã ở một trình độ hoàn toàn khác. Tôi quyết định thử nghiệm bảy dịch vụ phổ biến và xem ai trong số chúng thực sự xử lý được các nhiệm vụ phức tạp.



Để thử nghiệm, tôi chuẩn bị hai bài tập khó. Thứ nhất là đoạn văn chứa đầy thành ngữ và mã màu (feeling blue, red tape, in the red). Thứ hai là câu đố cú pháp cổ điển về việc thời gian bay như mũi tên, còn ruồi quả thì thích chuối. Đây không chỉ là bài kiểm tra ngây thơ, mà còn là những cái bẫy thực sự mà ngay cả các thuật toán tiên tiến cũng dễ mắc phải.

Bắt đầu với BotHub. Ở đó, hoạt động dưới nền là Gemini 3 Pro của Google. Google đã lập chỉ mục toàn bộ internet trong nhiều thập kỷ và biết về các ngôn ngữ nhiều hơn ai hết. Trong nhiệm vụ đầu tiên, Gemini xử lý rất tốt - nhận diện đúng tất cả thành ngữ, dịch "feeling blue" thành "buồn bã", còn "red tape" thành "thủ tục hành chính". Trong bài thử thứ hai, mô hình không mắc bẫy với từ "flies", nhưng lại mất luôn chơi chữ của nguyên bản. Về mặt kỹ thuật, điểm cộng, nhưng không có gì nổi bật.

DeepL từ Cologne, Đức - là một dịch máy dựa trên mạng lưới thần kinh chuyên biệt, hoạt động từ năm 2017 và đã xây dựng được danh tiếng tốt. Nhiều chức năng: xử lý tài liệu, hỗ trợ 35 ngôn ngữ, gần đây còn có Speech-to-Text. Trong nhiệm vụ đầu tiên, DeepL chọn phong cách thân thiện hơn, dịch "in the red" thành "âm" - rất chính xác, phù hợp với ngôn ngữ nói hàng ngày. Nhưng trong nhiệm vụ thứ hai, hoàn toàn thất bại - không nhận ra rằng "fruit flies" là tên gọi cố định của loài côn trùng, và đưa ra kết quả vô lý về ruồi bay trong trái cây. Điều này cho thấy, DeepL vẫn là một dịch máy dựa trên thống kê, đôi khi chọn phương án phổ biến nhất.

GigaChat của Sberbank chạy trên kiến trúc NeONKA và tích hợp nhiều mạng lưới thần kinh cùng lúc. Tính năng phong phú - có thể đưa vào tài liệu, bảng tính, trình chiếu, thậm chí file âm thanh giờ. Trong bài thử đầu tiên, GigaChat gần như chính xác nhất - dịch "feeling blue" thành "trầm cảm", truyền đạt đúng sắc thái cảm xúc hơn. Trong nhiệm vụ thứ hai, cũng không mắc bẫy và xác định đúng "flies". Kết quả ấn tượng cho một mô hình đa năng.

Microsoft Translator của Bing - là một "ngựa chiến" đã tích hợp khắp nơi: Edge, Skype, Word. Hỗ trợ 179 ngôn ngữ, kể cả Klingon cho fan Star Trek. Trong cả hai nhiệm vụ, đều xử lý chính xác - nhận diện đúng thành ngữ và không mắc bẫy cú pháp. Rõ ràng, phía sau là các thuật toán mạnh mẽ.

MachineTranslation - là một trình tổng hợp, gửi đoạn văn của bạn ngay lập tức đến Google, DeepL, Amazon, Microsoft và ChatGPT, rồi hiển thị tất cả các kết quả cạnh nhau. Thật sáng tạo khi không biết cách chọn đúng hơn. Hỗ trợ hơn 270 ngôn ngữ. Nhược điểm là trong chế độ miễn phí chỉ cho phép 100 từ mỗi lần. Trong cả hai bài thử, đều đưa ra các phương án an toàn, trung bình, ai cũng hiểu được.

Reverso hoạt động như một công cụ tìm kiếm dựa trên các bản dịch của người khác - duyệt qua cơ sở dữ liệu phụ đề, tài liệu của Liên Hợp Quốc và hướng dẫn sử dụng. Giao diện còn cứng nhắc như năm 2015, trong phiên bản miễn phí khá keo kiệt - chỉ 2000 ký tự mỗi lần. Trong nhiệm vụ đầu tiên, hoàn toàn thất bại - dịch "red tape" thành "băng thủ tục hành chính" (bạn có thể hình dung ra sếp cắt kéo không?). Trong nhiệm vụ thứ hai, mắc lỗi ngu hơn tất cả - dịch "like" thành so sánh, chứ không phải là động từ. Đây là trình độ của Google Translate năm 2010.

Yandex Alice giờ hoạt động trên YandexGPT và đã gia nhập cuộc đua các mô hình sinh tạo. Phát triển khắp mọi nơi - trên trang chủ Yandex, trong trình duyệt, trong các ứng dụng. Hiểu rõ các sắc thái của tiếng Nga vì đã học từ internet tiếng Nga. Trong nhiệm vụ đầu tiên, cho ra một trong những bản dịch văn học nhất - "feeling blue" thành "trong trạng thái trầm cảm", còn "red tape" thành "thoát khỏi các rắc rối thủ tục". Thật là đỉnh. Trong bài thử thứ hai, cũng không mắc lỗi và còn dịch "like" thành "thích" - thật tuyệt.

Tổng kết, các mạng lưới thần kinh dịch tốt nhất là GigaChat, Alice và Microsoft Translator. Chúng thực sự hiểu ngữ cảnh và không mắc các bẫy cú pháp. DeepL phù hợp cho tài liệu, nhưng đôi khi gặp trục trặc. Reverso thì tốt nhất là không dùng cho các nhiệm vụ nghiêm trọng.

Nhưng nhớ điều quan trọng nhất: mạng lưới thần kinh chỉ là trợ thủ, không hơn. Chúng có thể sai, tưởng tượng, đôi khi gây ngạc nhiên theo hướng không mong muốn. Hãy tin tưởng, nhưng cũng cần kiểm tra. Bạn đang dùng dịch máy dựa trên mạng lưới thần kinh nào? Chia sẻ kinh nghiệm trong phần bình luận!
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim