Đây là cách AI của Microsoft đang giúp máy dịch ngôn ngữ Ấn Độ

Hậu trường: AI mới của Microsoft cung cấp bản dịch thời gian thực bằng các ngôn ngữ Ấn Độ

Mặc dù Ấn Độ là thị trường Internet lớn thứ hai, nhưng phần lớn dân số nước này vẫn chưa kết nối mạng. Một trong những yếu tố tiếp tục đẩy họ ra khỏi world wide web là rào cản ngôn ngữ khổng lồ. Hầu hết người Ấn Độ không hiểu tiếng Anh và nhiều trang web cũng như ứng dụng dành cho họ không có sẵn bằng ngôn ngữ địa phương ưa thích của họ.

Đây là thực tế đáng buồn của các thị trường mới nổi, nơi tỷ lệ biết chữ thường kém và cơ sở hạ tầng địa phương không sẵn sàng để thu hẹp khoảng cách đó. Nó cũng nổi lên như một vấn đề đối với nhiều công ty, bao gồm cả các công ty ở Thung lũng Silicon đang tìm kiếm hàng tỷ người dùng tiếp theo của họ ở những nơi như Ấn Độ. Nhưng một số cũng sử dụng nó như một cơ hội để thể hiện tài năng kỹ thuật của họ.

Microsoft đã công bố vào thứ Năm rằng tất cả các dịch vụ được cung cấp bởi dịch vụ dịch thuật của hãng — bao gồm tìm kiếm Bing, trang web Bing Translator, cũng như các sản phẩm Microsoft Office 365 như Word, Excel, PowerPoint, Outlook và Skype — giờ đây có thể cung cấp dịch vụ thực được cải thiện. bản dịch thời gian bằng tiếng Hindi, tiếng Bengali và tiếng Tamil. Công ty cho biết ứng dụng Translator của công ty đã được cập nhật để nhận dạng và dịch các ngôn ngữ từ văn bản, lời nói cũng như chọn các nội dung từ một bức ảnh.

Đọc thêm:  Mark Zuckerberg là người giàu thứ 29

Bản cập nhật mới sẽ có ích cho hàng trăm triệu người Ấn Độ. Theo một nghiên cứu của công ty nghiên cứu KPMG, có khoảng 521 triệu người nói tiếng Hindi ở Ấn Độ, 101 triệu người nói tiếng Bengali và 75 triệu người nói tiếng Tamil. Công ty ước tính rằng với tốc độ hiện tại, chỉ khoảng 38% khán giả nói tiếng Hindi, 8% số người nói tiếng Bengal và chỉ 6% những người thích tiếng Tamil sẽ truy cập trực tuyến vào năm 2021.

Krishna Doss Mohan, giám đốc chương trình cấp cao của Microsoft Ấn Độ, ước tính chất lượng dịch thuật cho các ngôn ngữ Ấn Độ đã được cải thiện khoảng 20%. Trong thử nghiệm ngắn của chúng tôi, chúng tôi cũng rất ngạc nhiên với bản dịch.

Có một lời giải thích. Mohan cho biết sự cải tiến này có được là nhờ những tiến bộ về mạng thần kinh sâu của công ty. Microsoft đã bắt đầu khám phá lĩnh vực kỹ thuật nóng bỏng từ nhiều năm trước và lần đầu tiên giới thiệu nó trong ứng dụng Microsoft Translator cho các ngôn ngữ được chọn vào năm 2016. CŨNG ĐỌC: Microsoft làm cho tìm kiếm Bing của mình, Office 365 AI-thông minh; cập nhật ứng dụng ‘Seeing AI’ phổ biến

Hành động hậu trường

Trước đây, Microsoft đã dựa vào cái mà hãng mô tả là mô hình “Dịch máy thống kê (SMT)” để dịch các câu từ ngôn ngữ này sang ngôn ngữ khác. Nhưng công ty nhận thấy rằng mô hình này có những hạn chế của nó — nó gặp khó khăn trong việc hiểu nghĩa của các từ trong ngữ cảnh địa phương và động lực học của chúng với các từ khác. Hãy coi đây là những từ bổ sung như umm, hmm, aaa phổ biến trong các cuộc trò chuyện hiện đại. Một dịch giả, trừ khi được hướng dẫn khác, không biết những từ bổ sung này có nghĩa là gì.

Đọc thêm:  Microsoft Teams trở lại cổ điển, được thiết lập để triển khai tính năng nhấn để nói hữu ích này cho tất cả mọi người

Công ty cho biết: “Thêm vào sự phức tạp là sự khác biệt tinh tế trong cách phát âm, trọng âm, cách diễn đạt và tiếng lóng giữa các vùng khác nhau ở Ấn Độ”. “Ví dụ: hai người nói tiếng Hindi bản địa từ các vùng khác nhau của vành đai nói tiếng Hindi có thể có những cách khác nhau để xây dựng câu hoặc mô tả cùng một thứ.”

Dịch máy thống kê truyền thống yêu cầu một kho dữ liệu để cải thiện bản thân trong việc hiểu các ngôn ngữ tương ứng. Đây là một thách thức khác đối với Microsoft khi làm việc với các ngôn ngữ Ấn Độ. Hầu hết các ngôn ngữ Ấn Độ ít được đại diện trong các cuộc trò chuyện trực tuyến và thiếu các cặp dữ liệu song song duy nhất cho các ngôn ngữ Ấn Độ.

Đây là lúc các mô hình mạng thần kinh học sâu phát huy tác dụng. Mô hình xem xét các lý thuyết đã được thiết lập về nhận dạng mẫu để bắt chước cách thức hoạt động của bộ não con người và cố gắng dịch các câu theo cách tương tự. Do đó, Microsoft cho biết mô hình mạng thần kinh sâu của họ hiểu rõ hơn các khái niệm chi tiết như giới tính, bản chất và giọng điệu của các từ trong câu.

Mô hình mới đầu tiên nhận dạng lời nói và chuyển đổi chúng thành văn bản. Sau đó, nó loại bỏ những từ khó hiểu và lặp lại khỏi văn bản nguồn. Sau khi hoàn thành, nó bắt đầu loại bỏ các lỗi mà nó đã học được bằng cách xem cơ sở dữ liệu của các câu đã dịch, trước khi hoàn thiện văn bản kết quả. Bước cuối cùng liên quan đến việc tổng hợp bản dịch dựa trên văn bản thành lời nói. Bạn có thể dùng thử bằng giọng nói trên ứng dụng Translator của công ty.

Đọc thêm:  Hơn 500.000 thiết bị Huawei Android bị nhiễm phần mềm độc hại Joker

Microsoft cho biết các đối tác và khách hàng của họ cũng có thể sử dụng tính năng mới thông qua API trên Azure và có thể tích hợp vào các sản phẩm của họ. Các nhà phát triển cũng có thể truy cập API Dịch vụ nhận thức của công ty dựa trên mô hình này để phát triển ứng dụng bằng tiếng nước ngoài và tích hợp mô hình này vào chức năng của ứng dụng của họ. Người dùng Microsoft Edge có thể sử dụng tính năng này trên bất kỳ trang web nào họ truy cập bằng trình duyệt. Các mô hình dịch thuật do DNN cung cấp cho tiếng Hindi và tiếng Bengali hiện đang hoạt động và nó sẽ sớm hỗ trợ tiếng Tamil.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *