20q3.com
vị trí của bạn:tin tưc hăng ngay > giáo dục thể chất > Meta phát hành mô hình AI mới để hỗ trợ dịch giọng nói đa ngôn ngữ

Meta phát hành mô hình AI mới để hỗ trợ dịch giọng nói đa ngôn ngữ

thời gian:2024-05-19 11:16:35 Nhấp chuột:87 hạng hai

[Epoch Times, ngày 2 tháng 9 năm 2023] (Zoom Ziji, phóng viên người Anh của Epoch Times, gã khổng lồ truyền thông xã hội Meta đã ra mắt mô hình trí tuệ nhân tạo (AI) mới vào ngày 22 tháng 8, có thể dịch và chuyển đổi hàng chục giọng nói hoặc văn bản các ký tự được kỳ vọng sẽ trở thành nền tảng của các công cụ nhắn tin tức thời đa ngôn ngữ.

Người ta nói rằng mô hình mới này có tên là DànM4T, viết tắt của dịch máy đa ngôn ngữ và đa phương thức quy mô lớn. Meta cho biết nó có thể hỗ trợ dịch giọng nói thành văn bản hoặc chuyển văn bản thành văn bản ở gần 100 ngôn ngữ, cũng như dịch giọng nói sang giọng nói ở 35 ngôn ngữ.

Nó được phát hành theo giấy phép Creative Commons CC BY-NC 4.0, cho phép các nhà nghiên cứu lặp lại nó.

Ngoài DànM4T, Meta còn phát hành dữ liệu nguồn của tập dữ liệu dịch mở DànAlign.

Meta cho biết: “Việc xây dựng một trình dịch ngôn ngữ phổ quát, giống như chú cá Babel hư cấu trong Hướng dẫn về thiên hà của người đi nhờ xe, là một thách thức vì các hệ thống chuyển giọng nói thành giọng nói và chuyển giọng nói thành văn bản hiện tại chỉ bao phủ toàn thế giới. Một nhóm nhỏ các ngôn ngữ”,

Meta cho biết DànM4T thể hiện một "bước đột phá lớn" vì mô hình mới này có thể hoàn thành toàn bộ nhiệm vụ dịch cùng một lúc, không giống như các mô hình dịch lớn khác chia dịch thuật thành các hệ thống khác nhau.

Một tính năng thú vị của DànM4T, nếu hoạt động bình thường, là khả năng nhận biết khi người nói chuyển đổi mã hoặc khi ai đó chuyển đổi giữa hai hoặc nhiều ngôn ngữ trong một câu. Ví dụ: Meta đã chứng minh trong một video rằng mô hình có thể phân biệt ngay lập tức giữa tiếng Hindi, tiếng Telugu và tiếng Anh.

SeamlessM4T được xây dựng dựa trên mô hình dịch trước đây của Meta. Năm ngoái, Meta đã phát hành mô hình dịch máy chuyển văn bản thành văn bản "Không có ngôn ngữ nào bị bỏ lại", hỗ trợ 200 ngôn ngữ. Nó cũng đã phát triển SpeechMatrix, một bộ dữ liệu để dịch giọng nói sang giọng nói đa ngôn ngữ và lời nói đa ngôn ngữ quy mô lớn để nhận dạng giọng nói. Meta năm ngoái đã trình diễn công cụ dịch lời nói phổ quát của mình, chuyển đổi tiếng Phúc Kiến, một phương ngữ được sử dụng rộng rãi ở miền nam Trung Quốc, sang tiếng Anh.

Dịch ngôn ngữ rất quan trọng đối với những công ty như Meta, nơi tuyển dụng hàng nghìn người để kiểm duyệt lượng lớn bài đăng trên Facebook và Instagram bằng nhiều ngôn ngữ khác nhau. Nhiều khi, các nhóm sử dụng ngôn ngữ thích hợp có quy mô nhỏ hơn và cuối cùng phải dựa vào kiểm duyệt tự động, điều này không hoạt động tốt ở các ngôn ngữ này. Nếu AI được phép truy cập vào các tập dữ liệu bằng các ngôn ngữ thích hợp này, việc kiểm tra sẽ trở nên đơn giản hơn.

Asian Beauty

Theo bài đăng trên blog, Meta đang cung cấp bộ mô hình này cho công chúng để sử dụng phi thương mại.

Meta đã phát hành một loạt mô hình trí tuệ nhân tạo hầu hết miễn phí trong năm nay, trong đó có mô hình ngôn ngữ quy mô lớn có tên là Llama. Mô hình này đặt ra thách thức nghiêm trọng đối với các mô hình đã được cấp bằng sáng chế do OpenAI do Microsoft hậu thuẫn và Google của Alphabet sản xuất.

Zuckerberg nói rằng hệ sinh thái AI mở có lợi hơn cho Meta vì công ty sử dụng nguồn lực cộng đồng hiệu quả để tạo ra các công cụ hướng đến người tiêu dùng cho nền tảng xã hội của mình thay vì dựa vào các mô hình này. Phí người dùng được hưởng lợi nhiều hơn.

Về mô hình DànM4T, các nhà nghiên cứu của Meta tuyên bố trong một bài nghiên cứu rằng họ đã thu thập tài liệu đào tạo có liên quan từ 4 triệu giờ "tệp âm thanh gốc". Các tệp âm thanh có nguồn gốc từ cơ sở dữ liệu công cộng trực tuyến, nhưng các nhà nghiên cứu không chỉ rõ đó là cơ sở dữ liệu nào.

Bài nghiên cứu đề cập rằng dữ liệu văn bản được lấy từ tập dữ liệu được tạo vào năm ngoái và nội dung đến từ Wikipedia và các trang web liên quan. ◇

Người phụ trách biên tập: Xu Xiaohui

由该校天体物理学家所主导的研究团队发现,WASP-69b与母恒星的距离太近,以至于它的大气以每秒20万吨的速率蒸发,在恒星风(stellar wind)的吹拂之下,它形成了一条至少有35万英里长、类似彗星的尾巴,远比先前观测到的还长。

文中还提到该论坛在1月初发表的《2024年全球风险报告》,报告特别将错误讯息和虚假资讯列为首要风险,因为虚假讯息可能让选举结果的合法性受到质疑,并破坏社会稳定,而这些虚假讯息、仿冒声音和换脸影片是透过AI生成。

药明康德在上海上市的股票也同样跌停,跌幅达10%。

Asian Beauty

NASA指出,UGC 3912的扭曲形状通常意味着它与另外一个星系发生重力相互作用。当星系与星系之间相互作用时,无论是掠过对方的重力场或彼此发生碰撞,它们的恒星、尘埃和气体可能会被带往新的路径。

总体而言,Apple上一季营收1,195.8亿美元,超过伦敦证券交易所集团(LSEG)预期的1,179.1亿美元。每股盈余2.18美元,预期为2.10美元。

liên hệ chúng tôi
Trang web chính thức:{www.smt30.org/}
Thời gian hoạt động:Thứ Hai đến Thứ Bảy(09:00-18:00)
liên hệ chúng tôi
URL:www.smt30.org
Theo dõi tài khoản công khai

Powered by tin tưc hăng ngay bản đồ RSS bản đồ HTML

Copyright 站群 © 2013-2024 tin tưc hăng ngayĐã đăng ký Bản quyền