Meta giới thiệu LLaMA, Facebook tham gia vào cuộc chiến siêu AI

61
Meta giới thiệu LLaMA, Facebook tham gia vào cuộc chiến siêu AI
Meta giới thiệu LLaMA, Facebook tham gia vào cuộc chiến siêu AI
Mục lục

    LLaMA với 65 tỷ tham số, kém ChatGPT nhưng được huấn luyện trên 1.400 tỷ từ, gấp năm lần mô hình OpenAI theo thông tin của Meta (công ty mẹ của Facebook) công bố.

    LLaMA được viết tắt từ Large Language Model Meta AI (Mô hình Ngôn ngữ Lớn về AI của Meta). Nó hoạt động dưới dạng mở, cho phép các nhà nghiên cứu và tổ chức chính phủ, xã hội, học viện dùng miễn phí.

    Ngày 24/02/2023, Meta cho biết đã phát hành mô hình ngôn ngữ mới tên LLaMA cho các nhà nghiên cứu. Mô hình này làm nóng cuộc đua siêu AI khi các công ty công nghệ lớn đều đang không thể đứng ngoài xu hướng trí tuệ nhân tạo.

    Trước mắt, LLaMA sẽ tập trung cho 20 ngôn ngữ dùng bảng chữ cái Latinh và Cyrillic. Tiếng Việt chưa nằm trong danh sách này. Theo công bố, mô hình của Meta đòi hỏi sức mạnh tính toán “ít hơn nhiều” so với các siêu AI trước đó. Nó có tối đa 65 tỷ tham số, bằng một phần ba so với ChatGPT, nhưng lại được huấn luyện trên 1.400 tỷ từ, cao gấp năm lần siêu AI của OpenAI.

    Các mô hình ngôn ngữ lớn khai thác một lượng lớn văn bản để tóm tắt thông tin và tạo nội dung., từ đó, chúng có thể trả lời các câu hỏi theo ngữ cảnh như con người.


    Mặt trận siêu AI khởi động từ cuối năm ngoái khi OpenAI phát hành ChatGPT. Sau đó, Microsoft tuyên bố tích hợp mô hình này vào công cụ tìm kiếm Bing. Google đáp lại bằng chatbot Bard AI nhưng mới đang thử nghiệm nội bộ. Một số công ty công nghệ lớn ở châu Á như Baidu cũng xây dựng sản phẩm tương tự để cạnh tranh.

    Gil Luria, nhà phân tích cao cấp tại DA Davidson, nói: “Thông báo của Meta có thể là bước thăm dò về năng lực của mô hình ngôn ngữ lớn. Sau đó, họ sẽ đưa siêu AI vào sản phẩm của mình trong tương lai. Mô hình của Meta có thể không mạnh bằng ChatGPT nhưng rõ ràng sẽ đóng vai trò quan trọng với mô hình kinh doanh của công ty”.

    Meta tuyên bố LLaMA có thể vượt trội các đối thủ trong một số tình huống cụ thể. Với 65 tỷ tham số, nó cho thấy sức mạnh không thua kém Chinchilla70B và PaLM-540B của Google. Tháng 5/2022, Meta cũng đã phát hành mô hình ngôn ngữ lớn OPT-175B, tạo cơ sở cho phiên bản chatbot BlenderBot 3. Sau đó, công ty giới thiệu mô hình Galactica có thể viết bài báo khoa học và giải các bài toán. Tuy nhiên, cả hai AI này đều nhanh chóng bị gỡ bỏ do liên quan đến vấn đề bản quyền và thông tin sai lệch.

    Theo Vnexpress, Reuters

    BÌNH LUẬN

    Vui lòng nhập bình luận của bạn
    Vui lòng nhập tên của bạn ở đây