Tìm hiểu AI và GEN AI?
Chúng ta đã nghe tới Ai trí thông minh nhân tạo đã từ rất lâu, AI là viết tắt cảu Artificial Intelligence đây là cách những chiếc máy mô phỏng hành vi và suy nghĩ của con người. Bắt đầu từ những năm 40 của thế kỷ trước người ta đã có ý tưởng bản đầu về Ai đây là những chiếc máy tự động làm việc, robot, thiết bị thông minh. AI tạo sinh (Generative AI) được viết tắt là Gen Ai cũng là một trong số các loại Ai được đề cập ở trên và được nhắc đến nhiều trong những năm gần đây.
Một ví dụ cho mọi người dễ hình dung về Ai, ta có một dãy số 1 2 3 4 5, ... khi viết đến đây chúng ta cũng đã hình dung được số tiếp theo sẽ là số 6, 7. Từ ví dụ này bạn có thể hiểu nôm na Gen Ai là thứ công nghệ cố gắng bắt chước lại quá trình xảy ra trong đầu con người.
Tìm hiểu về LLM
Để làm được chuyện đó, thì Gen AI hoạt động dựa trên một thứ gọi là Mô hình ngôn ngữ lớn (Large Language Model - LLM). Từ lúc được tạo ra, LLM được đánh giá là một cuộc cách mạng trong việc con người tương tác với máy tính. Hiện tại LLM đang dần định hình thế giới kỹ thuật số mới và thay đổi cách con người tương tác với máy và với nhau, thay đổi luôn cách con người học hỏi, làm việc, sáng tạo,...
Những thí dụ điển hình của LLM chính là những cái tên cực kỳ nổi như GPT-4o của OpenAI, LaMDA của Google, Anthropic, Llma của Meta,... Tất cả đều là những mô hình ngôn ngữ lớn, được các công ty này cung cấp dưới dạng API (để các dev tích hợp nó vào ứng dụng của họ), hoặc chính các công ty này cũng làm sẵn các giao diện dịch vụ cho người dùng cuối xài. Một số dịch vụ hiện tại có thể kể tới là OpenAI của ChatGPT, Google thì có Gemini, Anthropic có Claude,...
LLM được tạo ra với mục đích hiểu và tạo ra ngôn ngữ con người. Người ta sử dụng các thuật toán machine learning phức tạp, các mạng neural mô phỏng cách hoạt động của não người, để xử lý và phân tích một lượng dữ liệu siêu lớn. Mục tiêu của LLM chính là hiểu được câu lệnh mà người dùng nhập vào, từ đó tạo ra một phản hồi mạch lạc, phù hợp với ngữ cảnh và cung cấp giá trị thỏa mãn nhu cầu của người dùng.
Tìm hiểu kiến trúc của LLM
Các LLM, thí dụ như GPT 4o của OpenAI hay LaMDa của Google,... đều sử dụng một mạng neural đặc biệt là Transformer, được thiết kế đặc biệt để làm việc hiệu quả với văn bản.
Để làm được điều đó, nó có một đặc tính quan trọng gọi là Self Attention. Đặc tính này cho phép nó có thể "nhìn" vào các từ khác nhau của một câu và quyết định xem từ nào là quan trọng trong ngữ cảnh cụ thể. Có thể hiểu nôm na thì Transformers cho phép model nhận định được đâu là từ quan trọng trong một câu mà người dùng nhập vào.
Đặc tính quan trọng thứ 2 của Transformers chính là khả năng xác định vị trí và mã hóa. Điều này giúp Model có thể xác định được vị trí của một từ trong câu. Có thể hình dung, việc này giống như Transformers biết cách dán nhãn cho mỗi từ để model biết từ đó nằm ở đâu trong một chuỗi từ nhập vào.
Với 2 đặc tính trên, LLM có thể xử lý và hiểu được không chỉ một câu mà cả một đoạn văn, một bài viết vài nghìn chữ và cả một tập tài liệu, một cuốn sách. Nó có thể hiểu ý nghĩa của các từ nằm trong một ngữ cảnh nào đó. Vì thế, khi được hỏi và hỏi đúng, model sẽ trả về ý nghĩa của từ đó và những thông tin có liên quan.