Kỹ thuật Few-shot prompt là gì?

Với one-shot prompt, người dùng sẽ cung cấp một thí dụ duy nhất trong prompt để model hiểu rõ hơn về nhiệm vụ và cách tạo ra đầu ra mong muốn. Mục đích ở đây là để cho model thấy một hình mẫu cụ thể để nó bắt chước làm theo.

Với các nhiệm vụ phức tạp hơn, few-shot prompt sẽ cung cấp nhiều thí dụ hơn (thường là từ 3 - 5 thí dụ). Các thí dụ này sẽ cung cấp các hình mẫu đa dạng hơn để model thấy và nó sẽ tuân theo. Điều này sẽ tăng khả năng của model thực hiện đúng định dạng / phong cách của đầu ra mà nó trả về cho người dùng.

Vai trò của few-shot prompt: khắc phục hạn chế của zero-shot một khi model không thể hiểu hoặc thực hiện nhiệm vụ một cách chính xác với những thông tin mà người dùng mô tả; cũng có những tình huống mà một prompt zero-shot rất dài nhưng kém hiệu quả hơn so với một prompt few-shot đơn giản hơn nhưng có thí dụ cụ thể. Prompt few-shot cũng sẽ có chức năng chỉ dẫn cấu trúc và format của đầu ra mà người dùng mong muốn. Một tác dụng khác nữa chính là thông qua thí dụ, người dùng đã ngầm cung cấp một ngữ cảnh / quy tắc cho model, đặc biệt là những quy tắc đó sẽ khó diễn đạt được bằng ngôn ngữ bình thường.

 

Một số nguyên tắc và lưu ý khi sử dụng few-shot prompt

  • Các thí dụ phải phù hợp với nhiệm vụ bạn muốn thực hiện.
  • Đảm bảo chất lượng ví dụ: Các ví dụ nên đa dạng, chất lượng cao và được viết tốt. Một lỗi nhỏ trong ví dụ có thể gây nhầm lẫn cho mô hình.
  • Bổ sung các trường hợp đặc biệt (nếu cần): Nếu bạn muốn mô hình xử lý tốt nhiều loại đầu vào, hãy thêm các trường hợp đặc biệt trong thí dụ của bạn.
  • Đối với nhiệm vụ phân loại, trộn lẫn các class: Khi sử dụng few-shot cho các tác vụ phân loại, hãy trộn lẫn các class phản hồi có thể có trong các ví dụ để tránh mô hình học thuộc thứ tự của thí dụ thay vì các đặc điểm của từng class.
  • Cung cấp một số lượng thí dụ hợp lý: Một quy tắc chung là bắt đầu với khoảng 6 thí dụ cho few-shot và sau đó kiểm tra độ chính xác.
  • Thí dụ là công cụ dạy model mạnh mẽ: Việc cung cấp thí dụ là một trong những mẹo tốt và quan trọng nhất trong prompting vì nó giúp mô hình hiểu rõ hơn về những gì người dùng mong đợi.

 

Cấu trúc của một prompt few-shot

NHIỆM VỤ X


THÍ DỤ:
A1 > B1

THÍ DỤ:
A2 > B2


Y > ?
 
Chúng ta sử dụng khi nào?
Prompt few-shot sẽ phù hợp với: các tác vụ đòi hỏi đầu ra phải tuân thủ một định dạng / cấu trúc nhất quán (thí dụ như cần model trả về một JSON với cấu trúc mong muốn), những nhiệm vụ khó diễn tả chính xác bằng lời, những nhiệm vụ mà prompt zero-shot đã không thể thực hiện thỏa mãn nhu cầu người dùng.
 
Ví dụ 1:
Chuyển thông tin đơn hàng thành định dạng JSON

ví dụ khi dụng few-shot prompt - camnangai

hướng dẫn sử dụng few-shot prompt - camnangai

Ví dụ 2:

Phân loại chủ đề và sửa lỗi

ví dụ khi dụng few-shot promt - camnangai

Vậy là bài viết này mình đã hướng dẫn các bạn sử dụng kỹ thuật few-shot để viết promt, còn nhiều kỹ thuật viết prompt khác các bạn có thể đón đọc để nâng cao khả năng viết prompt của mình.